跳转到内容

第七章 保持与遗忘作为时间的函数

AI 导读

本章旨在用科学方法精确描绘记忆随时间衰退的过程,从而得出了心理学历史上最著名的发现之一——「遗忘曲线」

文章的核心框架和关键点如下:

  1. 问题的提出:从模糊理论到科学测量(第 26-27 节)
  • 背景: 艾宾浩斯首先回顾了当时关于遗忘的三种主要理论(记忆被「覆盖」、记忆本身「褪色」、记忆「瓦解」),并批判它们都过于模糊、抽象,无法被验证。
  • 创新方法:为了解决这个问题,他再次使用了他的「节省法」。他通过测量在不同时间间隔(从 20 分钟到 31 天)后,重新学习一个列表所能节省的精力,来精确量化到底有多少记忆被保持了下来。
  1. 核心发现:遗忘曲线(第 28-29 节)
  • 实验结果:数据揭示了一个非常清晰且惊人的模式:
    • 遗忘在初始阶段速度极快。 在学习结束后的第一个小时内,遗忘的量最大,超过了所学内容的一半。
    • 遗忘速度随后急剧减慢。 随着时间的推移,记忆的衰退变得越来越平缓。例如,一天后保留了约三分之一,但即便过了一个月,仍有超过五分之一的记忆痕迹存在。
  • 规律性:这个过程非常规律,艾宾浩斯甚至能用一个简单的数学公式(一个对数函数)来精确描述这条曲线。其核心思想是:保持的记忆量与遗忘的记忆量的比值,与时间的对数成反比。
  1. 结果的验证与意义(第 30 节)
  • 验证:为了证明这个发现不是偶然,艾宾浩斯引用了他在不同时期、用不同材料进行的其他实验数据。结果发现,在 20 分钟和 24 小时这两个时间点上,新数据与原始的遗忘曲线惊人地吻合。
  • 意义:这证明了「遗忘曲线」是一个稳定、可重复的心理学现象。它首次将「遗忘」这一主观体验,转变为一个可预测、可用数学描述的自然过程,为记忆科学奠定了坚实的基础。

总而言之,本章通过严谨的实验,首次绘制出了人类记忆遗忘的精确轨迹:我们忘得最快的是刚刚学过的东西,而随着时间的流逝,剩下的记忆会变得越来越稳固。


第 26 节. 对保持与遗忘的解释

各种各样的观念,如果任其发展,都会逐渐被遗忘。这是一个众所周知的事实。那些我们起初能轻易回忆,或者它们自身会频繁地以生动色彩重现的观念组或序列,会逐渐地变得重现次数更少、色彩更黯淡,并且只能通过意志努力被困难地、部分地再现出来。经过更长的时间,即便如此也无法做到,当然,罕见的情况除外。那些似乎已遗忘多年的名字、面孔、知识片段和经验,会突然在头脑中浮现,尤其是在梦中,所有细节俱全且异常生动;我们很难理解它们从何而来,又如何在这期间隐藏得如此之好。心理学家们——各自依据其总体立场——从不同的视角来解释这些事实,这些视角并非完全相互排斥,但也并不完全协调。其中一派似乎最重视那些即便在很长时间后仍能显著重现的生动意象。他们假定,由外部印象引起的知觉,会留下一些苍白的意象,即「痕迹」。这些痕迹虽然在各方面都比原始知觉更微弱、更易逝,但它们会以其当下的强度,保持不变地继续存在。这些心理意象无法与现实生活中强度更高、更凝实的知觉相抗衡;但当后者完全或部分缺失时,前者便会更不受约束地占据主导。同样,较早的意象也确实会越来越多地被后来的意象,可以说是,「覆盖」和遮蔽。因此,对于较早的意象,其重现的可能性会变得更小、更困难。但是,如果通过某种偶然且有利的情境组合,这些累积的遮蔽层被推到一旁,那么,无论经过多长时间,那隐藏于下的东西,自然会以其原始且依然存在的生动性重新显现。[1]

而对于另一派学者[2]而言,观念,即那些持续存在的意象,会经历越来越多的、影响其本质的变化;「模糊化」的概念便由此引入。较早的观念被较新的观念所压抑,并被迫,可以说是,「沉降」下去。随着时间的推移,观念的内在清晰度和意识强度这些一般属性之一,会遭受损害。观念的联结和序列也经历着同样逐步弱化的过程;而当观念被分解为其组成部分时,这一过程会进一步加速,其结果是,那些如今仅松散联结的成员最终会被组合进新的联结之中。那些越来越被压抑的观念,只有在很长时间后才会完全消失。但是,我们不应将在模糊时期的被压抑观念想象成苍白的意象,而应将其视为一种「倾向」或「习性」,一种旨在重新创造那些被迫沉降的意象内容的倾向。如果这些倾向以某种方式得到支持和加强,那么在任何时刻,那些起压抑和阻碍作用的观念自身都可能被抑制,从而使那个看似已被遗忘的观念以完美的清晰度再度浮现。

第三种观点则认为,至少在复杂观念的情况下,遗忘在于瓦解成部分并丧失单个组件,而非整体的模糊化。前文提到的观念分解为其组成部分的概念,在这里提供了唯一的解释。「一个复杂客体的意象在我们的记忆中之所以模糊,并非因为作为一个整体,其所有部分都存在且有序,只是被一束较弱的意识之光所照亮;而是因为它已变得不完整。它的某些部分已完全缺失。最重要的是,那些尚存部分之间的精确连接,通常已经消失,只能通过『它们之间曾存在某种联合』这一念头来弥补;而我们认为这种或那种连接同样可能,却无法做出最终决定的那个可能性的范围有多大,就决定了我们应归于该观念的模糊程度有多大。」[3]

上述每一种观点,都能从我们时而拥有的、真实的(或自以为真实的)内在体验中,获得某种程度但非排他性的支持。原因何在?原因在于,这些偶然的、轻易获得的内在体验,过于模糊、肤浅,且能被多样地解读,以至于它们作为一个整体,根本无法只容纳一种单一的解释,甚至无法让任何一种解释显得具有压倒性的或然性。谁能——哪怕是勉强地精确——描述观念被所谓的覆盖、沉降或瓦解的渐进过程?谁能对不同广度的观念序列所引起的抑制作用,或者对任何一种稳固的复合观念因其组成部分被用于新的联结而遭受的瓦解,说出任何令人满意的话?每个人对这些过程都有自己私下的「解释」,但归根结底,那些有待解释的实际状况,对我们所有人而言都是同样未知的。

如果我们考虑到,我们只能依赖于直接的、无辅助的观察,以及那些有价值的经验的偶然出现,那么情况改善的前景似乎颇为渺茫。例如,一个人该如何确定在某个时间点上记忆已达到的模糊程度,或剩余碎片的数量?或者,如果那些几乎被完全遗忘的观念再也不重返意识,我们又该如何追溯其内在过程的可能轨迹?

第 27 节. 对实际状况的研究方法

借助我们的方法,我们便有了一种可能性,能在一个微小且明确限定的领域内,间接地探究上述问题,并且,通过暂时与任何理论保持距离,或许还能构建出一种新的理论。

在经过一段确定的时间后,那些通过学习一个音节序列而留下的、隐藏但依然存在的习性,可以通过对该序列的再次记忆而得到加强,从而使那些残留的片段重新联合成一个整体。完成这项任务所需的功,与在不存在此类习性和片段时所需的功相比,便为我们所遗忘的以及所保持的内容,提供了一个量度。不同种类或广度的观念组可能对其他观念组造成的抑制作用,可以通过在初次学习和重新学习之间插入明确定义的观念复合体的方式来研究,这种抑制作用必然会通过重新学习时或多或少增加的功而显现出来。一个联结纽带因其组成部分被用于其他用途而导致的松动,也可以用类似的方式来研究,即:在学习了某个序列之后,再去记忆由相同元素构成的新组合,然后确定重新学习原始组合所需功的变化。

首先,我研究了上述关系中的第一种,并提出了这样一个问题:如果将某一特定种类的音节序列学习至能背诵的程度,然后任其发展,那么在仅仅受到时间流逝或填充时间的日常事件的影响下,遗忘的过程将如何进行?对所遭受损失的确定,是通过前述方式进行的:在经过特定的时间间隔后,将先前已记忆的序列重新学习,然后比较两种情况下所需的时间。

这项研究是在 1879-80 年间进行的,包含了 163 次双重测试。每一次双重测试都包括学习八个由 13 个音节组成的序列(其中在上午 11-12 点进行的 38 次双重测试除外,每次只包含六个序列),然后在一段确定的时间后重新学习它们。初次学习一直持续到能够将所讨论的序列无误地背诵两次。重新学习也进行到同样的程度;它发生在以下时间点之一——即,大约三分之一小时后、1 小时后、9 小时后、1 天后、2 天后、6 天后,或 31 天后。

时间间隔是从第一组初次学习完成时开始计算的,因此,对于较长的时间间隔,并不要求很高的精确度。最后四个时间间隔的影响,分别在一天中的三个不同时段(见第 13 节末尾)进行了测试。在报告所获结果之前,有必要做一些初步的说明。

对于那些在经过了数个整天之后才重新学习的序列,我们可以理所当然地假定实验条件是相似的。无论如何,即便外部条件尽可能相似,要应对实际的内在波动,除了增加测试次数外,也别无他法。在内在差异性可能最大的地方,即在间隔了整整一个月之后,我将测试的数量大致加倍。

然而,在间隔为 9 小时和 1 小时的情况下,实验条件中存在着一个明显且恒定的差异。在一天中较晚的时段,人的精神活力和接受能力会下降。那些在早晨学习、然后在较晚时段重新学习的序列,即便不考虑其他影响,其重新学习所需的功也会更多,这与如果重学是在精神活力与初学时相等的时段进行的情况是不同的。因此,为了使数据具有可比性,为重学所获得的数值必须进行某种削减,至少在间隔 9 小时的情况下,这种削减量是如此之大以至于不容忽视。我们必须确定,在 B 时段学习那些在 A 时段需耗时 a 秒才能学会的序列,会多花多少时间。这个量的实际确定,需要比我目前拥有的更多的测试。如果对为 1 小时和 9 小时间隔所获得的数值应用一个必要但不精确的校正,这些数值会变得比其自身更不可靠。

在最小的间隔,即三分之一小时的情况下,同样的弊端再次出现,尽管程度较轻;但它很可能被另一种情况所补偿。这个总的时间间隔是如此之短,以至于一次测试中第一个序列的重新学习,几乎是紧随着同一个测试中最后一个序列的初次学习完成之后,或者只间隔一两分钟。因此,整个过程可以说形成了一次连续的测试,其中序列的重新学习是在精神清新度越来越不利的条件下进行的。但另一方面,在如此短的间隔后,重新学习进行得相当快,几乎只需要初次学习所需时间的一半。通过这种方式,学习与重新学习某个特定序列之间的间隔实际上是逐渐缩短的。因此,位置靠后的序列在时间间隔方面享有更有利的条件。鉴于进行更精确测定的困难,我理所当然地认为,这两种被假定为相互对抗的影响,近似地相互抵消了。

第 28 节. 结果

在下表中,我用以下符号表示:

L 首次学习序列所需的时间(秒),此为原始记录值,因此包含了两次背诵的时间。

WL 重新学习序列所需的时间,同样包含背诵时间。

WLk 经过必要校正后的重新学习时间。

D L-WL 或 L-WLk 的差值,视具体情况而定——即,在重新学习时所节省的功

Q 这一节省的功与首次学习所需时间的关系,以百分比形式给出。在计算该商值时,我只考虑了实际的学习时间,即已将背诵时间减去。[4]

后者(即两次背诵时间)对于 8 个 13 音节的序列,被估计为 85 秒;这相当于每个音节耗时 0.41 秒(见第 15 节)。

因此,Q = (100 * D) / (L - 85)

最后,A, B, C 代表前文提及的一天中的不同时段:上午 10-11 点,上午 11-12 点,下午 6-8 点。

粗略一瞥上表中的数字,便可发现,对于每一个时间间隔,在重新学习序列时所显现出的节省功,其数值都波动极大。(每一次的节省功,都是衡量在该间隔末期所保持的记忆量的指标。)这一点在绝对值(D)上尤其明显,但在相对值(Q)上也是如此。这些结果取自早期实验阶段,并受到了一些干扰性影响,而这些影响正是我通过测试本身才首次注意到的。

然而,尽管在细节上存在种种不规律,但从整体上看,这些数据以令人满意的确定性,组合成了一幅和谐的图景。作为证明,节省功的绝对值(D)价值较小。后者明显依赖于一天中的时段——,依赖于初次学习时间因时段不同而产生的变化。当初学时间最长时(C 时段),D 值也最大;对于 B 时段,在四分之三的案例中,D 值也大于 A 时段(在乘以 4/3 进行标准化后)。另一方面,我们计算出的相对节省率(Q)——即每次节省的功与最初所耗费时间的比率——显然几乎不受这种时段效应的影响。对于一天中的所有三个时段,它们的平均值都彼此接近,并且并未在较晚时段表现出任何规律性的增减特征。因此,我将后者(即 Q 值)汇总列表如下。

第 29 节. 结果的讨论

  1. 很可能会有人声称,「遗忘过程在开始时非常迅速,而在末期则非常缓慢」这一事实本应是可预见的。然而,当我们看到这种初期的迅速和后期的缓慢,在我们实验的特定条件下、对于某个特定个体、以及对于一个 13 音节的序列而清晰地显现出来时,我们同样有理由为之感到惊讶。在学习结束一小时后,遗忘已经进行得如此之深,以至于需要耗费相当于原始学习一半的功,才能将序列再次再现;8 小时后,需要弥补的功已达到初次努力的三分之二。然而,渐渐地,这个过程变得越来越慢,以至于即便在相当长的时间段之后,额外的损失也只能被困难地确定。24 小时后,大约三分之一的记忆效果总能被保持;6 天后,大约四分之一;而在整整一个月后,初次学习效果的五分之一仍然有效。在后期的这些时间间隔里,这种后效的衰减显然是如此之慢,以至于可以轻易地预见,如果任其自然发展,这些序列初次学习的效果要完全消失,恐怕需要无限长的时间。
  2. 在这些结果中,最不令人满意的是第三个和第四个数值之间的差异,尤其是当它与第四和第五个数值之间更大的差异联系起来看时。数据显示,在 9-24 小时间隔内,后效的衰减为 2.5%。而在 24-48 小时间隔内,衰减则为 6.1%;也就是说,在后一个 24 小时内的遗忘量,大约是前一个15小时内的三倍。这种情况是难以置信的,因为在所有其他数据点上,后效的衰减都随着时间的增加而显著减缓。即便是考虑到一个貌似合理的假设——即夜晚和睡眠(它们在 15 小时间隔中占比较大,而在 24 小时间隔中占比较小)会相当大地延缓后效的衰减——也无法使这一结果变得可信。 因此,我们必须假定,这三个数值中的某一个受到了偶然影响的极大干扰。如果我们将 24 小时后重学所得的 33.7% 这个数值视为偏大,并假定在更精确的重复测试中它会小 1 到 2 个百分点,这将与其他观察结果相当吻合。然而,它又得到了我即将陈述的其他观察结果的支持,所以我对此也存有疑虑。
  3. 考虑到我们这些数值结果的特殊性、个体性和不确定性,没有人会期望立刻从中揭示出什么「定律」。然而,值得注意的是,所有这七个覆盖了从三分之一小时到 31 天(即从 1 倍到 2000多倍的时间跨度)的数值,都可以被一个相当简单的数学公式以尚可的近似度来拟合。我定义:

t 为时间,从学习结束前一分钟算起(单位:分钟),

b 为重学时节省的功,即初次学习所保持下来的记忆量,以初学所需时间的百分比表示,

ck 为两个待定义的常数

那么,可以写出如下公式:

b = 100k / ((log t)^c + k)

使用常用对数,并仅进行近似估算(不涉及最小二乘法的精确计算),可得:

k = 1.84

c = 1.25

于是,结果如下:

计算值与观测值的偏差仅在第二个和第四个数据点上超过了可能的误差范围。关于后者,我已表达过猜想,即该次测试可能给出了一个过大的数值;而前者则受到所做校正的不确定性的影响。通过对t的这种定义,该公式的优点在于,它在学习停止的那一刻(t=1, log t=0)同样有效,并能正确地给出 b=100。在序列刚好能被背诵的那一刻,重新学习自然不需要时间,因此节省的功等于付出的功。

将公式对 k 求解,我们得到:

k = b(log t)^c / (100 - b)

这个表达式,100-b,即节省的功的补数,无非就是重新学习所需的功,也就是从初次学习中遗忘的量。称之为 v,便可得到如下的简单关系:

b / v = k / (log t)^c

用语言来表述:当每个包含 13 个音节的无意义序列被记忆并在不同间隔后重新学习时,保持的量(b)与遗忘的量(v)的商,大约与那些时间间隔的对数的一个小次幂成反比。更简短、不那么精确地表述:保持量与遗忘量的比值,与时间的对数成反比。

当然,这一陈述及其所依据的公式,在此处除了作为对上述在特定条件下仅获得一次的结果的简便记述外,别无他值。它们是否具有更普遍的意义,以至于在其他条件下或对其他个体,能够通过不同的常数来表达,我目前尚不能断言。

第 30 节. 控制性检验

无论如何,即便只是对我个人的情况,我仍能在一定程度上,通过在其他时期进行的测试,为上述数值中的两个提供支持。

从一个比上述研究更早的时期,我拥有几次用 10 音节序列进行的测试,每次测试由 15 个序列组成。这些序列首先被记忆,然后在初次学习后平均18分钟,每个序列被重新学习。六次测试的结果如下:

在初次记忆 18 分钟后重新学习 10 音节的序列时,节省了相当于最初所耗费的功的 56%。这个数字与前文(第 28 节)中为 13 音节序列在 19 分钟后重学所得到的数值(58%)令人满意地吻合。并且,后者尽管间隔时间更长,其保持率却仍然稍高一些,这一事实,正如我们将看到的,与下一章的结果完全协调。根据那些结果,较短的序列在记忆后,会比较长的序列遗忘得稍快一些。

从 1883-84 年时期,我有七次测试,包含 9 个 12 音节的序列,它们在初次记忆 24 小时后被重新学习。获得了如下结果:

在 24 小时后仍然可观的初次记忆的后效,在这里相当于节省了初次功耗的 33.4%。这个数字也与前文为 13 音节序列在 24 小时后重学所报告的数值(33.7%)令人满意地吻合,尽管这两个数据是在相隔遥远的时间段、并且在迥然不同的研究过程中获得的。


脚注

[1] 这是亚里士多德的观点,至今仍对许多人具有权威性。例如,德尔伯夫最近便重拾此说,并用以补充其「感受性通论」。在他的文章 Le sommeil et les rêvesRev. Philos. IX, p. 153 f.)中,他说道:「我们现在看到,依据一条普遍的法则,每一次感觉、思想或意志的行为,都会在我们身上留下或深或浅但不可磨灭的印记;这种印记通常铭刻于无数先前的痕迹之上,而后又被无数其他各种性质的线条所覆盖,但尽管如此,其字迹仍有可能无限清晰生动地重现于世。」(括号内为原文提供的英译:我们现在看到,根据一条普遍的法则,每一个感觉、思想或意志的行为都在我们心中留下或多或少深刻但不可磨灭的印记,这种印记通常刻在无数先前的痕迹之上,后来又被无数其他的痕迹所覆盖,但仍然能够以生动清晰的面貌重现。)诚然,他接着写道:「然而……有一种观点认为记忆不仅会疲劳,而且会消失,此说亦有几分道理」,但他用「一种记忆可能会阻碍另一种记忆出现」的理论来解释这一点。「如果一个回忆并未真正驱逐另一个,至少可以主张一个回忆阻碍了另一个,因此对每个个体的大脑而言,是存在饱和的。」

至于贝恩等人提出的「每个观念都寄居于一个独立的神经节细胞」这一奇特理论——一个在心理学和生理学上都不可能的假说——在某种程度上也植根于亚里士多德的观点。

[2] 赫尔巴特及其学派的观点。例如,参见 Waitz, Leehrbuch der Psychologie Sect. 16

[3] Lotze, Metaphysik (1879), p. 521; also Mikrokosoms (3) I, p. 231 ff.

[4] 对所求得的差值(D)和商值(Q)的或然误差进行理论上正确的测定,将是一件非常困难和麻烦的工作。这项工作必须以直接观测到的 L 值和 WL 值为基础。但是,误差理论的常规法则并不能应用于这些数值,因为这些法则仅对彼此独立获得的观测值有效,而 L 和 WL 却是内在关联的,因为它们都源自同一个序列。误差的来源之一,「序列的难度」,对于每一对 L 和 WL 值而言,其变化方式是相同的,而非随机的。因此,我在此将一个序列的初次学习和重新学习过程视为一次单一的测试,并将由此产生的 D 或 Q(视情况而定)作为这次测试的数值代表。然后,我便像处理直接观测值一样,从这些独立计算出的 D 值和 Q 值中,计算出它们的或然误差。对于近似地评估这些数值的可靠性而言,这样做是足够的。


上一章:第六章 保持作为重复次数的函数

下一章:第八章 保持作为重复学习的函数