第三章 研究方法
AI 导读
本章详细阐述了艾宾浩斯为将记忆研究转变为一门精确科学而设计的具体实验方法。其核心在于通过严格控制变量和量化测量来研究纯粹的记忆过程。
文章的框架和关键点如下:
一、实验材料:无意义音节
- 是什么:艾宾浩斯创造了约 2300 个由「辅音-元音-辅音」构成的无意义音节(如 ZOF, KEX, QAJ)。他将这些音节随机组合成不同长度的列表作为记忆材料。
- 为什么:这是整个方法论的基石。无意义音节的最大优点在于消除了预设含义、情感和联想。与诗歌或散文不同,它能最大限度地减少被试者已有知识的干扰,从而更纯粹地测试记忆形成这一机械过程。同时,这种材料可以无限量生成,且易于量化(如精确控制列表长度)。
二、实验过程:建立恒定的条件
为了确保每次实验的可比性,艾宾浩斯制定了一套极其严格的规则来控制内外部环境:
- 标准化的学习方式:以恒定速率(每分钟 150 次)和固定节奏朗读整个列表,不允许跳跃或只专注于难点。
- 排除助记技巧:严禁使用任何记忆「窍门」,完全依赖纯粹的重复。
- 稳定的身心状态:在固定的时间段进行实验,排除外界干扰,并尽量保持生活作息规律,以确保被试(即艾宾浩斯本人)的注意力、情绪和生理状态尽可能一致。
三、测量方法:量化「记忆功」
- 如何测量: 通过记录学习一个列表直至能首次完美背诵所需的重复次数或总耗时,将「记忆付出的努力」转化为一个具体的、可比较的数值。
四、误差来源:承认方法的局限性
艾宾浩斯坦诚地指出了该方法无法完全克服的两个主要问题:
- 「掌握」瞬间的波动性:「首次完美背诵」并非一个绝对稳固的记忆水平。有时是靠运气「侥幸成功」,有时则因注意力不集中而延迟,这给数据带来了噪音。
- 实验者偏见:由于实验者和被试是同一个人,艾宾浩斯自己的预期和假设可能会无意识地影响他的表现(比如,当他预感结果会很好时,可能会更努力一点),从而潜在地扭曲数据。
结论:本章介绍了一种开创性的研究范式,它通过使用标准化的无意义材料、严格的程序控制和可量化的结果测量,试图将心理学研究提升到自然科学的严谨水平,尽管艾宾浩斯也清醒地认识到其固有的局限性。
第 11 节. 无意义音节序列
为了在实践中检验一种能更深入地探究记忆过程的方法——我们前面的全部思考都是为此服务的——尽管这只是在一个有限的领域内进行,我构想出了如下的研究方法。
利用字母表中的简单辅音以及我们语言中的十一个元音和双元音,我构建出了所有可能的、由一个元音置于两个辅音之间的特定类型的音节。[1]
这些音节总数约 2300 个,我将它们混合在一起,然后随机抽取,用以构建不同长度的序列。每次实验都以若干个这样的序列作为测试材料。[2]
起初,为了避免在构建音节时出现过于邻近的相似读音,我遵循了几条规则,但并未严格遵守。后来,我干脆放弃了这些规则,将一切交由随机决定。每次使用过的音节都会被仔细地放置一旁,直到所有音节都被用过一遍,然后才将它们重新混合使用。
运用这些音节序列进行测试的目标是,通过反复地出声诵读单个序列,将其牢牢印在脑中,以便在诵读结束后能立刻主动地再现它们。当给出首个音节后,测试者能够在第一次尝试时,便毫不犹豫地、以特定的速率、并且在确信自己完全正确的意识下将整个序列背诵出来时,这个目标就被视为达成。
第 12 节. 这种材料的优点
前述的无意义材料,恰恰因其「无意义」而具备了诸多优点。首先,它相对简单且相对同质。与我们手边最易获取的材料——即诗歌或散文——相比,后者的内容时而叙事,时而写景,时而议论;其文句时而激昂,时而诙谐;其比喻时而优美,时而生硬;其节奏时而流畅,时而滞涩。因此,这会引入大量无规律变化的干扰因素,例如各种纷至沓来的联想、不同程度的兴趣,以及因某些诗句的突出或优美而格外容易被记起等等。而使用我们的音节,则可以避免所有这些问题。在成千上万的组合中,几乎没有几十个是具有明确意义的,而在这些有意义的组合中,又只有极少数的意义在记忆过程中被意识到了。
然而,我们绝不能高估这种材料的简单性和同质性。它远未达到理想状态。学习这些音节需要同时调用视觉、听觉以及言语器官的肌肉感觉这三个感觉领域。尽管每个感觉领域所扮演的角色界限分明且性质上总保持一致,但由于它们的协同作用,我们仍必须预料到实验结果会存在一定的复杂性。再具体说来,这些音节序列的同质性,也远未达到人们可能期望的程度。在学习的难易程度上,这些序列表现出极为显著且几乎令人费解的差异。从这个角度看,有意义材料与无意义材料之间的差异,似乎远不像人们先验地想象的那么巨大。至少,当我自己背诵拜伦《唐璜》的几个诗章时,所获得的各项数值测量结果的分布范围,并不比学习一组耗时大致相等的无意义音节序列时更大。在前一种情况下,前面提到的无数干扰性影响似乎相互抵消,从而产生了一种中间水平的效应;而在后一种情况下,由于母语的影响,个体对某些字母和音节组合的熟悉程度必然是千差万别的。
而在另外两方面,我们材料的优势则更为确定无疑。首先,它允许我们无穷无尽地创造出性质完全同质的新组合,而不同的诗歌或散文片段总有其不可比拟之处。其次,它使得进行充分且明确的定量变化成为可能;相比之下,在诗句或句子的中间截断或从中间开始,会因各种不可避免的意义干扰而导致新的复杂性。
我也曾尝试过使用数字序列,但对于更深入的测试而言,它们显得并不实用。其基本元素的数量太少,因此很快便会穷尽。
第 13 节. 建立尽可能恒定的实验条件
为保证记忆过程的稳定,我制定了以下规则。
- 每次朗读都必须将单个序列从头到尾完整读完;决不能将序列分段学习,然后再拼接起来;也决不能将特别困难的部分单独拿出来增加重复次数。在朗读和偶尔必要地检验自己能否凭记忆再现之间,可以完全自由地切换。对于后者,有一条重要规则:一旦出现犹豫,就必须将序列的剩余部分通读完毕,然后才能重新开始尝试。
- 序列的朗读和背诵均以恒定的速率进行,即每分钟 150 次敲击。起初,我使用一个放置在稍远处的发条节拍器来调节速率;但很快就改用手表的滴答声代替,因为后者更为简单,对注意力的干扰也更小。大多数手表的擒纵机构每分钟摆动 300 次。
- 由于持续说话时完全不带重音的变化在实践中是不可能的,为避免不规则的重音变化,我采用了以下方法:将三个或四个音节组合成一个音步,从而在第 1、4、7……个音节,或第 1、5、9……个音节上施以轻微的重音。除此之外,尽可能避免了任何其他的语音强调。
- 每学习完一个序列,都停顿 15 秒,用于记录结果。之后,立即开始同一组测试中的下一个序列。
- 在学习过程中,尽可能地将「尽快达成目标」的意图保持在心中。因此,在有意识的决心所能影响的有限范围内,我努力将注意力集中于这项枯燥的任务及其目标之上。不言而喻,为保证这一目标的实现,我注意排除了所有外部干扰。在不同环境中进行测试所可能导致的较小分心,也尽可能地被避免了。
- 我没有尝试通过发明特殊的、助记术(mnemotechnik) [原文如此] 类型的联想来串联这些无意义音节;学习过程完全依赖于纯粹的重复对自然记忆所产生的影响。由于我本人对各种助记技巧毫无实践知识,因此遵守这一条件对我而言毫无困难。
- 最后,也是最重要的一点,我注意控制测试期间的客观生活条件,以消除过大的变动或不规律性。当然,由于测试前后持续了数月之久,这一点只在有限的程度上是可能的。但即便如此,对于那些结果需要直接进行比较的测试,我仍努力在尽可能相似的生活条件下进行。特别是,实验前所从事的活动也尽可能保持性质上的一致。由于人的心理及生理状态都受到明显的24小时周期的影响,因此,一个不言自明的前提是,相似的实验条件只有在一天中的相同时段才能获得。然而,为了能在一天内进行多次测试,有时我也会在一天中的不同时段同时进行不同的实验。当外部和内部生活发生过大变化时,测试便会中断一段时间。在重新开始测试之前,会根据中断时间的长短,进行为期数天的适应性训练。
第 14 节. 误差的来源
在选择材料和确定其使用规则时,我们的指导观点显而易见,即试图尽可能地简化和恒定化那些被观察的活动——记忆——所赖以发挥作用的条件。自然,一个人在这方面越是成功,他就越是脱离了这种活动在日常生活中所处的、并因此而对我们具有重要意义的复杂多变的条件。但这并不能构成对这种方法的反驳。物理学所研究的自由落体、无摩擦机器等,与自然界中对我们至关重要的实际现象相比,同样也只是抽象的模型。我们几乎无法在任何地方直接洞悉复杂与真实的现实,而必须通过迂回的方式,通过对一系列经验的连续组合来逼近它们,而这些经验中的每一种,都是在人为的、实验性的情境下获得的——自然界很少,甚至从未以这种形式提供给我们。
然而,暂时与日常生活的记忆活动失去联系这一事实,其重要性远不如其反面,即:这种与生活的复杂性和波动性的联系,必然地仍然过于紧密。在诸多方面,我们为争取达到最简单和最统一条件的努力,自然会遇到植根于事物本质的障碍,这些障碍使我们的尝试受挫。材料不可避免的差异性,以及外部条件同样不可避免的不规律性,前文已经提及。接下来我将阐述另外两个无法克服的(unsurmountable)[原文如此]困难来源。
通过连续的重复,我们所学习的序列,可以说,被提升到了越来越高的水平。一个自然的假设是,当它们能够首次被凭记忆再现时,所达到的水平应当总是相同的。如果情况果真如此,即,如果这种标志性的「首次再现」在任何情况下都是一个不变的客观标志,代表着一种同样不变的记忆稳固度,那么它对我们将具有真正的价值。然而,事实并非如此。在首次可能再现的时刻,各个序列的内在条件并非总是相同,我们最多只能假定,对于不同的序列,这些条件总是围绕着相同程度的内在确定性而上下振荡。如果我们继续学习和重复一个序列,即便是在已经达到首次自发再现之后,这一点就会看得非常清楚。通常情况下,主动再现的能力一旦获得便会持续存在。但在许多情况下,它会在首次出现后立即消失,只有经过数次额外的重复才能重新获得。这证明,记忆序列的心理准备状态,即便不考虑那些因一天中的时段、主客观条件等因素造成的较大差异,其本身也会受到一些持续时间很短的微小变化的影响,无论我们称之为注意力的振荡还是别的什么。如果在待记忆材料几乎达到所需的确定程度的那一刻,恰好出现一个精神格外清晰的瞬间,那么这个序列就会被「凌空捕获」,常常令学习者本人也感到惊讶;但这个序列并不能被长久保持。反之,如果恰好出现一个精神特别迟钝的瞬间,那么首次无差错的再现就会被推迟片刻,尽管学习者感觉自己实际上已经掌握了它,并对自己不断出现的犹豫感到困惑。在前一种情况下,尽管外部条件同质,首次无差错的再现所达到的水平,会略低于正常情况下与其关联的保持水平。在后一种情况下,则会略高于那个水平。如前所述,在这方面最合理的推测是,在大规模的组别中,这些偏差将会相互抵消。
关于另一个误差来源,我只能说它可能会发生,并且一旦发生,便是一个巨大的危险来源。我指的是那些正在形成中的理论和见解所产生的潜在影响。一项研究通常始于对结果将会如何的明确预设。即便开始时没有,如果实验者必须独自工作,这种预设也会逐渐形成。因为,不可能长时间地进行研究而不关注其结果。实验者必须知道研究问题是否被恰当地提出,是否需要补充或修正。必须控制结果的波动,以便单个观测能够持续足够长的时间,从而赋予平均值以研究目的所需的确定性。因此,在观察了数值结果之后,不可避免地会产生一些关于隐藏在数据背后的一般规律的假设,而这些规律偶尔会显露出其存在的蛛丝马迹。随着研究的深入,这些假设,连同最初就存在的那些预设,共同构成了一个复杂的因素,很可能对后续的结果产生明确的影响。不言而喻,我所指的并非任何有意识地认知到的影响,而是类似于这样一种情况:当一个人试图表现得非常不偏不倚,或试图摆脱某个念头时,恰恰是这种努力本身,反而强化了那个念头或偏见。我们带着一种预期的知识,一种期待,去「迎接」实验结果。仅仅是实验者对自己说,绝不能让这种预期改变研究的公正性,这本身并不能带来预期的效果。恰恰相反,这些预期依然存在,并在决定我们整个内在态度方面扮演着一个角色。根据被试注意到这些预期是否得到证实(通常在学习过程中他就会注意到这一点),他会——即便只是在轻微的程度上——感受到一种愉悦或惊讶。难道我们不该预料到,尽管怀着最大的良知,被试对于那些特别惊人的偏差(无论是正面的还是负面的)所感到的惊讶,会在他没有任何意愿的情况下,导致其态度的微小改变吗?难道他不会因此在这里多用几分力,在那里又多放松几分,从而与他若对结果的可能数值一无所知或毫无预设的情况有所不同吗?我无法断言这种情况总是或甚至经常发生,因为我们在此讨论的并非可被直接观察的事物,并且在许多可能预见到这种秘密的真相扭曲的结果中,也显示出明显的独立性。我只能说,基于我们对人性的普遍了解,我们必须预料到这类事情的发生,并且在任何内在态度至关重要的研究中——例如在感觉知觉的实验中——我们必须特别警惕其误导性影响。
这种影响通常如何显现是显而易见的。对于平均值,它会倾向于拉平极端值;在预期出现极大或极小数值时,它会倾向于进一步增大或减小这些数值。只有当测试由两人合作进行时,才能确定地避免这种影响,其中一人在一段时间内担任被试,而不提出任何关于研究目的或结果的问题。否则,只能通过迂回的方法来补救,而且很可能只是在有限的程度上。被试可以——像我自己一直做的那样——尽可能长时间地向自己隐瞒确切的结果。研究可以扩展到所讨论变量的上限,通过这种方式,任何对真相的扭曲都会变得相对更加困难和不重要。最后,被试可以提出许多看似相互独立的问题,以期通过这种方式,让那些相互关联的心理过程的真实关系自行显露出来。
前述的误差来源在多大程度上影响了下文给出的结果,自然无法精确地确定。数字的绝对值无疑会经常受到它们的影响,但由于这些测试的目的从来不可能是精确地测定绝对值,而是旨在获得比较性的结果(尤其是在数值意义上)以及相对更为普遍的规律,因此没有理由过分忧虑。在一个重要的案例中(第 38 节),我能够直接确信,排除所有关于结果性质的知识并未带来任何改变;在另一个我自己无法消除疑虑的案例中,我已特别提请读者注意。无论如何,那些先验地倾向于高度估计潜在愿望对整体心理态度的无意识影响的人,也必须考虑到:那种探求客观真理,而不是以不成比例的辛劳将自己想象的创造物建立在泥足之上的潜在愿望——我说,这种愿望,在这些可能影响的复杂机制中,也同样可以占有一席之地。
第 15 节. 所需功的测量
为将一个序列记忆至首次可能再现所必需的重复次数,我最初并非通过直接计数来确定,而是间接地通过测量记忆它所需的时间(以秒为单位)。我的目的在于,通过这种方式来避免计数行为本身所必然带来的分心;并且我可以假定,在特定的节奏下,所花费的时间与重复的次数之间存在着一种比例关系。我们几乎不能期望这种比例性是完美的,因为当只测量时间时,那些犹豫和思考的瞬间也被计入其中,而当计数重复次数时则不然。对于那些犹豫发生得相对更频繁的困难序列,计时法会得出相对更大的数值;而对于较容易的序列,则会得出相对更小的数值,这与计数法的结果会有所不同。但是,对于较大规模的序列组,我们可以理所当然地认为,困难与容易的序列会呈现出一种大致均匀的分布。因此,在每个组别中,与比例性的偏差会以类似的方式相互抵消。
当为了某些测试,直接计数重复次数变得必要时,我采用了如下方式。我将一些直径约 14 毫米、最厚处 4 毫米的小木制纽扣串在一根绳子上,这根绳子既能让纽扣轻松移动,又足够重以防止意外滑动。每第十个纽扣是黑色的,其余的则保持原色。在记忆过程中,我将绳子握在手中,每进行一次新的重复,便将一个纽扣从左向右移动几厘米。当序列能够背诵出来时,只需瞥一眼这串以十为单位分组的绳子,便足以确定所需的重复次数。这种操作几乎不占用注意力,以至于在使用时间(这个数据总被同时记录)的平均值中,与早期的测试相比,并未观察到任何延长。
通过这种对时间和重复次数的同时测量,我获得了一个偶然的机会,来验证和更精确地界定我先前已预见到并刚刚解释过的、关于它们二者相互关系的问题。当每分钟 150 次敲击的规定节奏被精确维持时,每个音节应耗时 0.4 秒;而当纯粹的朗读被尝试凭记忆背诵的行为打断时,不可避免的犹豫会使总时间延长,延长的量虽小但应相当一致。然而,事实并非如此精确;恰恰相反,出现了如下的修正情况。
当直接朗读序列占主导时,会出现一种无意识的驱动,一种节奏的加速,这使得每个音节的平均耗时低于 0.4 秒的标准。
然而,当朗读与背诵交替进行时,时间的延长通常并非恒定,而是随着序列变长而增加。在这种情况下,由于困难度随着序列长度的增加而迅速增加,便会出现一种节奏的放缓,这同样是无意识且不被直接察觉的。下表展示了这两种情况。
一旦我注意到这种偏离精确比例性的趋势,我在学习中便会产生一种有意识的对抗反应。
最后,结果表明,计时法的或然误差要略大于计数法。鉴于上述解释,这种关系是完全可以理解的。在计时法中,那些自然出现在较困难序列中的较大数值,其相对值会比计数法中的更大一些,因为它们大多被犹豫的时间所延长了;反之,较小的时间值,其相对值必然会比重复次数的数值更小一些,因为它们通常对应于较容易的序列。因此,计时法所得数值的分布范围要比计数法更广。
两种计算方法之间的差异,如我们轻易可见,是足够大的,以至于在追求高度精确性的研究中可能导致不同的结果。然而,在我迄今获得的结果中,情况并非如此;因此,无论是使用秒数还是重复次数,都无关紧要。
哪种测量方法更正确——即,更能充分地衡量所付出的心理功——是无法先验地做出决定的。一方面,可以说印象完全源于重复,重复才是关键;可以说,一次犹豫的重复与一次简单流畅的再现同样有价值,两者都应被同等计数。但另一方面,我们也有理由怀疑,那些回忆的瞬间是否纯粹是一种时间上的损失。在任何情况下,在这些瞬间都发生了一定的能量展示:一方面,学习者会非常迅速地对紧邻的前面几个词进行额外的回忆,可以说是一次新的启动,以克服犹豫的停顿;另一方面,对后续段落的注意力也会提高。如果伴随这个过程,如很可能的那样,序列的记忆得到了进一步的巩固,那么这些瞬间就有理由被纳入考量,而这只有通过计时法才能做到。
只有当两种制表方法的结果出现显著差异时,我们才有必要在两者之间做出取舍。届时,我们将选择那种能够使所讨论的结果得到更简洁表述的方法。
第 16 节. 测试的时期
我的测试分两个时期进行,分别在 1879-80 年和 1883-84 年,每个时期都持续了一年以上。在第一个时期的正式测试之前,已经进行了很长一段时间类似性质的初步实验,因此,对于本文报告的所有结果,都可以认为技能的增长期已经过去。在第二个时期的开始,我也谨慎地进行了重新的适应性训练。这种将测试分布在两个时间段,并间隔超过三年的做法,为大多数结果提供了一种理想的相互检验的可能性。坦率地说,这两个时期的测试并非严格可比。在第一个时期的测试中,为了限制在特别专注的瞬间对序列「第一次短暂把握」[3]的重要性,我曾决定将序列学习至能够连续两次无误再现为止。后来我放弃了这种方法,因为它只能不完全地达到其目的,并转而坚持以第一次流畅的再现为标准。显然,早先的方法在许多情况下导致了稍长的学习时间。此外,为测试指定的每日时段也有所不同。后一期的测试全部在下午 1-3 点之间进行;而前一期的测试则不均匀地分布在上午 10-11 点、上午 11-12 点以及下午 6-8 点这几个时段,为简便起见,我将它们分别称为 A、B、C 时段。
脚注
[1] 元音是 a, e, i, o, u, ä, ö, ü, au, ei, eu. 辅音是 b, d, f, g, h, j, k, 1, m, n, p, r, s, (= ss), t, w, z, ch, sch, soft s, ng. K, j, z 在词首的位置上被省略了; ch, sch, ss, ng 在词首的位置上也没有出现,它们被认为是简单的辅音。
[2] 这些系列被写在可移动的纸条上,每张纸条都放在一个特殊的架子上,这个架子可以旋转,一次只露出一个音节。
[3] 在第 14 节中描述。
下一章:第四章 所获平均值的效用