第二章 扩展我们关于记忆知识的可能性
AI 导读
这篇文章提出了一个革命性的方法,旨在将记忆研究从模糊的哲学思辨转变为一门可量化的、精确的实验科学,其严谨性可媲美自然科学。
文章的核心框架是识别并解决在心理学研究中应用科学方法所面临的两大根本困难:
一、控制问题:如何保持实验条件恒定?
- 困难:人的心理状态(如注意力、兴趣、情绪)变幻莫测,似乎无法为科学实验创造一个稳定、可控的环境。
- 艾宾浩斯的解决方案:
- 简化:通过选择中性、无趣的实验材料(如无意义音节)和排除外部干扰,可以最大限度地减少兴趣和注意力的波动。
- 验证:真正的关键在于如何验证条件是否「足够恒定」。艾宾浩斯提出使用统计学工具——「误差定律」(即正态分布/钟形曲线)。如果多次实验的结果(例如,每次学习所需的重复次数)的分布符合这条曲线,就极有可能说明我们正在测量一个单一、稳定的心理过程,而不是一堆混乱、随机的心理活动。
二、测量问题:如何对记忆进行数值测量?
- 困难:记忆似乎是一种「有或无」的现象——你要么记得,要么不记得,这很难量化。
- 艾宾浩斯的解决方案:
- 间接测量(节省法):艾宾浩斯提出了一个巧妙的间接测量方法。我们不直接测量「还剩下多少记忆」,而是测量「重新学习时节省了多少精力」。
- 具体操作:先记录学会某项内容(如一串词语)所需的重复次数。等待一段时间让其被遗忘后,再重新学习至同样的熟练程度。第二次学习所需的重复次数会更少。这两次数之间的差额或节省的比例,就成为了一个精确的、可量化的记忆保持度的指标。
结论:通过将 「节省法」 作为一种可量化的测量工具,并用 「误差定律」 来验证实验条件的稳定性,艾宾浩斯认为已经为建立一门真正的记忆科学铺平了道路。这使得研究者能够首次以精确的数学关系来描述诸如「重复次数与记忆强度的关系」或「时间与遗忘速度的关系」等问题,将心理学从定性描述推向了定量分析。
第 4 节. 自然科学的方法
获得因果关系内在结构的精确测量——即,数值上的精确测量——的方法,就其本质而言,具有普遍有效性。诚然,这种方法已被自然科学如此排他性地运用并发展得如此完备,以至于通常它被定义为自然科学所特有的东西,即自然科学的那种方法。然而,重申一下,它的逻辑本质使其普遍适用于所有存在和现象的领域。此外,能否准确和精确地界定任何过程的实际行为,并由此为直接理解其关联性提供可靠的基础,首先取决于应用这种方法的可能性。
我们都清楚这种方法包含什么:研究者试图保持那些已被证明与某一特定结果存在因果联系的庞杂条件群保持恒定;从中分离出一个条件,并以一种可进行数值描述的方式加以变化;然后通过测量或计算,确定效应方面所伴随的变化。
然而,似乎有两个根本性且不可逾越的困难,阻碍着将这种方法转移到普遍的心理事件的因果关系研究,特别是记忆的因果关系研究中。首先,我们如何才能近似地保持那些令人困惑的巨量因果条件恒定?这些条件,就其心理性质而言,几乎完全逃脱我们的控制,并且它们还持续不断地处于永无休止的变化之中。其次,我们能用什么可能的方法对那些转瞬即逝、通过内省又如此难以分析的心理过程进行数值测量?我将首先讨论第二个困难,当然,鉴于这是我们当前的关注点,我们将结合记忆来讨论。
第 5 节. 为记忆内容引入数值测量
如果我们再次审视上文提及的保持和再现的条件(第 2 节),但现在从可计算性的角度来看待,我们将发现,至少其中两个条件,可以进行数值上的确定和变化。一系列观念的首次形成和再现之间流逝的不同时间可以被测量,并且使这些序列可再现所需的重复次数可以被计数。然而,乍看之下,在效应这一端似乎并没有类似的可量测指标。这里似乎只有一种二元选择:再现要么可能,要么不可能。它发生或不发生。当然,我们假定它在不同条件下可能或多或少地接近实际发生,因此在其潜意识的持续存在中,该观念序列具有分级差异。但只要我们将观察局限于那些偶然地或应我们意志召唤而从这一内在领域浮现出来的事物,所有这些潜在的差异对我们来说都是同样不存在的。
然而,通过稍微减少对内省的依赖,我们可以通过间接手段迫使这些差异显现出来。例如,一首诗被背诵下来,然后不再重复。我们假设半年后它已被遗忘:任何回忆的努力都无法将其再次召回意识。充其量只有零星的片段出现。这时,假设这首诗再次被背诵。事实显而易见:尽管它表面上已被彻底遗忘,但在某种意义上它仍然存在,并以一种有效的方式存在。第二次学习所需的时间或重复次数明显少于第一次。它所需的时间或重复次数也少于现在学习一首相同长度的类似诗歌所必需的时间或重复次数。在这种时间和重复次数的差异中,我们显然获得了某种衡量标准,衡量半年后仍存在于构成这首诗的有序观念复合体中的那种内在能量。在更短的时间后,我们预期会发现这种差异更大;在更长的时间后,我们预期会发现差异更小。如果第一次记忆是经过非常仔细和长时间持续的,那么差异将大于如果它是散漫且很快放弃的。
简而言之,毫无疑问,在这些差异中,我们拥有了这些潜意识持续存在的观念序列之间差异的数值表达,否则这些差异我们只能默认其存在,而无法通过直接观察来证明。因此,我们获得了一些至少类似于我们在尝试为应用自然科学方法取得立足点时所寻求的东西:即,在效应方面是清楚可确定、随条件变化而变化、且能够进行数值测定的现象。至于我们是否拥有正确的量度来衡量这些内在差异,以及我们是否可以通过它们获得关于这种隐藏的心理生活所进入的因果关系的正确概念——这些问题不能先验地回答。化学也同样无法先验地确定,到底是电现象、热现象,还是化学结合过程的其他伴随现象,为其提供了衡量化学亲和力有效作用的正确量度。要回答这个问题,只有一种方法,那就是看是否有可能在假设这种假说正确的前提下,获得分类良好、不矛盾的结果,以及对未来的正确预测。
因此,我打算从实验的角度,考虑一个更复杂的过程作为效应,而不是那种不容许数值区分的简单现象——再现的发生或不发生——我将观察和测量其变化,随着条件的变化。我指的是通过适当次数的重复,人为地引发一种原本不会自行发生的再现。
但要实现这一实验方法,至少必须满足两个条件。
首先,必须能够以某种确定性界定达到目标的那一刻——即,背诵过程完成的时刻。因为如果背诵过程有时超过了那一刻,有时又在那一刻之前中断,那么在不同情况下发现的部分差异将归因于这种不同,将其完全归因于观念系列的内在差异将是不正确的。因此,在记忆一首诗的过程中出现的不同再现中,实验者必须挑出一个作为特别具有代表性的,并能够以实际的准确性再次找到它。
其次,必须允许这个前提假设:在其他条件不变的情况下,通过重复次数来实现这种特征性再现的重复次数,每次都是相同的。因为如果这个数字,在其他条件等同的情况下,时而是这个,时而是那个,那么由变化的条件产生的差异,当然就会失去对批判性评估那些变化条件的全部意义。
现在,就第一个条件而言,在任何可以恰当地称为背诵(如诗歌、词语序列、音调序列等)的情况下,它很容易满足。在这里,一般来说,随着重复次数的增加,再现最初是零散和停顿的;然后它获得确定性;最终流畅且没有错误地发生。出现最后结果的第一次再现不仅可以被选出作为特别具有代表性的,而且可以在实践中被识别出来。为方便起见,我将简要地将其指定为第一次可能的再现。
现在的问题是:——这是否满足了上面提到的第二个条件?在其他条件等同的情况下,实现这种再现所需的重复次数总是相同的吗?
然而,以这种形式提出的问题,将会被理所当然地拒绝,因为它将我们正在探讨的核心问题强加为一个显而易见的假设,并且只会得到一个误导性的答案。任何人都会毫不犹豫地承认,如果保持完美的实验条件对等,这种依赖关系将是相同的。至少,被频繁提及的意志自由,在这里几乎从未被任何人误解到会干扰这个关系。但这种理论上的恒定性价值不大:当我实际上被迫进行观察的环境永不相同时,我如何能找到它?因此,我宁愿问:——我能否控制那些不可避免且持续波动的环境,并将它们均衡到某种程度,使得所讨论的因果关系中假定存在的恒定性对我来说变得可见和可感知?
因此,对阻碍心理领域因果关系进行精确检验的这个困难的讨论,自然而然地将我们引向了另一个困难(第 4 节)。如果我们可以实现必要的显著条件在重复实验中的统一性,那么对因果关系相互依存的变化进行数值测定似乎确实是可能的。
第 6 节. 维持研究所需的条件恒定性的可能性
任何考察过高级心理生活的复杂过程,或从事于国家和社会等更复杂现象研究的人,通常会倾向于否认保持心理学实验条件恒定的可能性。对我们而言,最熟悉的莫过于心理生活变幻莫测的特性,它使一切预见和计算都归于无效。诸如精神活力、对课题的兴趣、注意力的集中程度,以及由突发的奇想和决心所引起的思维流向的改变等因素,它们在最高程度上具有决定性,也同样极易变化——所有这些因素,要么完全不受我们控制,要么只能在一定程度上被控制,而这种程度是无法令人满意的。
然而,在处理不同于那些高级心理过程的领域时,我们必须谨慎,切勿将由观察它们而得出的上述观点(其本身是正确的)赋予过高的权重。所有这些难以驾驭的因素,对于那些只有在特别有利的条件汇集时才会发生的高级心理过程而言,至关重要。而那些较为低等、司空见惯、且持续发生的心理过程,虽然丝毫未脱离它们的影响,但当事关重大时,我们基本上有能力使这种影响只构成轻微的干扰。例如,感觉知觉的准确性,无疑会随着兴趣程度的不同而有所差异;它也会因外部刺激和内在观念的变化而不断改变方向。但尽管如此,我们总体上仍然有足够的能力在想看一栋房子时就看到它,并且在没有发生客观变化的情况下,连续十次接收到几乎完全相同的图像。
根据普遍的共识,普通的保持与再现过程,其复杂性等级仅次于感觉知觉。因此,假定它在这方面也应表现出与感觉知觉相似的特性,这种假设本身并无任何先验的荒谬之处。然而,情况是否果真如此,我现在和过去一样要说,是无法预先断定的。我们目前的知识过于零碎、过于笼统,且绝大部分来自于对极端案例的观察,因而无法借助它就这一点得出结论;这个问题的答案,必须留待专门为此目的设计的实验来揭示。我们必须尝试以实验的方式,将那些已知或被怀疑对保持与再现有影响的环境,尽可能地保持恒定,然后去验证这样做是否足够。实验材料的选择必须能够——至少从表面上看——排除显著的兴趣差异;注意力的均等可以通过排除外部干扰来促成;突发的奇想固然无法控制,但总的来说,其干扰效应仅限于瞬间,如果实验时间足够长,其影响便会相对微不足道,诸如此类。
然而,当我们以这种方式,确实获得了我们所能达到的最大可能的条件恒定性时,我们又如何知道这种恒定性对于我们的目的而言是足够的呢?那些在敏锐的观察下无疑仍会呈现出种种差异的环境,在何时才算是足够恒定呢?答案可以是:——当重复实验时,结果保持恒定。后一种说法听起来似乎简单到不言自明,但当我们深入探究此事时,却又遇到了另一个困难。
第 7 节. 恒定的平均值
在尽可能相似的条件下重复实验所获得的结果,何时才能被视为恒定或足够恒定?是当一次实验的结果与另一次的结果数值相同时吗?或者至少偏差极小,以至于该差异相对于结果本身的量级而言,对于我们的目的来说可以忽略不计时吗?
显然不是。那样要求太高了,即便是自然科学也未必能达到。那么,或许是当来自较大规模实验组的平均值表现出上述特征时?
也显然不是。那样要求又太低了。因为,如果将从任何角度看都相似的过程的观察数据,以足够大的数量汇集起来,几乎在任何领域都能获得相当恒定的平均值,然而,这些平均值对于我们在此的目的而言,几乎没有或根本没有重要性。两根信号杆之间的精确距离、一颗恒星在特定时刻的位置、一种金属在特定温度升高下的膨胀系数——物理学和化学中的众多系数和其他常数,都是以平均值的形式呈现给我们的,这些平均值只是高度地趋近于恒定。另一方面,某个特定月份的自杀人数、某个特定地点的平均寿命、某个街角每日的车流和人流数量等等,也同样显著地恒定,它们每一个都是大量观察的平均值。但这两种数值,我暂且分别称之为自然科学常数和统计常数,正如众所周知,它们恒定的原因各不相同,对于我们理解因果关系而言,其意义也完全不同。
这些差异可以表述如下:——
就自然科学常数而言,每一个独立的效应都是由一组完全相同的成因组合所产生的。之所以每次测得的数值会略有不同,是因为这些成因中的某些因素并非总能以完全相同的数值参与到组合中(例如,仪器的校准和读数存在微小误差,所检验或使用的材料的质地或成分存在不规则性,等等)。然而,经验告诉我们,这些单个成因的波动并非完全无规律,而是通常在一个有限且相对狭小的数值范围内,围绕一个中心值对称地进行。如果将多个案例汇集起来,各个偏差所产生的影响必然会越来越多地相互抵消,从而被它们所围绕的那个中心值所吸收。最终,组合这些数值的结果,将近似于这样一种情况:即那些实际上在变化的成因,不仅在概念上,而且在数值上也始终保持不变。因此,在这些情况下,平均值是一个概念上确定且界限分明的因果系统的充分的数值代表;如果该系统的某一部分被改变,平均值所伴随的变化,就能再次给出那些改变对整个系统所产生影响的正确量度。
另一方面,无论从什么角度来考察统计常数,都不能说其每一个独立数值是由那些本身在相当狭窄范围内对称波动的成因组合所产生的。恰恰相反,各个独立的效应产生于一种常常是错综复杂、种类繁多的因果组合,这些组合之间诚然可能共享众多因素,但作为一个整体,它们之间不存在任何可设想的共同体,实际上仅仅在效应的某一个特征上彼此相应。各个构成因素的数值必然千差万别,这几乎是不言自明的。然而,即便在这种情况下,通过组合大量的样本,也能呈现出近似恒定的数值——对于这一事实,我们可以这样解释:在相等且足够大的时间或空间范围内,各种独立的因果组合会以近似相等的频率出现;我们这样说,只不过是承认了自然界存在一种奇特而精妙的安排。因此,这些恒定的平均值并不代表某个确定而独立的因果系统,而是众多这类系统的组合,而这些组合本身绝非一目了然。所以,当条件变化时,这些平均值的变化并不能提供这些变化所产生影响的真实量度,而仅仅是其迹象。它们对于建立数值上精确的依赖关系没有直接价值,但可以为之做准备。
现在让我们回到本节开头提出的问题。我们何时可以认为,我们努力通过实验实现的这种条件均等已经达到了?答案如下:当数次观察的平均值近似恒定时,并且同时我们可以假定,各个独立的案例都属于同一个因果系统,然而,该系统的构成要素的数值并非绝对恒定,而是在一个中心值周围的狭小范围内对称地波动。
第 8 节. 误差定律
然而,仅凭上述陈述,我们的问题尚未得到最终解答。假设我们以某种方式为某个心理过程找到了令人满意的恒定平均值,我们该如何着手去判断,我们是否可以假定其背后存在一个同质的因果条件?而这种假定对于进一步利用这些平均值是必要的。物理科学家通常事先就知道他将要处理的是一个单一的因果组合;统计学家则知道他必须处理的是大量的、即便经过所有分析也永远无法厘清的因果组合。他们之所以知道这一点,是源于他们在进行更详细研究之前,就已具备的关于过程性质的基本知识。正如我们刚才认为,心理学目前的知识过于模糊和不可靠,无法依赖它来判断实验条件恒定的可能性;如今,它或许同样不足以让我们满意地确定,在给定的情况下,我们面对的究竟是一个同质的因果组合,还是一个碰巧共同作用的多元组合。因此,问题在于,我们是否能借助其他一些判据,来阐明我们在尽可能统一的条件下所获结果的因果性质。
答案必然是:我们无法获得绝对的确定性,但可以达到很高的或然性。因此,研究者们从一些与获得物理常数所依据的预设尽可能相似的预设出发,并对从中得出的推论进行了研究。这项研究是针对单个数值围绕其最终中心值的分布情况而进行的,并且完全独立于成因的实际具体特征。将这些计算出的数值与实际观测值进行反复比较后发现,预设的相似性确实足够高,足以使结果达成一致。这些思辨的成果与现实高度近似。其核心在于——大量源于同类成因并只受到我们反复提及的那类修正因素影响的单个数值,其分布模式可以被一个数学公式,即所谓的「误差定律」,准确地加以表述。该定律的一个显著特征是它只包含一个未知量。这个未知量衡量的是单个数值围绕其中心趋势分布的相对密集程度。因此,它会根据观测的种类而变化,并通过对单个数值的计算来确定。
注意:关于此公式的进一步信息,并非本文的重点,读者可参阅有关概率计算和误差理论的教科书。对于不熟悉后者的读者,一个图示化的解释会比公式的陈述和讨论更容易理解。设想某项观测被重复了 1000 次。每一次观测本身由一个面积为一平方毫米的方块来代表,其数值,或者更确切地说,是它与这 1000 次观测的总中心值的偏差,则由它在附图 1 中水平线 p q 上的位置来表示。
对于每一次与中心值完全吻合的观测,就在垂直线 m n 上放置一个一平方毫米的方块。对于每一个比中心值高一个单位的观测值,就在 m n 右侧一毫米处的垂直线上放置一个方块,以此类推。对于每一个比中心值高(或低)x 个单位的观测值,就在距离 m n 右侧(或左侧)x 毫米的垂直线上放置一个方块。当所有观测都以此方式排列后,图形的外部轮廓可以被平滑化,使得单个方块的突出边角转变为一条对称的曲线。现在,如果各项测量值的性质,使得它们的中心值可以被视为物理科学概念中的常数,那么最终形成的曲线形态就是图 1 中标记为 a 和 b 的那种。如果中心值是一个统计常数,那么曲线可以是任何形态。(曲线 a、b 与直线 p q 在每种情况下都围成一个 1000 平方毫米的面积。严格来说,这只有在曲线和直线 p q 无限延长时才成立,但这两者最终会彼此非常贴近,以至于在图形的中断处,曲线的两端各自只缺少两三个平方毫米的面积。)对于某一组观测,其形成的曲线是更陡峭还是更平坦,取决于观测的性质。观测越精确,数值就越会聚集在中心值周围,大的偏差就越少出现,曲线也就越陡峭,反之亦然。除此之外,曲线的形成规律总是一样的。因此,如果一个人在任何特定的观测组合中,获得了衡量观测值分布密集程度的某个指标,他就能概览整个群体的分布情况。例如,他可以说明某个特定数值的偏差出现的频率,以及有多少偏差落在某个范围之内。或者——正如我将在下文展示的——他可以说出多大的变异范围,能将所有观测值中的某个百分比包含在它与中心值之间。例如,我们图中的 +w 和 -w 两条线,恰好界定出了代表所有观测的总面积的中心一半。但在 1b 所示的更精确的观测中,它们与 m n 的距离只有 1a 中的一半。因此,它们相对距离的陈述,也提供了一个衡量观测精确度的指标。
因此,可以说:凡是一组效应,如果可被视为每次都源于同一个因果组合,而该组合每次只受到所谓的偶然干扰,那么这些数值的分布就会遵循「误差定律」。
然而,这个命题的反命题未必为真,即:凡是出现遵循误差定律的数值分布,就可以推断其背后是这种单一的因果机制在起作用。为何自然界不能偶尔以一种更复杂的方式,产生一种类似的分布模式呢?实际上,这种情况似乎极为罕见。因为,在统计学中通常被汇总为平均值的所有数组中,迄今为止,尚未发现任何一个案例,是毫无疑问地源于多个因果系统,而其分布又恰好呈现出「误差定律」所概括的模式。[1]
因此,这一定律可以作为一个判据——诚然不是一个绝对安全的判据,但仍是一个或然性极高的判据——用以判断通过任何程序可能获得的近似恒定的平均值,是否可以作为真正的科学常数在实验中使用。「误差定律」并不为此类应用提供充分条件,但它确实提供了其中一个必要条件。最终的解释必须依赖于后续研究的结果,而这一定律则为这些研究的基础提供了一定的保障。这正是我运用它所提供的衡量标准,来回答我们那个悬而未决的问题的原因:如果在条件保持尽可能相似的情况下,将相似的序列学习至首次可能再现点所需的平均重复次数,是否是一个自然科学意义上的恒定平均值?在此我可以预先说明,在我所研究的情况中,答案是肯定的。
第 9 节. 摘要
在将所谓的自然科学方法应用于心理过程的检验时,会遇到两个根本性的困难:
(1)心理事件持续变动且变幻莫测的特性,不允许我们建立稳定的实验条件。
(2)心理过程本身无法提供测量或计数的方法。
就记忆(学习、保持、再现)这一特殊领域而言,第二个困难可以在一定程度上被克服。在这些过程的外部条件中,有一些可以直接进行测量(例如时间、重复次数)。我们可以利用这些可测量的条件,来间接地获得那些无法被直接测量的心理过程的数值。我们不必等待已记下的观念序列自行重返意识,而是必须主动地「迎上前去」,通过复习将其恢复到刚好可以无差错地再现出来的程度。在特定条件下完成这项任务所需的功,我将其作为这些条件所产生影响的实验量度;而当条件改变时,这项功所产生的差异,我则将其解读为该条件变化所产生影响的量度。
至于第一个困难,即建立稳定的实验条件,是否能够被满意地克服,是无法先验地决定的。我们必须在尽可能相同的条件下进行实验,以观察那些单独来看很可能彼此偏离的结果,在汇集形成较大的组别后,是否能呈现出恒定的平均值。然而,仅此一点,尚不足以让我们能够利用这类数值结果来建立自然科学意义上的数值依赖关系。统计学所处理的大量恒定平均值,根本不是源于理想状态下同一事件的重复发生,因此也无法帮助我们更深入地洞察其内在机制。鉴于我们心理生活的巨大复杂性,我们无法否认,当获得恒定的平均值时,它们很可能具有这类统计常数的性质。为了检验这一点,我考察了构成一个平均值的各个独立数值的分布情况。如果其分布模式,符合我们在自然科学领域中(当对同一事件的重复观测产生不同的独立数值时)普遍观察到的分布模式,那么我便——同样是试探性地——假定,我们所反复检验的那个心理过程,其每一次发生都是在对于我们的目的而言足够相似的条件下进行的。这个假设并非强制性的结论,但具有很高的或然性。如果它是错误的,那么后续的实验本身大概会揭示这一点:从不同角度提出的问题将会导致相互矛盾的结果。
第 10 节. 或然误差
正如前文所述,在任何给定的情况下,衡量所获观测值密集程度并使代表其分布的公式得以确定的那个量,可以有不同的选择。我使用的是所谓的「或然误差(probable error)」(P.E.)——即,平均值之上和之下的一个偏差值,在所有单个观测值中,偏差超过它的数量与未达到它的数量恰好相等。因此,在其正负极限之间,恰好包含了围绕平均值对称排列的全部观测结果的一半。从这一定义中可以明显看出,该值可通过对结果进行简单计数来获得;而通过基于理论的计算,则可以更精确地得到它。
现在,如果我们对任何一组观测数据试探性地进行这种计算,那么,我们便可通过以下事实来识别这组数值是否遵循「误差定律」的分组模式:在根据经验计算出的或然误差的几分之一倍和整数倍之间,我们所获得的、围绕中心值对称排列的单个测量值的数量,与理论所要求的数量相符。
根据该理论,在 1000 次观测中,分布应当如下:
范围内 |
单个测量值的数量 |
---|---|
± 1/10 P.E. |
54 |
± 1/6 P.E. |
89.5 |
± 1/4 P.E. |
134 |
± 1/2 P.E. |
264 |
± 1 P.E. |
500 |
± 1 1/2 P.E. |
688 |
± 2 P.E. |
823 |
± 2 1/2 P.E. |
908 |
± 3 P.E. |
957 |
± 4 P.E. |
993 |
如果实际分布与理论分布在足够程度上相符,那么,仅陈述或然误差这一数值,便足以表征所有观测值的排列情况。同时,其数值大小也为分布围绕中心值的密集程度——即,为结果的精确性和可信赖性——提供了一个有用的量度。
正如我们讨论了单个观测值(separate observations)的或然误差(P.E.o),我们同样可以讨论中心趋势量度,或平均值(mean values),的或然误差(P.E.m)。它以类似的方式描述了这样一种分布情况:如果我们对同一现象的观测重复极多次,并且每一次都将同样大量的观测值合并为一个中心值,那么这些单独的中心值本身将会形成的分布。它为重复观测所产生的平均值的波动性,提供了一个简短而充分的表征,并随之为我们已获结果的可靠性和可信赖性提供了一个量度。
因此,P.E.m 通常被包含在下文的论述中。至于它如何通过计算得出,同样无法在此详述;只要其含义清晰明了即可。它告诉我们的是:基于我们刚刚从中获得某个平均值的全部观测数据的特性,我们可以预期,该平均值与那个「假定正确的平均值」之间的偏离,最多不超过其或然误差的大小的概率为 1 比 1(即 50%)。我们所说的「假定正确的平均值」,是指假如观测被无限次重复后将会获得的那个平均值。任何比或然误差更大的偏差,在数学意义上都变得「不大可能」——即,其不发生的概率要大于其发生的概率。并且,正如浏览上表便可发现,偏差值越是大,其发生的不可能性便以极快的速度增加。我们所获得的平均值与真实平均值的偏差超过或然误差 2.5 倍的概率仅为 92 比 908,因此约为 1 比 10;其偏差超过 4 倍或然误差的概率则微乎其微,为 7 比 993(约为 1 比 142)。
脚注
[1] 据说,从总出生人口中分别得出的男孩和女孩的出生数量,其分布情况与误差定律高度吻合。但在这种情况下,恰恰是由于这个原因,我们很有理由相信它们源于一个同质的生理成因组合,这个组合可以说旨在达成一个确定明确的性别比例。(参见 Lexis, Zur Theorie der Massenerscheinungen in der menschlichen Gesellschaft, p. 64 及其他地方。)
上一章:第一章 我们关于记忆的知识
下一章:第三章 研究方法