虽然国内心理学学者对于效果量这一概念较为陌生,国外心理学学者也是近年来对效果量有所关注,但效果量并非新生事物。早在70多年以前,费希尔就提出方差分析的研究结果应该包括相关比率或η2 以表示自变量和因变量之间关系的强弱。自此,不少研究者提出不同的效果量指标。科克在总结他人研究的基础上,于1996年就提出了41种不同的效果量指标。所以,在报告效果量时应清楚地指出所使用的效果量的类别和名称,以帮助读者正确估计其强度,并用以指导后续研究。简言之,效果量的大小是来自总体1的随机样本的实验处理的强度大于来自总体2的随机样本的概率:P (X1>X2)。依据获得效果量的不同方法可以将效果量分成不同的类别。
克莱恩(R.Kline)认为效果量一般可以分为广义的两族:(1)标准化平均差异或群组差异指标。当统计分析使用平均数来比较潜在的群组差异时使用该族效果量。(2)关系强度指标,即考虑方差的关系或者方差解释率的效果量指标。该族效果量是基于因变量相关联的某一特殊变异和总体变异的比率,常适用于使用广义线性模型(GLM)的跨研究设计,意味着自变量所能解释的因变量的变异,产生的变量间的关系强度或方差解释比率。如:表示双变量Pearson相关系数平方的r2,表示三个或更多变量的多元相关系数平方的R2。科克呈现了三类效果量:标准化平均数差异;考虑方差的效果量;混合效果量。汤普森依据是否有偏将效果量进一步划分为有偏(未调校)效果量和无偏(调校)效果量两类。汤普森在2006年又将效果量分成三种:标准化平均数差异效果量;未调校的考虑方差的效果量;调校的考虑方差的效果量。目前,学者普遍接受汤普森的划分标准。(一)标准化平均数差异效果量指标(Standarized Difference Effect Size)采用事前事后设计、对照组实验设计,需要使用平均数比较潜在的群组差异时,可用该类指标。理论上,实验效应可以直接用某一统计量的群组差异来表示。但心理学不同于医学等学科,其结果变量在本质上并无有意义的量尺,即使是对于多元事后测量也可能会得到不同的标准差。所以不能直接使用组间平均数来计算、比较某一研究或不同研究中的效果量。所以,应采用标准化这一统计策略,用组间平均数差异除以特定尺度的标准差,使之在量尺上获得自由,从而可以比较不同研究中的效果量。最为常用的是赫奇斯(Hedges)提出的g指标和科亨提出的d指标。 g=Mexperiment-McontrolSpooled(2)其中Spooled=(n1-1)s21+ (n2-1)s22槡n1+n2-2 d=M1-M2σpooled(3)其中σpooled=(n1-1)s21+ (n2-1)s22槡n1+n2 标准化指标可比较两个或多个测度的个人分数,尽管这些分数是不同量尺的测度。这类指标的提出沿用标准分数的思想,可以直观地理解效果量是如何比较不同研究的结果,即使这些研究采用的是不同因变量,也可很好地利用已获得的统计量。这类指标使用两组结果变量的标准差的加权平均数来估计标准差,其主要考虑是实验处理对于事后分数的离散程度不会产生影响,使用联合标准差可以加大估计的样本容量,提供更为精确的效果量估计。这类指标完全依赖于实验情境,是较好的标准化差异效果量指标。
(二)考虑方差的效果量(Variance-Accounted-For Effect Size)使用GLM 的跨实验设计,用以评量变量间的关系时应该使用考虑方差的效果量指标。该类指标是基于与因变量相关联的某一特殊变异和总变异的比率,意味着自变量所能解释因变量的变异,反应变量间的关系强度或者方差解释率。可进一步将该类效果量指标分为有偏(未调校)效果量和无偏(调校)效果量。
有偏效果量和抽样过程、抽样误差相关联,一般会高于由原始样本直接获取的效果量。无偏效果量可更好地反映总体真实的效果量及以后研究样本中的效果量,其原因在于从统计学意义上来讲该类指标是正确的:计算关系强度的指标是正偏的,无偏效果量调校研究中的标准误对于将来研究样本效果量的估计会比总体效果量的估计有所收缩。由于未调校的效果量没有考虑样本容量或因素的水平数,所以调校的效果量倾向于小于(至少不大于)未调校的效果量。研究中有很多因素会影响效果量的有偏性,主要包括:(1)结果或测量的信度。一般而言,测验结果的信度越高,效果量的偏性越小;(2)样本容量,大样本产生的效果量偏性较小,样本量足够大时,有偏和无偏的效果量会相等。大样本倾向于产生更为稳定的效果量; (3)自变量的数目,自变量越少,且样本容量越大,效果量的偏性越小;(4)研究样本的同质性,样本越同质,效果量的偏性越小;(5)研究设计类型,实证性研究可以产生偏性较小的效果量,设计过程、实施过程缜密、严格的研究会减少效果量有偏的大小,效果量需要调校的可能性越小,若研究设计不够理想,应当报告调校的效果量。
(1)未调校的考虑方差的效果量常用指标有以下几种:
1)决定系数r2 或R2,可用以下公式计算:
r2 或R2=SSE/SST(4)
其中,SSE表示处理平方和,SST表示总平方和。r2 或R2 描述了结果变量分数的变异中有多少可以由预测变量分数的变异来解释或者预测。由于所有统计量都相互关联,都可作为广义线性模型的一部分。所以,所有研究都可计算决定系数。2)η2,其计算公式如下:
η2=SSE/SST(5)
这一效果量适用于单变量方差分析,其中,SSE表示处理平方和,SST表示总平方和。η2 描述了结果分数变异中有多少可以由被试所属的群组解释或预测。
(2)调校的效果量倾于小于(至少不会大于)未调校的效果量,其原因主要在于前者考虑了抽样误差。个体特质决定了样本总不能很好地代表总体。通常统计分析过程无法区分样本所代表的总体中存在的变异和总体中不存在的变异,样本效果量常常正偏态地高估了总体中真实的效果量。所以必须考虑抽样误差带来的后果:样本大小对于抽样误差的变异有重要影响,小样本倾于产生更多的抽样误差,而大样本会高估效果量;测量变量的数目对于抽样误差有影响,研究中测量的变量越多,抽样误差越大;总体效果量对抽样误差有影响。研究者总是不可能知道总体的效果量,只能通过样本效果量进行估计、调校,所以,很难看到这种动态的变化、影响。调校的考虑方差的效果量常用指标有以下几种:
1)对于r2 或R2,Ezekiel使用调校估计R2*。R2*可以用以下公式计算:
R2*=1- (n-1/n-v-1)(1-R2) (6)
其中,n表示样本容量,v表示预测变量数。这一公式也可以等同地表示为:
R2*=R2- (1-R2)/( v/n-v-1) (7)
2)对于方差分析,调校的效果量为ω2,这是Hays提出的。其公式为:
ω2=[SSb-(k-1)MSw]/(SST+MSw) (8) 其中,k表示方差分析中的水平数,SSb、SST是效应平方和和总平方和,MSw表示误差均方。总之,以上类型涵括了现有的参数化的效果量指标。标准化平均数差异效果量易于计算;考虑方差的效果量是基于广义线性模型,由组间变异和总变异的比率计算得到的,解释为变量变异中由自变量所产生变异的比率。当样本量在很大时,各种效果量间的波动不大。
|