单因素方差分析 一、问题的提出例5-1。为了比较三种不同材料对产品寿命的影响,试验人员分别对三种不同材料所制造的一组产品的寿命进行了测试,所得结果如表5-1所示 (为简化计算,以各取4个样本为例)。 表5-1:某种材料使用寿命的抽样统计表 材料种类 实验1 实验2 实验3 实验4 A 115 116 98 83 B 103 107 118 116 C 73 89 85 97 现要求根据上述试验结果,显著性水平为 通常,在方差分析中,我们把对试验结果发生影响和起作用的自变量称为因素。如果方差分析研究的是一个因素对于试验结果的影响和作用,就称为单因素方差分析。在本例中,因素就是可能影响产品使用寿命的材料。因素的不同选择方案称之为因素的水平。上例中材料有三种不同的选择就说因素有三个水平。因素的水平实际上就是因素的取值或者是因素的分组,例如,可以在包装、质量、价格和销售区域等方面取不同的值或分为不同的组,就表示因素选了不同的水平。方差分析要检验的问题就是当因素选不同的水平时,对结果有无显著的影响。若无显著影响,则随便选择哪一种材料都无所谓。否则就要选择最终产品寿命最长的一种材料。 一般地,我们假定所检验的结果受某一因素A的影响,它可以取K个不同的水平:1,2,3,…K。对于因素的每一个水平i都进行n次试验,结果分别为 用统计的语言来表达,要检验的假设就是: 由此可见,方差分析是研究一个或多个可分组的变量(称为自变量)与一个连续变量(因变量)之间的统计关系,并测定自变量在取各种不同水平时对因变量的影响和作用的一种统计分析方法。方差分析通过比较和检验在因素的不同水平下均值之间是否存在显著的统计差异的方法来测定因素的不同水平对因变量的影响和作用的差异。 二、方差分析的基本原理和步骤方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的一个估计值。另一方面,再考虑在同一水平下不同试验数据对于这一水平的均值的方差。由此,计算出对由所有试验数据所组成的全部数据的总体方差的第二个估计值;最后,比较上述两个估计值。如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设。否则,就说明因素的不同水平下的均值间的差异比较大,就接受备择假设。 根据上述思路我们可以得到方差分析的方法和步骤。 1、提出假设 2、方差分解 我们先定义总离差平方和为各样本观察值与总均值的离差平方和。 记作 SST= 其中: 将总离差平方和分解为两部分: SST= = = 其中: 记 SSE= 表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内平方和。 记 SSR= 表示不同的样本组之间,由于变异因素的不同水平影响所产生的离差平方和,简称为组间平方和。 由此可以得到 SST=SSR+SSE. 对应于SST,SSR和SSE的自由度分别为: N-1, K-1, N-K. 相应的自由度之间的关系也有: N-1=(K-1)+(N-K). 3、F检验 将SSR和SSE分别除以其自由度,即得各自的均方差: 组间均方差 MSR=SSR/(K-1) 组内的均方差 MSE=SSE/(N-K) 统计上可以证明 E(MSE)= E(MSR)= 由此可见,如果原假设 E(MSR)> 根据F分布,如果原假设 检验统计量 如上所述,当原假设 4、方差分析表 上述方差分析的方法可以用一张标准形式的表格来实现,这种表格称为方差分析表。它将方差分析的计算方法以简洁的形式进行总结。表格分为五列,第一列表示方差的来源,第二列表示方差的离差的平方和,第三列表示自由度,第四列为均方差,第五列为统计检验量F。表格又分为三行。第一行是组间的方差SSR和均方差MSR,表示因素的不同水平的影响所产生的方差,其值作为计算统计检验量F时的分子;第二行是组内方差SSE和均方差MSE,表示随机误差所引起的方差,其值作为计算统计检验量F的分母,第三行是检验行,表示总的方差SST。 由于方差分析表概括了方差分析的中统计量之间的关系,我们在进行方差分析时就可以直接按照方差分析表来逐行,逐列地计算出有关的统计量,最后得到检验量F的值,并把这一F值与查表所得到的一定显著性水平下的F检验的临界值进行比较,以得出接受或拒绝原假设的结论。 单因素方差分析表 方差来源 离差平方和 自由度 均方差 统计检验量F 组间 SSR K-1 MSR 组内 SSE N-K MSE 总方差 SST N-1 对于本节开头的例5-1,我们可计算得到方差分析表如下: 单因素方差分析表 方差来源 离差平方和 自由度 均方差 统计检验量F 不同材料间 1304 2 652 4.92 同种材料间 1192 9 132.4 总方差 2496 11 现假设原问题规定检验的显著性水平 F=4.92> 所以拒绝 |
|