|
协方差分析的概述 1.什么是协方差分析 在介绍医学试验设计时曾谈到,严格按试验设计的4项基本原则设计试验,目的就是为了排除非处理因素的干扰和影响,使试验误差的估计降到最低限度,从而可以准确地获得处理因素的试验效应。但在某些实际问题中,有些因素在目前还不能控制或难以控制,如在动物饲养试验中,各组动物所增加的平均体重不仅仅与各种饲料营养价值高低有关,还与各动物的进食量有关,甚至与各动物的初始重量等因素及其交互作用都有关系。如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。 协方差分析(Analysis of Covariance)是将回归分析与方差分析结合起来使用的一种分析方法。在这种分析中,先将定量的影响因素(即难以控制的因素)看作自变量,或称为协变量(Covariate),建立因变量随自变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受不易控制的定量因素的影响扣除掉,从而,能够较合理地比较定性的影响因素处在不同水平下,经过回归分析手段修正以后的因变量的总体均数之间是否有显著性的差别,这就是协方差分析仅问题的基本思想。 只有1个定量的自变量时称为一元协方差分析、含有2个及2个以上定量的自变量时称为多元协方差分析。 2.协方差分析的模型 下面我们结合用SAS中GLM过程进行协方差分析时MODEL语句的书写方式,从实用的角度介绍处理几种常见试验设计类型资料的协方差分析的模型。 设定性的影响因素为A、B、C等,它们之间的交互作用为A*B、A*C等;定量的影响因素为X或X1、X2、…;定量的观测结果(即因变量)为Y,则有∶ (1)单因素k水平设计的协方差分析模型为∶ MODEL Y=X A / SS3; (2)配伍组设计的协方差分析模型为∶ MODEL Y=X A B / SS3; (3)两因素析因设计的协方差分析模型为∶ MODEL Y=X A B A*B / SS3; [说明] 若定量的影响因素在2个或2个以上,则可用X1 X2 X3等取代上述诸模型中的变量X。另外,还需写上相应的LSMEANS语句,参见下节的SAS程序。 3.协方差分析的应用条件 理论上要求各组资料都来自方差相同的正态总体;各组的总体直线回归系数相等,且都不为0。因此,严格地说,在对资料作协方差分析之前,应先对这两个前提条件作假设检验,若资料符合上述两个条件,或经变量变换后符合上述条件,方可进行协方差分析。
|
|