§8.2 协方差分析
例8.2 某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量与年龄有关,资料见下表。
正常组 |
超重组 |
年龄(X1) |
胆固醇(Y1) |
年龄(X2) |
胆固醇(Y2) |
48 |
3.5 |
58 |
7.3 |
33 |
4.6 |
41 |
4.7 |
51 |
5.8 |
71 |
8.4 |
43 |
5.8 |
76 |
8.8 |
44 |
4.9 |
49 |
5.1 |
63 |
8.7 |
33 |
4.9 |
49 |
3.6 |
54 |
6.7 |
42 |
5.5 |
65 |
6.4 |
40 |
4.9 |
39 |
6.0 |
47 |
5.1 |
52 |
7.5 |
41 |
4.1 |
45 |
6.4 |
41 |
4.6 |
58 |
6.8 |
56 |
5.1 |
67 |
9.2 |
该题选自《医学统计学》第二版第七章。考虑到统计分析对数据格式的要求,我们这里建立三个变量:GROUP表示组别,AGE代表年龄,CHOL则表示胆固醇。
8.2.1 分析步骤
由于协方差分析涉及到许多较深的统计理论,这里我只好采用照本宣科的方法,告诉大家如何作,而不作过多解释,欲进一步了解原理的朋友请参考《医学统计学》原书。
首先应进行预分析,了解资料是否符合协方差分析的要求,最重要的一点就是看age的影响在两组中是否相同,这可以用age与group是否存在交互作用来表示。对该问题,粗糙的方法可以是作分组散点图,差不多就可以,也可以进行预分析,看交互作用有无统计学意义,这里用后一种方法中最为精确的步骤来讲解。
预分析步骤:
-
Analyze==>General Lineal model==>Univariate
- Dependent Variable框:选入chol
- Fixed Factors框:选入group
-
Model钮:单击
-
Custom单选钮:选中
-
Model框:选入group、age和group*age(后者用interaction方法就可选入)
-
Sum of squares列表框:改为Model I
-
单击OK
-
单击OK
该步骤用于判断group和age间是否存在交互作用,如存在,则协方差分析的条件不满足,分析不能继续。注意这里选择了Model I,从而拟合结果和模型中变量的引入顺序有关,即侧重点在group对chol的影响大小和交互作用上。
8.2.2 结果解释
预分析步骤的结果如下:
Univariate Analysis of Variance
上表显示交互作用无统计学意义,而且P值非常大,因此交换group和age多半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析。
正式分析步骤:
-
Analyze==>General Lineal model==>Univariate
- Dependent Variable框:选入chol
- Fixed Factors框:选入group
-
Model钮:单击
-
Custom单选钮:选中
-
Model框:选入group、age
-
Sum of squares列表框:改为Model III
-
单击OK
-
Options钮:单击
-
Displsy means for框:选入group
-
Compare mean effects复选框:选中(下面的区间调整方法就用LSD(none)即可)
-
单击OK
-
单击OK
Univariate Analysis of Variance
这是正式的统计分析结果,显示group和age都对胆固醇含量有影响,P值分别为0.038和小于0.001。
Estimated Marginal Means
这是两组的修正均数及相应的可信区间,显然超重组的胆固醇均值较高。下方的提示表明该修正均数是按年龄为50.2308岁的情形计算的。
|