正交设计及其资料的统计分析 1. 正交设计的概念和正交表的初步认识 正交设计是利用一系列规格化的正交表来安排多因素试验的一种十分有效的设计方法。 正交表是已经制作好的规格化的表, 是进行正交设计的基本工具。正交表可分为同水平的和混合水平的2大类,常用的同水平正交表有2n型:L4(23)、L8(27)、L16(215)、…; 有3n型:L9(34)、L27(313)、…; 有4n型:L16(45)、…; 有5n型:L25(56)、… 。常用的混合水平的正交表有:L8(41×24)、L18(37×21)、L50(511×21)等。Ln(Km)中的L━正交表, n━正交表的行数,K━各列的水平数, m━列数。正交表一般分成表头(列号)喉身(水平的标志)。进行正交设计,实际上就是把试验因素及其交互作用合理地安排到正交表的表头中去。现以L8(27)及其交互作用表为例,获得对正交表的初步认识。 与 对应的2列间的交互作用表 ━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━━━━ 试验 列号 1 2 3 4 5 6 7 列 列 号 号 设计 A B A×B C A×C B×C D 号 1 2 3 4 5 6 7 ━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━━━━ 1 1 1 1 1 1 1 1 1 (1) 3 2 5 4 7 6 2 1 1 1 2 2 2 2 2 (2) 1 6 7 4 5 3 1 2 2 1 1 2 2 3 (3) 7 6 5 4 4 1 2 2 2 2 1 1 4 (4) 1 2 3 5 2 1 2 1 2 1 2 5 (5) 3 2 6 2 1 2 2 1 2 1 6 (6) 1 7 2 2 1 1 2 2 1 7 (7) 8 2 2 1 2 1 1 2 ━━━━━━━━━━━━━━━━━━━ ∪ └──┘ └──────┘ 注:在左表中,又把1组称为1群,把1、2组结 组 1 2 3 合起来称为2群,把1~3组结合起来称为3群; ━━━━━━━━━━━━━━━━━━━ 显然,不同组中水平改变的频率是不同的。 从左表身可看出:数字1与2在各列中出现的次数相同(均为4次),任何2列不同数对(如:1━1;1━2;2━1;2━2)出现的次数也相同(均为2次);正交表的各列所具有的这一性质, 称为正交性,使得用正交表挑选出来的试验点具有在空间中均匀分散、在分析时整齐可比的特点。 所谓正交设计,就是先根据需要考察的因素数、水平数及其交互作用的个数(以专业知识为依据),选择合适的正交表;然后,结合该表的交互作用表, 把单个因素及其交互作用分别安排在表头的各列号之下,称这一过程为表头设计。如将2水平因素A,B,C,D及其交互作用A×B,A×C,B×C安排在L8(27)的表头上。 交互作用表的查法:第i列与第j列的交互作用在哪一列呢?从左边找到列号i,从上边找到列号j,这2列的交叉处的数字就是交互作用所在的列号。因正交表中各列的自由度等于水平数减1,而2个都具有m水平的因素的交互作用的自由度为(m-1)×(m-1),故正交表中2个因素的交互作用所占的列数为水平数减1列。另外, 在左表中, 第1~第7列的列名分别叫a,b,ab,c,ac,bc,abc。当需考虑3因素交互作用B×C×D(以下简写成BCD)时,其所在的列名应该是:b·c·abc=a·b2·c2=a·b0·c0=a,即第1列。同理, ACD、ABD分别出现在第2和第4列上,CD、BD、AD分别出现在第3、5、6列上。由此可看出, 4个主效应(A,B,C,D)全部是与3因素交互作用相处在一起的;6对2因素交互作用每2个相处在一起。这种在1个列中,安排2个要因(即重要因素)的现象,称为“相互有别名(aliases)关系”或“互相混杂”。此时, 当各列中仅有1个要因(指单个因素及交互作用)占有主导地位时,忽略掉作用小的一方,才能对主要要因的效应作出较准确地估计。对于上面左表的设计,把有这种别名关系的2个要因相乘, 则不管哪一列均为ABCD。把这4个因素交互作用ABCD称为定义这种“1/2实施( 即4个2水平因素的全面试验本应进行16次,现在只做8次)”的要因效应,简称为定义对比。一旦知道了某种设计的定义对比,寻找和自身有别名关系的要因就容易了,即用自身的列名乘以定义对比,如: 对于因素B而言,B·(ABCD)=AB2CD≡ACD, 即B与ACD之间相互有别名关系; 对于AB而言,AB·(ABCD)=A2B2CD≡CD,即AB与CD之间相互有别名关系。 2. 常用的正交表和表头设计 : 主效应不与交互作用混杂的表头设计 ━━━━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━ 因素数 实施 列号1 2 3 4 5 6 7 定义对比 试验号 列号 1 2 3 4 ━━━━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━ 3 1 A B A C A B - 1 1 1 1 1 B C C 2 1 2 2 2 3 1 3 3 3 ────────────────────── 4 2 1 2 3 4 1/2 A B A C A B D 1=ABCD 5 2 2 3 1 B C C 6 2 3 1 2 ‖ ‖ ‖ 7 3 1 3 2 C B A 8 3 2 1 3 D D D 9 3 3 2 1 ━━━━━━━━━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━ 注:实施━实际试验次数/全面试验次数。 注:任意2列间交互作用出现于另2列。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 试验号 列号: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 1 1 1 2 2 2 2 1 1 1 1 2 2 2 2 4 1 1 1 2 2 2 2 2 2 2 2 1 1 1 1 5 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 6 1 2 2 1 1 2 2 2 2 1 1 2 2 1 1 7 1 2 2 2 2 1 1 1 1 2 2 2 2 1 1 8 1 2 2 2 2 1 1 2 2 1 1 1 1 2 2 9 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 10 2 1 2 1 2 1 2 2 1 2 1 2 1 2 1 11 2 1 2 2 1 2 1 1 2 1 2 2 1 2 1 12 2 1 2 2 1 2 1 2 1 2 1 1 2 1 2 13 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 14 2 2 1 1 2 2 1 2 1 1 2 2 1 1 2 15 2 2 1 2 1 1 2 1 2 2 1 2 1 1 2 16 2 2 1 2 1 1 2 2 1 1 2 1 2 2 1 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ : 主效应不与交互作用混杂的表头设计 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 因素数 实施 列号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 │定义对比 列名:a b ab c ac bc abc d ad bd abd cd acd bcd abcd| ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 4 1 A B AB C AC BC D AD BD CD | - 5 1/2 DE CE BE AE E | 1=ABCDE ──────────────────────────────── A B AB C AC BC D AD BD CD | DE BE AE E CE | 1=ABDE 6 1/4 DF EF CF AF F BF | 1=ACDF 7 1/8 FG EG DG CG BG G AG | 1=BCDG 8 1/16 CH BH AH H GH FH EH DH | 1=ABCH ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 注:5个因素所在行里所列的项是在4个因素设计的基础上需要添加的项;同理,可理解后3行。如最后1行的第3列,包含AB,DE,FG,CH四对交互作用,仅当其中之一起决定作用时,对它的估计才是有意义的。 及主效应不与交互作用混杂的表头设计 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 试验号 列号: 1 2 3 4 5 6 7 8 9 10 11 12 13 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 2 2 2 2 2 2 2 2 2 3 1 1 1 1 3 3 3 3 3 3 3 3 3 4 1 2 2 2 1 1 1 2 2 2 3 3 3 5 1 2 2 2 2 2 2 3 3 3 1 1 1 6 1 2 2 2 3 3 3 1 1 1 2 2 2 7 1 3 3 3 1 1 1 3 3 3 2 2 2 8 1 3 3 3 2 2 2 1 1 1 3 3 3 9 1 3 3 3 3 3 3 2 2 2 1 1 1 10 2 1 2 3 1 2 3 1 2 3 1 2 3 11 2 1 2 3 2 3 1 2 3 1 2 3 1 12 2 1 2 3 3 1 2 3 1 2 3 1 2 13 2 2 3 1 1 2 3 2 3 1 3 1 2 14 2 2 3 1 2 3 1 3 1 2 1 2 3 15 2 2 3 1 3 1 2 1 2 3 2 3 1 16 2 3 1 2 1 2 2 3 1 2 2 3 1 17 2 3 1 2 2 3 3 1 2 3 3 1 2 18 2 3 1 2 3 1 1 2 3 1 1 2 3 19 3 1 3 2 1 3 2 1 3 2 1 3 2 20 3 1 3 2 2 1 3 2 1 3 2 1 3 21 3 1 3 2 3 2 1 3 2 1 3 2 1 22 3 2 1 3 1 3 2 2 1 3 3 2 1 23 3 2 1 3 2 1 3 3 2 1 1 3 2 24 3 2 1 3 3 2 1 1 3 2 2 1 3 25 3 3 2 1 1 3 2 3 2 1 2 1 3 26 3 3 2 1 2 1 3 1 3 2 3 2 1 27 3 3 2 1 3 2 1 2 1 3 1 3 2 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 因素数 列名: a b ab a2b c ac a2c bc abc a2bc b2c ab2c a2b2c ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 3 A B AB A2B C AC A2C BC B2C 4 C2D B2D A2D D AD BD C2D2 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 注:当因素数为4时,定义对比为1=ABCD2。任何2个主效应的交互作用出现在某2列上,如:第1列上的A与第2列上的B的交互作用出现在第3、4两列上,用AB和A2B表示。 3. 应用举例 完成了表头设计之后,应该将放有主效应的列的代码水平转换成因素的真实水平,然后按表中各试验号所对应的试验条件做试验,将试验数据写在各行的最后,用方差分析处理数据。 [例2.3.14] 用固化法制静脉注射用的蛋白微球试验,根据药剂学的理论,若蛋白微球的颗粒大于12μm时,静脉注射后即属于机械截流,故本试验以微球直径大于12μm的比例作为质控标准(即观测指标), 希望尽量减少12μm的微球比例。制作过程中主要涉及下列6个因素,各取2个水平: 因 素 1 水平 2 水平 因 素 1 水平 2 水平 A(蛋白浓度) 8% 12% D(乳化剂量(ml)) 1.0 0.5 B(固化油相(ml)) 40 60 E(搅拌速度) 快档 慢档 C(固化温度(℃)) 130 150 F(固化时间(分)) 30 60 可以不考虑交互作用,将A~F6个因素依次安排在L16(215)正交表的1、2、4、8、11、13列上(这样安排的目的是尽量避免主效应与可能的交互作用混杂在一起), 16次试验数据依次为:0.3,4.2,3.0,12.1,13.1,8.1,10.5,11.4,12.3,17.0,17.9,5.8,8.4,26.2,13.8,20.0。 试分析此资料,并给出最优的试验条件。 [分析与解答] H0:任何1个因素的2个水平所对应的总体均数相等, H1:任何1个因素的2个水平所对应的总体均数不等或不全相等,α=0.05。 方差分析的总模型是非常显著的,因F=11.56,P=0.0009;除C、D2因素外, 其他因素均非常显著。A~F各水平下的均数分别为:A(7.8,15.2);B(9.1,13.9);C(11.2,11.8);D(9.9,13.1);E(8.5,14.5);F(14.0,9.0)。 因观测指标是大于12μm的颗粒所占的比例,观测值越小越好,A,B,C,D,E均取1水平,F取2水平效果最好。 若将[ANOVAW15.PRG]过程步的MOEDL语句中C删除,再运行该程序, 等价于将C合并到误差中去,使估计更加精确些。
专业结论] 用固化法制静脉注射用蛋白微球时, 固化温度可定在130℃到150℃之间任何值上即可,蛋白浓度取8%左右,固化油相取40ml左右,乳化剂量取1.0ml左右,用快档搅拌,固化时间取60分钟左右为好。
|