中国心理学家网
 
热线咨询 0551—2826223
当前位置: 网站首页 - 心理统计 - 统计理论
    发表日期:2007年3月16日 编辑:shphao 有11160位读者读过此文 【字体:
回归分析实验设计方法的发展
回归分析试验设计方法的发展
  回归分析的试验设计起源于五十年代初 [ Box,G.E.P. & Wilson, K.B.,1951 ; Box,G.E.P.,1952] , 近三十年来出现很多设计方法,包含了相当丰富的内容[茆诗松 ,丁 元 ,周纪芗 和 吕乃刚,1981;刘朝荣,1990]。
  根据试验因素的个数和要考虑的交互作用的多少, 选用一合适的正交表,将每一因素的各个水平适当地安排在表的某一列上,便得正交设计。一般来说,对于正交设计的资料可以用直观分析(Profile Analysis)和方差分析(ANOVA), 也可用回归分析进行处理。
  如果一次回归拟合得不好,则需作二次或高次回归的试验设计,所得回归方程也稍为复杂。用正交设计获得二次回归可以采用2种不同的方法。一是基于3水平因素全面试验的正交设计;一是基于2水平正交表的组合设计。基于3水平因素全面试验的二次回归实际上是一种特殊的正交多项式回归,其缺点是因素较多时所要做的试验太多。例如,3个3水平因素全面试验是27次, 4个3水平因素全面试验是81次, 因素个数超过4时, 3水平因素全面试验次数的增加会使得试验者完全无法接受。为了克服这一缺点,人们提出了一种基于2水平正交表的组合设计。所谓基于2水平正交表的组合设计,或称为中心组合设计,就是在试验区域中选取3类具有不同性质的实验点,把它们适当组合起来而形成的试验设计。
  回归正交设计的优点是试验次数较少、计算简单方便和消除了回归系数间的相关性,其缺点在于回归预测值的方差依赖于试验点在试验区域中的位置。因为按回归方程求得的预测值不仅与预测点有关, 而且与回归系数的方差和协方差都有关, 从而与各试验点在试验区域内的位置有关。回归预测值的方差刻划了回归方程的精度。回归方程精度对试验点位置的依赖,使得试验者不能根据回归预测值直接寻求最优区域,因为预测值的误差随试验点在试验区域中的取法而有所不同。所求最优区域在一种试验点取法下是有意义的,可能在另一种试验点的取法下已无一定精度保证。回归试验的旋转设计与分析可以部分地克服上述缺点。所谓回归的旋转设计是指,为了作回归分析所选取的试验点,能使回归预测的方差在以试验中心为原点、半径为p的球面上相等的设计。
  随着生产技术的发展,人们对于已有的各种各样设计,思考如下的问题:如何比较设计的好坏?能否构造出一定意义下的最优设计,从而获得这种意义下的最优回归方程?回归试验的正交设计适当地减少了试验的次数并使统计计算和分析得到了简化;回归试验的旋转设计保证了试验区域中同一球面上各点的回归预测值的方差相等。但是,它们都未涉及到从严格的统计意义上比较不同试验设计好坏和构造一定意义下的最优设计的问题。从本世纪70年代以来, 人们对这一问题进行了系统的研究, 先后提出多种比较试验设计好坏的标准,例如,A-最优性、G-最优性、E-最优性和D-最优性等。并由此出发构造出了一系列相应的最优设计[Atkinson, .C. & Donnev , A.N. 1992 ]。
  早在第二次世界大战中,就出现了序贯设计;在我国,该方法在临床试验,药物评价,药物筛选中的应用,徐端正已有详尽的论著[徐端正,1986]。在回归试验设计领域中的序贯设计,是针对多因素多水平问题,将中心组合设计分为几个区组按序贯安排试验,每个区组的安排都有正交性和近似的旋转性。对于试验过程中每一区组的实验数据都要及时分析处理,一旦找到合适的回归模型,就不再继续试验[Lorenzen,TJ & Anderson,VL., 1993]。
  本世纪70年代末,我国数学家方开泰和王元将数论方法用于多因素试验设计,提出“均匀设计”[方开泰, 1980],在形式上与正交设计相似,但从理论上则是创造出了一种新的适用于多因素、多水平试验的设计方法。正交设计为了实现“整齐可比”性,对所考察的多因素中的任意两因素而言,必须是全面试验,即每个因素的各水平必须有重复,于是试验点在其试验范围内,并不能做到充分地“均匀分散”;同时为了达到“整齐可比”性,试验点矩须比较多。在均匀设计中,首先舍弃“整齐可比”性,让试验点在其试验范围内充分地“均匀分散”,这样每个试验点就可以有更好的代表性。试验点的数目也可以大幅度地减少。这种单纯从“均匀分散”性出发的试验设计称为均匀设计。由于没有考虑“整齐可比”性和试验点少,可能使试验结果的分析误差大、不稳定。因此,为克服这只足,在选择使用表时,可以首先考虑稳定性准则,即让所选各列对应的设计矩阵的条件数最小;其次考虑优良性准则;第三考虑均匀性准则[张学中,1992]。
  以上所介绍的各种设计的共同点是把实际因素的各水平对号入座地填到现成的表中去,因而可称为“间接试验设计”。把因素各水平的真实数值规范成为某个现有的表中的正整数,就难免有“削足适履”之嫌: 当各因素的水平数不等时要用拟水平方法、实际水平不可能等间隔时也要用等间隔的正整数来代替、定性指标需要量化或用拟因素办法等等,这些都有可能改变原表的性质。因此我们在均匀设计的实践基础上,并受其设计思想的启发,根据实验设计的基本原则[Montgomery, D.C.,1991],直接按因素各水平的实际组合随机选择试验点产生若干试验方案,按优良性准则从中选出较优者,因而叫做直接试验设计[张学中,1995]。
【本文由 中国心理学家网 发布,转载须保留本文链接!手机浏览网页显示不完整时,请点击网页底部的电脑版。欢迎关注本站微信公共号:xinlixuejianwang 分享按钮

相关专题:

相关信息:
 没有相关信息

相关评论:
 没有相关评论
发表、查看更多关于该信息的评论 将本信息发给好友 打印本页
版权所有  中国心理学家网技术支持创立互联    通讯地址:安徽医科大学医学心理学150#   邮编:230032

联系电话:0551—2826223  E-mail:cnpsy@126.com QQ:619938829  皖ICP备 06003963国内心理学类综合性门户网站