统计问题集锦[中国心理学家网心理论坛]

楼主

统计问题集锦

统计推断中如何使用正态分布

上文中，每对男女都是从男女白细胞数均数一样的总体中抽取到的。尽管大多数样本的差异都接近0，但多次实验后，总有一对样本可能从男女白细胞数差异远大于0的总体中抽取到的。这种情况出现的频率有多少？如果样本足够大，重复实验的结果服从于正态分布（此原则将在下文解释说明），知道了正态曲线的形状，我们就可以准确地计算出偏离假设总体均数为0的各个标准差由于偶然所得结果的概率。如果计算的概率很低，满足统计学显著性接受标准，那么我们只能认为：结果比无效假设更接近于总体中的情形，（无效假设是作为估计经验性结果的技术性推论准则）。注意整个推断都是在这些重复实验结果（统计学上称为样本分布）的分布形状为正态的设想下进行的。下段将讨论该设想。

如何知道违反了正态假设呢

尽管上文的许多理论可以用数学来证明，但还有一些没有理论依据，仅仅凭经验，即所谓的Monte-Carlo实验，实验中，电脑根据事先设计的规则产生大量的样本，并采用各种各样的检验对这些样本进行分析。这样，当数据不满足所用检验的理论假设时，可以从经验上估计产生错误或偏移的类型和大小。具体地说，Monte-Carlo实验广泛应用于判断基于正态假设基础上的检验对总体中分析变量违反正态假设的敏感性。该实验的基本结论是：这种违反正态假设所得的结果比原先想的要小，这个结论使我们比较振奋——不用过多考虑正态性假设，从而大大增加了那些依赖分布形式的统计检验方法在各研究领域的普及。

为什么“正态分布”很重要

正态分布很重要，因为在大多数情况下正态方程与上文介绍的方程近似。许多统计检验方法要求的资料分布都是正态分布的，或遵循某种由正态分布中演绎出的形式。在这个意义上，正态分布是有关现实基本本质并被实践证实了的基本真理，它可与自然科学中基本法则相媲美。正态分布的准确形状（特征性的“钟形”）只要2个参数就可确定，均数与标准差。

正态分布的特征属性提示了68%的观察对象落在均数±标准差之内。在均数±1.96倍标准差内含有95%的观察值。换句话说，在正态分布中的，观察对象值在均数±2倍标准差之外的频数低于5%。如果你掌握了STATISTICA，使用交互式概率计算器，就可知道正态分布中各值的确切概率；例如，如果你键入Z值为4时，STATISTICA计算的对应概率为0.0001以下，因为在标准正态分布中几乎所有的观察值（即99.99 %以上）落在4个标准差范围内。下边的动画显示了其他的Z值对应的尾部区域范围。

“统计学显著性水平”的计算

假定我们已经计算出两变量的关联，下一个问题就是“关联显著性有多大？”。两变量中可解释的变异为40%是否就可认为关联具有显著性了呢？回答是不确定的，具体地说，是否具有显著性取决于样本量的大小。上面提及，大样本中小关联也具有显著性，而小样本中即使是大关联也不能认为可信（具有显著性）。因此，判断统计学显著性水平，需要一个基于样本量大小上能够表达变量间关联强度与可信性关系的方程。所需的方程要确切地告诉我们在样本量一定的条件下，假设总体中变量关联不存在，我们得到给定关联强度的可能性。换句话说，方程要给出显著性水平（P），并且要告诉我们拒绝接受总体中变量不存在关联的可能性。这个备择假设（总体不存在关联）常常称为无效假设。如果概率方程呈线性，随着样本的变化斜率发生变化，这中情况是理想化。方程总是很复杂，并不总是相同的；不过，大多情况下，我们知道其形状，并可据此判定大小一定的样本中结论的显著性水平。大部分方程都与正态方程有关。

统计检验共同的“基本格式”

因为大多数统计检验的最终目的是估计变量间的关联，所以大多数统计检验都遵循上面所解释的基本格式。统计学上，就是研究变量组间差异与变量总变异的比率。例如，上例表示性别解释的那一部分变异与白细胞数总变异的比率，这比率通常称为可解释变异与总变异之比。统计学上，可解释变异一词并不需要我们从概念上理解它。它通常仅用来表示所研究变量的共同变异，即某一变量中可由另一变量特定值所解释的那部分变异，反之亦然。

如何测量变量间的关联强度

统计学家发展了许多测量变量关联强度大小的方法；一定条件下，某种方法的选择依赖于所含变量的多少，所使用的量表及关联的本质等等，但大多都遵守一条基本原则：都试图通过与这些特定变量间最大可能关联比较来估计实际关联强度的大小。从统计学上讲，估计关联的常用方法是观察变量值的差异，然后计算所研究的两个或多个变量含有共同差异时解释总差异的比例。通俗地说，就是将变量中共同部分比成如果变量完全相关时应潜在相同的部分。让我们看一个简单的例子。样本中男性WCC的平均值为100，女性为102。可以认为，每个个体与总体平均数（101）的差异中，包含了由于对象性别差异的成分。这个成分的大小为1。这个值一定程度上，代表了性别与WCC间的关联。但这个值的说服力还是相当弱的。因为，在给定了WCC的总体差异情况下，它还不能说明该成分的相对大小。考虑2个特殊例子：

a.如果全部男子WCC值都为100，而女性都为102，那么所有与样本总均值的差异均可用性别来解释。可认认为样本中性别与WCC完全相关，即观察对象间100%的观察变异都可用性别来解释。

b.如果WCC值在0-1000的范围中波动。男女WCC平均值相同的差异（为2）所能解释的总变异就很小了，几乎可被忽略。例如，增加一个观察对象可能改变差异甚至将差异方向颠倒过来。因此，一个好的测量变量间的关联的方法必须考虑样本中个体的总变异并估计有多大的变异可被所讨论的关联来解释。

无关联能成为显著性结果吗？

变量间的小关联需要大样本证明其显著性。例如，推测证明硬币仅有0.000001%的不对称需要进行多少次投掷！因此最小样本量随着作用结果大小的减弱而增加。当作用大小接近于0，最终证明其作用的必需样本量趋近于无穷大。也就是说，如果两变量间几乎无关联，那么样本量大小几乎等于总体，假设总体为无限大。统计学显著性是如果我们测量整个总体，能够得到类似结果的概率。因此，根据定义，在测量总体之后以最高的可能性水平检验任何结果都可能具有显著性，其中也包括无关联的结果。

为什么只有大样本中小关联才有显著性

上段的例子提示，如果所研究变量间的关联（即在总体中）的确很小，除非调查样本相当大，没有其他方法识别这种关联。即使样本的确具有“很好的代表性”，样本很小，统计学上也不具统计学显著性水平。类似地，如果研究关联的确非常大（即在总体中），小样本中也可能具有高度统计学意义。看下面的一个例子。如果硬币轻微不对称，抛的时候，产生头面的次数较尾面次数多（例如60%对40%），投掷10次不足以让人相信硬币是不对称的。即使所得的结果（6次头面4次尾面）很能代表硬币的不均衡性。但是，是不是10次的投掷什么也不能证明呢？不是的，如果研究的作用相当大，10投掷就足够了。如果硬币很不对称，无论怎么投掷结果都是头面。这样的硬币投10次，并且每次都是头面，大部分的人就认为硬币确有“不妥”。换句话说，该现象可认为是在一无限投掷硬币的理论总体中头面比尾面多的有力证据。如果关联足够大，小样本就可证明其显著性。

[此贴子已经被作者于2006-10-29 11:29:04编辑过]

奖励楼主50分

谢谢

楼主真厉害

楼主好像是俺上研时的老师哦。嘿嘿。