第四节 集中趋势集中量:描述反映数据的集中趋势或典型水平的指标c
算术平均数/平均数或均数
中位数/位置平均数Md
众数Mo
加权均数:
几何平均数
算术平均数是所有观察值Xi的总和除以总次数所得之商
观察值须按大小排列位于最中间的观察值
是数据中出现次数最多的那个数值。
成几何级数增长的变量值的平均数,
观察值的总和等于算术平均数的n倍,
各观察值与算术平均数之差(离差)总和为零 。
各观察值与算术平均数之差(离差)的平方和为最小,x。为非E(x)的任意值
方法:依大小排列;据总次数(n)奇偶定中间位。若为奇则第(N+1)/2个观察位就是中位数;若为偶取n/2和n/2+1个观察值间均值。
方法: 依大小排列,观察法直接找出现次数最多的数;次数分布中次数最多的那一组的组值或次数分布曲线最高点相对应的横坐标的点的取值
反应灵敏;严密确定;适合进一步的代数运算;受抽样变动的影响较小; 可消除因偶然性造成的差异,从而揭示出必然因素的作用。
极端数值不影响、严密确定、简明易懂、计算简便,受抽样变动影响较小(劣于算术平均数)。适有极端数值,或个别数据缺少或顺序量表。
众数简明易懂.也不受极端数值的影响
当一个数列的后的数据是以前一个数据为基础成比例增长时;适合于计算平均比率和平均发展速度,n数值连乘积的n次根
易受极端数值的影响,数据某个数值的不确切则无法计
敏感性不如算术均数,不适合进一步的代运算,
次数分布表设定不同组时,数值变化大;不适进一步运算,而受抽样变动影响较大
三者关系:若次数分布是对称的,则二者相等,在图上重合为一个点。
若观察值够多次数分布偏斜适度(接近正态分布),则:中位数与算术平均数之间的距离和众数与算术平均数之间的距离之比为1:3。