1.1单因素方差分析
1.1.1数据结构
1.1.2分析步骤
(1)提出假设
(2)构造检验统计量
(3)统计决策
(4)方差分析表
(5)用Excel进行方差分析
1.1.2.1提出假设
1.1.2.2构造检验的统计量
1.为检验H0是否成立,需确定检验的统计量
2.构造统计量需要计算
(1)水平的均值
(2)全部观察值的总均值
(3)离差平方和
(4)均方(MS)
1、计算水平的均值
结合表3的数据结构进行说明:假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数
计算公式为
2、计算全部观察值的总均值
全部观察值的总和除以观察值的总个数
计算公式为
式中,n=n1+n2+…+nk
例1分析
3、计算各误差平方和
1. 每个水平或组的各样本数据与其组平均值的离差平方和
2. 反映每个样本各观察值的离散状况,又称组内平方和
3. 该平方和反映的是随机误差的大小
4. 计算公式为
补充例计算结果
构造检验的统计量(计算误差项平方和SSE)
1. 每个水平或组的各样本数据与其组平均值的离差平方和
2. 反映每个样本各观察值的离散状况,又称组内离差平方和
3. 该平方和反映的是随机误差的大小
4. 计算公式为
构造检验的统计量(三个平方和的关系)
总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之前的关系
构造检验的统计量(三个平方和的作用)
1.SST反映了全部数据总的误差程度;SSE反映了随机误差的大小;SSA反映了随机误差和系统误差的大小
2.如果原假设成立,即H1=H2=…=Hk为真,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差
3.判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小
4.为检验这种差异,需要构造一个用于检验的统计量
计算统计量——计算均方MS
1.各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差
2.计算方法是用离差平方和除以相应的自由度
3.三个平方和的自由度分别是
(1)SST的自由度为n-1,其中n为全部观察值的个数
(2)SSA的自由度为k-1,其中k为因素水平(总体)的个数
(3)SSE的自由度为n-k
组间方差:SSA的均方,记为MSA,计算公式为
MSA=SSA/(k-1)
组内方差:SSE的均方,记为MSE,计算公式为
MSE=SSE/(n-k)
计算检验的统计量F
将MSA和MSE进行对比,即得到所需要的检验统计量F
当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k 的F 分布,即
F=MSA/MSE~F(k-1,n-k)
构造检验的统计量(F分布于拒绝域)
1.1.2.3统计决策
将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出接受或拒绝原假设H0的决策
(1)根据给定的显著性水平a,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k相应的临界值Fa
(2)若F>Fa,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响
(3)若FFa,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响
单因素方差分析表(基本结构)
例10.1题方差分析结果
【例】为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,其中零售业抽取7家,旅游业抽取了6家,航空公司抽取5家、家电制造业抽取了5家,然后记录了一年中消费者对总共23家服务企业投诉的次数,结果如表9.7。试分析这四个行业的服务质量是否有显著差异?(a=0.05)
1.1.3关系强度的测量
1.拒绝原假设表明因素(自变量)与观测值之间有关系
2.组间平方和(SSA)度量了自变量(行业)对因变量(投诉次数)的影响效应
(1)只要组间平方和SSA不等于0,就表明两个变量之间有关系(只是是否显著的问题)
(2)当组间平方和比组内平方和(SSE)大,而且大到一定程度时,就意味着两个变量之间的关系显著,大得越多,表明它们之间的关系就越强。反之,就意味着两个变量之间的关系不显著,小得越多,表明它们之间的关系就越弱
变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映
自变量平方和占总平方和的比例记为
,即
其平方根R就可以用来测量两个变量之间的关系强度
1.1.4方差分析中的多重比较
1.多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异
2.多重比较方法有多种,这里介绍Fisher提出的最小显著差异方法,简写为LSD,该方法可用于判断到底哪些均值之间有差异
3.LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的
1.1.5用Excel进行方差分析
第1步:选择“工具”下拉菜单
第2步:选择“数据分析”选项
第3步:在分析工具中选择“单因素方差分析”,然后选择“确定”
第4步:当对话框出现时
在“输入区域”方框内键入数据单元格区域
在a方框内键入0.05(可根据需要确定)
在“输出选项”中选择输出区域