考试结束了,仙友们估计都精疲力竭了,开启了短暂的休息时间。回忆备考时各路修仙大队、小分队长期不懈的并肩作战、互相督促、学习和努力,那种感觉真是美好,前进的路上,你不是在孤军奋战。
本来想着考完试后,临幸下四公主狂打一个月游戏,彻底舒缓一下那持续8个月压在心口上的那口气,后来发现硬核游戏好难打,被BOSS疯狂教做人后气不打一处来,还是乖乖看书吧,把今年学习的内容趁热打铁总结完成,给2020年画下一个句号。
之前由于备考,心理统计学的重点章节的总结没有全部完成,接下来还需要总结卡方检验、非参数检验、线性回归三大章节,今天我们先来看卡方检验。
本文篇幅较长、内容较多,总结的顺序为:
卡方检验别名、卡方检验原理、实际次数、理论次数
卡方检验的假设、卡方检验的类别、卡方检验的基本公式、期望次数计算、连续性校正
配合度检验:检验无差假说、检验假设分布的概率、分布拟合检验(吻合性检验)、比率或百分比配合度检验
独立性检验:独立样本四格表独立性检验、相关样本四格表独立性检验、RXC表独立性检验
同质性检验:单因素分类数据同质性检验、列联表形式同质性检验
第一节:卡方检验原理
一、基本概念
1. 卡方检验的别名:
卡方检验:由于是对计数数据统计分析的根据是卡方分布,所以称这类统计方法为卡方检验。
列联表分析或交叉表分析:在初步整理技术数据时,除了用次数分布表呈现数据之外,大都用列联表(contingency table)或交叉表(cross tabulation)的单元格形式,也称为列联表分析或交叉表分析。
百分比检验:因卡方检验使用的列联表的单元格里的值是次数或百分比,所以也称为百分比检验。
非参数检验:因为对计数数据总体的分布形态不做任何假设,卡方检验被视为非参数检验方法的一种。
2. 卡方检验能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否一致的问题,或者说有无显著性差异问题。
3. 实际频数(actual frequencies):简称实计数或实际数,指在实验或调查中得到的计数资料,也称为观察频数(observed frequencies)。
4. 理论频数(theoretical frequencies):是根据概率原理、某种理论、某种理论次数分布或经验分布计算出的次数,也称为期望频数(expect frequencies)。
二、卡方检验的假设
1. 分类相互排斥、互不相容:每一个观测值只能被划分到一个类别或另一个类别之中,不能出现某一观测值同时划分到多个类别当中的情况。
2. 独立性假设:即观测值相互独立。各个被试的观测值之间彼此独立,是最基本的一个假设。在实际研究中,让观测值的总数等于实验中不同被试的总数,要求每个被试只有一个观测值,这是确保观测值相互独立最安全的做法。
3. 期望次数的大小
为使卡方分布称为卡方值合理准确的近似估计,每一个单元格中的期望次数应该至少在5个以上。
更严谨的统计学家提出更严格的标准:当自由度为1时,每一个单元格的期望次数至少不应低于10才能保证检验的准确性。
在许多分类研究中,若自由度很大,有几个类别的理论次数虽然很小,但在可接受的标准范围内,只有一个类别的理论次数低于1,此时,简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。
三、卡方检验的类别
1. 配合度检验:
无差假说检验:主要检验一个因素多项分类的实际观察数与某理论次数是否相一致的问题,或有无显著差异问题。
正态吻合性检验:当对连续数据的正态性进行检验时,也称为正态吻合性检验。
分布拟合检验:在给定显著水平下,根据样本次数分布对连续型随机变量数据是否服从某种指定的具有明确表达式的理论分布(如正态分布、二项分布、泊松分布)进行的显著性检验,也称为分布的拟合度检验,或吻合度检验,简称分布拟合检验。
单因素检验:由于检验的内容仅涉及一个因素多项分类的计数资料,也可以说是一种单因素检验(one-way test)。
2. 独立性检验:用来检验两个或两个以上因素各种多项分类之间是否有关联或是否有独立性问题。如果变量多于两个,即探讨三个以上变量之间关系时,必须使用多维列联表分析方法。如,性别(男、女)对某个问题的态度(赞成、不可置否、反对)是否有关系。
3. 同质性检验:检定不同人群母总体在某一个变量的反应是否具有显著差异,或分析几种因素之间是否真有实质上的差异,或判断几次重复实验的结果是否同质的问题。
注意!独立性检验和同质性检验的区别:
四、卡方检验的基本公式
1. 卡方检验的统计原理:
比较观察值与理论值的差别:
2. 计算公式
五、期望次数的计算
1. 配合度检验:期望值为总体的实际数值,或某一理论存在的数值。
2. 独立性检验、同质性检验:如果两个变量或两个样本无关联时,期望值为列联表中个单元格的理论次数,即各个单元格对应的两个边缘次数的乘积除以总次数,如下:
六、小期望次数的连续性校正
1. 条件:运用卡方检验时,各单元格的理论次数不得小于5。小于5将违反统计基本假设,导致统计检验高估的情况,通常要有80%以上的单元格理论值要大于5。
2. 单元格次数过少时,有以下四种处理办法:
单元格合并法:若有一格或多个单元格的期望次数小于5时,可适当调整变量的分类方式,将部分单元格合并。如学历层次,可将博士生与研究生合并。
增加样本数:若研究者无法改变变量的分类方式,又想获得有效样本,最佳方法是直接增加样本容量来提高期望次数。
去除样本法:若样本无法增加,次数偏低的类别又不具有研究价值时,可将该类被试去除,但研究的结论不能推论到这些被去除的母总体中。
使用校正公式:
在2X2列联表检验中,若单元格的期望次数低于10但高于5,可用耶茨校正公式校正。
若期望次数低于5时,或样本总人数低于20时,应使用费舍精确概率检验法。
当单元格内容牵扯到重复测量设计时(如前后测设计),可用麦内码检验。
第二节:配合度检验
一、配合度检验的一般问题和步骤
1. 统计假设:
2. 计算自由度:
第一,配合度检验中的自由度与两个因素有关:
第二,配合度检验的自由度一般为分类的项数-1。
第三,在对计数数据分布的配合度进行检验(即拟合优度检验)时,如正态拟合检验会用到总数、平均数、标准差3个统计量,此时自由度为分组数目-3。
3. 计算理论次数:一般根据某种理论,按一定的概率通过样本即实际观察次数计算。这里的某种理论可以是经验概率,也可以是理论概率。
二、配合度检验的应用
1. 检验无差假说:所谓无差假说,指各项分类的实际数之间没有差异,即假设各项分类之间的机会相等或概率相等,即理论次数完全按概率相等的条件计算,即:理论次数 = 总数/分类项数。
我们通过两个例题进行理解:
2. 检验假设分布的概率:
假设某因素各项分类的次数分布为正态,检验实计数与理论上期望的结果之间是否有差异,即理论次数的计算应按正态分布概率,分别计算各项分类的理论次数。具体方法为按正态分布理论计算各项分类应有的概率再乘以总数,便得到各项分类的理论次数。
若实现假定所观察的资料不是正态分布,而是其他分布,如二项分布、泊松分布,其概率应按所假定的分布计算。
若实现假定的分布不是理论分布,而是经验分布,可按此经验分布计算概率,再乘以总数得到理论次数,进一步检验假设分布与实计数的分布之间,即实计数与理论次数之间差异是否显著。
我们通过1个正态分布、1个经验分布的例题进行理解:
3. 连续变量分布的吻合性检验:
第一,分布拟合检验(吻合性检验):对于连续随机变量的计量数据,有时在研究中预先不知道其总体分布,而要根据对样本的次数分布来判断是否服从某种指定的具有明确表达式的理论次数分布,然后在给定的显著性水平下,对假设做显著性检验,通常称为拟合度检验。
第二,检验方法:
将测量数据整理成次数分布表,画出次数分布曲线图,根据次数分布曲线,判断选择恰当的理论分布。
可选择某一直线或曲线的理论分布函数方程式计算理论次数,把实际分组次数和理论次数代入卡方检验的基本公式,计算卡方值,查卡方值表。
若差异显著,需另选理论分布函数再次比较,直至吻合。
以下例题为通过次数分布表来检验实际计数分布是否为正态分布。
4. 比率或百分比的配合度检验:
若收集的计数资料用百分数表示,配合度方法与上述情况基本相同,只是最后将计算的卡方值乘以N/100后再查卡方值表,原因在于最初百分数是由原数据乘以100/N得到的,在结果中再乘以N/100进行还原。
第三节:独立性检验
一、概念与定义
1. 独立性检验:主要用于两个或两个以上因素多项分类的计数资料分析,也即研究两类变量之间的关联性和依存性问题,即研究的两个因素(又称自变量)或两个以上因素之间是否具有独立性,或有无关联的,或有无“交互作用”存在。
2. 双因子检验(双母总体检验):由于两个变量代表两个不同的概率(或母体),独立性检验必须同时处理双变量的总体特性,也可称为双因子检验。
3. 列联表分析:独立性检验也称为列联表分析,如下表所示:
2X2表(四格表):两个因素各有两项分类,称为2X2表或四格表。
2Xk表:一个因素有两项分类,另一个因素有k项分类,则称为2Xk表。
RXC表:一个因素有R类,另一个因素分C类,这种表称为RXC表。
多维列联表:因素多于两个以上,称为多维列联表。
二、独立性检验的一般问题与步骤
1. 统计假设:(一般多用文字叙述而少用统计符号表示)
2. 理论次数的计算:
3. 计算自由度:
两因素列联表自由度与两因素各自的分类项数有关。设R为每一行的分类项数,C为每一列的分类数目,则自由度为:df=(R-1)(C-1)。
在上例中,R=3,C=2,df=(3-1)(2-1)=2。这里的自由度指的是,在计算理论次数时,在3x2=6的单元格内,只有2个单元格内的数目可以自由变动,即在6个单元格内,只要有2个单元格内的数字确定,在边缘次数(即fx、fy)不变的情况下,其他各单元格的数字就随之确定了。
4. 统计方法的选择:
上式中f0i为每一格的实计数,fxi是与f0i对应的那一行的总数即为边缘次数。fyi是与f0i对应的那一列的总数,也为边缘次数,N为总的观察次数。
5. 结果与解释:
三、四格表的独立性检验
最简单的列联表即四格表,四格表的独立性检验很多情况下与二比率差异显著性检验的统计功用相同。例如其中一个因素属于被试方面的两项分类时,将调查结果可以整理成两个比率,也可以整理成四格表形式。
1. 独立样本四格表卡方检验
独立样本四格表检验例题如下:
2. 相关样本四格表卡方检验
相关样本四格表检验例题如下:
3. 四格表卡方值的近似校正
四、RXC表独立性检验
第四节:同质性检验
1. 同质性检验(test for homogeneity)应用的场景:
2. 单因素分类数据的同质性检验:
计算步骤如下:
计算各个样本组的卡方值和自由度。
累加各样本组卡方值,计算其总和、自由度的总和。
将各样本组原始数据相应类别合并,产生一个总的数据表,并计算此总数据表的卡方值和自由度。
计算各样本组的累计卡方值与总测试次数合并获得卡方值之差,称此为异质性卡方值。异质性卡方值是各个样本组间不一致的部分,其自由度为各样本组累计自由度与合并后的总数据的自由度之差。
查卡方值表,判断卡方值是否显著:若显著,表明几个样本组之间异质;若不显著,表明同质。
例题如下:
3. 列联表形式的同质性检验:
当几组实测数据以列联表形式呈现时,其同质性—异质性卡方分析方法与单因素分类数据的通知性检验方法相同,我们直接看下面的例题:
参考文献
张厚粲、徐建平:《现代心理与教育统计学》,北京师范大学出版集团、北京师范大学出版社,第4版
弗雷德里克·J·格雷维特、拉里·B·瓦尔诺 著:《行为科学统计精要》,中国人民大学出版社,第8版