作者:fhuwiop | 来源:互联网 | 2023-08-22 13:31
游程检验亦称“连贯检验”,主要目的就是检验取值为二分类并且按某种顺序(例如时间顺序)排列的数据资料,是否确实是随机出现的,可以通俗理解为检验样本数据的随机性。
这个方法对于提前了解数据质量,在数据预处理阶段能发挥比较重要的作用,但在实际应用当中,它反而是太低调,以至于很多人压根不知道还有这么一个统计方法。
基本原理
简单举例说明:比如一组数据00110111000100100010,共20位。前两个0连贯出现1次,称为1个游程,第3和4位连贯两个1出现1次,称为1个游程,第5位单独一个0也算1个游程,第6第7第8位,三个1连贯出现,算作一次游程,依次类推,这组数据00110111000100100010,(0用划线,1不用划线)就有11个游程。这是游程的概念。
原则:如果序列为真随机序列,那么游程的总数应该不太多也不太少。如果游程的总数极少,就说明样本缺乏独立性,内部存在一定的趋势或者结构,这可能由于观察值间不独立,或者来自不同的总体。如果样本间存在大量游程,则可能有系统的短周期波动影响观察结果,同样认为序列非随机。
检验原理:将数据分为两类(以平均数或者中数或者众数或者自定义的值为基准,小于此基准的为一类,大于此基准的为一类),看前一个个案的是否影响后一个个案的,若不影响,进而得到数据是随机抽取的。
假设检验中原假设H0:样本是随机抽取的。
案例演示
收集生产线上连贯生产的30袋食品并称重,试分析该生产线运行是否正常。
如上图,数据包括编号和重量两个变量。
1、调出菜单界面
菜单栏中选择【分析】→【非参数检验】→【单样本】。
2、参数设置
【单样本非参数检验】有三个选项卡,第一个选项卡【目标】选择【定制分析】,第二个选项卡【字段】,将左侧变量栏中的“重量”移入右侧【检验字段】栏中,第三个选项卡【设置】,第一项【选择检验】,在【定制检验】界面中选择最后一项【检验序列的随机性(游程检验)】,点击【选项】按钮,在【定义连续字段的分割点】下选择【样本平均数】。其他选项不用过多设置,默认采用0.05临界显著性水平。
将连续变量分隔为二分类,除了我们前面提到的平均值外,选择数据均值作为分隔点,同样是非常棒的参考标准。
3、执行任务
点击下方【运行】,SPSS软件开始执行此次游程检验。
4、结果分析
SPSS单样本游程检验,假设检验摘要表。
30袋食品重量的均值为83.57,以83.57作为分隔点,将30个数据分割为两组,原假设第一组内的重量值和第二组内的重量值是随机序列,游程检验给出的显著性是0.00,小于临界值0.05,拒绝随机性假设,说明该生产线生产情况不正常,生产过程中连续出现重量偏低或者偏高的产品。
双击假设检验表,还可以打开具体的数据,如上,此组数据共出现5个游程,属于偏少的情况,数据本身并不具备完全的随机化,对于产品生产来说,可能过多的出现连续偏高或偏低的产品。
再制作一个条形图,我们也可以从图形能看出游程的分布情况,产品生产连续偏高和偏低,随机化较差。
练习所需数据下载
链接: https://pan.baidu.com/s/1A3n6Q7eFkcV3_9zUhoYIBA 密码: wkut