热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

matlab游程检验结果分析,SPSS教程学习笔记6:数据随机化游程检验

游程检验亦称“连贯检验”,主要目的就是检验取值为二分类并且按某种顺序(例如时间顺序)排列的数据资料,是否确实是随机出现的,可以通俗理解为检

游程检验亦称“连贯检验”,主要目的就是检验取值为二分类并且按某种顺序(例如时间顺序)排列的数据资料,是否确实是随机出现的,可以通俗理解为检验样本数据的随机性。

这个方法对于提前了解数据质量,在数据预处理阶段能发挥比较重要的作用,但在实际应用当中,它反而是太低调,以至于很多人压根不知道还有这么一个统计方法。

基本原理

简单举例说明:比如一组数据00110111000100100010,共20位。前两个0连贯出现1次,称为1个游程,第3和4位连贯两个1出现1次,称为1个游程,第5位单独一个0也算1个游程,第6第7第8位,三个1连贯出现,算作一次游程,依次类推,这组数据00110111000100100010,(0用划线,1不用划线)就有11个游程。这是游程的概念。

原则:如果序列为真随机序列,那么游程的总数应该不太多也不太少。如果游程的总数极少,就说明样本缺乏独立性,内部存在一定的趋势或者结构,这可能由于观察值间不独立,或者来自不同的总体。如果样本间存在大量游程,则可能有系统的短周期波动影响观察结果,同样认为序列非随机。

检验原理:将数据分为两类(以平均数或者中数或者众数或者自定义的值为基准,小于此基准的为一类,大于此基准的为一类),看前一个个案的是否影响后一个个案的,若不影响,进而得到数据是随机抽取的。

假设检验中原假设H0:样本是随机抽取的。

案例演示

收集生产线上连贯生产的30袋食品并称重,试分析该生产线运行是否正常。

a19d7d657d744ecd17cc6f7317ffb346.png

如上图,数据包括编号和重量两个变量。

1、调出菜单界面

菜单栏中选择【分析】→【非参数检验】→【单样本】。

bf39f8e7ef6a56215561d5a6fec117c3.png

2、参数设置

【单样本非参数检验】有三个选项卡,第一个选项卡【目标】选择【定制分析】,第二个选项卡【字段】,将左侧变量栏中的“重量”移入右侧【检验字段】栏中,第三个选项卡【设置】,第一项【选择检验】,在【定制检验】界面中选择最后一项【检验序列的随机性(游程检验)】,点击【选项】按钮,在【定义连续字段的分割点】下选择【样本平均数】。其他选项不用过多设置,默认采用0.05临界显著性水平。

c54dcb5f71a15cf58d7815c40adfa2b9.png

将连续变量分隔为二分类,除了我们前面提到的平均值外,选择数据均值作为分隔点,同样是非常棒的参考标准。

3、执行任务

点击下方【运行】,SPSS软件开始执行此次游程检验。

4、结果分析

SPSS单样本游程检验,假设检验摘要表。

9f7a406e90f2fbc161d8eccbd2cec2bc.png

30袋食品重量的均值为83.57,以83.57作为分隔点,将30个数据分割为两组,原假设第一组内的重量值和第二组内的重量值是随机序列,游程检验给出的显著性是0.00,小于临界值0.05,拒绝随机性假设,说明该生产线生产情况不正常,生产过程中连续出现重量偏低或者偏高的产品。

27fd90ee241dbdb7c2ddac0e513e4bff.png

双击假设检验表,还可以打开具体的数据,如上,此组数据共出现5个游程,属于偏少的情况,数据本身并不具备完全的随机化,对于产品生产来说,可能过多的出现连续偏高或偏低的产品。

3b606bf7028b8ba8ffa9969b51cbe908.png

再制作一个条形图,我们也可以从图形能看出游程的分布情况,产品生产连续偏高和偏低,随机化较差。

练习所需数据下载

链接: https://pan.baidu.com/s/1A3n6Q7eFkcV3_9zUhoYIBA 密码: wkut



推荐阅读
author-avatar
fhuwiop
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有