热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

logistic回归分析优点_数据统计的理解和应用(十三)预测模型篇之logistic回归...

专栏的前几期文章,临度简单讲解了基础统计的知识,如:两组定量资料的分析思路之t检验多组样本比较之方差分析列联表之卡方检验之后介绍了logi
84c0fbc37e268ae8b77eb4f56786778c.png

专栏的前几期文章,临度简单讲解了基础统计的知识,如:

  1. 两组定量资料的分析思路之t检验
  2. 多组样本比较之方差分析
  3. 列联表之卡方检验

之后介绍了logistic回归,如:

  1. 统计分析之logistic回归
  2. 单因素logistic回归分析案例
  3. 多因素logistic回归案例分析

我们知道logistic回归的几个作用:

  1. 探索危险因素
  2. 控制协变量,求某种因素对结局的影响
  3. 统计建模

那我们今天升华一下:

万物皆可盘,数据预未来

模型终有误,或尤建奇功

聊聊这个建模预测的过程

一般常见的统计建模为内部验证和外部验证:内部验证即把一份数据一拆为二,70%用作训练集,30%用作验证集;外部验证即为用已有的数据做模型,用其他的数据来做验证(原理都相似)。

直接上代码:先用SAS随机生成一份数据来演示,样本量1000,因变量y和自变量x1-x4均为二分类(1,0)。

b7b9e90fa4d1126baef1091a0fa52b3a.png
8c24fb3a564cfdd331e83585f179a08e.png
257776ede8449ad9be0315aab67989c9.png

结果X1-X4均有统计学意义,可建模分析。

*如果您的数据没差异,可选择一种回归方式筛选变量,之后在进行建模。

ad01b5dc779734ff13cc8ed139896a88.png
3d6c24c77f19b8b73f70e30c34aad11f.png

结果知:mcnemar检验P>0.05,说明实际的结局分布和预测的结局分布差异无统计学意义,可用于预测。

476e7e4cb3fee328649d76e5e44f66eb.png
77958b392badfa9be69a335ed7bd2387.png

结果同上,只是思路不一样而已。

d3711059fdde4bd80e712476a415b271.png
b72e5c4c25f0d95a2646bd3a9e949fce.png

结果同上:mcnemar检验P>0.05,说明实际的结局分布和预测的结局分布差异无统计学意义,可用于预测。

最终的预测模型为:

03912fcc8abb53b4c7621d2c828efb8b.png
69040d5e4ba57832a59557835b9d7c97.png

大家可能会觉得OR都<1&#xff0c;结果不太好去解释&#xff0c;那就把参照换掉。

160370b88c2442182b8fbb1b241d1303.png
5ee095a5a0d601d1fa830fbdaf4c8f0f.png
695a06b80cbadd7486c7ab37c5615121.png

好了&#xff0c;本期讲解到此结束&#xff0c;欢迎关注哦&#xff0c;我们下期再见~

— THE END —



推荐阅读
author-avatar
浪奔西安
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有