专栏的前几期文章,临度简单讲解了基础统计的知识,如:
之后介绍了logistic回归,如:
我们知道logistic回归的几个作用:
那我们今天升华一下:
万物皆可盘,数据预未来
模型终有误,或尤建奇功
一般常见的统计建模为内部验证和外部验证:内部验证即把一份数据一拆为二,70%用作训练集,30%用作验证集;外部验证即为用已有的数据做模型,用其他的数据来做验证(原理都相似)。
直接上代码:先用SAS随机生成一份数据来演示,样本量1000,因变量y和自变量x1-x4均为二分类(1,0)。
结果X1-X4均有统计学意义,可建模分析。
*如果您的数据没差异,可选择一种回归方式筛选变量,之后在进行建模。
结果知:mcnemar检验P>0.05,说明实际的结局分布和预测的结局分布差异无统计学意义,可用于预测。
结果同上,只是思路不一样而已。
结果同上:mcnemar检验P>0.05,说明实际的结局分布和预测的结局分布差异无统计学意义,可用于预测。
最终的预测模型为:
大家可能会觉得OR都<1&#xff0c;结果不太好去解释&#xff0c;那就把参照换掉。
好了&#xff0c;本期讲解到此结束&#xff0c;欢迎关注哦&#xff0c;我们下期再见~
— THE END —