点击蓝字 关注我们
1
样本与总体回归系数的区分
简单回顾一下:

无论是做回归还是相关分析,我们拿到数据的第一步应该是先画一个散点图:以因变量Y为纵轴,以自变量X为横轴(如果有多个自变量,则让Y逐一与X画散点图)。本例我们研究的是DON对OAP的影响,所以以OAP为Y,以DON为X,散点图如下:

如上图,两变量之间正向的线性关系还是很明显的,随着DON的提升,OAP也有上升的趋势,所以推测,粮食中DON毒素可能会导致患者关节炎的发生。我们现在希望通过回归分析来定量地衡量DON对OAP的影响,就是希望求出回归方程中的

如下图,我们根据肉眼观察,对关节炎的数据画出来两条线:蓝线和红线,问题是到底选择哪一条线呢?

肉眼观察肯定不靠谱,只能通过数学计算来比较判断,如何判断呢?本质上这是一个求最小值的问题。上面说过了,我们希望得到的直线离所有散点的综合距离最小,怎么把这句话转变成数学计算呢?所谓的“综合距离”最小,用数学的语言来表达就是让下面这个式子取最小值

重点看上式的右边,我们要知道,

以上这个过程就是大家总能听到的“最小二乘法”。
回到我们关节炎的例子,最后得出其回归方程为:


来源:“丁点帮你”公众号
【免责声明】《管理学刊》微信公众平台所转载的专题文章,仅作学术交流之用,未有任何商业目的;本平台对文中观点保持中立;文章版权属于原作者,如果分享内容有侵权或非授权发布之嫌,请联系我们,我们会及时审核处理。


扫二维码|关注我们
微信号|glxk2009
电话|0373-3683517
