点击蓝字 关注我们
1
样本与总体回归系数的区分
简单回顾一下:无论是做回归还是相关分析,我们拿到数据的第一步应该是先画一个散点图:以因变量Y为纵轴,以自变量X为横轴(如果有多个自变量,则让Y逐一与X画散点图)。本例我们研究的是DON对OAP的影响,所以以OAP为Y,以DON为X,散点图如下:如上图,两变量之间正向的线性关系还是很明显的,随着DON的提升,OAP也有上升的趋势,所以推测,粮食中DON毒素可能会导致患者关节炎的发生。我们现在希望通过回归分析来定量地衡量DON对OAP的影响,就是希望求出回归方程中的 如下图,我们根据肉眼观察,对关节炎的数据画出来两条线:蓝线和红线,问题是到底选择哪一条线呢?肉眼观察肯定不靠谱,只能通过数学计算来比较判断,如何判断呢?本质上这是一个求最小值的问题。上面说过了,我们希望得到的直线离所有散点的综合距离最小,怎么把这句话转变成数学计算呢?所谓的“综合距离”最小,用数学的语言来表达就是让下面这个式子取最小值重点看上式的右边,我们要知道,以上这个过程就是大家总能听到的“最小二乘法”。
回到我们关节炎的例子,最后得出其回归方程为:
来源:“丁点帮你”公众号
【免责声明】《管理学刊》微信公众平台所转载的专题文章,仅作学术交流之用,未有任何商业目的;本平台对文中观点保持中立;文章版权属于原作者,如果分享内容有侵权或非授权发布之嫌,请联系我们,我们会及时审核处理。
扫二维码|关注我们
微信号|glxk2009
电话|0373-3683517