作者:跳花妹535 | 来源:互联网 | 2023-07-03 16:14
为什么样本方差的分母为n-1而不是n?样本方差与样本均值,都是随机变量,都有自己的分布,也都可能有自己的期望与方差(由此进一步讨论估计量的无偏性与有效性)。取分母n-1,可使样本方
为什么样本方差的分母为n-1而不是n?
样本方差与样本均值,都是随机变量,都有自己的分布,也都可能有自己的期望与方差(由此进一步讨论估计量的无偏性与有效性)。取分母n-1,可使样本方差的期望等于总体方差,即这种定义的样本方差是总体方差的无偏估计。
这样看,x1,x2,…xn是n个可以自由变化的样本,互不影响。
而x1-xbar, x2-xbar,…xn-xbar是否也是n个自由变化的呢?不是……因为这n个统计量受到一个约束条件的影响就是之和等于0。如果我们记 yi=xi-xbar,也就是说y1+y2+…yn=0,这样我们可以任意变动其中n-1值,比如取定了y1,y2,…y(n-1),那么yn就不能任意变化,yn=-(y1+y2+y(n-1))。
这个只是从自由变化的角度直观解释,实际上证明分布比较烦琐……
举个例子:
比如说让十跟人任意取十个数,很容易理解可以随便取.十个都是自由的.
如果我加一个条件,十个人取十个数,但是这是个书加起来必须得零.第一个人可以随便取,第二个人也可以,第九个也可以,都是自由的,但是第十个人不能随便自由取,只能取特定的数,才能保证这十个数的和是零.所以加了一个条件就丢了一个自由度
由于有一个约束条件,所以最后一个变量不能随便取。为了满足这个约束条件,第n个变量不能随机取值,它的值由前n-1个变量确定了。问题是:虽然第n个变量不能随机取,假设取10以满足约束条件,但10与均值的离差仍然存在。分子中,包括了这个离差平方,但分母却不考虑它。
是不是可以这样理解:按照方差的“定义”,分母仍应取n。只是为了保证无偏性,对样本方差进行调整。通过计算,分母应当取n-1。这时的方差实际是“调整后的样本方差”,只不过我们仍将它叫做“样本方差”。
用样本去估计总体,当然就要评估估计的好坏如何。第一个评估方面就是先要评估这个估计是有偏估计还是无偏估计,无偏估计更为有效。除以n所得到的样本方差虽然也是总体方差的估计量,但是不是无偏估计量,而除以n-1所得到的样本标准方差则是无偏估计量。正因为除以n-1所得到的样本标准方差是总体的无偏估计,所以它更科学点,误差小些。之所以选择n-1,不是巧合,而是数学推导下的结果。
[@more@]
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/8479061/viewspace-1007320/,如需转载,请注明出处,否则将追究法律责任。
转:http://blog.itpub.net/8479061/viewspace-1007320/