設(shè)樣本均值為
很多人可能都會有疑問,為什么要除以n-1,而不是n,但是翻閱資料,發(fā)現(xiàn)很多都是交代到,如果除以n,對樣本方差的估計(jì)不是無偏估計(jì),比總體方差要小,要想是無偏估計(jì)就要調(diào)小分母,所以除以n-1,那么問題來了,為什么不是除以n-2、n-3等等。所以在這里徹底總結(jié)一下,首先交代一下無偏估計(jì)。
無偏估計(jì)
以例子來說明,假如你想知道一所大學(xué)里學(xué)生的平均身高是多少,一個(gè)大學(xué)好幾萬人,全部統(tǒng)計(jì)有點(diǎn)不現(xiàn)實(shí),但是你可以先隨機(jī)挑選100個(gè)人,統(tǒng)計(jì)他們的身高,然后計(jì)算出他們的平均值,記為
介紹無偏估計(jì)的意義就是,我們計(jì)算的樣本方差,希望它是總體方差的一個(gè)無偏估計(jì),那么假如我們的樣本方差是如下形式:
那么,我們根據(jù)無偏估計(jì)的定義可得:
由上式可以看出如果除以n,那么樣本方差比總體方差的值偏小,那么該怎么修正,使得樣本方差式總體方差的無偏估計(jì)呢?我們接著上式繼續(xù)化簡:
到這里得到如下式子,看到了什么?該怎修正似乎有點(diǎn)眉目。
如果讓我們假設(shè)的樣本方差
則:
因此修正之后的樣本方差的期望是總體方差