學習教育統(tǒng)計中,對自由度的概念不甚了解,故求助于baidu。
自由度,很多統(tǒng)計量的計算公式中都有自由度的概念,可為什么同樣是計算標準差,總體標準差的自由度是n,而樣本標準差的自由度就是n-1?為什么其它公式中的自由度還有n-2、n-3呢? 它到底是什么含意?
翻看了以前的教材以及到網(wǎng)上查閱了大量相關(guān)資料,原來,不僅僅是統(tǒng)計學里有自由度的概念呀!下面把有關(guān)自由度的問題點簡要歸納一下。
理論力學:確定物體的位置所需要的獨立坐標數(shù)稱作物體的自由度,當物體受到某些限制時——自由度減少。一個質(zhì)點在空間自由運動,它的位置由三個獨立坐標就可以確定,所以質(zhì)點的運動有三個自由度。假如將質(zhì)點限制在一個平面或一個曲面上運動,它有兩個自由度。假如將質(zhì)點限制在一條直線或一條曲線上運動,它只有一個自由度。剛體在空間的運動既有平動也有轉(zhuǎn)動,其自由度有六個,即三個平動自由度x、y、z和三個轉(zhuǎn)動自由度a、b、q。如果剛體運動存在某些限制條件,自由度會相應減少。
熱力學中:分子運動自由度就是決定一個分子在空間的位置所需要的獨立坐標數(shù)目。
統(tǒng)計學中:在統(tǒng)計模型中,自由度指樣本中可以自由變動的變量的個數(shù),當有約束條件時,自由度減少自由度計算公式:自由度=樣本個數(shù)-樣本數(shù)據(jù)受約束條件的個數(shù),即df = n - k(df自由度,n樣本個數(shù),k約束條件個數(shù))
我們當然最關(guān)心的還是統(tǒng)計學里面的自由度的概念。這里自由度的概念是怎么來的呢?據(jù)說:
一般總體方差(sigma^2),其實它是衡量所有數(shù)據(jù)對于中心位置(總體平均)平均差異的概念,所以也稱為離散程度,通常表示為sum(Xi-Xbar)^1/2/N ,(有多少個數(shù)據(jù)就除多少)而樣本方差(S^2),則是利用樣本數(shù)據(jù)所計算出來估計總體變異用的(樣本統(tǒng)計量的基本目的:少量資料估計總體).一般習慣上,總體怎么算,樣本就怎么算,可是在統(tǒng)計上估計量(或叫樣本統(tǒng)計量)必須符合一個特性--無偏性,也就是估計量的數(shù)學期望值要等于被估計的總體參數(shù)=> E(S^2)=sigma^2(無偏估計)。很不幸的,樣本變異數(shù)E(S^2)并不會等于sigma^2所以必須做修正,而修正后即為sum(Xi-Xbar)^2/(N-1).才會繼續(xù)帶出后來的自由度概念。(自由度是由修正樣本統(tǒng)計量得來的嗎?)
網(wǎng)上一些文獻的說法也是林林總總。
金志成實驗設計書中的定義:能獨立變化的數(shù)據(jù)數(shù)目。只要有n-1個數(shù)確定,第n個值就確定了,它不能自由變化。所以自由度就是n-1。自由度表示的是一組數(shù)據(jù)可以自由表化的數(shù)量的多少。
通俗點說,一個班上有50個人,我們知道他們語文成績平均分為80,現(xiàn)在只需要知道49個人的成績就能推斷出剩下那個人的成績。你可以隨便報出49個人的成績,但是最后一個人的你不能瞎說,因為平均分已經(jīng)固定下來了,自由度少一個了。
自由度的設定是出于這樣一個理由:在總體平均數(shù)未知時,用樣本平均數(shù)去計算離差(常用小s)會受到一個限制————要計算標準差(小s)就必須先知道樣本平均數(shù),而樣本平均數(shù)和n都知道的情況下,數(shù)據(jù)的總和就是一個常數(shù)了。所以,“最后一個”樣本數(shù)據(jù)就不可以變了,因為它要是變,總和就變了,而這是不允許的。至于有的自由度是n-2什么的,都是同樣道理。
n-1是通常的計算方法,更準確的講應該是n-k,n表示“處理”的數(shù)量,k表示實際需要計算的參數(shù)的數(shù)量。如需要計算2個參數(shù),則數(shù)據(jù)里只有n-2個數(shù)據(jù)可以自由變化。例如,一組數(shù)據(jù),平均數(shù)一定,則這組數(shù)據(jù)有n-1個數(shù)據(jù)可以自由變化;如一組數(shù)據(jù)平均數(shù)一定,標準差也一定,則有n-2個數(shù)據(jù)可以自由變化。df=n-k的得出是需要大量的數(shù)理統(tǒng)計的證明的。太復雜的情況,我們就不討論了。
對卡方分布,t分布而言,從其統(tǒng)計量的來源看,卡方分布自由度n理解為來自n個服從正態(tài)分布的樣本,而且他們之間并沒有什么約束關(guān)系,也就是說n個樣本都是可以自由變化的。
而對于我們在統(tǒng)計檢驗中構(gòu)造的那些統(tǒng)計量而言,也可以這樣理解,一般自由度并不為n,是因為這n個樣本之間有約束關(guān)系,約束方程的個數(shù)為a,則自由度為n-a,因為一般約束方程的個數(shù)等于未知參數(shù)的個數(shù),也就是說自由度是n-未知參數(shù)的個數(shù),但是這種解釋在有些場合不容易理解,也沒有說到本質(zhì)上,嚴格的解釋應該還是從統(tǒng)計量對應的二次型的秩的角度來理解。
參見南開大學王兆軍 數(shù)理統(tǒng)計講義 2006
或幾篇論文:
1、劉麗君,數(shù)理統(tǒng)計中的“自由度”及教材中一處證明的訂正,溫州師范學院學報(自然科學版),vol24,5,2003。
2、張宏廣,自由度的求法,承德民族師專學報,第26 卷第2 期,2006。
3、曲衛(wèi)彬,淺談“自由度”,高校教育。
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。