標(biāo)準(zhǔn)化回歸系數(shù)
在多元線性回歸中,SPSS、SAS等統(tǒng)計(jì)軟件都會(huì)在模型參數(shù)中輸出非標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化系數(shù)。如上圖,為SPSS的多元線性回歸分析結(jié)果。
那該如何對(duì)標(biāo)準(zhǔn)化回歸系數(shù)進(jìn)行解釋呢?
咱們分兩步來闡明:
第一步:為你打開標(biāo)準(zhǔn)化回歸系數(shù)計(jì)算的“黑匣子”,弄懂統(tǒng)計(jì)軟件計(jì)算標(biāo)準(zhǔn)化回歸系數(shù)的具體思路;
第二歩:介紹標(biāo)準(zhǔn)化系數(shù)的實(shí)際意義及其應(yīng)該場(chǎng)景。
第一步
標(biāo)準(zhǔn)化回歸系數(shù)的‘黑匣子’
在多元線性回歸中,通常各自變量取值的單位及其離散程度是不同的,所以量綱不同的各回歸系數(shù)之間不能直接比較大小。
為此,可先對(duì)所有的自變量和因變量進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換,即將變量減去其均值后再除以標(biāo)準(zhǔn)差。隨后,以標(biāo)準(zhǔn)化變換后的因變量為因變量,以標(biāo)準(zhǔn)化后的各自變量為自變量,重新建立回歸方程,得到的回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)。這就是SPSS、SAS等統(tǒng)計(jì)軟件計(jì)算標(biāo)準(zhǔn)化回歸系數(shù)的“黑匣子”。
平常我們?cè)赟PSS中進(jìn)行一般的多元線性回歸操作,都會(huì)得出如下的輸出結(jié)果:
現(xiàn)在,我們按照標(biāo)準(zhǔn)化回歸系數(shù)的生成思路,一步步生成標(biāo)準(zhǔn)化回歸系數(shù),看與上面結(jié)果是否一致:
步驟一、對(duì)所有的自變量和因變量進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換,即將變量減去其均值,之后再除以標(biāo)準(zhǔn)差。
SPSS操作步驟如下:
由上圖可以看出,已生成標(biāo)準(zhǔn)化變量。
步驟二、以標(biāo)準(zhǔn)化變換后的因變量為因變量,以標(biāo)準(zhǔn)化后的各自變量為自變量,重新建立回歸方程,得到的回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)。
由上圖與開篇的第一張圖比較可以看出,藍(lán)色框中的非標(biāo)準(zhǔn)化回歸系數(shù)與一般線性回歸操作的標(biāo)準(zhǔn)化回歸系數(shù)一致。
其實(shí),從上圖中就可以看出:變量標(biāo)準(zhǔn)化后的回歸分析中,得到的非標(biāo)準(zhǔn)化回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)(藍(lán)色框與紅色框結(jié)果一致)。
至此,第一步驗(yàn)證成功!
第二歩
標(biāo)準(zhǔn)化系數(shù)的實(shí)際應(yīng)用
由于因變量與自變量的標(biāo)準(zhǔn)化轉(zhuǎn)換后,標(biāo)準(zhǔn)化變量均是服從均值為0,標(biāo)準(zhǔn)差為1 的標(biāo)準(zhǔn)正態(tài)分布,且十分重要的一點(diǎn)是,所有的標(biāo)準(zhǔn)化變量均沒有了量綱,且離散程度相同(標(biāo)準(zhǔn)差均為1)。
所以,計(jì)算出的標(biāo)準(zhǔn)化回歸系數(shù)不受變量的量綱影響。進(jìn)而,各自變量的標(biāo)準(zhǔn)化回歸系數(shù)之間是可以直接比較大小的。
標(biāo)準(zhǔn)化的變量是以一個(gè)變量自身的標(biāo)準(zhǔn)差為單位的。標(biāo)準(zhǔn)化回歸系數(shù)也就是其他自變量保持不變的情況下,該自變量變化一個(gè)單位(也就是一個(gè)標(biāo)準(zhǔn)差),因變量變化多少個(gè)單位的標(biāo)準(zhǔn)差。
各自變量的標(biāo)準(zhǔn)化回歸系數(shù)的比較反映各自變量對(duì)因變量的貢獻(xiàn)誰大誰小。
在實(shí)際應(yīng)用中,遇到“各自變量對(duì)因變量的作用大小比較”的問題。在排除了強(qiáng)影響點(diǎn)和多重共線性的前提下,應(yīng)看各自變量的標(biāo)準(zhǔn)化回歸系數(shù)。因?yàn)闃?biāo)準(zhǔn)化回歸系數(shù)消除了自變量單位的影響,具有可比性。
下面,將開篇的案例結(jié)果進(jìn)行解釋:
根據(jù)上表結(jié)果可以看出,對(duì)肺活量的貢獻(xiàn)大小,從高到低依次為身高、體重、胸圍。在這三個(gè)自變量中,身高對(duì)肺活量的影響作用最大。
總結(jié)
標(biāo)準(zhǔn)化回歸系數(shù)是指數(shù)據(jù)標(biāo)準(zhǔn)化以后算出來的回歸系數(shù),非標(biāo)準(zhǔn)化回歸系數(shù)就是用原來的數(shù)據(jù)算出來的回歸系數(shù)。
如果是要寫出回歸方程的話,就要用非標(biāo)準(zhǔn)化回歸系數(shù)。
如果是要比較各自變量對(duì)因變量的貢獻(xiàn)大小,就要用標(biāo)準(zhǔn)化回歸系數(shù)來比較。
ps:另外,路徑分析中的路徑參數(shù)就是標(biāo)準(zhǔn)化回歸系數(shù)。標(biāo)準(zhǔn)化回歸系數(shù)還可以用于進(jìn)一步的路徑分析中。統(tǒng)計(jì)分析方法學(xué)到最后你會(huì)發(fā)現(xiàn)很多相互連通的地方,很有意思。
松哥說:多元線性回歸中不可避免會(huì)碰到非標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化回歸系數(shù)的結(jié)果解釋。跟著本期一起,自己動(dòng)手驗(yàn)證一下標(biāo)準(zhǔn)化回歸系數(shù)的計(jì)算思路,加深印象,懂了思路才會(huì)應(yīng)用哦!一句話:用標(biāo)準(zhǔn)化回歸系數(shù)來比較各自變量對(duì)因變量的貢獻(xiàn)大小,其他的應(yīng)用(如路徑分析等)后續(xù)有機(jī)會(huì)再聊。一起加油吧!
聯(lián)系客服