抽樣調(diào)查是在社會(huì)實(shí)踐中產(chǎn)生的,已有一百多年的歷史。全面調(diào)查由于規(guī)模大,費(fèi)時(shí)、費(fèi)力,客觀上催生了抽樣思想和抽樣理論的發(fā)展。抽樣調(diào)查的早期例子是法國數(shù)學(xué)家P.-S.拉普拉斯[注]利用某些地區(qū)的新生兒出生率推算法國總?cè)丝跀?shù)。1895年,挪威統(tǒng)計(jì)學(xué)家A.N.凱爾(Anders Nicolai Kiaer,1838~1919)在國際統(tǒng)計(jì)學(xué)會(huì)第五次大會(huì)上正式建議使用代表性樣本調(diào)查方法代替全面調(diào)查方法,開啟了統(tǒng)計(jì)調(diào)查的里程碑,可以看作是抽樣調(diào)查的開端。在如何選擇代表性樣本的問題上,A.L.鮑利(Arthur Lyon Bowley,1869~1957)于1906年最先提出了簡單隨機(jī)抽樣法。A.A.楚普洛夫(Alexander Alexandrovitch Tschuprow)和美籍波蘭裔統(tǒng)計(jì)學(xué)家J.奈曼發(fā)展了分層抽樣與多重抽樣技術(shù)。20世紀(jì)40年代前后,抽樣理論有了迅猛發(fā)展。在英國,F(xiàn).耶茨(Frank Yates,1902~1994)和I.扎克潘西及美國數(shù)理統(tǒng)計(jì)學(xué)家W.G.科克倫(William Gemmell Cochran,1919~1980)提出了比估計(jì)與回歸估計(jì),H.D.帕特森提出了連續(xù)調(diào)查時(shí)的樣本輪換理論。在美國,M.H.漢森和 W.N.赫維茨及D.G.霍維茨和 D.J.湯普森發(fā)展了不等概率抽樣理論,而W.G.麥多和L.M.麥多于1944年則提出了實(shí)施起來十分方便的系統(tǒng)抽樣法。在印度,P.C.馬哈拉諾比斯(Prasanta Chandra Mahalanobis,1893~1972)提出了整群抽樣法、多階抽樣法以及控制非抽樣誤差的方法。這些突破性成果構(gòu)成了現(xiàn)代抽樣調(diào)查技術(shù)的基本內(nèi)容。20世紀(jì)60年代,抽樣調(diào)查的研究開始重視傳統(tǒng)統(tǒng)計(jì)學(xué)模型在抽樣實(shí)踐中的應(yīng)用,在模型化推斷、模型輔助推斷方面取得了巨大進(jìn)展。一個(gè)典型的例子是,對小域的估計(jì)問題,基于模型的方法已經(jīng)成為現(xiàn)代主流的估計(jì)方法?,F(xiàn)代抽樣調(diào)查技術(shù)已被廣泛地應(yīng)用于社會(huì)、經(jīng)濟(jì)、衛(wèi)生、生態(tài)、環(huán)境資源等各個(gè)領(lǐng)域,取得了令人滿意的效果。
抽樣調(diào)查是相對于全面調(diào)查而言的。全面調(diào)查是指對全體被調(diào)查對象都進(jìn)行調(diào)查。相對于全面調(diào)查,抽樣調(diào)查有以下四個(gè)特點(diǎn):①節(jié)省費(fèi)用。抽樣調(diào)查能較大程度地節(jié)約調(diào)查的人力、物力和財(cái)力,從而大大地降低調(diào)查的費(fèi)用。②時(shí)效性強(qiáng)。抽樣調(diào)查周期短,能快速地獲取所需要的信息。③適用范圍廣。對于那些不可能進(jìn)行全面調(diào)查的總體,只能抽取一部分進(jìn)行調(diào)查。④數(shù)據(jù)質(zhì)量高。抽樣調(diào)查由于只調(diào)查總體的一部分,有條件精心組織調(diào)查,從而提高調(diào)查質(zhì)量。抽樣調(diào)查中的總體是指有限總體,對于無限總體可以轉(zhuǎn)化為有限總體進(jìn)行研究。
抽樣調(diào)查的實(shí)施包括調(diào)查目標(biāo)的明確陳述、抽樣框的選擇、抽樣方法的確定、問卷設(shè)計(jì)、數(shù)據(jù)收集、數(shù)據(jù)編碼和錄入、數(shù)據(jù)審核、數(shù)據(jù)分析與處理、調(diào)查報(bào)告的撰寫與發(fā)布等步驟,其中對調(diào)查結(jié)果影響最大的是抽樣框、抽樣方式、問卷設(shè)計(jì)以及數(shù)據(jù)的分析即目標(biāo)量的推斷方法。
抽樣框是抽樣單元的清單,一般分為名錄框和地域框。名錄框定義為所有總體單元的實(shí)際的或者概念的名錄清單;地域框是由地理區(qū)域構(gòu)成的一種特殊的名錄框。
抽樣方法分為概率抽樣和非概率抽樣。概率抽樣也稱隨機(jī)抽樣,是指嚴(yán)格地按照給定的概率來抽取樣本;非概率抽樣是相對于概率抽樣而言的,其特點(diǎn)是樣本的抽取不是按科學(xué)的原則進(jìn)行的,而是有目的地或隨意地抽取樣本。概率抽樣的優(yōu)點(diǎn)是可以根據(jù)抽取的樣本給出總體可靠的推斷:它既可以給出總體目標(biāo)量的可靠估計(jì),也可以估計(jì)抽樣誤差,但是這種抽樣比較費(fèi)時(shí)、費(fèi)力,費(fèi)用也更高;非概率抽樣實(shí)施便利,而且節(jié)省時(shí)間和費(fèi)用,這種抽樣能夠提供一些有用的信息,但不能根據(jù)所獲得的樣本對總體進(jìn)行推斷。一般制定抽樣方案時(shí),應(yīng)盡量采用概率抽樣。
常用的概率抽樣方法包括簡單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、不等概率抽樣、整群抽樣和多階抽樣等,其中簡單隨機(jī)抽樣是最基本的抽樣方法,是其他抽樣方法的基礎(chǔ)。在實(shí)際的抽樣調(diào)查中,很少單獨(dú)采用某一種抽樣方法,常常是幾種抽樣方法的有機(jī)結(jié)合。最常見的抽樣方案通常是先將總體分層,層內(nèi)采用二階或多階抽樣,其中前幾階抽樣是不等概率抽樣,最后一階抽樣是簡單隨機(jī)抽樣、系統(tǒng)抽樣或整群抽樣。
常見的非概率抽樣包括:①隨意抽樣。指抽樣者的抽樣是以無主觀目的、隨意的方式或僅根據(jù)方便的原則進(jìn)行,例如“街頭攔截”調(diào)查。②目的抽樣。指抽樣者根據(jù)調(diào)查的需要,有針對性地挑選所需要的樣本。③判斷抽樣。指抽樣者依據(jù)自身的經(jīng)驗(yàn)和對總體的了解,選擇自認(rèn)為對總體有代表性的樣本。④志愿者抽樣。指被調(diào)查者都是志愿者。
所有的調(diào)查都會(huì)產(chǎn)生誤差。在抽樣調(diào)查中,誤差分為抽樣誤差和非抽樣誤差兩大類。非抽樣誤差不是由于抽樣引起的,它主要包括抽樣框誤差、無回答誤差和計(jì)量誤差三種。這類誤差不是僅存在于抽樣調(diào)查,它在全面調(diào)查中同樣存在。抽樣誤差是由于抽樣造成的誤差,或者說是由于樣本的隨機(jī)性而引起的誤差。但與非抽樣誤差不同的是,抽樣誤差是可以計(jì)量并得到控制的。
為了從被調(diào)查者處獲取感興趣的信息,需要設(shè)計(jì)高質(zhì)量的問卷(或調(diào)查表),它包含了與調(diào)查目的相關(guān)的一系列問題。問卷設(shè)計(jì)主要考慮問卷中應(yīng)該提什么問題、如何措辭、問題如何排列等,所設(shè)計(jì)的問卷要便于后面的計(jì)算機(jī)處理,另外其長短也應(yīng)適中。樣本被抽中后,就要通過問卷收集數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)收集模式包括:①郵寄調(diào)查。調(diào)查者把問卷郵寄(或傳真)給被調(diào)查者,被調(diào)查者自己回答問題,寄回答卷。②面訪調(diào)查。調(diào)查者面對面地與被調(diào)查者溝通,提出問題,并得到回答。③電話調(diào)查。調(diào)查者通過電話聯(lián)系被調(diào)查者,向他們提出問題,并記錄他們的回答。計(jì)算機(jī)技術(shù)對上述三種傳統(tǒng)的數(shù)據(jù)收集方法都有較大的影響,各種各樣的計(jì)算機(jī)輔助方法已被應(yīng)用于郵寄調(diào)查、面訪調(diào)查和電話調(diào)查中。計(jì)算機(jī)的發(fā)展和應(yīng)用也產(chǎn)生了一些新的數(shù)據(jù)收集方式,如基于互聯(lián)網(wǎng)的網(wǎng)絡(luò)調(diào)查,它通過互聯(lián)網(wǎng)把傳統(tǒng)的調(diào)查在線化,這大大降低了調(diào)查的成本。另外,網(wǎng)絡(luò)調(diào)查的問卷內(nèi)容可以有圖片、對話甚至視頻剪輯形式。
抽樣調(diào)查的基本推斷目標(biāo)是通過樣本調(diào)查數(shù)據(jù)構(gòu)造總體總量、總體均值、總體比例和總體比值等總體參數(shù)的估計(jì)以及相應(yīng)的精度(抽樣方差)估計(jì),在有些實(shí)際問題中,也關(guān)心總體分位數(shù)、總體分布函數(shù),以及子總體的總量、均值等參數(shù)。對這些目標(biāo)量,本質(zhì)上有兩種推斷方式:基于抽樣設(shè)計(jì)的推斷(也稱隨機(jī)化推斷)和基于模型的推斷(也稱模型化推斷)。前者認(rèn)為總體中各單元的指標(biāo)值是固定不變的,隨機(jī)性僅表現(xiàn)在樣本的抽取,對推斷的評估建立在反復(fù)抽樣的基礎(chǔ)上,這是一種傳統(tǒng)的推斷方式;后者認(rèn)為有限總體的指標(biāo)值是來自某個(gè)統(tǒng)計(jì)模型(即超總體模型)的一個(gè)樣本,對推斷的評估建立在模型的基礎(chǔ)上。在基于模型的推斷框架下,對有限總體目標(biāo)量的估計(jì)問題實(shí)際上就變成對未抽中單元指標(biāo)值的預(yù)測問題,這樣傳統(tǒng)的統(tǒng)計(jì)學(xué)模型和估計(jì)方法自然地被應(yīng)用于抽樣調(diào)查的推斷問題中。可以說超總體模型建立了抽樣理論與統(tǒng)計(jì)學(xué)其他分支聯(lián)系的橋梁。
基于抽樣設(shè)計(jì)的推斷和基于模型的推斷各有優(yōu)缺點(diǎn):一個(gè)純粹基于抽樣設(shè)計(jì)構(gòu)造估計(jì)量,沒有利用模型的信息;一個(gè)純粹基于超總體模型構(gòu)造估計(jì)量,沒有結(jié)合抽樣設(shè)計(jì),不易被實(shí)際工作者所接受。因此一種自然的想法是綜合利用抽樣設(shè)計(jì)和模型信息進(jìn)行統(tǒng)計(jì)推斷。這就產(chǎn)生了模型輔助推斷方式,它借助模型構(gòu)造有限總體目標(biāo)量的估計(jì),但要求所構(gòu)造的估計(jì)量具有設(shè)計(jì)意義下的優(yōu)良性質(zhì),如(近似)無偏性、相合性等,因此這種推斷方式對模型的依賴較弱。盡管模型輔助推斷也會(huì)假設(shè)超總體模型,但模型只是被用來協(xié)助產(chǎn)生估計(jì)量,之后的推斷并不依賴于模型,因此本質(zhì)上模型輔助推斷是基于抽樣設(shè)計(jì)推斷的一種形式。
聯(lián)系客服