教育研究的有目的有計劃地認(rèn)識教育現(xiàn)象,探索教育規(guī)律的活動,具有很強(qiáng)的探索性。為了揭示教育現(xiàn)象與過程發(fā)展的規(guī)律,選取的研究對象必須是有典型代表意義的,才能保證研究結(jié)果的可靠性。如何選擇有代表性的研究對象,即取樣問題,就成為考慮研究計劃時很重要的一環(huán)。善于進(jìn)行科學(xué)的取樣,也是科學(xué)研究的基本要求。
㈠總體、樣本、取樣的基本概念
總體,即研究對象的全體。凡是在某一相同性質(zhì)上結(jié)合起來的許多個別事物的集體,當(dāng)它成為統(tǒng)計研究對象時,就叫做總體,是一定時空范圍內(nèi)研究對象的全部總和。
樣本,是從總體中抽取的、對總體有一定代表性的一部分個體,也稱樣組。它是能夠代表總體的一定數(shù)量的基本觀測單位。樣本中所包含的個體的數(shù)量稱為樣本容量。
取樣,是遵循一定的規(guī)則,從一個總體中抽取有代表性的一定數(shù)量的個體進(jìn)行研究的過程。目的在于:用一個樣本去推斷關(guān)于這個總體的信息及一般性結(jié)論,從樣本的特征推斷總體,從而對相應(yīng)的研究作出結(jié)論。
為什么要在一個總體中抽取樣本進(jìn)行研究?這是由于教育研究對象的特點和取樣本身的基本特點所決定的。
教育科學(xué)研究對象是數(shù)以萬計的兒童乃至成人。由于研究課題的不同,被研究的兒童范圍也是不同的。如果你研究的是個別人或少數(shù)人,不存在取樣的問題,因為對象總體已成為你的研究直接對象。但是教育研究絕大多數(shù)課題涉及對象是比較廣泛的,比如研究幼兒學(xué)習(xí)習(xí)慣的現(xiàn)狀和特點,我國幼兒就有幾千萬名,限于研究者的時間、精力、人力和物力,要對上千萬的幼兒進(jìn)行逐一研究然后得出結(jié)論是非常困難的,事實上也是不必要的。取樣,以概率論的大數(shù)定律作為理論基礎(chǔ),是根據(jù)部分樣本的實際資料對全部總體的數(shù)量特征做出推論估計。由于是按隨機(jī)原則從全部調(diào)查總體中抽取樣本單位,而且抽樣推斷的抽樣誤差可以事先計算并加以控制,從而保證了研究結(jié)果的準(zhǔn)確性和研究的可靠性,并使研究有一定的深度,提高了研究的效率。
在我們的教育研究實際工作中,由于不掌握取樣方法而造成時間、精力、人力和物力以及數(shù)據(jù)資源的浪費,造成的對問卷調(diào)查泛濫的抵觸情緒等,這種例子是很多的。有人誤以為用行政命令手段,樣本越大越好。如果一個研究只需要選取500人作為樣本就可以推斷出總體情況,就不需要搞上萬人。人多,抽樣誤差減少,可是過失誤差又增大。
㈡選擇樣本的基本要求
為了保證取樣的水平,應(yīng)遵循以下四個方面的基本要求。
⒈明確規(guī)定總體
要從內(nèi)涵和外延兩方面明確總體界限。
研究的目的、課題性質(zhì)決定總體的內(nèi)容。如“弱智幼兒智能特點的研究”,總體就是所有的弱智兒童。
研究目的決定了總體的范圍。研究者準(zhǔn)備將研究成果推廣到什么樣的范圍,就應(yīng)在該范圍內(nèi)抽樣。這就要區(qū)分是城市幼兒園,還是農(nóng)村幼兒園,是示范園還一般園。從某一總體抽取樣本,經(jīng)過研究獲得的結(jié)果只能推廣到這一總體中去。
⒉取樣的隨機(jī)性
要盡可能使每個被抽取的個體具有均等機(jī)會,也就是說使被抽取的任何個體與個體之間是彼此獨立的,在選擇上沒有聯(lián)系。這里不存在任何選擇的標(biāo)準(zhǔn),不帶任何有意義的萬分,從而盡可能使樣本保持和總體有相同的結(jié)構(gòu)。
⒊取樣的代表性
要盡可能使抽取的樣本代表總體。如某某市對幼兒園的幼兒的非智力因素水平進(jìn)行調(diào)查研究,全市15萬在園幼兒,可以從中抽取800名幼兒來說明15萬幼兒的非智力水平,因此,這800名幼兒的代表性就顯得非常重要了。只有樣本具有代表性,那么由樣本特征推斷的總體特征才有一般性,對總體的研究成果才有推廣價值。樣本的代表性正是由部分推斷整體做法的理論根據(jù)。
取樣的偏差將導(dǎo)致結(jié)論的無效。如有研究某大學(xué)學(xué)生課余休閑和愛好,利用晚自習(xí)時間到圖書館發(fā)放問卷,問卷回收率90%以上,結(jié)論是:65%大學(xué)生晚上都是在圖書館度過的。這一結(jié)論由于取樣的偏差而帶來誤差。
為了保證樣本的代表性,抽樣時,首先要明確規(guī)定抽樣的總體??傮w所有特性為:①必須包括于樣本之中。如要研究特殊幼兒,就得規(guī)定“特殊幼兒”的總體范圍:“幼兒”包括哪些年齡的孩子;“特殊”指的是哪幾方面的,如智力、身體生理缺陷、行為異?;蛑橇Τ5?。②必須十分注意總體的明確界限:是否包括邊緣范圍的人。如在規(guī)定“幼兒園孩子”這個總體時,要注意包括上特殊幼兒園的孩子以及超過一般年齡范圍而又在幼兒園學(xué)習(xí)的孩子等。③要弄清總體中各種成份所占的比例。其次,要估計和計算樣本所需要的合適數(shù)量。確定樣本的大小,應(yīng)力求以較小的樣本取得盡可能可靠的結(jié)果,以使樣本既具有代表性,又不必耗費過多。
要使取樣有代表性,還必須對取樣的偏差進(jìn)行正確估計。取樣誤差是指樣本的指標(biāo)數(shù)值與總體的指標(biāo)數(shù)值之間所存在的離差。這種差異值越小,就說明抽取的樣本能比較正確地反映總體。因此,為了保證取樣的代表性,研究者人分析影響誤差大小的因素,通過計算取樣的標(biāo)準(zhǔn)誤差將誤差值測定出來,并努力使誤差控制在最低的程度。
⒋合理的樣本容量
要科學(xué)地確定樣本的大小,既要滿足統(tǒng)計學(xué)上要求,又要考慮實際上收集資料的可能性,并使誤差減到最低限度。一般說來,樣本容量與樣本代表性呈正相關(guān),大的樣本更具有代表性,研究結(jié)果可能更有一般性。
樣本大小取決于以下諸方面因素:⑴研究的不同類型。⑵預(yù)定分析的精確程度。⑶允許誤差的大小。⑷總體的同質(zhì)性。⑸研究者的時間、人力和物力。⑹取樣的方法等。在研究中,如果要求的精確度高,允許的誤差值小,總體的異質(zhì)性很在,許多未控制因素會混淆研究結(jié)果,或研究的因變量在測量上的信度較低時,就要考慮使用較大的樣本。
根據(jù)以上分析,結(jié)合長期教育研究的實踐經(jīng)驗,提供以下取樣大小的參考值。
描述研究、調(diào)查研究:總體的10%。除少數(shù)情況,調(diào)查研究的樣本容量一般不能少于100。
相關(guān)、比較研究的滿意樣本每組至少30。
實驗研究:條件控制較嚴(yán)密的研究,如心理學(xué)實驗,每組15人;條件控制不嚴(yán)密的教育實驗,最好一個自然教學(xué)班,不少于30人。
必須指出的是,不能絕對地理解“總體越大,樣本容量就越大”。不是絕對地按比例取樣。據(jù)國外有的學(xué)者對總體與樣本容量關(guān)系的研究也說明了這一點。見下表
從給定的總體確定樣本大小一覽表
N | S | N | S | N | S | N | S | N | S | N | S |
10 | 10 | 85 | 70 | 220 | 140 | 440 | 205 | 1200 | 291 | 4000 | 351 |
15 | 14 | 90 | 73 | 230 | 144 | 460 | 210 | 1300 | 297 | 4500 | 354 |
20 | 19 | 95 | 76 | 240 | 148 | 480 | 214 | 1400 | 302 | 5000 | 357 |
25 | 24 | 100 | 80 | 250 | 152 | 500 | 217 | 1500 | 306 | 6000 | 361 |
30 | 28 | 110 | 86 | 260 | 155 | 550 | 226 | 1600 | 310 | 7000 | 364 |
35 | 32 | 120 | 92 | 270 | 159 | 600 | 234 | 1700 | 313 | 8000 | 367 |
40 | 36 | 130 | 97 | 280 | 162 | 650 | 242 | 1800 | 317 | 9000 | 368 |
45 | 40 | 140 | 103 | 290 | 165 | 700 | 248 | 1900 | 320 | 10000 | 370 |
50 | 44 | 150 | 108 | 300 | 169 | 750 | 254 | 2000 | 322 | 15000 | 375 |
55 | 48 | 160 | 113 | 320 | 175 | 800 | 260 | 2200 | 327 | 20000 | 377 |
60 | 53 | 170 | 118 | 340 | 181 | 850 | 265 | 2400 | 331 | 30000 | 379 |
65 | 56 | 180 | 123 | 360 | 186 | 900 | 269 | 2600 | 335 | 40000 | 380 |
70 | 59 | 190 | 127 | 380 | 191 | 950 | 274 | 2800 | 338 | 50000 | 381 |
75 | 63 | 200 | 132 | 400 | 196 | 1000 | 278 | 3000 | 341 | 75000 | 382 |
80 | 66 | 210 | 136 | 420 | 201 | 1100 | 285 | 3500 | 346 | 1000000 | 384 |
抽樣的樣本是否有代表性,最后還要通過結(jié)果的檢驗來證明。由樣本得到的結(jié)果必須作統(tǒng)計學(xué)上的顯著性檢驗。例如,在某種實驗研究中,實驗班成績高于對比班成績,那么這種差異是否真實呢?這就必須做實驗結(jié)果的顯著性檢驗,目的是說明由實驗樣本所取得的結(jié)論。如果樣本具有代表性,那么這種結(jié)論也適用于總體,因而具有一般性。而某種統(tǒng)計量的計算和各種不同的顯著性檢驗,如平均數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù)有及u檢驗、t檢驗、x2檢驗等等,都有各自的標(biāo)準(zhǔn)來估計樣本可能產(chǎn)生的誤差,樣本容量大小將會影響上述誤差和由樣本估計總體的真實價值。
㈢取樣的基本方法
取樣的方法我種多樣,要根據(jù)研究目的和條件靈活選用。
⒈簡單隨機(jī)取樣
按照概率論的原理,抽樣時要盡可能使總體中的每一個基本觀測單位都有均等的機(jī)會,有被抽中的可能。簡單隨機(jī)取樣,優(yōu)點是:可以保證全部標(biāo)識的代表性;能夠確定抽樣誤差的理論值,并且簡單易行。這是在總體異質(zhì)性不是很大而且所抽樣本較小時經(jīng)常采用的一種形式。局限是:當(dāng)樣本規(guī)模小時,樣本的代表性差。
簡單隨機(jī)取樣有兩種方式:
⑴抽簽。把總體的每個觀測單位依次編上號碼并做成簽,放進(jìn)一個器皿加以充分混合后,每次從中抽取一個,記下號碼,然后把抽取的簽再放回器皿中,再次搖動和抽取,如此反復(fù),直到取夠樣本所需數(shù)目為止。
⑵隨機(jī)數(shù)目表。隨機(jī)數(shù)目表是一種嚴(yán)格制作的由許多數(shù)目字組成的表,數(shù)字隨機(jī)排列,操作時,首先隨機(jī)確定一個表上取數(shù)的“起點”,然后按表上所示的數(shù)號取樣。
⒉系統(tǒng)隨機(jī)取樣
系統(tǒng)隨機(jī)取樣,也叫等距抽樣、機(jī)械抽樣。先將總體各個觀測單位按某一標(biāo)志順序排列編號成數(shù)量相等的組,使組數(shù)與取樣婁相同。然后從每組中依事先規(guī)定的機(jī)械次序抽取對象。
抽樣比率的計算公式:K=N/n(K:抽樣比率;N:總體數(shù);n:樣本數(shù))。
例如,某一研究要從1000名幼兒中抽取100人作為樣本,抽樣比率為:K=1000/100=10。按幼兒名冊或?qū)W號,從1至10中選出第一個樣本單位,比如這個號碼是5,然后作等距抽樣,5,15,25,......,直到100為止。
系統(tǒng)隨機(jī)取樣,由于能在總體的整個范圍內(nèi)有系統(tǒng)地抽取樣本,因此與簡單隨機(jī)抽樣相比較,抽樣誤差要小一些。如果按其總體的每個觀測單位按照某種性質(zhì)特征的變異度大小或增減程度依次編號,進(jìn)行系統(tǒng)抽樣,其結(jié)果常與分層抽樣差別不大,但又有比分層抽樣設(shè)計更簡單的優(yōu)點。所以抽樣調(diào)查中常被采用。
系統(tǒng)隨機(jī)取樣,要考慮研究總體的情況。如果總體存在周期性變化,如考試試卷,男生單號,女生雙號,那么,很可能出現(xiàn)樣本的系統(tǒng)誤差,抽取的樣本只有一個性別。
系統(tǒng)隨機(jī)抽樣使樣本分配均衡,更具有代表性,抽樣誤差較簡單隨機(jī)抽樣小,操作也簡單,實際運用較廣。
⒊分層隨機(jī)取樣
分層抽樣也叫做類型抽樣或配額抽樣。它是將總體按一定標(biāo)準(zhǔn),即單位屬性特征(變異度的大?。┓殖扇舾蓪哟位蝾悇e,然后根據(jù)事先確定的樣本大小及其各層或各類在總體中所占的比例提取一定數(shù)目的樣本單位。即按總體中具有各類特征的對象所占的比例,在總體中隨機(jī)抽取同樣比例的樣組成分的取樣方法。如對某校800個學(xué)生的學(xué)習(xí)態(tài)度進(jìn)行調(diào)查,擬抽取十分之二的學(xué)生作為樣本。首先按成績評定標(biāo)準(zhǔn)將學(xué)生分成優(yōu)(160)、良(320)、中(240)、差(80)四層。然后用簡單隨機(jī)抽樣在四層中按比例分別抽取樣本,從優(yōu)等中抽取160×2÷10=32(人);從良等中抽取320×2÷10=64(人);從中等中抽取240×2÷10=48(人);從差等中抽取決80×2÷10=16(人)。這160人組成了分層隨機(jī)抽樣的樣本。
適用條件及特點:當(dāng)已知研究總體由不同性質(zhì)的幾個部分組成,要使抽取的樣本能客觀反映總體的各個層面、不同類型的觀測單位,因而獲取的樣本更具有代表性。分幾層,如何分層,要根據(jù)已有研究進(jìn)行。
采用分層取樣的步驟:
⑴了解總體中個體特征的差別,按特征差異分組,計算每一類別在總體中所占的比例。
⑵根據(jù)各組在總體中所占比例,分配各組中每一類別的人數(shù)。
⑶最后從總體的不同類別的對象中按規(guī)定人數(shù)在各組中隨機(jī)抽取樣本。
分層抽樣是將已知的將會直接影響研究結(jié)果的特征,如分?jǐn)?shù),智力等,按不同的水平分層,然后進(jìn)行類型取樣。
⒋整群隨機(jī)取樣
把一個個整體,如幼兒或班級編號然后隨機(jī)、機(jī)械或類型取樣方法進(jìn)行抽取,它不是從整體中逐個地抽取對象,而是抽取一個或幾個單位整群作為樣本。
教育實驗中,考慮到教師和幼兒的配合等問題,有意地選定研究班級而不打亂原教學(xué)單位,所以它是常用的方法。但是必須看到,整群抽樣所獲得的樣本,由于樣本分布不均勻,比如存在學(xué)習(xí)成績、智力水平、性別等差異,一般說,代表性不如個別取樣,在統(tǒng)計推論上存在一定缺陷。因此,我們在選定研究幼兒園和班級時,必須十分謹(jǐn)慎。比如幼兒園的尖子班,對一般幼兒園的普通班是不具代表性的。因此,在這樣的班級中獲得的研究結(jié)果,對類似幼兒園類似班來說是適用的,但要向一般幼兒園普通班推廣,就會遇到困難。
抽樣的標(biāo)準(zhǔn)、方法以及抽樣大小是否適合,關(guān)系到研究工作的進(jìn)程,特別是研究方法的準(zhǔn)確性、科學(xué)性,是研究工作開始時必須妥善解決的一個重要問題。另外,還應(yīng)該根據(jù)研究課題性質(zhì)特點選擇不同取樣方法。無論何種取樣的方法,都會產(chǎn)生一定的抽樣誤差,研究人員盡量排除主觀因素干擾,保證樣本能客觀、全面地反映總體,并能通過一定的計算檢驗樣本的代表性程度。