在確定了研究對(duì)象的納入、排除標(biāo)準(zhǔn),即劃分好設(shè)計(jì)人群后,從總體中抽取研究樣本。抽樣方法的選擇和應(yīng)用非常重要,它決定了我們抽得的樣本對(duì)總體代表性的優(yōu)劣,也會(huì)影響研究結(jié)果的外推。不少讀者看了研究中的三種人群后,都表示對(duì)抽樣方法感興趣。這次我們就來(lái)聊聊抽樣方法,由于相關(guān)的內(nèi)容較多,我們分幾期慢慢和大家嘮嘮。這期先講講簡(jiǎn)單隨機(jī)抽樣和分層隨機(jī)抽樣。
無(wú)論是簡(jiǎn)單隨機(jī)抽樣還是分層隨機(jī)抽樣都是較為常見(jiàn)的抽樣方法,都屬于隨機(jī)抽樣的范疇,應(yīng)用這兩種方法獲得的研究對(duì)象樣本都對(duì)總體有較好的代表性。
簡(jiǎn)單隨機(jī)抽樣(simple random sampling)是把符合要求的每一個(gè)個(gè)體都作為抽樣的對(duì)象,通過(guò)隨機(jī)化使每個(gè)個(gè)體被抽中選入樣本的機(jī)會(huì)是相等的。由于隨機(jī)化過(guò)程可以保證每個(gè)個(gè)體被抽中入選研究樣本的機(jī)率相同,因此能保證研究樣本對(duì)總體的代表性。舉個(gè)小例子,假設(shè)符合我們要求的研究對(duì)象總體有20000人(這么整,一看就是假滴),我們研究需要從中抽取200人作為研究樣本,如果采用簡(jiǎn)單隨機(jī)抽樣的方法來(lái)獲得研究樣本,那么總體中每個(gè)人被我們抽中的機(jī)率都是1%。因?yàn)楸WC了機(jī)率相等,那么我們可以說(shuō)我們抽得的樣本是杠杠的好哇!
看到這兒有人會(huì)說(shuō)了,這種抽樣方法看起來(lái)很美,但是似乎都是在估計(jì)疾病頻率的橫斷面研究里用,我們臨床研究應(yīng)用得很少吧。如果你也深以為然的話,那小編要提醒你,病例-對(duì)照設(shè)計(jì)的臨床研究中也常會(huì)用到這個(gè)方法哦。比如,乳腺癌的預(yù)后研究中,如果是病例-對(duì)照設(shè)計(jì),我們會(huì)先獲得一組乳腺癌發(fā)生了轉(zhuǎn)移的病例,say 100人。當(dāng)然,我們的對(duì)照組一定是患乳腺癌但沒(méi)有發(fā)生轉(zhuǎn)移的病例,由于目前的乳腺癌預(yù)后還不錯(cuò),所以沒(méi)有發(fā)生轉(zhuǎn)移的患者很多,我們?nèi)绾螐闹刑暨x代表性好的對(duì)照呢?簡(jiǎn)單隨機(jī)抽樣啊,我們可以找同期的乳腺癌但沒(méi)有發(fā)生轉(zhuǎn)移的患者,從中隨機(jī)抽取100、200甚至400例形成對(duì)照組(具體幾例可以根據(jù)研究設(shè)計(jì)的需要了,當(dāng)然例數(shù)越多,統(tǒng)計(jì)效能越高)。病例-對(duì)照研究中,對(duì)照組的選擇是最考驗(yàn)研究者的設(shè)計(jì)功力的,對(duì)照的代表性常受質(zhì)疑。我們可以在非病例中(在這個(gè)研究中是沒(méi)有發(fā)生不良結(jié)局的患者中)采用隨機(jī)抽樣的方法獲得有良好代表性的對(duì)照。
簡(jiǎn)單隨機(jī)抽樣的優(yōu)點(diǎn)是能獲得良好代表性的研究樣本,操作實(shí)施也比較容易理解;其缺點(diǎn)是在抽樣范圍較大時(shí),需要對(duì)總體中每個(gè)研究對(duì)象進(jìn)行編號(hào)并收集基本信息,工作量太大從而影響研究可行性。另一方面,當(dāng)某一重要研究因素在人群中分布不均勻時(shí),采用簡(jiǎn)單隨機(jī)抽樣可能會(huì)導(dǎo)致在總體中占比例較少的個(gè)體被遺漏,從而導(dǎo)致選擇偏倚。分層抽樣則可以很好地解決這一問(wèn)題。
分層抽樣(Stratified Sampling)是從分布不均勻的研究人群中抽取有代表性樣本的方法。先按照研究對(duì)象的屬性(如年齡、性別、病情、病程、臨床亞型、職業(yè)、教育程度、民族等)將研究人群分為若干層,然后在每層內(nèi)再開(kāi)展隨機(jī)抽樣。還是借用上面的例子,同樣是乳腺癌預(yù)后的病例-對(duì)照研究,乳腺癌的轉(zhuǎn)移與否和病程可能相關(guān),如果僅僅是簡(jiǎn)單隨機(jī)抽樣的方法獲得對(duì)照組有可能會(huì)出現(xiàn)病程短的人比較多(因?yàn)椴〕潭痰幕颊叱霈F(xiàn)轉(zhuǎn)移的機(jī)率低),這樣會(huì)降低對(duì)照組和病例組的可比性。這時(shí)我們可以根據(jù)病程分層再隨機(jī)抽樣,先看看我們的病例組中病程5年以下的有多少例,5年以上的有多少例,假設(shè)是2:3好了,那么我們就在乳腺癌沒(méi)有轉(zhuǎn)移的患者中根據(jù)病程是否大于5年分層,參考病例組的構(gòu)成在不同的層內(nèi)抽取研究對(duì)象構(gòu)成對(duì)照組。
一定要注意,分層抽樣要求層內(nèi)變異越小越好,層間變異越大越好,這樣可以提高樣本的代表性,便于層間進(jìn)行比較。分層隨機(jī)抽樣不能保證每個(gè)個(gè)體被抽中的概率相等,有可能處于不同分層之間的個(gè)體被抽中概率是不同的。
聯(lián)系客服