開(kāi)篇明義,概念先行。橫斷面研究又稱(chēng)橫斷面調(diào)查,因?yàn)樗@得的描述性資料是在某一時(shí)點(diǎn)或在一個(gè)較短時(shí)間區(qū)間內(nèi)收集的,所以它客觀地反映了這一時(shí)點(diǎn)的疾病分布以及人們的某些特征與疾病之間的關(guān)聯(lián)。由于收集的資料是調(diào)查當(dāng)時(shí)所得到的現(xiàn)況資料,故又稱(chēng)現(xiàn)況研究或現(xiàn)況調(diào)查;又因橫斷面研究所用的指標(biāo)主要是患病率,因此,又稱(chēng)患病率調(diào)查(prevalence survey)。
(1)了解疾病負(fù)擔(dān):疾病的患病率常常被用來(lái)衡量疾病的負(fù)擔(dān)。當(dāng)需要對(duì)一個(gè)國(guó)家或是一個(gè)地區(qū),某種疾病的負(fù)擔(dān)進(jìn)行描述和比較分析時(shí),需要開(kāi)展基于橫斷面研究的患病率統(tǒng)計(jì)。
(2)人群特征的估計(jì):橫斷面研究也經(jīng)常會(huì)被用來(lái)估計(jì)某個(gè)特定人群的習(xí)慣或特征,如男性/女性人群中飲酒和吸煙的狀況。面對(duì)面調(diào)查和問(wèn)卷調(diào)查是主要收集信息的方式。例如:了解男性不同年齡段人群吸煙的分布狀況,可以在特定時(shí)間范圍內(nèi)完成選定人群的問(wèn)卷調(diào)查并按照年齡段分組計(jì)算吸煙率。
(3)關(guān)于態(tài)度、認(rèn)知和健康行為的調(diào)查:研究者可以設(shè)計(jì)了一項(xiàng)橫斷面研究來(lái)幫助調(diào)查了解研究對(duì)象對(duì)某一事件、知識(shí)和現(xiàn)象的態(tài)度、認(rèn)知和行為狀況。
(4)關(guān)于因果關(guān)聯(lián)的分析:大多數(shù)評(píng)估暴露與疾病之間關(guān)系的分析性觀察研究都是隊(duì)列研究或病例對(duì)照研究,但橫斷面研究有時(shí)也可用于因果推斷分析。但應(yīng)用的前提很有限,除非在特殊情況下,否則不能做出因果推論。
橫斷面研究的主要研究方法包括普查和抽樣調(diào)查兩種,應(yīng)根據(jù)不同研究目的選擇,選擇合適的研究方法。橫斷面研究?jī)煞N方法的特征如下表所示。
橫斷面研究主要有以下幾個(gè)特點(diǎn):
1)觀察性:研究本身不施加任何干預(yù)或?qū)Ω深A(yù)效果進(jìn)行評(píng)價(jià);
2)橫斷面:研究只觀察一個(gè)較短的時(shí)間段;
3)設(shè)計(jì)階段不設(shè)對(duì)照,但分析階段可進(jìn)行分組分析;
4)可同時(shí)測(cè)量多個(gè)變量,如同時(shí)調(diào)查糖尿病和高血壓患病率;
5)確定因果關(guān)系受限,但可為探索因果關(guān)系研究假說(shuō)提供依據(jù)。
當(dāng)我們使用抽樣調(diào)查方法開(kāi)展橫斷面研究時(shí),研究對(duì)象(即樣本人群)的選擇首先取決于研究目的;其次則是樣本的代表性,在質(zhì)量方面,隨機(jī)抽樣是樣本代表總體的有力保證,在數(shù)量方面,足夠的樣本含量是樣本代表總體的有效措施。開(kāi)始收集相關(guān)資料之前,估計(jì)樣本含量是必不可少的步驟。樣本含量估計(jì)要考慮三點(diǎn)因素:
①總體標(biāo)準(zhǔn)差平均水平σ的高低,其值越大,所需樣本含量越大,一般從以往的研究資料或預(yù)調(diào)查獲得。
②容許誤差δ,即對(duì)調(diào)查要求的精確性。
③確定控制容許誤差的概率,即顯著性水準(zhǔn)α,其值越小,可靠性越好,所需樣本含量也越大,通常取0.05。
橫斷面研究樣本含量計(jì)算方法按不同抽樣方法各異。以下主要介紹橫斷面研究單純隨機(jī)抽樣樣本量計(jì)算。根據(jù)不同資料類(lèi)型,使用不同的估計(jì)方法。
一、估計(jì)總體率所需的樣本含量
二、估計(jì)總體均數(shù)所需的樣本含量
公式(1)中,α為顯著性水平,一般設(shè)為0.05,μα/2值為時(shí)對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)下的面積;π為總體率的標(biāo)準(zhǔn)差;δ為容許誤差。公式(2)中,為σ總體均數(shù)標(biāo)準(zhǔn)差。
無(wú)限總體抽樣按公式(1),(2)求n,有限總體還需要使用以下校正公式(3)進(jìn)行校正;公式(3)中N是有限總體包含的單位數(shù)。當(dāng)n/N<0.05時(shí),可省去以下校正。
(一)估計(jì)總體率樣本含量
為了解某城鎮(zhèn)婦女生育率情況,根據(jù)現(xiàn)有資料,我國(guó)婦女現(xiàn)階段高齡生育率在0.29上下波動(dòng),容許誤差定位0.01,α=0.05,估計(jì)高齡婦女樣本含量。
我們使用公式(1)計(jì)算樣本量:
結(jié)果可得,樣本含量需要7910人。
(二)估計(jì)總體均數(shù)樣本含量
某化工廠共有5000名工人,為了解該廠職工白細(xì)胞數(shù)的平均水平,評(píng)價(jià)該廠生產(chǎn)條件是否對(duì)白細(xì)胞數(shù)有影響,根據(jù)以往資料,職工白細(xì)胞總數(shù)的標(biāo)準(zhǔn)差為0.95×109/L,希望控制誤差不超過(guò)0.1×109/L,取α=0.05,問(wèn)需調(diào)查多少人。
我們使用公式(2)計(jì)算樣本量,由于n/N>0.05,需使用校正公式(3)進(jìn)行校正:
結(jié)果可得,樣本含量需要325人。
參考來(lái)源:
1.孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計(jì)學(xué):第4版[M].北京:人民衛(wèi)生出版社.2014.
確定合適的抽樣方法,包括:
a) 簡(jiǎn)單隨機(jī)抽樣,是其他抽樣的基礎(chǔ),原則為確??傮w中每個(gè)對(duì)象被抽取的機(jī)會(huì)均等,實(shí)際較少采取;
b) 系統(tǒng)抽樣,按照一定順序,每隔若干個(gè)單位機(jī)械的抽取一個(gè)個(gè)體單位。容易進(jìn)行,代表性較好,但是不適用于某些總體中存在各單位分布具有周期性規(guī)律的情況,因?yàn)榇藭r(shí)可能使得樣本產(chǎn)生偏性(例如疾病的時(shí)間分布規(guī)律、季節(jié)性變化特點(diǎn));
c) 分層抽樣,總體先分為若干層,層內(nèi)分別進(jìn)行簡(jiǎn)單隨機(jī)抽樣。實(shí)踐中常被采用,分層的因素可以是年齡或者性別,或者某個(gè)我們認(rèn)為會(huì)顯著影響到目標(biāo)疾病患病情況的因素;
d) 整群隨機(jī)抽樣,即總體分為若干個(gè)群組,以群組作為抽樣單位,抽到哪些群組,這些群組所有的個(gè)體就組成了我們的樣本。易于實(shí)施,成本低,但是抽樣誤差較大,一般推薦在既有樣本量基礎(chǔ)上額外增加1/2的樣本量;
e) 多階段抽樣,適合于全國(guó)性質(zhì)或者多行政區(qū)域、多級(jí)別的抽樣,例如,從基礎(chǔ)的家戶(hù)一級(jí)直接一路抽取到省一級(jí),此時(shí)就需要采取多節(jié)段的抽樣方法,根據(jù)每個(gè)抽樣水平,分別制定其抽樣具體方法。
首先建議大家看一下上期文章:
【1093.】臨床設(shè)計(jì)與統(tǒng)計(jì)設(shè)計(jì):相愛(ài)相殺
看完之后您會(huì)發(fā)現(xiàn),僅僅憑橫斷面研究這種設(shè)計(jì),誰(shuí)也沒(méi)法告訴您具體研究方法。在這種設(shè)計(jì)之下,您得根據(jù)自己的研究目的和資料類(lèi)型,才能選擇合適的統(tǒng)計(jì)分析方法,而且這種方法不是單一的。
包括統(tǒng)計(jì)學(xué)的一維分析:也就是進(jìn)行常規(guī)的統(tǒng)計(jì)學(xué)描述分析;
也可以根據(jù)研究目的,進(jìn)行分組,從而進(jìn)行差異性統(tǒng)計(jì)分析,也就是統(tǒng)計(jì)學(xué)的二維分析。
同樣,一維是觀察性研究,所受到的混雜干擾因素很多,因此,也可以進(jìn)行相關(guān)分析、單因素和多因素回歸分析。
說(shuō)白了還是松哥的那就話(huà):方法看變量、設(shè)計(jì)看類(lèi)型,目的定乾坤。這15個(gè)字就是統(tǒng)計(jì)分析的15字箴言!
------------------------------
---統(tǒng)計(jì)思維與理論系列---
【1093.】臨床設(shè)計(jì)與統(tǒng)計(jì)設(shè)計(jì):相愛(ài)相殺
【1090.】中英文期刊分類(lèi)(SCI分區(qū)和中文核心),一文秒懂!
【1089.】看懂此圖,統(tǒng)計(jì)開(kāi)悟!松哥薦讀
【1088.】模型發(fā)現(xiàn)有交互作用怎么辦?怎么解釋呢!
【1086.】為啥20分以上SCI論文如此鐘情P-interaction!
【1085.】正態(tài)性不符合怎么辦?其實(shí)沒(méi)啥大事!
【1084.】哎呦媽呀!幾何均數(shù)還有標(biāo)準(zhǔn)差呀?書(shū)中從來(lái)沒(méi)說(shuō)過(guò)呀!
【1083.】交叉驗(yàn)證是啥個(gè)意思,是換妻游戲嗎?
【1082.】不懂統(tǒng)計(jì)思維的統(tǒng)計(jì)是沒(méi)有靈魂的!
【1080.】辨析丨啥?統(tǒng)計(jì)上還有q值,和P值啥關(guān)系?
【1078.】SCI相關(guān)分析比中文正規(guī)的3點(diǎn)理由
【1077.】臨床科研設(shè)計(jì)與數(shù)據(jù)分析9大易忽視錯(cuò)誤(推薦)
【1076.】這種套路可以學(xué),怎么化無(wú)意義為有意義!
【1075.】很有意思的一個(gè)統(tǒng)計(jì)問(wèn)題,并發(fā)癥到底該如何分析?
【1073.】WHAT!計(jì)算機(jī)隨機(jī)序列竟然是偽隨機(jī)
【1072.】單因素Logistic回歸變量篩選,你還在用表表達(dá),看看人家如何可視化的,審稿人看了能不開(kāi)心嗎?
【1071.】SCI論文中回歸模型樣本量確定標(biāo)準(zhǔn),建議閱讀
【1070.】性別和吸煙是專(zhuān)業(yè)公認(rèn)的危險(xiǎn)因素,為啥多因素分析性別沒(méi)意義了?
【1069.】數(shù)值變量應(yīng)該以何種形式進(jìn)入模型
【1068.】多項(xiàng)分類(lèi)變量進(jìn)入模型的正確姿勢(shì)
【1066.】SCI統(tǒng)計(jì)方法寫(xiě)作秘籍
【1065.】這篇SCI論文10個(gè)統(tǒng)計(jì)問(wèn)題辨析
【1064.】以前認(rèn)為概念無(wú)所謂,其實(shí)松哥錯(cuò)了
【1063.】松哥,我發(fā)現(xiàn)一處SCI統(tǒng)計(jì)錯(cuò)誤,非?;闹?!
【1062.】分類(lèi)變量啞變量設(shè)置后,參照到底如何選擇?
【1061.】這篇SCI的診斷試驗(yàn)結(jié)果看不懂,他到底是咋比的
【1060.】如何向統(tǒng)計(jì)老師咨詢(xún)統(tǒng)計(jì)問(wèn)題的正確姿勢(shì)
【1058.】4種最常用的統(tǒng)計(jì)設(shè)計(jì)解讀
【1057.】SPSS統(tǒng)計(jì)軟件學(xué)習(xí)終身不忘之必殺技
【1056.】回歸家族的書(shū)劍恩仇錄,高手進(jìn)階必經(jīng)之路
【1055.】單因素是危險(xiǎn)因素,多因素卻保護(hù)因素了,想逆天嗎?
【1054.】這種文章統(tǒng)計(jì)套路您一定要學(xué),不管你什么專(zhuān)業(yè)通殺
【1052.】同一肝癌患者,同時(shí)接受CT、超聲和磁共振,如何分析?
【1051.】來(lái)自臨床真實(shí)問(wèn)題,有點(diǎn)意思,松哥薦讀!
【1050.】知道兩組數(shù)據(jù)的樣本量均數(shù)標(biāo)準(zhǔn)差,怎么算合并統(tǒng)計(jì)量呢?
【1049.】meta分析軟件Revman5.3卡死解決方案
【1048.】P>0.05,本身就是沒(méi)意義還是樣本量不夠?
【1047.】?jī)梢蛩胤讲罘治觯绾闻袛嗄膫€(gè)因素對(duì)結(jié)果影響較大?
【1046.】帶基線(xiàn)數(shù)據(jù)數(shù)值變量如何進(jìn)行統(tǒng)計(jì)分析辨析
【1045.】統(tǒng)計(jì)學(xué)習(xí)之最大困惑!!
【1044.】松哥為啥我318樣本量統(tǒng)計(jì)分析出來(lái)確實(shí)400樣本量?
【1043.】這兩個(gè)是啥圖?區(qū)別和聯(lián)系
【1042.】變量之間到底是單項(xiàng)轉(zhuǎn)化還是雙向轉(zhuǎn)化
【1041.】統(tǒng)計(jì)水平自我評(píng)估表
【1039.】統(tǒng)計(jì)小白的學(xué)習(xí)路徑
【1038.】SCI論文中Logistic回歸模型“門(mén)當(dāng)戶(hù)對(duì)”原則,松哥心得推薦給您
【1037.】被我們忽視的生存分析區(qū)間刪失數(shù)據(jù)
【1036.】Logistic回歸文章的SCI審稿人意見(jiàn)解讀
【1035.】統(tǒng)計(jì)學(xué)上的2K效應(yīng),你發(fā)現(xiàn)了沒(méi)?
【1034.】正態(tài)分布的3個(gè)基因密碼,聆聽(tīng)大自然心跳的代碼!
【1033.】生存分析K-M法與COX回歸結(jié)論不一致怎么辦?
【1031.】沒(méi)有比較就沒(méi)有傷害,讓咱們互相傷害吧,教你4大類(lèi)統(tǒng)計(jì)傷害方法
【1030.】SCI審稿人讓我控制2個(gè)單因素?zé)o意義的變量?
【1029.】量表評(píng)價(jià)是信度重要還是效度重要?
【1027.】文章材料與方法中統(tǒng)計(jì)方法如何描述
【1026.】這個(gè)到底是啥統(tǒng)計(jì)設(shè)計(jì)?一起來(lái)看看!
【1025.】聚類(lèi)分析穩(wěn)定性判別的經(jīng)驗(yàn)總結(jié)
【1024.】“參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)”哪個(gè)更好?
【1023.】干預(yù)前后數(shù)據(jù)統(tǒng)計(jì)分析方法
【1022.】聽(tīng)完四個(gè)小故事,你就明白主成分分析是啥意思了!
【1021.】方差分析P>0.05,兩兩比較LSD法P<0.05,這可咋整?
【1018.】終于發(fā)現(xiàn)不用學(xué)習(xí),頓悟統(tǒng)計(jì)的方法
【1017.】?jī)A向性評(píng)分后數(shù)據(jù),應(yīng)該采用配對(duì)設(shè)計(jì)還是成組設(shè)計(jì)?
【1016.】統(tǒng)計(jì)必學(xué)的4個(gè)核心思想
【1014.】平行性檢驗(yàn)到底應(yīng)該啥時(shí)候做?
【1013】統(tǒng)計(jì)的4維空間(一維一層天)
【1009】P<0.05也別理直氣壯,統(tǒng)計(jì)也會(huì)犯錯(cuò),還分犯I類(lèi)和II類(lèi)錯(cuò)誤?
【1008】文章鑒析:這篇文章或許有10處不適!
【1007】R×C卡方的Fisher確切概率法為什么會(huì)有卡方值
【1006】大小優(yōu)指標(biāo)如何同時(shí)制作ROC曲線(xiàn)[經(jīng)驗(yàn)技巧]
【1005】統(tǒng)計(jì)方法與統(tǒng)計(jì)思想誰(shuí)重要?
【1004】別說(shuō)相關(guān)太簡(jiǎn)單,且聽(tīng)松哥說(shuō)相關(guān)
【1002】連續(xù)變量變成等級(jí)變量后,原來(lái)有意義的變量變得沒(méi)意義了?
【1001】SCI論文中的P for trend是什么鬼?為什么高分文章經(jīng)常采用呢
------------------------------
聯(lián)系客服