國內的臨床試驗,尤其是涉及到新藥的報批,也是講究樣本量計算的。國家局在這方面管的很緊。
倒是一般的臨床試驗,作者的目的又僅是為了發(fā)表論文,就很少見他們進行樣本量估算了。
你上面的文字,也就是對樣本量計算的大致描述。
下面的文字,你對照著找一下:
**************************************************************
2.2 樣本量計算 貌似嚴謹一點的設計都需要在試驗設計時估算樣本量。
沒有足夠的樣本量,試驗可能難以得出設計的效果;得出的資料也許錯誤風險較大……
太大的樣本量,又會增加試驗的成本和難度。
因此有了樣本量設計一說。這里給親們搜集了一些常用的樣本量計算。這些計算主要參考顏虹主編《醫(yī)學統(tǒng)計學》及孫瑞元、鄭青山、姚晨及劉玉秀等人的相關著述。
先提示一下:樣本量計算應先給定必要的參數(shù)。沒有任何給定參數(shù)的樣本量,誰也算不出來呵。這些必要的參數(shù),一般可通過預試驗或參考文獻或以前的經(jīng)驗資料得到。
樣本量的計算,在Excel中非常容易。以下的介紹中,將順便給出需要使用的Excel函數(shù)。這些函數(shù)的意義,Excel中都有解釋。希望親們捕獲魚時更獲得漁之方法(授人魚不如授人以漁)。
當然,本小書的作者也搜集或建立了下面所述的各樣本量計算公式模板,上傳于丁香園醫(yī)學網(wǎng)站,親們可去下載:http://www.dxy.cn/bbs/topic/21117904
常用的樣本量計算方法有:
A 兩獨立組比較(率/計數(shù)資料)
B 多獨立組比較(率/計數(shù)資料)
C 兩獨立組比較(均數(shù)/計量資料)
D 多獨立組比較(均數(shù)/計量資料)
E 兩配對組比較(率/計數(shù)資料)
F 兩配對組比較/單組前后比較(均值/計量資料)
G 等效性/非劣性試驗:兩組率/計數(shù)資料的比較
H 等效性/非劣性試驗:兩組計量資料的比較
I 診斷試驗
J 橫斷面研究的樣本例數(shù)(0-1變量總體概率估計)
K 橫斷面研究的樣本例數(shù)(均值/計量資料)
好,下面逐一為親們介紹(仍然是不講理論和出處,只講應用?。?。
A 兩獨立組比較(率/計數(shù)資料) 【例】 某課題的研究目的是比較兩種藥物治療乙型肝炎后表面抗原HBsAg的改善情況(雙側檢驗),問兩組各需要乙肝患者多少名?擬規(guī)定:乙肝患者隨機分為2組,兩組樣本量比:甲藥組/乙藥組=0.55/0.45;預試驗測得甲藥的轉陰率為60%,乙藥的轉陰率為75%。公式:
N={Z
α/2[(2P
均)(1-P?
均)(Q
1-1 Q
2-1 )]
0.5 Z
β[P
1Q
1-1(1-P
1) P
2Q
2-1(1-P
2)]
0.5}
2/(P
1-P
2)
2 (注:以上為雙側檢驗公式。單側檢驗時,將Z
α/2換成分Z
α即可。親若是統(tǒng)計初學者,不太清楚統(tǒng)計檢驗是雙側檢驗還是單側檢驗,那就一般選擇雙側檢驗。以后的公式若無特別提示,都僅列示雙側檢驗的計算結果)
參數(shù):
⑴ Z
α/2:α=0.05,Z
α/2=1.960 Excel計算:=NORMSINV(1-0.05/2)
⑵ Z
β:β=0.10,Z
β=1.282 Excel計算:=NORMSINV(1-0.10)
⑶ Q
1、Q
2:各組樣本比例。本例設計Q
1=0.55,Q
2=0.45
⑷ P
1、P
2:各組的預試驗所得率,本例為轉陰率:P
1=0.60、P
2=0.75
⑸ P
均:兩組合并率,或兩組平均率。P
均= P1Q
1 P2Q
2=(0.55×0.6 0.45×0.75)=0.6675。
⑹ N:兩組例樣本總例數(shù)。(N=n1 n2)
代入可得樣本總例數(shù) N≈411。
(注:平方根計算(Excel計算,以求30的平方根:30
0.5 為例):=SQRT(30)或 =30^0.5
結果:
比較兩種藥物治療乙型肝炎后表面抗原HBsAg的轉陰情況,置信水平為0.95,檢驗功效為0.9,兩組共需要411名乙肝患者。其中甲藥組需要:n1=Q1N=0.55×411=226;乙藥組需要:n2=Q2N=0.45×411=185。
后面的各類樣本量計算,不再寫結果這段了(節(jié)省版面嘿嘿)
B 多獨立組比較(率/計數(shù)資料)【例】 比較三種矯治近視眼方法的效果有無差異,問各法需觀察多少例?預試驗如下:采用三種方法矯治近視眼,治療后得到A法有效率為37.78%,B法為18.75%,C法為27.78%。公式: 多組本率比較的樣本例數(shù)公式
n = 2λ/[2sin
-1(P
max0.5 )- 2sin
-1(P
min0.5 )]
注:該公式中出現(xiàn)反正弦函數(shù),以對樣本率進行以弧度為單位的反正弦被換,從而解決該類資料的率向兩側偏離的偏態(tài)現(xiàn)象。
參數(shù):
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:設計的組數(shù),本例中,K=3
⑷ λ:查下表得,λ
α,β,K-1 =λ
0.05,0.10,3-1=12.65
α=0.05時的λ值表 組數(shù)K | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
自由度v=K-1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
β=0.2 | 9.63 | 10.90 | 11.94 | 12.83 | 13.62 | 14.35 | 15.02 | 15.65 |
β=0.1 | 12.65 | 14.17 | 15.41 | 16.47 | 17.42 | 18.28 | 19.08 | 19.83 |
⑸ SIN
-1:反正弦函數(shù),若用Excel函數(shù)計算0.5的反正弦值:=ASIN(0.5)
⑹ P
max、P
min:分別為最大率和最小率,根據(jù)預試驗或查文獻來估計。本例P
max=0.3778,P
min=0.1875。代入計算得樣本例數(shù)n≈138。
C 兩獨立組比較(均數(shù)/計量資料)【例】 某課題的研究目的是欲比較黃芪與生血散對粒細胞減少癥的療效,兩組樣本比例:Q1/Q2=0.5/0.5。問每組需要觀察多少例?預試驗如下:一個研究組將隨機抽取的粒細胞減少癥的病例平均分為兩組,分別用黃芪和生血散治療后測得,黃芪組平均增加粒細胞1×109 個/L,生血散組平均增加粒細胞2×109 個/L,合并標準差為σ=1.8×109 個/L。公式:兩組均數(shù)比較樣本例數(shù)公式
N=[Z
α/2 Z
β] σ/δ]
2(Q
1-1 Q
2-1)
參數(shù):
⑴ Z
α/2:α=0.05,Z
α=1.960 [ Excel函數(shù)計算:Z
α/2=NORMSINV(1-0.05/2) ]
⑵ Z
β:β=0.20,Z
β=0.842 [ Excel函數(shù)計算:Z
β=NORMSINV(1-0.20) ]
⑶ σ: σ=1.8×10
9 注:合并標準差σ= [(S
12 S
22)/2]
0.5 ⑷ δ:兩組差值,見前述預試驗,δ=(2×10
9)-(1×10
9)=1×10
9⑸ Q
1、Q
2:見前述預試驗,Q
1=0.5、Q
2=0.5
代入可得樣本例數(shù)N≈80。
D 多獨立組比較(均數(shù)/計量資料)【例】 某課題的研究目的是比較三種方案治療血紅蛋白不滿100g/L的嬰幼兒貧血患者后,血紅蛋白增的變化有無差異,問三組各需要觀察多少例?預試驗如下:一個研究組將隨機抽取的血紅蛋白不滿100g/L的嬰幼兒貧血患者平均分為三組,經(jīng)各治療方案治療后血紅蛋白增加的均數(shù)Xi分別為18.5g/L、13.2g/L、10.4g/L,標準差Si為11.8g/L、13.4g/L、9.3g/L。公式:多個樣本均數(shù)比較樣本例數(shù)公式
n = Ψ
2(∑(S
i2)/K)/[∑(X
i均 - X
均)
2/(K-1)]
參數(shù):
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:為組數(shù),本例題K=3。
⑷ Ψ:本例K=3,自由度V1=K-1=2;自由度V2=N-1,N未知,可取最大∞,查下表得:
Ψ
α,β,K-1,∞=2.52。
⑸ X
均i、S
i:分別為第i組的均數(shù)(X
1=18.5、X
2=…)和標準差(S
1=11.8,S
2=…)的估計值,由預試驗或文獻來估計。
⑹ X
均的確定:X
均=(X
1 X
2 X
3)/K=(18.5 13.2 10.4)/3=14.0
代入便可計算求出樣本例數(shù):n≈51
α=0.05,β=0.10時的Ψ值表 | V1=K-1 |
V2=N-1 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
2 | 6.80 | 6.71 | 6.68 | 6.67 | 6.66 | 6.65 | 6.65 | 6.65 | 6.64 | 6.64 |
3 | 5.01 | 4.63 | 4.47 | 4.39 | 4.34 | 4.30 | 4.27 | 4.25 | 4.23 | 4.22 |
4 | 4.40 | 3.90 | 3.69 | 3.58 | 3.50 | 3.45 | 3.41 | 3.38 | 3.36 | 3.34 |
5 | 4.09 | 3.54 | 3.30 | 3.17 | 3.08 | 3.02 | 2.97 | 2.94 | 2.91 | 2.89 |
6 | 3.91 | 3.32 | 3.07 | 2.92 | 2.83 | 2.76 | 2.71 | 2.67 | 2.64 | 2.61 |
7 | 3.80 | 3.18 | 2.91 | 2.76 | 2.66 | 2.58 | 2.53 | 2.49 | 2.45 | 2.42 |
8 | 3.71 | 3.08 | 2.81 | 2.64 | 2.54 | 2.46 | 2.40 | 2.35 | 2.32 | 2.29 |
9 | 3.65 | 3.01 | 2.72 | 2.56 | 2.44 | 2.36 | 2.30 | 2.26 | 2.22 | 2.19 |
10 | 3.60 | 2.95 | 2.66 | 2.49 | 2.37 | 2.29 | 2.23 | 2.18 | 2.14 | 2.11 |
11-15 | 3.51 | 2.84 | 2.54 | 2.36 | 2.23 | 2.15 | 2.08 | 2.02 | 1.98 | 1.95 |
16-20 | 3.43 | 2.74 | 2.43 | 2.24 | 2.11 | 2.02 | 1.94 | 1.89 | 1.84 | 1.80 |
21-25 | 3.39 | 2.69 | 2.37 | 2.18 | 2.04 | 1.95 | 1.87 | 1.81 | 1.76 | 1.72 |
26-30 | 3.36 | 2.66 | 2.33 | 2.14 | 2.00 | 1.90 | 1.82 | 1.76 | 1.71 | 1.67 |
31-35 | 3.34 | 2.63 | 2.31 | 2.11 | 1.97 | 1.87 | 1.79 | 1.73 | 1.68 | 1.63 |
36-40 | 3.33 | 2.62 | 2.29 | 2.09 | 1.95 | 1.85 | 1.77 | 1.70 | 1.65 | 1.61 |
41-45 | 3.32 | 2.61 | 2.28 | 2.07 | 1.93 | 1.83 | 1.75 | 1.69 | 1.63 | 1.59 |
46-50 | 3.31 | 2.60 | 2.26 | 2.06 | 1.92 | 1.82 | 1.74 | 1.67 | 1.62 | 1.57 |
50 | 3.31 | 2.59 | 2.26 | 2.06 | 1.92 | 1.81 | 1.73 | 1.67 | 1.61 | 1.56 |
60 | 3.30 | 2.58 | 2.25 | 2.04 | 1.90 | 1.79 | 1.71 | 1.64 | 1.59 | 1.54 |
80 | 3.28 | 2.56 | 2.23 | 2.02 | 1.88 | 1.77 | 1.69 | 1.62 | 1.56 | 1.51 |
120 | 3.27 | 2.55 | 2.21 | 2.00 | 1.86 | 1.75 | 1.66 | 1.59 | 1.54 | 1.49 |
240 | 3.26 | 2.53 | 2.19 | 1.98 | 1.84 | 1.73 | 1.64 | 1.57 | 1.51 | 1.46 |
∞ | 3.24 | 2.52 | 2.17 | 1.96 | 1.81 | 1.70 | 1.62 | 1.54 | 1.48 | 1.43 |
E 兩配對組比較(率/計數(shù)資料)【例】 用A、B兩種方法檢查血樣中的HIV,先用A法檢驗,再用B法檢驗。比較兩法的差異,需要多少樣本量?預試驗結果如下表:A法B 法均為陽性 為a例,均為陰性-的為d例,分別為陽、陰性的為d或c例。 配對設計 | A法測定 |
陽性 | 陰性- |
B法測定 | 陽性 | a | b |
陰性- | c | d |
公式:兩配對組(率/計數(shù)資料)比較公式
n=[Z
α/2(2π
c)
0.5 Z
β(2π
-π
- )
0.5]
2/(π
- -π
- )
2參數(shù):
⑴ Z
α/2:α=0.05,Z
α/2=1.960
⑵ Z
β:β=0.10,Z
β=1.282
⑶ π
-:π
-=b/(a b)
⑷ π
- :π
- =c/(a c)
⑸ π
c: (π
- π
- )/2
代入可得樣本例數(shù)。
F 兩配對組比較/單組前后比較(均值/計量資料)【例】 某降壓藥臨床試驗,觀測病人服藥前后的血壓值,以判斷降壓效果。求樣本量。預試驗知:病人用藥前后的血壓差值觀測的標準差S=8.3mmHg,觀測比較的閾值δ為2mmHg。公式:n = [(Z
α/2 Z
β)S/δ]
2參數(shù):
⑴ Z
α/2:α=0.05,Z
α/2=1.960
⑵ Z
β:β=0.10,Z
β=1.282
⑶ S:標準差。由文獻或預調查的資料來估計。本例為S=8.3。
⑷ δ:判斷閾值或比較界值或容許誤差,一般可考慮δ=(0.1~0.5)S,本例取2。
代入計算得:n=180。
(注:δ:判斷閾值,其含義大致同下面的等效性檢驗中的定義。親可這樣理解:如果想比較的更精細準確一些,其比較的δ:判斷閾值應該小一些,對應的樣本量就大一些(δ在計算樣本量的分母上)
G 等效性/非劣性試驗:兩組率/計數(shù)資料的比較【例】 某新藥進行Ⅱ期臨床試驗,考察其治愈率不差于經(jīng)典對照藥,按1/1設試驗組和對照組,求樣本量。預試驗知:兩組治愈率均約0.80。公式:非劣性試驗:n= 2×(U
α U
β)
2×P(1-P)/δ
2等效性試驗:n = 2×(U
α U
β/2)
2×P(1-P)/δ
2(注:等效性試驗包括高低兩個方向的單側檢驗,但采用U
β/2而非U
α/2)
特別地,臨床常用α=0.05,β=0.20,兩組例數(shù)比K=Q1/Q2=1時,親可用下述簡化公式:
非劣性試驗:n= 12.365×P(1-P)/δ
2等效性試驗:n = 17.127×P(1-P)/δ
2參數(shù):
⑴ α=0.05
⑵ β=0.20
⑶ P=0.80(P為兩組合并率或兩組平均率,約為兩組率的均值或合并計算后的均值)
⑷ δ(檢驗界值)=0.15(一般由臨床專業(yè)決定,可取兩組平均率的1/3~1/10)
⑸ Q
1、Q
2=0.5(兩組例數(shù)比0.5/0.5=1)
代入可得每組樣本例數(shù):n=12.365×0.8(1-0.8)/0.15
2 =88
如果:兩組例數(shù)比K=Q
1/Q
2≠1時,則n1≈n(1 K)/2;n2≈n(1 K)/2K
H 等效性/非劣性試驗:兩組計量資料的比較【例】 【例】 某新藥進行Ⅱ期臨床試驗,考察其生存期不差于經(jīng)典對照藥,按1/1設試驗組和對照組,求樣本量。預試驗知:兩組共同標準差s=60d。公式:非劣性試驗:n= 2×(U
α U
β)
2×(σ/δ)
2等效性試驗:n = 2×(U
α U
β/2)
2×(σ/δ)
2(注:等效性試驗包括高低兩個方向的單側檢驗,但采用U
β/2而非U
α/2)
特別地,臨床常用α=0.05,β=0.20,兩組例數(shù)比K=Q
1/Q
2=1時,親可用下述簡化公式:
非劣性試驗:n= 12.365×(s/δ)
2等效性試驗:n = 17.127×(s/δ)
2參數(shù):
⑴ α=0.05
⑵ β=0.20
⑶ σ = 60 (合并標準差,σ= [(S
12 S
22)/2]
0.5。近似估算甚至可取兩組標準差的幾何均值(S
1×S
2)
0.5。
注:標準差S:通常指樣本的標準差,Excel中表述為標準偏差SD,其函數(shù)計算:=STDEV(),其計算公式為SD=[∑(X
i-X
均)
2)/(n-1)]
0.5。 親們不要和總體的標準差弄混啊(總體的標準差公式里將n-1換作n),當然弄混也無大事,反正樣本量計算就一參考值,有點誤差木什么大不了。
⑷ δ(檢驗界值)=0.20(一般由臨床專業(yè)決定,可取共同標準差的1/2~1/5,或取對照/參比組均值的1/5~1/10)
⑸ Q1、Q2 =0.5(兩組例數(shù)比0.5/0.5=1)
代入可得每組樣本例數(shù):n=12.365×(60/20)
2 =111
如果:兩組例數(shù)比K=Q
1/Q
2≠1時,則n1≈n(1 K)/2;n2≈n(1 K)/2K
I 診斷試驗【例】 某課題的研究目的是為了解B超診斷肝硬化的臨床價值,每組各需要多少例患者?預試驗中:B超診斷肝硬化約為:P靈敏度=0.75;P特異度=0.55。公式: 診斷試驗的樣本例數(shù)公式
n=(U
α/δ)
2(1-P)P
參數(shù):
⑴ μ
α:α=0.05,μ
α=Z
α/2=1.960
⑵ μ
β:β=0.20,本法計算中可不涉及μ
β。
⑶ δ:判斷界值。由研究者根據(jù)預試驗或查文獻來估計。可綜合取預試驗之靈敏度或特異度的1/5~1/10。一般定在0.05~0.10之間。本例取δ=0.08
⑷ P的確定:P
靈敏度=0.75;P
特異度=0.55
(一般,計算試驗組的樣本量時用P
靈敏度,而計算對照組樣本量時用P
特異度)
代入計算求出樣本例數(shù):
將P
靈敏度=0.75代入公式后可計算得n
試驗≈113。
將P
特異度=0.55代入公式后可計算得n
對照≈149。
J 橫斷面研究的樣本例數(shù)(0-1變量總體概率估計) 【例】 為了在全國作生育率的調查,根據(jù)資料已知全國婦女現(xiàn)階段峰值年齡生育率估計值,按單純隨機抽樣,估計峰值年齡婦女需要多少人?預調查如下:為了在全國作生育率的抽樣調查,經(jīng)查閱文獻獲得,我國婦女現(xiàn)階段峰值年齡生育率P在0.3上下波動,允許誤差δ
為0.015,若定檢驗水準為0.05,試按單純隨機抽樣,估計峰值年齡婦女樣本例數(shù)。公式: n= Z
α/22×P(1-P)/δ
2 參數(shù):⑴ Z
α/2:α=0.05,Z
0.05/2=1.96。
⑵ δ:δ=P-π。δ可通過預試驗、查閱文獻、專家意見來確定。特別地,在很多情況下:可取δ≈0.1P,Z
α/2≈2,則公式可簡化為n = 400(1-P)/P。
⑶ P:總體概率。通過預試驗或查閱文獻獲得。
本例按公式計算得:樣本例數(shù)n=1.96
2×0.3(1-0.3)/0.015
2 = 3733
若按簡化公式:δ定為0.1P=0.03,則樣本例數(shù)n=400×(1-0.3)/0.3=933
K 橫斷面研究的樣本例數(shù)(均值/計量資料)【例】 研究某地區(qū)平均每月每位社區(qū)醫(yī)生的家訪次數(shù),至少需要調查多少名醫(yī)生? 預調查知:一個研究組從社區(qū)醫(yī)療機構的名單中隨機抽取90名社區(qū)醫(yī)生進行調查,發(fā)現(xiàn)他們一個月內家訪平均次數(shù)為4.89次,標準差為3.48次。公式:n= (Z
α/2×V/ε)
2 參數(shù):⑴ Z
α:α=0.05,Z
0.05/2=1.96。
⑵ ε:相對誤差。由研究者根據(jù)問題的背景自行規(guī)定,例如可以取0.1、0.15、0.2等。本例取0.2。
⑶ V:變異系數(shù)。V = σ/μ(總體的標準差/總體均值),或用S/X均估計,其中參數(shù)由文獻或預調查的資料來估計。本例為V=3.48/4.89=0.712。
代入公式后可得n=49。