第24天 如何使用R語(yǔ)言進(jìn)行假設(shè)檢驗(yàn)
統(tǒng)計(jì)推斷是統(tǒng)計(jì)分析最基本的方法,其中最主要的方法是假設(shè)檢驗(yàn)。
統(tǒng)計(jì)推斷中假設(shè)檢驗(yàn)是比較兩組或多組總體均數(shù)是否有差異最為常用的方法,傳統(tǒng)的假設(shè)檢驗(yàn)方法包括t檢驗(yàn)、方差分析、卡方檢驗(yàn)、秩和檢驗(yàn)。
本文將給大家介紹醫(yī)學(xué)數(shù)據(jù)常用假設(shè)檢驗(yàn)方法,包括正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)、卡方檢驗(yàn)和秩和檢驗(yàn)。
一、 正態(tài)性檢驗(yàn)
很多統(tǒng)計(jì)方法要基于數(shù)據(jù)的分布開(kāi)展,正態(tài)分布是定量資料中一種非常重要的分布形式,對(duì)定量資料進(jìn)行假設(shè)檢驗(yàn)時(shí),首先就要考慮資料是否符合正態(tài)性,R語(yǔ)言當(dāng)中正態(tài)性檢驗(yàn)的語(yǔ)句包括shapiro.test,ks.test,lillie.test。
1.小樣本正態(tài)性檢驗(yàn)shapiro
shapiro.test(newdata$weight) #正態(tài)性檢驗(yàn),適用于小樣的資料
2.大樣本正態(tài)性檢驗(yàn)Kolmogorov-Smirnov
ks.test(newdata$weight,"pnorm") #采用K-S法進(jìn)行正態(tài)性檢驗(yàn),適用于大樣本資料
3. Lilliefor檢驗(yàn) 它是Kolmogorov-Smirnov正態(tài)性檢驗(yàn)修正,使用nortest包中的函數(shù)
library(nortest)
lillie.test(newdata$weight)
二、方差齊性檢驗(yàn)
兩組或多組定量資料進(jìn)行比較時(shí),除了要考慮正態(tài)性外,還要考慮方差齊性,在R中可以利用var.test或car包中的bartlett.test函數(shù)完成。
var.test(newdata$height~newdata$sex,na.rm=T) #男女方差齊性檢驗(yàn)
library(car)
bartlett.test(height~sex,data=newdata) #方差齊性檢驗(yàn)
三.t檢驗(yàn)
t.test(x, y=NULL,alternative=,mu=0, paired=FALSE, var.equal=FALSE,conf.level=0.95, ...)
x:比較的變量,兩組比較變量在前,因子在后,weight~sex
y:變量,當(dāng)x為距陣時(shí),y無(wú)效,多用于配對(duì)檢驗(yàn)的時(shí)候應(yīng)用
alternative:?jiǎn)坞p側(cè):定義 "two.sided", "greater" or "less"
mu:與某個(gè)值比較,無(wú)差別假設(shè)
var.equal方差是否齊
conf.level可信區(qū)間
1) 單樣本t檢驗(yàn)
t.test(newdata$weight,mu=65,alternative="less") #單樣本t檢驗(yàn),是否比65小。
2)兩獨(dú)立樣本t檢驗(yàn)
t.test(weight~sex,data=newdata ,mu=0,var.equal=F) #alternative不填默認(rèn)雙側(cè)
3)配對(duì)t檢驗(yàn)
t.test(newdata$eq5d_1,newdata$eq5d_2,paired=TRUE) #配對(duì)t檢驗(yàn)
四.方差分析
aov(formula,data= NULL, ...)
formula:比較變量,和t檢驗(yàn)的參數(shù)一致;比較變量~因子1+因子2,兩因素方差分析;比較變量~因子1*因子2兩因素方差分析交互效應(yīng)分析
1)單因素方差分析
newdata$marriage<-as.factor(newdata$marriage) #將marriage設(shè)置成因子
fit<-aov(weight~marriage,data=newdata) #單因素方差分析
summary(fit)
TukeyHSD(fit) # 兩兩比較的方法
2)雙因素方差分析
fit1<-aov(weight~marriage+huji,data=newdata)
summary(fit1) # 兩因素方差分析
3)交互效應(yīng)分析
fit2<-aov(weight~marriage*huji,data=newdata)
summary(fit2) # 兩因素方差分析帶交互
五. 卡方檢驗(yàn)
chisq.test(x, y = NULL, correct = TRUE,…)
x:分析變量
y: 變量,和t檢驗(yàn)一致
correct:是否較正,默認(rèn)較正
1)行列表卡方檢驗(yàn)
table1 <- table(newdata$sex,newdata$marriage) #列聯(lián)表兩組分類變量
chi<-chisq.test(table1) #卡方檢驗(yàn)
chisq.test(table1,correct = F) #連續(xù)較正
summary(chi)
chisq.test(table1)$expected #提取理論頻數(shù),判斷采用哪種方法
2)配對(duì)卡方檢驗(yàn)
table2<- table(newdata$sex,newdata$insomnia) #2*2列表
mcnemar.test(table1) #配對(duì)卡方檢驗(yàn),行列需要是2*2
fisher.test(table1) #fisher 精確法
六.秩和檢驗(yàn)
wilcox.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, exact = NULL, correct = TRUE, ...)
x,y是觀察數(shù)據(jù)構(gòu)成的數(shù)據(jù)向量,與t檢驗(yàn)相同
alternative是備擇假設(shè),有單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn),
mu待檢參數(shù)
paired:是否配對(duì)
exact是邏輯變量,說(shuō)明是否精確計(jì)算P值
correct是邏輯變量,說(shuō)明是否對(duì)P值的計(jì)算采用連續(xù)性修正,相同秩次較多時(shí),統(tǒng)計(jì)量要校正。conf.int是邏輯變量,說(shuō)明是否給出相應(yīng)的置信區(qū)間。
1)單樣本符號(hào)秩和檢驗(yàn)
wilcox.test(newdata$weight,mu=65,alternative="less") #單樣本t檢驗(yàn),是否比65小。
2)兩獨(dú)立樣本秩和檢驗(yàn)
wilcox.test(weight~sex,data=newdata ,mu=0) #alternative不填默認(rèn)雙側(cè)
3)配對(duì)樣本秩和檢驗(yàn)
wilcox.test(newdata$eq5d_1,newdata$eq5d_2,paired=TRUE) #配對(duì)t檢驗(yàn)
以上就是對(duì)醫(yī)學(xué)數(shù)據(jù)常用的假設(shè)檢驗(yàn)方法,在R語(yǔ)言中,統(tǒng)計(jì)描述和假設(shè)檢驗(yàn)的代碼相對(duì)比較簡(jiǎn)單,在對(duì)醫(yī)學(xué)數(shù)據(jù)進(jìn)行分析時(shí),重點(diǎn)還要在于對(duì)于前期數(shù)據(jù)的整理。
DAY23的內(nèi)容就介紹到這里!
聯(lián)系客服