術(shù)語(yǔ)
AUC:ROC曲線下面積;
C-指數(shù):一致性指數(shù);
EGFR-TKI:表皮生長(zhǎng)因子受體酪氨酸激酶抑制劑;
GO:基因本體,在生物信息學(xué)領(lǐng)域中廣泛使用的本體,涵蓋細(xì)胞組分、分子功能、生物過(guò)程三個(gè)生物學(xué)方面;
GEO:基因表達(dá)綜合
GSEA:基因集富集分析
HR:風(fēng)險(xiǎn)比
KEGG:京都基因與基因組百科全書(shū)
LASSO:最小絕對(duì)收縮與選擇算子
LUAD:肺腺癌
LUSC:肺鱗狀細(xì)胞癌
NSCLC:非小細(xì)胞肺癌
OS:總生存
ROC:受者操作特征
TCGA:癌基因組圖譜
一
研究思路
二
結(jié)果
進(jìn)一步通過(guò)Lasso回歸得到LUAD的22個(gè)和LUSC的11個(gè)生存相關(guān)基因。TCGA-LUAD(A)中25個(gè)基因和TCGA-LUSC(B)中11個(gè)基因的LASSO系數(shù)分布。根據(jù)對(duì)數(shù)(lambda)序列生成系數(shù)剖面圖。TCGA-LUAD(C)和TCGA-LUSC(D)套索模型中最優(yōu)參數(shù)(lambda)的選擇。(E) TCGA-LUAD隊(duì)列中22個(gè)基因的遺傳改變。(F) TCGA-LUSC隊(duì)列中11個(gè)基因的遺傳改變。
根據(jù)每個(gè)基因的mRNA表達(dá)水平和風(fēng)險(xiǎn)系數(shù),即每個(gè)自噬相關(guān)基因的mRNA水平與其多變量LASSO回歸系數(shù)加權(quán)的線性組合,計(jì)算每個(gè)患者的風(fēng)險(xiǎn)得分。風(fēng)險(xiǎn)評(píng)分用于預(yù)測(cè)預(yù)后,以中位風(fēng)險(xiǎn)評(píng)分作為臨界值,將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。繪制熱圖以顯示高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組的基因表達(dá)譜,TCGA-LUAD(A)和TCGA-LUSC(B)。TCGA-LUAD(C)和TCGA-LUSC(D)的危險(xiǎn)評(píng)分分布、患者生存時(shí)間及狀態(tài),黑色虛線是將患者分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組的最佳界限。TCGA-LUAD(E)和TCGA-LUSC(F)的單因素Cox回歸分析,風(fēng)險(xiǎn)因素與存活率之間關(guān)系的森林圖。
多元Cox回歸分析。自噬相關(guān)基因標(biāo)記是TCGA-LUAD(A)和TCGA-LUSC(B)預(yù)后的獨(dú)立預(yù)測(cè)因子。TCGA肺癌患者的Kaplan-Meier分析,(C) 高危評(píng)分與TCGA-LUAD患者總體生存率低有關(guān),(D) TCGA-LUSC的高危評(píng)分與總體生存率低相關(guān)。受試者操作特征(ROC)分析操作系統(tǒng)對(duì)TCGA-LUAD(E)中22個(gè)基因風(fēng)險(xiǎn)評(píng)分和TCGA-LUSC(F)中11個(gè)基因風(fēng)險(xiǎn)評(píng)分的敏感性和特異性。TCGA-LUAD(G)和TCGA-LUSC(H)的分期和危險(xiǎn)度評(píng)分聯(lián)合應(yīng)用比單獨(dú)應(yīng)用兩者更能預(yù)測(cè)預(yù)后。
這部分是對(duì)之前利用TCGA數(shù)據(jù)所構(gòu)建的模型在GEO數(shù)據(jù)集進(jìn)行驗(yàn)證。Okayama包括226例原發(fā)性I-II期肺腺癌(GSE31210)患者?;颊叩娘L(fēng)險(xiǎn)評(píng)分從-58到-53(圖A)。低?;颊叽婊顣r(shí)間明顯長(zhǎng)于高危人群(圖C和E)。Rousseaux包括293例I-IV期肺癌(GSE30219),包括71例腺癌、61例鱗狀細(xì)胞癌、56例大細(xì)胞神經(jīng)內(nèi)分泌腫瘤、39例基底細(xì)胞瘤、24例類(lèi)癌、21例小細(xì)胞癌和7例其他組織學(xué)。風(fēng)險(xiǎn)評(píng)分范圍從-19到-15(圖B)。即使在該混合型肺癌樣本(圖D和F),風(fēng)險(xiǎn)評(píng)分也表現(xiàn)良好。
三
結(jié)語(yǔ)
聯(lián)系客服