今天要給大家拆解的文獻是今年5月剛剛發(fā)表在Aging上的文章,影響因子5.515。文章題目是Identification and validation of hub microRNAs dysregulated in esophageal squamous cellcarcinoma。從標題很容易看出本研究是常規(guī)的hub基因研究,但本研究之所以能發(fā)表在5分 上,我覺得一是文章研究的是microRNAs,有所新意;二是文章還做了點簡單的實驗對篩選出的兩條microRNA進行了表型驗證。
數(shù)據(jù)解構(gòu)
挑——差異表達miRNA篩選
本文首先通過GEO數(shù)據(jù)庫篩選食管癌差異表達microRNAs(miRNAs)。作者選用了GSE114110和GSE43732兩個數(shù)據(jù)集進行分析。值得一提的是,作者還利用R語言的limma包對數(shù)據(jù)集進行了標準化處理。作者設定的閾值為|log2FC|≥ 1和P < 0.05,由圖E和F的火山圖可以看出篩選出的差異表達miRNAs相比于平時我們篩選mRNA時是要相對少一些的。作者使用的是limma包進行的差異表達分析,使用GEO數(shù)據(jù)庫的在線工具GEO2R也能達到同樣的目的。篩選到差異基因后,作者使用R語言VennDiagram包制作韋恩圖,使用網(wǎng)站Draw Venn Diagrams (http://bioinformatics.psb.ugent.be/webtools/Venn/)也可做出類似的圖。最終篩選得到3個上調(diào)的和5個下調(diào)的miRNAs。
此外再提一句,在分析多個數(shù)據(jù)集時,可以將多個數(shù)據(jù)集的數(shù)據(jù)合并分析,但是必須得先去掉批次效應。如果不想去進行去批次的操作,可以像這篇文章這樣采用取交集的方式,這樣也算是有一定道理的。
聯(lián)——miRNA靶基因預測
miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/php/index.php)是一個經(jīng)過實驗驗證的miRNA-靶基因相互作用數(shù)據(jù)庫,作者利用這個數(shù)據(jù)庫對8個差異表達的miRNA的靶基因進行了預測。3個上調(diào)的和5個下調(diào)的hub miRNAs總共分別預測出468和753個可能的靶基因。
除了miRTarBase網(wǎng)站外,常用的miRNA靶基因預測網(wǎng)站還有Targetscan、ENCORI、miRDB、miRWalk等。
圈——miRNA靶基因GO和KEGG富集分析
聯(lián)——PPI網(wǎng)絡分析得到hub基因,miRNA-hub基因互作網(wǎng)絡構(gòu)建
作者又使用STRING數(shù)據(jù)庫對預測出468和753個可能的靶基因分別作了蛋白蛋白互作(PPI)分析,并進一步地利用Cytoscape軟件篩選得到hub基因各10個。然后對這20個基因做了GO和KEGG富集分析。本文作者將GO分析的三大類:生物過程(BP)、分子功能(MF)、細胞組分(CC)分開展示,并對靶基因、hub基因分別做富集分析,因此得到的圖比較多。
隨后,作者利用Cytoscape軟件構(gòu)建miRNA-hub基因網(wǎng)絡。由于miR-196a-5p和miR-1-3p所關聯(lián)的hub基因最多,作者進一步地利用miRNACancerMAP數(shù)據(jù)庫分析了miR-196a-5p和miR-1-3p所涉及的信號通路。
miRNACancerMAP(http://cis.hku.hk/miRNACancerMAP/)是一個可以預測、構(gòu)建癌癥miRNA調(diào)節(jié)網(wǎng)絡的在線工具,只需點擊網(wǎng)站上方的Quick Search,輸入想要研究的miRNA,即可得到分析結(jié)果。
靠——miRNAs預后價值分析
隨后,作者利用利用TCGA數(shù)據(jù)庫、細胞系以及臨床樣本驗證了miR-196a-5p和 miR-1-3p的表達情況。并利用基于TCGA數(shù)據(jù)的starBase數(shù)據(jù)庫對miR-196a-5p和miR-1-3p進行Kaplan-Meier生存分析,以評估其預后價值。
干濕結(jié)合
到這里其實這篇文章已經(jīng)可以發(fā)表了,但最新的Aging已經(jīng)不收純生信文章了,要發(fā)5分必須補濕實驗。
干濕結(jié)合的參考組合有:
1、生信 臨床標本驗證
2、生信 功能表型驗證(細胞或者細胞 動物均可)
3、生信 臨床 功能表型驗證
4、生信 臨床 功能 機制研究
這篇文章運用的是“生信 臨床 功能表型驗證”組合,作者做了一點實驗來驗證miR-196a-5p和miR-1-3p對食管癌細胞增殖和遷移的影響。所用實驗為CCK-8、EdU和Transwell等常規(guī)實驗技術,比較簡單。這里作者只是用了miRNAmimics做實驗,其實還可增加使用miRNA inhibitors的實驗。
總結(jié)
到此全文就結(jié)束了,總結(jié)一下,作者先用GEO數(shù)據(jù)庫篩選得到食管癌差異表達miRNAs(挑),然后利用篩選得到的8條miRNAs預測靶基因(聯(lián)),并對靶基因進行富集分析(圈);進一步地在靶基因中篩選得到hub基因(聯(lián)),并篩出兩條與hub基因聯(lián)系最多的miRNAs(聯(lián));最后對這兩條miRNAs進行生存分析,來說明臨床意義(靠),其實本文還可增加臨床相關性分析,ROC曲線等分析進一步豐富內(nèi)容。此外,這篇文章還增加了一點濕實驗的內(nèi)容:利用細胞系和臨床樣本驗證兩條miRNA的表達情況(臨床標本驗證),并利用細胞實驗驗證其對食管癌細胞增殖遷移能力的影響(功能表型驗證)。
整體來說,全文基本全部按照“挑、圈、聯(lián)、靠”的生信套路來進行,所用技術以在線工具為主,適合初學者模仿。
最后再給大家歸納一下干濕結(jié)合研究套路模板(加粗的是本文所用的方法):
干:
挑:差異表達分析篩選目的基因
圈:GO/KEGG富集分析、GSEA富集分析、WGCNA網(wǎng)絡分析、其他特殊分析(miRNA相關通路預測、免疫浸潤等等)
聯(lián):蛋白蛋白互作(PPI)分析、miRNA交互作用、分子網(wǎng)絡構(gòu)建
靠:生存分析、臨床相關系分析、單因素/多因素分析、差異表達預后分析、ROC曲線
濕:
1、臨床標本驗證(包括細胞系和臨床樣本)
2、功能表型驗證(細胞或者細胞 動物均可)
3、臨床 功能表型驗證
4、臨床 功能 機制研究
如果對這篇文章感興趣,想進一步研究,小伙伴們可以通過回復“ Summer'獲取文章全文。