一個追求高品質(zhì)生活異想天開的浪漫瘋子,一只研究精神疾病與腦的遺傳的科研汪...生活不該只停留在想法而無實際行動,做一個勇敢的行動者,去嘗試去努力。 此公眾號旨在分享本汪在科研及生活中的一些實踐報告、學(xué)習(xí)筆記,期待與你的交流與合作。戳這里ActionFree公眾號原文,請多關(guān)注哦~
隨著技術(shù)的進步,數(shù)據(jù)的累積,有很多公共的數(shù)據(jù)可以用來挖掘出有意義的解讀。今天小編跟大家扒拉的是一篇發(fā)表在JAMA Psychiatry雜志上的文章的分析方法。
全文都是利用的公共數(shù)據(jù)庫,在線的網(wǎng)站,并沒有費一兵一卒來做實驗,對于想要從生物信息角度入手的你,值得學(xué)習(xí)。
精神分裂癥是一種常見的精神障礙,發(fā)病率高,遺傳度高,且遺傳異質(zhì)性很大。2014年的GWAS薈萃分析找到了108個精神分裂癥的相關(guān)基因組,標志著人類對精神分裂癥理解的一個偉大進步。研究精神分裂癥的風(fēng)險基因是如何作用于疾病的是非常重要的課題。
隨著研究的開展,MicroRNA(miRNA)——基因表達的調(diào)控因素參與精神分裂癥的病因的證據(jù)越來越多:
miRNA在腦的發(fā)育過程中發(fā)揮總要作用;
在死亡后的精神分裂癥的腦組織中發(fā)現(xiàn)了差異表達的miRNA;
miRNA和miRNA的靶基因富集在風(fēng)險基因區(qū)域
而精神分裂癥相關(guān)的GWAS信號大多被認識是來自于影響了基因表達的區(qū)域。此文在三個層面上研究了miRNA在精神分裂癥可能發(fā)揮的作用:
評估精神分裂癥的風(fēng)險基因是否更可能被miRNA調(diào)控;
通過基因集富集分析找到能調(diào)控精神分裂癥風(fēng)險基因的保守的miRNA;
基因表達分析來系統(tǒng)的描繪GWAS和CNV研究界定的區(qū)域中的miRNA的特性;
1
Level 1
1. 從PGC2下載了精神分裂癥的GWAS的summary statistics數(shù)據(jù)【這個數(shù)據(jù)也可以在GWAS Catloge下載,詳情見】
2. 根據(jù)編碼蛋白質(zhì)的基因的位置,得到每個基因與精神分裂癥相關(guān)的匯總的p value
3. 使用TargetScan預(yù)測miRNA的靶基因;
4. 統(tǒng)計每個基因上miRNA的binding sites的數(shù)目
5. 建立線性回歸模型,將基因與精神分裂癥的相關(guān)程度作為因變量,基因的miRNA的binding sites作為因變量,同時將基因的長度和基因的3‘UTR的長度作為協(xié)變量,評估 miRNA 基因調(diào)控和精分的風(fēng)險基因之間的相關(guān)性。
6. 為了驗證該模型的specificity, 本文還將如上方法分析了克羅恩病,女性初潮年齡和身高的GWAS的數(shù)據(jù)。
2
Level 2
根據(jù)千人基因組的European的計算LD,分成不同的interval,然后根據(jù)顯著性水平,將interval分成三種(threshold):
1 × 10-5;
top 1%;
top 5%;
首先根據(jù)來源,分成:
保守的miRNA;
位于精分GWAS loci的miRNA ;
位于精分相關(guān)的CNV的miRNA;
然后利用TargetScan6.2分別預(yù)測他們的靶基因,得到了三類基因集;
對于每一類miRNA的靶基因集與精神分相關(guān)的三種基因集分別進行INRICH分析,得到三個p value,將這三個p value 匯總為一個combine score,對每一類的miRNA的基因集中進行排序,得到排序最高的miRNA, 即為調(diào)控精分風(fēng)險基因的miRNA。
3
Level 3
對level2中找到的排名靠前的miRNA,研究其在腦中的表達情況,使用BrainSpan的數(shù)據(jù),可以看到miRNA在腦的發(fā)育過程中的表達的變化情況,不同時間和不同腦區(qū)。同時還進行了這些miRNA的靶基因的聚類分析。
1. 具有更多的miRNA binding sites的基因具有更strong的精神分裂癥的相關(guān)性,但是在其他的性狀的分析中也有類似的趨勢;
2. 給出了富集分析中保守的miRNA的top 10羅列如下
且將他們的靶基因譜用circos圖繪制出來:
局部視圖如下↓
3. 重點miRNA的時空表達
MiRNA的研究是最近幾年的研究熱點,此文為研究miRNA在復(fù)雜性狀的研究中提供了一個比較好的范式,同樣的,你可以將這套流程搬遷到你需要探討的疾病上,看是否可以找到一些比較重要的miRNA.
批判的眼光
1. 本文所用的risk gene是使用了位于GWAS信號中的基因,而很多研究指出risk gene不一定是GWAS信號附近的基因,所以在界定risk gene時仍需要斟酌,可以參考SMR所提供的精分的基因,或者自己使用SMR界定target 基因,同時QTL調(diào)控的基因也是不錯的選擇;
2. MiRNA在本文中所起的作用,是調(diào)控risk gene, 而我們知道m(xù)iRNA的發(fā)揮作用seed region是非常重要的區(qū)域,而作者似乎并沒有做到這么精細,這也是需要改進的地方;
3. 關(guān)于靶基因的預(yù)測問題,預(yù)測的靶基因之間證據(jù)程度是有不同的,作者這里是一概而論,雖然后面做validation的時候引入了其他的證據(jù),不過可能把靶向程度也考慮進來應(yīng)該是更全面的。