題目:Pan-cancer characterization of long non-coding RNA and DNA methylation mediated transcriptional dysregulation
泛癌的lncRNA和DNA甲基化介導的轉(zhuǎn)錄失調(diào)研究
摘要
背景:DNA甲基化擾亂(DNAm)是癌癥的關(guān)鍵特征之一,然而癌癥中DNA甲基化調(diào)控的機制還不是十分清楚。
流程圖
結(jié)果
1. 數(shù)據(jù)的獲取和整理
從TCGA下載RNA-seq數(shù)據(jù)和DNAm數(shù)據(jù),分析癌癥包括BLCA,BRCA,CESC, CHOL,COAD,ESCA,HNSC,KIRC,KIRP,LIHC,LUAD,LUSC,PAAD,PRAD,READ,THCA和UCEC。
2. 全面分析癌癥的多組學數(shù)據(jù)
首先,作者從TCGA數(shù)據(jù)庫下載18種癌癥的RNA-seq數(shù)據(jù),DNA甲基化數(shù)據(jù)和拷貝數(shù)數(shù)據(jù)并分析。乳腺癌的相關(guān)性熱圖分析顯示,頂部的數(shù)據(jù)與激素受體狀態(tài)相關(guān)性較強。作者將乳腺癌樣本分為兩組,分別為ER+(雌激素受體陽性)和ER-(雌激素受體陰性)。同時,作者對每種癌癥的lncRNA進行分析,共鑒定到14325個lncRNA,每種癌癥的lncRNA數(shù)量在10438到14013之間,lncRNA和編碼蛋白基因表達水平分析研究發(fā)現(xiàn)lncRNA的表達量較低。
3. 18種癌癥的DNA甲基化介導的lncRNA調(diào)控情況
整合分析不同癌癥的Exp-DNAm-CNV和lncRNA-基因調(diào)控(圖1a)。作者首先鑒定每種癌癥的差異表達基因和差異甲基化基因,隨后作者鑒定基因水平以來甲基化水平的轉(zhuǎn)錄調(diào)控回路。使用多元回歸模型鑒定癌癥中高甲基化啟動子和低表達基因以及低甲基化啟動子和過表達基因(圖1b)。此外,作者得到與啟動子甲基化和編碼蛋白基因表達有關(guān)的lncRNA調(diào)控因子(圖1c)。使用這種方法,作者鑒定18種癌癥中l(wèi)ncRNA介導的甲基化失調(diào)(圖1d)。分析lncRNA調(diào)控因子的特征(圖1e)。
圖1 泛癌lncRNA介導DNA甲基化擾動分析流程圖
4. 甲基化介導的lncRNA調(diào)控網(wǎng)絡(luò)的性質(zhì)
作者首先分析了癌癥中MeLncTRN的拓撲特征(圖2a),lncRNA調(diào)控網(wǎng)絡(luò)具有無尺度的特征。結(jié)果表明,大部分節(jié)點間沒有相互作用,僅有少部分節(jié)點具有相互作用(圖2b)。此外,作者發(fā)現(xiàn)degree高的lncRNA與啟動子甲基化和靶基因表達相關(guān)性更強(圖2c和2d)。這些結(jié)果表明,lncRNA靶基因越多則調(diào)控作用越強。
圖2 全面分析癌癥中l(wèi)ncRNA-基因的相互作用
5. 保守的lncRNA調(diào)控因子在癌癥中具有重要作用
作者首先計算存在lncRNA調(diào)控的癌癥數(shù)量,大部分lncRNA調(diào)控發(fā)生在特定癌癥類型中,僅有一小部分在泛癌中發(fā)生(圖3a)。對于lncRNA調(diào)控因子僅有17%發(fā)生在一種癌癥中,有89.8%lncRNA-基因互作發(fā)生在特定癌癥類型中。組織特異性的lncRNA調(diào)控因子和靶點主要存在在腎癌中(圖3b)。作者進一步根據(jù)lncRNA調(diào)控因子發(fā)生癌癥中的數(shù)量分為三類:癌癥特異性(僅發(fā)生在一種癌癥中),中度(發(fā)生在2-14種癌癥類型中)和泛癌(發(fā)生在15種癌癥中)。lncRNA調(diào)控因子的作用程度分析發(fā)現(xiàn),泛癌的調(diào)控因子的表達水平較高(圖3c)。隨后,作者根據(jù)lncRNA調(diào)控因子在正常組織中的表達水平計算組織特異性指數(shù),作者發(fā)現(xiàn)泛癌的調(diào)控因子組織特異性較低(圖3d)。GTEx的數(shù)據(jù)結(jié)果與之一致(圖3e)。此外,作者發(fā)現(xiàn)泛癌的lncRNA調(diào)控因子在啟動子區(qū)的序列保守性較高(圖3f)。
圖3 lncRNA調(diào)控因子分類和癌癥中的調(diào)控特征分析
6. 相似組織的癌癥的lncRNA介導的甲基化失調(diào)類似
大量研究表明,相似組織的癌癥的基因,miRNA和lncRNA表達水平類似。作者根據(jù)lncRNA,基因和lncRNA-基因情況,計算癌癥之間的Jaccard指數(shù)以確定癌癥之間的相似性(圖4a-4c)。作者發(fā)現(xiàn)相似組織的癌癥可能具有相同的lncRNA調(diào)控因子。這一結(jié)果表明,來源相似的組織的癌癥可能具有相似的調(diào)控機制。對相同組織的癌癥中的lncRNA調(diào)控因子的靶基因進行GO分析(圖4d)。
圖4 全面比較泛癌lncRNA調(diào)控網(wǎng)絡(luò)
7. 異常表達的lncRNA調(diào)控因子具有生物醫(yī)學意義
作者在泛癌的表達水平分析lncRNA調(diào)控因子的異常調(diào)控模式。作者發(fā)現(xiàn)大量lncRNA調(diào)控因子在癌癥中的表達模式不同(圖5a)。lncRNA調(diào)控因子的分布發(fā)現(xiàn),有2160個lncRNA調(diào)控因子在一種癌癥中差異表達,7043個lncRNA調(diào)控因子在少于5種癌癥中差異表達,僅有219個lncRNA調(diào)控因子在多于10種癌癥中差異表達(圖5b)。作者在多于12種癌癥中鑒定到共有的差異表達lncRNA141個,這141個lncRNA在泛癌中的調(diào)控因子顯著富集(圖5d)。此外,作者發(fā)現(xiàn)lncRNA調(diào)控因子在特定癌癥中起到關(guān)鍵作用。ENSG00000227036 (LINC00673/LINC00511)在14種癌癥中上調(diào)表達,生存分析表明ENSG00000227036 (LINC00673/LINC00511)的表達與KIRC預后不良有關(guān)(圖5e)。ENSG00000203499 (FAM83H-AS1)可以調(diào)控多種癌癥的表達且在18種癌癥中差異表達,ENSG00000203499 (FAM83H-AS1)上調(diào)與PAAD預后不良有關(guān)(圖5f)。
圖5 lncRNA調(diào)控因子的表達分析
8. 不同癌癥的保守網(wǎng)絡(luò)核心的功能不同
接下來,作者研究網(wǎng)絡(luò)中的核心以確定他們是否在癌癥中發(fā)揮重要作用。作者選擇網(wǎng)絡(luò)中排名前10的lncRNA和基因,共有2823個lncRNA和920個蛋白編碼基因(圖6a和6b)。隨后,作者研究核心lncRNA和非核心lncRNA的表達模式。在大部分癌癥中,核心lncRNA的表達水平較高(圖6c)。其中,ADAMTS9-AS2是10種癌癥的核心lncRNA,在不同癌癥中調(diào)控的靶基因不同,NKAPL為共有靶基因(圖6d)。功能分析表明ADAMTS9-AS2在癌癥中具有不同功能(圖6e和6f)。
圖6 甲基化介導lncRNA調(diào)控網(wǎng)絡(luò)的核心分析
9. 臨床相關(guān)的lncRNA網(wǎng)絡(luò)模塊可以作為預后標志物
作者整合生存信息篩選預后相關(guān)的lncRNA調(diào)控因子。作者將每類癌癥數(shù)據(jù)隨機分為訓練集和驗證集,使用cox回歸分析鑒定網(wǎng)絡(luò)中生存相關(guān)的lncRNA/基因。作者鑒定到5.32%的lncRNA/基因與生存相關(guān)(圖7a)。不同lncRNA調(diào)控因子的臨床相關(guān)性差異分析表明甲基化相關(guān)的lncRNA調(diào)控網(wǎng)絡(luò)對預后十分重要(圖7b)。隨后作者計算每個網(wǎng)絡(luò)的風險打分,共有2061個模塊可以根據(jù)生存期將癌癥樣本分開(圖7c)。其中涉及l(fā)ncRNA CRNDE(圖7d)的模塊與患者生存有關(guān)(圖7e和f)。
圖7 lncRNA調(diào)控網(wǎng)絡(luò)的臨床分析
10. 可用于研究甲基化相關(guān)的lncRNA調(diào)控擾動的數(shù)據(jù)庫
為便于用戶研究癌癥中甲基化介導的lncRNA調(diào)控模式和相關(guān)的靶基因轉(zhuǎn)錄失調(diào),作者搭建了在線數(shù)據(jù)庫MeLncTRN(http://compgenelab.info/MeLncTRN/)。該數(shù)據(jù)庫可以查詢lncRNA或靶基因在癌癥中的相互作用并提供下載功能。
結(jié)論
作者根據(jù)18種癌癥的RNA-seq數(shù)據(jù)和DNA甲基化數(shù)據(jù)構(gòu)建甲基化介導的lncRNA調(diào)控網(wǎng)絡(luò)并搭建了相關(guān)數(shù)據(jù)庫。本文的局限性在于預測的lncRNA調(diào)控因子需要進一步的實驗和計算研究。