來源:生物世界 2022-09-17 13:21
在上述研究的基礎(chǔ)上,搭建了“奧秘可思”(OMICS)數(shù)據(jù)查詢平臺(tái)(http://omics.njmu.edu.cn:8012/search),該平臺(tái)可查詢本研究中健康個(gè)體的基因組變異。
肺癌是中國人群發(fā)病率和死亡率最高的惡性腫瘤。近十年來,基于高通量芯片和基因型填補(bǔ)策略的大樣本全基因組關(guān)聯(lián)研究(GWAS)已被廣泛用于解析復(fù)雜疾病的易感機(jī)制。
前期,南京醫(yī)科大學(xué)沈洪兵院士和胡志斌教授團(tuán)隊(duì)在中國人群中開展了多項(xiàng)非小細(xì)胞肺癌(NSCLC)GWAS,鑒定了20余個(gè)NSCLC發(fā)病相關(guān)的遺傳變異,部分揭示了肺癌發(fā)病的遺傳機(jī)制,上述研究成果發(fā)表于 Nature Genetics(2011,2012)和 The Lancet Respiratory Medicine(2019)雜志。
然而,傳統(tǒng)基于芯片填補(bǔ)的GWAS策略仍然存在一定的局限性:一方面,芯片只覆蓋部分基因組變異,其對(duì)于基因組其他變異基因型的推斷依賴于填補(bǔ)技術(shù),因此準(zhǔn)確性依賴人群匹配且更全面準(zhǔn)確的單倍型參考數(shù)據(jù)庫,而現(xiàn)有參考庫主要以歐美人群為主,大規(guī)模、高質(zhì)量的中國人群參考庫亟需進(jìn)一步豐富;另一方面,芯片填補(bǔ)策略僅適用于研究常見和低頻變異(Minor allele frequency,MAF ≥ 0.5%),對(duì)罕見致病變異(Minor allele frequency,MAF < 0.5%)的解析能力不足。
將全基因組測(cè)序(Whole-genome sequencing,WGS)技術(shù)應(yīng)用于中國人群肺癌致病變異的鑒定不僅可以為研究者提供中國人群特異的單倍型參考庫,提高常見和低頻變異填補(bǔ)準(zhǔn)確性和覆蓋度,增加發(fā)現(xiàn)新易感變異的可能性;還可以提供罕見變異頻率信息,為系統(tǒng)發(fā)現(xiàn)肺癌罕見致病變異,揭示肺癌發(fā)病新的生物學(xué)機(jī)制奠定基礎(chǔ)。
2022年9月15日,南京醫(yī)科大學(xué)沈洪兵、胡志斌團(tuán)隊(duì)在 Cancer Cell 期刊發(fā)表了題為:Analyses of rare predisposing variants of lung cancer in 6004 whole genomes in Chinese 的研究論文。
該研究首次將大規(guī)模全基因組測(cè)序應(yīng)用于非小細(xì)胞肺癌的全基因組關(guān)聯(lián)研究,構(gòu)建了高質(zhì)量的中國人群單倍型參考庫,新發(fā)現(xiàn)多個(gè)非小細(xì)胞肺癌相關(guān)的常見和低頻易感變異;同時(shí)系統(tǒng)解析了非小細(xì)胞肺癌編碼區(qū)和調(diào)控區(qū)罕見致病變異,首次發(fā)現(xiàn)BRCA2啟動(dòng)子區(qū)變異可增加8.84倍的肺癌發(fā)病風(fēng)險(xiǎn),該效應(yīng)在男性和女性間沒有差異,并在前瞻性隊(duì)列中評(píng)價(jià)了BRCA2啟動(dòng)子區(qū)變異對(duì)肺癌發(fā)病風(fēng)險(xiǎn)的預(yù)測(cè)效能。
研究團(tuán)隊(duì)還基于上述基礎(chǔ)和發(fā)現(xiàn)搭建了“奧秘可思”(OMICS)數(shù)據(jù)查詢平臺(tái)(http://omics.njmu.edu.cn:8012/search),以便于其他研究者查詢。
研究團(tuán)隊(duì)對(duì)2984例NSCLC病例和3020例健康對(duì)照的外周血樣本進(jìn)行了(胚系)深度全基因組測(cè)序(~30×),開展了國際上迄今為止最大規(guī)模的以WGS為基礎(chǔ)的肺癌基因組學(xué)關(guān)聯(lián)研究。該研究系統(tǒng)鑒定了9162412個(gè)常見或低頻遺傳變異和91403178個(gè)罕見遺傳變異,其中68.59%的罕見變異未被國際gnomAD數(shù)據(jù)庫收錄,為中國人群所特有。
以此為基礎(chǔ),作者首先構(gòu)建了高質(zhì)量的中國人群常見和低頻變異的單倍型參考庫,并基于該數(shù)據(jù)庫對(duì)11256例NSCLC病例和11793例對(duì)照的芯片數(shù)據(jù)進(jìn)行基因型填補(bǔ),將可研究的常見和低頻變異拓展至824萬。隨后通過整合分析,識(shí)別了20個(gè)影響肺癌發(fā)病風(fēng)險(xiǎn)的常見和低頻易感區(qū)域,其中5個(gè)易感區(qū)域(6p21.31、20q11.23、6p24.3、6p22.2和22q11.22)為首次發(fā)現(xiàn)。通過肺組織表達(dá)數(shù)量性狀位點(diǎn)數(shù)據(jù)和共定位分析,準(zhǔn)確定位了這5個(gè)區(qū)域的易感基因(SRC、DSP、RGL2、BTN3A2和CCDC116)。
接下來,作者開發(fā)了肺組織表達(dá)轉(zhuǎn)錄本特異的注釋方法,對(duì)發(fā)現(xiàn)的罕見變異進(jìn)行功能評(píng)價(jià),并以基因和調(diào)控區(qū)域?yàn)閱挝?,研究罕見變異與NSCLC發(fā)病風(fēng)險(xiǎn)的關(guān)聯(lián)。研究發(fā)現(xiàn)攜帶BRCA2基因罕見編碼區(qū)功能缺失(Loss-of-function,LoF)變異的個(gè)體,NSCLC發(fā)病風(fēng)險(xiǎn)增加2.66倍。除了BRCA2,另有10個(gè)經(jīng)典癌癥易感基因(即RAD50、ATM、FANCA、ERCC6、RAD51D、FANCM、WRN、CHEK2、NBN和MRE11A)上的LoF變異也顯著增加NSCLC的發(fā)病風(fēng)險(xiǎn)。在這些基因中,共有5.29%的肺癌患者攜帶183個(gè)罕見致病變異,其中98.91%為首次發(fā)現(xiàn)。
除編碼區(qū)域的LoF變異外,作者通過整合組蛋白修飾、三維基因組等多維數(shù)據(jù)構(gòu)建了非編碼區(qū)變異的注釋評(píng)分體系,定義一系列潛在的非編碼區(qū)功能性變異,并首次全面系統(tǒng)的開展了非編碼區(qū)域罕見變異與NSCLC的關(guān)聯(lián)研究。研究新發(fā)現(xiàn)BRCA2啟動(dòng)子區(qū)的罕見功能性變異可增加8.84倍的NSCLC發(fā)病風(fēng)險(xiǎn)。為了評(píng)價(jià)該區(qū)域變異對(duì)肺癌發(fā)病風(fēng)險(xiǎn)的預(yù)測(cè)效能,作者進(jìn)一步在江蘇自然人群前瞻性隊(duì)列中(包括23826個(gè)體)進(jìn)行了研究,發(fā)現(xiàn)BRCA2啟動(dòng)子區(qū)的罕見功能性變異可增加3.89倍的肺癌發(fā)病風(fēng)險(xiǎn),該效應(yīng)與BRCA2的LoF變異效應(yīng)類似。
在上述研究的基礎(chǔ)上,搭建了“奧秘可思”(OMICS)數(shù)據(jù)查詢平臺(tái)(http://omics.njmu.edu.cn:8012/search),該平臺(tái)可查詢本研究中健康個(gè)體的基因組變異。
綜上所述,該研究成功將全基因組測(cè)序應(yīng)用于肺癌基因組學(xué)研究,系統(tǒng)發(fā)現(xiàn)了肺癌的常見/低頻易感變異和罕見致病變異,也為全面揭示肺癌的遺傳模式提供了新思路,為肺癌的遺傳檢測(cè)提供了大量候選變異。這些發(fā)現(xiàn)有助于完善肺癌高危人群的識(shí)別策略,也為肺癌的精準(zhǔn)預(yù)防提供新的理論依據(jù)。此外,肺癌罕見強(qiáng)效致病變異的發(fā)現(xiàn)為將來在胚胎早期基因檢測(cè)和干預(yù)提供了候選位點(diǎn),提高了重大疾病源頭防控能力。研究構(gòu)建的查詢平臺(tái)也為中國乃至東亞地區(qū)的醫(yī)學(xué)和遺傳學(xué)研究提供了關(guān)鍵基礎(chǔ)數(shù)據(jù)。
南京醫(yī)科大學(xué)生物醫(yī)學(xué)工程與信息學(xué)院王鋮副教授、公共衛(wèi)生學(xué)院戴俊程教授、秦娜博士后、范靜依博士、馬紅霞教授及陳聰聰博士為該文章的共同第一作者,南京醫(yī)科大學(xué)沈洪兵院士和胡志斌教授為通訊作者。
聯(lián)系客服