來(lái)源:生物世界 2022-10-17 10:48
基于DNA序列編碼基因表達(dá)模式的假設(shè),該研究提出了深度學(xué)習(xí)模型Nvwa(女?huà)z),首次實(shí)現(xiàn)了完全基于基因組序列預(yù)測(cè)單細(xì)胞水平的基因表達(dá),且預(yù)測(cè)準(zhǔn)確度與實(shí)驗(yàn)測(cè)量精度相當(dāng)。
浙江大學(xué)基礎(chǔ)醫(yī)學(xué)院/浙江省良渚實(shí)驗(yàn)室郭國(guó)驥/韓曉平團(tuán)隊(duì)在 Nature Genetics 期刊發(fā)表了題為:Deep learning of cross-species single cell landscapes identifies conserved regulatory programs underlying cell types 的研究論文。
該研究利用自主構(gòu)建的高通量單細(xì)胞測(cè)序平臺(tái)Microwell-seq繪制了斑馬魚(yú)、果蠅和蚯蚓的全身單細(xì)胞轉(zhuǎn)錄組圖譜,并探究了八種代表性后生動(dòng)物細(xì)胞類(lèi)型的跨物種可比性,揭示了脊椎動(dòng)物細(xì)胞類(lèi)型保守的調(diào)控程序。
此外,該研究提出了深度學(xué)習(xí)模型——Nvwa(女?huà)z),首次實(shí)現(xiàn)了完全基于基因組序列預(yù)測(cè)單細(xì)胞分辨率下的基因表達(dá)。該研究基于Nvwa模型學(xué)習(xí)衍生的譜系特異性基序,表征了跨物種細(xì)胞類(lèi)型特異性的調(diào)節(jié)程序。
預(yù)測(cè)基因表達(dá)和解析基因調(diào)控機(jī)制一直是基因組學(xué)的重要目標(biāo)。盡管研究人員已經(jīng)努力使用細(xì)胞系或組織中的各種實(shí)驗(yàn)特征來(lái)預(yù)測(cè)調(diào)節(jié)信號(hào)和基因表達(dá),但在單細(xì)胞分辨率下進(jìn)行生物體規(guī)模的表達(dá)預(yù)測(cè)仍然具有挑戰(zhàn)性。如今單細(xì)胞圖譜能夠以統(tǒng)一的標(biāo)準(zhǔn)呈現(xiàn)物種細(xì)胞的表型,因而人類(lèi)有機(jī)會(huì)使用跨物種的單細(xì)胞數(shù)據(jù)來(lái)探索進(jìn)化過(guò)程中不同細(xì)胞類(lèi)型的表達(dá)和調(diào)控程序。
研究團(tuán)隊(duì)假設(shè)可以直接從基因組序列預(yù)測(cè)生物體規(guī)模的單細(xì)胞基因表達(dá),并試圖在具有巨大細(xì)胞類(lèi)型多樣性的后生動(dòng)物中檢驗(yàn)這一假設(shè)。
該研究中,研究人員首先使用其團(tuán)隊(duì)自主研發(fā)的高通量單細(xì)胞測(cè)序平臺(tái)Microwell-seq繪制了斑馬魚(yú)、果蠅和蚯蚓的全身單細(xì)胞轉(zhuǎn)錄組圖。其中,斑馬魚(yú)圖譜收集了635,228個(gè)單細(xì)胞數(shù)據(jù),果蠅圖譜涵蓋了276,706個(gè)單細(xì)胞數(shù)據(jù),蚯蚓圖譜包含了95,020個(gè)單細(xì)胞數(shù)據(jù)。該研究利用這三種模式動(dòng)物的單細(xì)胞圖譜,并結(jié)合其他五種代表性動(dòng)物的單細(xì)胞圖譜(人類(lèi)、小鼠、海鞘、線蟲(chóng)和渦蟲(chóng)),挖掘了跨物種細(xì)胞譜系特異性的轉(zhuǎn)錄因子,探究了八種代表性后生動(dòng)物細(xì)胞類(lèi)型的跨物種可比性,揭示了脊椎動(dòng)物細(xì)胞類(lèi)型,特別是免疫細(xì)胞、基質(zhì)細(xì)胞、神經(jīng)元、上皮細(xì)胞、內(nèi)皮細(xì)胞和生殖細(xì)胞的保守調(diào)節(jié)程序。
基于DNA序列編碼基因表達(dá)模式的假設(shè),該研究提出了深度學(xué)習(xí)模型Nvwa(女?huà)z),首次實(shí)現(xiàn)了完全基于基因組序列預(yù)測(cè)單細(xì)胞水平的基因表達(dá),且預(yù)測(cè)準(zhǔn)確度與實(shí)驗(yàn)測(cè)量精度相當(dāng)。
值得注意的是,Nvwa模型可以高度準(zhǔn)確地預(yù)測(cè)幾乎所有測(cè)試物種的基因表達(dá)。此外,通過(guò)檢查模型第一層的卷積的基序特征Filter,團(tuán)隊(duì)揭示了細(xì)胞類(lèi)型特異的基序。這些基序與在特異細(xì)胞類(lèi)型中作用機(jī)制明確的轉(zhuǎn)錄因子基序相一致?;谀vwa模型Filter的跨物種比較,該研究還發(fā)現(xiàn)同源Filter傾向于保持跨物種的細(xì)胞類(lèi)型特異性。該工作首次建立了物種層面基因組編碼細(xì)胞圖譜的整合模型,并為解碼多物種基因調(diào)控程序提供了寶貴資源。
浙江大學(xué)基礎(chǔ)醫(yī)學(xué)院2019級(jí)直博生李佳琦、良渚實(shí)驗(yàn)室特聘研究員王晶晶、浙江大學(xué)基礎(chǔ)醫(yī)學(xué)院博士后張?chǎng)汉屯羧视楸疚墓餐谝蛔髡?,浙江大學(xué)基礎(chǔ)醫(yī)學(xué)院郭國(guó)驥教授、韓曉平教授和良渚實(shí)驗(yàn)室王晶晶研究員為共同通訊作者。研究獲得了國(guó)家重點(diǎn)研發(fā)計(jì)劃和國(guó)家自然科學(xué)基金的支持。
聯(lián)系客服