本周又有一期新的Science期刊(2022年4月1日)發(fā)布,它有哪些精彩研究呢?讓小編一一道來。
1.Science:首次發(fā)布完整的人類基因組序列
doi:10.1126/science.abj6987
之前為全世界所稱頌的人類基因組測序工作并不完整,因為當(dāng)時的DNA測序技術(shù)無法讀取人類基因組中的某些部分。即使在更新之后,它仍然缺少大約8%的人類基因組。在一項新的研究中,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員描述了有史以來第一次完整的人類基因組---一套構(gòu)建和維持人類的指令---的測序。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標(biāo)題為“The complete sequence of a human genome”。
人類T2T-CHM13全基因組組裝概述,圖片來自Science, 2022, doi:10.1126/science.abj6987。
論文共同通訊作者、華盛頓大學(xué)研究員Evan Eichler說,“一些使我們成為獨(dú)特的人類的基因?qū)嶋H上是在基因組的暗物質(zhì)中,它們被完全遺漏了?;?0多年時間,但我們終于完成了?!盓ichler參與了當(dāng)前的研究工作和最初的人類基因組計劃(Human Genome Project)。
科學(xué)家們指出人類基因組的全貌將使得對人類的進(jìn)化和生物學(xué)特性有更多的了解,同時也為衰老、神經(jīng)退行性疾病、癌癥和心臟病等領(lǐng)域的醫(yī)學(xué)發(fā)現(xiàn)打開大門。
2.Science:人類著絲粒的完整基因組和表觀遺傳圖譜
doi:10.1126/science.abl4178
為了在細(xì)胞分裂過程中忠實地將遺傳物質(zhì)分配給子細(xì)胞,紡錘絲必須通過一種稱為“動粒(kinetochore)”的結(jié)構(gòu)與DNA結(jié)合,動粒在每條染色體的著絲粒(centromere)上組裝。人類著絲粒位于一大串稱為α衛(wèi)星重復(fù)序列(alpha satellite, αSat)的串聯(lián)重復(fù)DNA序列內(nèi),這些序列通常橫跨每條染色體上的數(shù)百萬個堿基對。一大串αSat序列經(jīng)常被其他類型的功能不甚明了的串聯(lián)衛(wèi)星重復(fù)序列所包圍,同時還有包括可發(fā)生轉(zhuǎn)錄的基因在內(nèi)的非重復(fù)序列。以前的基因組測序工作由于其規(guī)模和重復(fù)性,無法產(chǎn)生富含衛(wèi)星重復(fù)序列的區(qū)域的完整組裝,從而限制了研究它們的分布、變異和功能的能力。
在過去的20年里,人類參考基因組中幾乎完全沒有著絲粒周緣區(qū)域和著絲粒(pericentromeric and centromeric, peri/centromeric)衛(wèi)星DNA序列。在一項新的研究中,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員使用完整的、端粒到端粒(T2T)的人類基因組組裝,開發(fā)并部署了定制的計算方法,以揭示這些衛(wèi)星重復(fù)序列在大的和小的長度尺度上的分化和進(jìn)化模式。他們還進(jìn)行了一些實驗,以精確繪制哪些αSat重復(fù)序列與動粒蛋白相互作用。最后,他們比較了多個個體之間的peri/centromeric區(qū)域,以了解這些序列在不同的遺傳背景下是如何變化的。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標(biāo)題為“Complete genomic and epigenetic maps of human centromeres”。
無間隙組裝闡明著絲粒進(jìn)化。圖片來自Science, 2022, doi:10.1126/science.abl4178。
衛(wèi)星重復(fù)序列占T2T-CHM13基因組的6.2%,其中αSat是最大的一個組成部分(占該基因組的2.8%)。通過對每個著絲粒的αSat的序列關(guān)系的詳細(xì)研究,這些作者發(fā)現(xiàn)全基因組的證據(jù)表明人類著絲粒是通過“分層擴(kuò)張(layered expansions)”進(jìn)化的。具體來說,不同的重復(fù)序列變異出現(xiàn)在每個著絲粒區(qū)域內(nèi),并通過類似于連續(xù)串聯(lián)重復(fù)(tandem duplication)的機(jī)制進(jìn)行擴(kuò)張,而較老的側(cè)翼序列則隨著時間的推移而縮小和分化。
這些作者還發(fā)現(xiàn),每串αSat內(nèi)最近擴(kuò)張的重復(fù)序列更有可能與內(nèi)部的動粒蛋白---著絲粒蛋白A(CENP-A)---相互作用,這與CpG甲基化降低的區(qū)域相吻合。這表明局部衛(wèi)星重復(fù)序列擴(kuò)張、動粒定位和DNA低甲基化之間有密切的關(guān)系。此外,他們發(fā)現(xiàn)了影響多種衛(wèi)星重復(fù)序列類型的大型和意外的結(jié)構(gòu)重排,包括活躍的著絲粒αSat。
3.Science:完整人類參考基因組改進(jìn)了對人類遺傳變異的分析
doi:10.1126/science.abl3533
人類參考基因組的核心應(yīng)用之一是作為幾乎所有人類基因組研究的比較基線。不幸的是,人類參考基因組的許多困難區(qū)域幾十年來一直沒有得到解決,并且受到塌陷區(qū)、序列缺失和其他問題的影響。相對于目前的人類參考基因組GRCh38,人類T2T-CHM13(Telomer-to-Telomere CHM13)基因組填補(bǔ)了所有剩余的空白,將這種基因組序列增加了近200 Mbp(Mbp),校正了數(shù)以千計的結(jié)構(gòu)錯誤,并為科學(xué)探索釋放了人類基因組中最復(fù)雜的區(qū)域。
在一項新的研究中,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員展示了T2T-CHM13參考基因組是如何在全球不同的隊列中普遍改善讀取序列映射和變異識別的。這個隊列包括來自擴(kuò)大的1000基因組計劃(1KGP)的經(jīng)過短讀測序的所有3202個樣本,以及17個經(jīng)過長讀測序的全球不同樣本。通過應(yīng)用最先進(jìn)的方法來調(diào)用單核苷酸變異(SNV)和結(jié)構(gòu)變異(SV),他們記錄了T2T-CHM13相對于之前的人類參考基因組序列的優(yōu)勢和局限性,并強(qiáng)調(diào)它有望在基因組的技術(shù)挑戰(zhàn)區(qū)域內(nèi)揭示新的生物學(xué)見解。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標(biāo)題為“A complete reference genome improves analysis of human genetic variation”。
T2T-CHM13的基因組特征和可用資源。圖片來自Science, 2022, doi:10.1126/science.abl3533。
在1KGP樣本中,與GRCh38相比,這些作者在全基因組范圍內(nèi)利用T2T-CHM13發(fā)現(xiàn)了超過100萬個額外的高質(zhì)量變異。在以前未解決的基因組區(qū)域,他們在每個樣本中發(fā)現(xiàn)了幾十萬個變異---這是進(jìn)化和生物醫(yī)學(xué)發(fā)現(xiàn)的好機(jī)會。T2T-CHM13提高了602個三人組之間的孟德爾一致率,并消除了每個樣本數(shù)以萬計的假性SNV,包括將269個具有挑戰(zhàn)性的醫(yī)學(xué)相關(guān)基因的假陽性率降低了12倍。這些校正在很大程度上是由于在GRCh38中由錯誤塌陷區(qū)域或重復(fù)區(qū)域引起的長達(dá)9 Mbp以上的不準(zhǔn)確序列中對70個蛋白編碼基因的改進(jìn)。通過使用T2T-CHM13參考基因組還可以在全基因組范圍內(nèi)更好地了解結(jié)構(gòu)變異,大大改善了序列插入和缺失之間的平衡。最后,通過為T2T-CHM13提供大量的資源(包括1KGP基因型、可訪問性掩碼和突出的注釋數(shù)據(jù)庫),他們的研究工作將促進(jìn)從目前的人類參考基因組向T2T-CHM13過渡。
4.Science:揭示完整人類基因組中重復(fù)序列的轉(zhuǎn)錄和表觀遺傳狀態(tài)
doi:10.1126/science.abk3112
在一項新的研究中,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員實施了一個全面的重復(fù)序列注釋工作流程,使用以前已知的人類重復(fù)序列和從頭重復(fù)序列建模,然后進(jìn)行人工整理,包括利用基因注釋評估重疊,分段復(fù)制,串聯(lián)重復(fù)序列和經(jīng)過注釋的重復(fù)序列。通過使用這種方法,他們開發(fā)出一個更新的人類重復(fù)序列目錄,并完善了以前的重復(fù)序列注釋。他們在T2T-CHM13中發(fā)現(xiàn)了43個以前未知的重復(fù)序列和重復(fù)序列變異(repeat variant),并表征了19個復(fù)雜的經(jīng)常攜帶基因的復(fù)合重復(fù)序列結(jié)構(gòu)。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標(biāo)題為“From telomere to telomere: The transcriptional and epigenetic state of human repeat elements”。
CHM13的端粒到端粒組裝支持重復(fù)序列注釋和發(fā)現(xiàn)。圖片來自Science, 2022, doi:10.1126/science.abk3112。
通過使用精確的PRO-seq(precision nuclear run-on sequencing)技術(shù)和牛津納米孔技術(shù)公司長讀測序數(shù)據(jù)產(chǎn)生的CpG甲基化位點(diǎn),這些作者在全基因組范圍內(nèi)評估了逆轉(zhuǎn)錄因子中的RNA聚合酶結(jié)合,揭示了新生轉(zhuǎn)錄、序列分歧、CpG密度和甲基化之間的相關(guān)性。他們將這些分析擴(kuò)展到評估所有重復(fù)序列的RNA聚合酶占有率,包括位于所有人類染色體的以前無法進(jìn)入的著絲粒中的高密度衛(wèi)星重復(fù)序列。
此外,在早期發(fā)育階段和完整的細(xì)胞周期時間序列中,這些作者使用依賴圖譜和不依賴圖譜的方法,發(fā)現(xiàn)整個衛(wèi)星重復(fù)序列中的RNA聚合酶占有率很低;相反,轉(zhuǎn)座因子轉(zhuǎn)錄很豐富,并作為CpG甲基化和著絲粒亞結(jié)構(gòu)變化的一個界限。這些數(shù)據(jù)共同揭示了轉(zhuǎn)錄活躍的逆轉(zhuǎn)錄因子和DNA甲基化之間的動態(tài)關(guān)系,以及新的重復(fù)序列家族和復(fù)合重復(fù)序列的衍生和進(jìn)化的潛在機(jī)制。
通過關(guān)注新興的HG002 X染色體的端粒到端粒組裝,這些作者揭示了人類群體可能存在高水平的重復(fù)序列變異,包括影響基因拷貝數(shù)的復(fù)合重復(fù)序列拷貝數(shù)。此外,他們強(qiáng)調(diào)了重復(fù)序列對基因組結(jié)構(gòu)多樣性的影響,揭示了人類和靈長類動物之間拷貝數(shù)差異極大的重復(fù)序列擴(kuò)張,同時也對逆轉(zhuǎn)錄因子轉(zhuǎn)導(dǎo)事件進(jìn)行了高置信度的注釋。
5.Science:揭示完整人類基因組中的片段重復(fù)及其變異
doi:10.1126/science.abj6965
較大的、高同一性的重復(fù)序列---被稱為片段重復(fù)(segmental duplication, SD)---通常是基因組中最后被測序和組裝的區(qū)域。雖然人類參考基因組為構(gòu)建SD景觀提供了路線圖,但是這種基因組中剩余的50%以上的空白對應(yīng)于復(fù)雜的SD區(qū)域。SD是進(jìn)化基因創(chuàng)新的主要來源,對類人猿物種內(nèi)部和之間的遺傳變異起著不成比例的作用。有了完整的人類基因組:T2T-CHM13,科學(xué)家們就有可能識別基因并發(fā)現(xiàn)人類的遺傳變異模式。
在一項新的研究中,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員在T2T-CHM13中發(fā)現(xiàn)了51 Mbp(million base pair,百萬個堿基對)的額外人類SD,如今估計人類基因組的7%由SD組成,即在總共31億個堿基對的人類基因組中,SD共有218 Mbp。SD占近端著絲的短臂的三分之二(68.1Mbp中的45.1Mbp),這些SD是人類基因組中最大的(見圖中的A部分)。此外,54%的近端著絲SD的拷貝數(shù)是可變的,或者在被研究的六個人中映射到不同的染色體上。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標(biāo)題為“Segmental duplications and their variation in a complete human genome”。
更完整的片段重復(fù)改善了基因分型。圖片來自Science, 2022, doi:10.1126/science.abj6965。
對目前參考基因組(GRCh38)和T2T-CHM13的SD含量進(jìn)行詳細(xì)比較,發(fā)現(xiàn)有81Mbp的以前未解決的或結(jié)構(gòu)可變的SD。來自一個由268個人組成的多樣性小組的短讀全基因組序列數(shù)據(jù)顯示,人類拷貝數(shù)與T2T-CHM13相匹配的可能性為與GRCh38匹配的9倍(前者為59.26 Mbp,后者為6.55Mbp),包括119個蛋白編碼基因(見圖中的B部分)。
利用來自25個人類單倍型的長讀測序數(shù)據(jù),這些作者調(diào)查了人類遺傳變異的模式,發(fā)現(xiàn)結(jié)構(gòu)和單核苷酸多樣性的顯著增加。他們確定了基因豐富的區(qū)域(比如TBC1D3),這些區(qū)域在個體之間的差異達(dá)數(shù)十萬個堿基對和基因拷貝數(shù),顯示了一些最高的全基因組結(jié)構(gòu)雜合度(85%至90%)。
6.Science:分析完整人類基因組中的表觀遺傳模式
doi:10.1126/science.abj5089
人類參考基因組已成為許多大規(guī)模計劃的基礎(chǔ),包括對表觀基因組(epigenome)進(jìn)行編目的集體努力,其中表觀基因組是控制基因活動和細(xì)胞功能的一組標(biāo)記和蛋白相互作用。然而,二十多年來,構(gòu)建完整表觀基因組的努力一直受到不完整人類參考基因組的阻礙。
隨著近期技術(shù)的進(jìn)步,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員如今可以通過一個完整的人類基因組端粒到端粒組裝:T2T-CHM13,全面研究人類基因組的結(jié)構(gòu)和功能。因此,人們?nèi)缃窨梢酝貙捜祟惐碛^基因組,包括2.25億個堿基對的額外序列。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標(biāo)題為“Epigenetic patterns in a complete human genome”。
描述整個人類基因組的表觀遺傳特征。圖片來自Science, 2022, doi:10.1126/science.abj5089。
表觀基因組是指DNA修飾(如CpG甲基化)、蛋白-DNA相互作用、組蛋白修飾和染色質(zhì)結(jié)構(gòu),它們共同影響基因表達(dá)、基因組調(diào)節(jié)和基因組穩(wěn)定性。這些表觀遺傳特征在細(xì)胞分裂時是可遺傳的,但在發(fā)育過程中是動態(tài)的,產(chǎn)生了不同組織和細(xì)胞類型所特有的模式。在這項新的研究中,這些作者提出了對人類基因組的表觀遺傳學(xué)注釋,比如他們探索了以前未解決的區(qū)域,包括近端著絲的染色體短臂、片段重復(fù)的基因(segmentally duplicated genes)以及包括人類著絲粒在內(nèi)的各種重復(fù)序列類別。對以前缺失的8%的人類基因組產(chǎn)生完整的表觀遺傳學(xué)注釋,為闡明這些基因組元件的功能作用提供了基礎(chǔ),這對人們理解基因組的調(diào)節(jié)、功能和進(jìn)化至關(guān)重要。
7.Science:青銅時代和鐵器時代的人口流動是新疆人口歷史的基礎(chǔ)
doi:10.1126/science.abk1534
中國的新疆地區(qū)與山脈接壤,是一個重要的歷史區(qū)域。在一項新的研究中,我們科學(xué)家對古代基因組進(jìn)行了取樣,研究了該地區(qū)從青銅時代(距今約5000年至3000年)到鐵器時代(距今約3000年至2000年),再到進(jìn)入歷史時代(距今約2000年)的人口變化。這一分析表明,較年長的個體代表了來自草原文化的祖先,后來東亞和中亞的祖先在青銅時代末期和鐵器時代初期進(jìn)入該地區(qū)。在歷史時期,混合繼續(xù)進(jìn)行,但保留了核心的草原成分,使人口形成了一個遺傳連續(xù)體。在一個中心人群中保留這種遺傳連續(xù)性是令人驚訝的,因為它代表了在孤立人群中更典型的觀察模式。此外,這些遺傳聯(lián)系確定了一個以前未知的譜系,有可能解釋印歐語系的傳播。
8.Science:一個關(guān)鍵基因是實驗性食物網(wǎng)持續(xù)存在的基礎(chǔ)
doi:10.1126/science.abf2232
在過去的幾十年里,關(guān)鍵物種的識別,即那些在構(gòu)建一個群落或生態(tài)系統(tǒng)中具有重要作用的物種,在不同的系統(tǒng)中都有增加。Barbour等人將這一概念擴(kuò)展到了基因上,表明一個特定植物防御基因的單個等位基因促進(jìn)了整個小型實驗營養(yǎng)系統(tǒng)的物種共存。具體來說,具有這個等位基因的植物生長得更快,支持兩種食草動物及其捕食者的更大種群。這一發(fā)現(xiàn)表明,基因型變異可以在有機(jī)體系統(tǒng)的結(jié)構(gòu)和功能中發(fā)揮作用。
9.Science:探究哺乳動物的腦化率
doi:10.1126/science.abl5584
在脊椎動物中,哺乳動物的大腦與身體大小的比例最大(腦化)。人們一直認(rèn)為,這種關(guān)系在哺乳動物進(jìn)化的早期就出現(xiàn)了,擴(kuò)大的大腦引領(lǐng)著它們進(jìn)入新的和多樣化的形式。然而,Bertrand等人研究了從古新世開始的所有哺乳動物的腦化率,發(fā)現(xiàn)身體尺寸首先增加,以便在恐龍滅絕后進(jìn)行生態(tài)位填充。只是到了后來,即始新世,大腦大小才開始增加,這可能是由于在日益復(fù)雜的環(huán)境中需要有更大的認(rèn)知能力。這導(dǎo)致了今天的高度腦化的大腦,包括人類的大腦。
10.Science:一個脊髓小膠質(zhì)細(xì)胞群體參與緩解性和復(fù)發(fā)性神經(jīng)疼痛
doi:10.1126/science.abf6805
對神經(jīng)系統(tǒng)的損害從病理上改變了軀體感覺系統(tǒng),這可能導(dǎo)致神經(jīng)性疼痛的發(fā)生。雖然疼痛產(chǎn)生已經(jīng)得到了很好的研究,但協(xié)調(diào)疼痛恢復(fù)的機(jī)制仍然不清楚。Kohno等人在神經(jīng)損傷的小鼠中發(fā)現(xiàn)了一個CD11c+脊髓小膠質(zhì)細(xì)胞群體在疼痛產(chǎn)生后出現(xiàn),對神經(jīng)病理性疼痛的恢復(fù)至關(guān)重要。這些細(xì)胞促進(jìn)疼痛恢復(fù)的能力依賴于它們高水平的胰島素樣生長因子-1(IGF1)的表達(dá)。即使在疼痛恢復(fù)后,CD11c+小膠質(zhì)細(xì)胞仍然存在,如果它們遭受耗竭,疼痛的超敏性就會恢復(fù)。這些發(fā)現(xiàn)闡明了緩解性和復(fù)發(fā)性神經(jīng)疼痛的機(jī)制,并可能有助于治療策略的開發(fā)。
11.Science:在實驗人群中,選擇性社會學(xué)習(xí)保留了復(fù)雜的認(rèn)知算法
doi:10.1126/science.abn0915
我們世代積累復(fù)雜算法的能力使人類能夠適應(yīng)不同的環(huán)境,并解決超出我們個人限制的挑戰(zhàn)。然而,創(chuàng)新算法的文化積累是難以解釋的。Thompson等人研究了大量的參與者,以探索不同學(xué)習(xí)條件下的算法演化。涉及不同策略或不同模型的成功水平知識的選擇性社會學(xué)習(xí)比隨機(jī)社會學(xué)習(xí)或一次嘗試的非社會學(xué)習(xí)更能保存難以發(fā)明的高效算法。有兩種有效的算法被很多人使用,但最有效的算法只在選擇性的社會學(xué)習(xí)下傳播。(生物谷 Bioon.com)