基因倍增(gene duplication)在基因組進(jìn)化(特別是以動(dòng)植物為代表的真核生物)中扮演了重要角色。在多種多樣的基因倍增方式中,全基因組倍增(whole genome duplication)是重要的一種。去年五月,我們向大家介紹了來(lái)自亞利桑那大學(xué)Michael Barker團(tuán)隊(duì)報(bào)道的昆蟲進(jìn)化中的基因組倍增(或說(shuō)古多倍體化paleopolyploidy)現(xiàn)象【1】。興奮之余,我們也注意到文中所采用的方法存在一些不同的聲音(詳見推送:PNAS最新研究揭示多倍體在昆蟲進(jìn)化中的普遍性——兼談多倍體現(xiàn)象與基因組倍增)。
今年年初,這些來(lái)自坊間的不同聲音終于登上了“大雅之堂”:來(lái)自愛爾蘭都柏林大學(xué)(University of Dublin)的中谷與一郎(Yoichiro Nakatani)和Aoife McLysaght在PNAS上對(duì)這篇文章以letter形式發(fā)表了另一種解讀:亞利桑那大學(xué)團(tuán)隊(duì)所發(fā)現(xiàn)的昆蟲進(jìn)化過(guò)程中的基因組倍增現(xiàn)象或許是假陽(yáng)性【2】。如作者所言,傳統(tǒng)上來(lái)說(shuō)動(dòng)物界的多倍體是很罕見的,這引發(fā)了他們的懷疑。為了探究亞利桑那大學(xué)團(tuán)隊(duì)原文結(jié)果的可靠性,中谷與一郎和導(dǎo)師Aoife McLysaght進(jìn)行了一系列分析。
BTW:為什么多倍體化現(xiàn)象和多倍體個(gè)體在植物中比較常見呢?最簡(jiǎn)單的理由是多倍體化會(huì)在減數(shù)分裂過(guò)程中直接破壞有性生殖生物(包括絕大多數(shù)動(dòng)物)的傳宗接代,而植物可以通過(guò)無(wú)性生殖等方式渡過(guò)難關(guān)并最終獲得多倍體帶來(lái)的進(jìn)化上的好處。
判斷全基因組倍增的兩個(gè)方法
為方便大家理解,我們先簡(jiǎn)要回顧一下推斷全基因組倍增比較通行的兩個(gè)方法。傳統(tǒng)上來(lái)說(shuō),要通過(guò)基因共線性(gene synteny)。該法基于一個(gè)最基本的假設(shè),就是全基因組倍增過(guò)后旁系同源基(paralog)因應(yīng)該按照倍增前的順序在染色體上一字排開(下圖)。隨著時(shí)間的推移,有些基因會(huì)丟失,沒有丟失的基因也可能會(huì)經(jīng)歷基因組重排(genome rearrangement)導(dǎo)致它們?cè)谌旧w上出現(xiàn)的順序發(fā)生改變,但如果這些過(guò)程不是那么劇烈(比如這些事件發(fā)生的年代不是特別久遠(yuǎn)的話),我們應(yīng)該可以在現(xiàn)存生物的基因組里面找到它們的蹤跡——遺留下來(lái)的共線性區(qū)域(synteny block)。實(shí)際上,第一個(gè)基因組倍增的證據(jù)正是通過(guò)這種方法于1997年在經(jīng)典模式生物面包酵母(Saccharomyces cerevisiae)中被發(fā)現(xiàn)的【3】。值得一提的是,發(fā)現(xiàn)者ken wolfe正是本文的主角Aoife McLysaght的博士導(dǎo)師。
圖1酵母的基因組倍增和后期的基因丟失
顯然,這種基于基因組共線性的方法是比較嚴(yán)密的,但它對(duì)于缺乏高質(zhì)量的基因組組裝的生物則一籌莫展了。于是,一種新的方法應(yīng)運(yùn)而生。該法擺脫基因組的束縛,完全基于基因序列的比較:通過(guò)比較旁系同源基因之間的差異以獲得基因的相對(duì)年齡(用同義密碼子位點(diǎn)替換速率,也就是ks表示,理由是ks一般認(rèn)為基本不受選擇,在同一物種內(nèi)與演化時(shí)間成正比)。如果如圖2所示可以發(fā)現(xiàn)有很多基因有相仿的年齡(所謂ks峰),那么一個(gè)可能的推斷便是這些基因都來(lái)自一次全基因組倍增。此外,近年來(lái)還有通過(guò)基因樹拓?fù)浣Y(jié)構(gòu)比較的方法,該法同基因年齡法一樣不依賴于基因共線性,但計(jì)算上更為復(fù)雜(也應(yīng)該更加嚴(yán)謹(jǐn),小編不是很了解希望熱心網(wǎng)友可以補(bǔ)充)。不論如何,不依賴旁系同源基因共線性的方法由于可以充分挖掘轉(zhuǎn)錄組數(shù)據(jù),且可以繞過(guò)基因組序列缺乏的難題,似乎越來(lái)越受到學(xué)姐的青睞。有趣的是,該方法也為亞利桑那大學(xué)Michael Barker老師多次使用,尤其是15年對(duì)裸子植物中基因組倍增的揭示【4】。
圖2 (來(lái)自【1】)
共線性的喪失?
言歸正傳之前還是不忘提醒大家小編也不是領(lǐng)域?qū)<?,以下敘述錯(cuò)漏難免,請(qǐng)大家多多批評(píng)。
實(shí)際上亞利桑那大學(xué)團(tuán)隊(duì)主要就是通過(guò)上述的第二類方法對(duì)于昆蟲進(jìn)化中的基因組倍增做出的推測(cè)。然而,盡管這種方法近年來(lái)大行其道,但卻在這里遭遇了阻擊。小編以為,雙方爭(zhēng)論的焦點(diǎn)就在于,缺乏基因組共線性情況下的基因組倍增推斷是否足夠嚴(yán)謹(jǐn)。
讓我們來(lái)看看都柏林大學(xué)團(tuán)隊(duì)是怎樣做的。他們針對(duì)亞利桑那大學(xué)團(tuán)隊(duì)提出的鱗翅目(Lepidoptera)基因組倍增做了基因共線性分析(之所以選取鱗翅目是因?yàn)轺[翅目中有染色體水平的基因組組裝)。他們的假設(shè)是,如果包括家蠶Bombyx mori在內(nèi)的鱗翅目昆蟲的確發(fā)生有全基因組倍增的話,理應(yīng)在家蠶的基因組上找到大段的共線性區(qū)域。實(shí)際上,亞利桑那大學(xué)團(tuán)隊(duì)在原文中對(duì)這一點(diǎn)利用家蠶基因組進(jìn)行了分析,不過(guò)都柏林大學(xué)的研究者對(duì)此提出了反駁:
圖3不同類群昆蟲進(jìn)化關(guān)系圖,請(qǐng)注意鱗翅目、甲蟲和蜜蜂的位置
他們認(rèn)為亞利桑那大學(xué)作者所找到的共線性區(qū)段并不可靠,理由如下圖所示:一是這些倍增的共線性區(qū)段看上去是“隨機(jī)地”分布在基因組上的,二是有的區(qū)域(如chr5和chr10)對(duì)應(yīng)了超過(guò)一個(gè)倍增區(qū)域——表明它們不是一次基因組倍增的結(jié)果。
圖4
都柏林大學(xué)團(tuán)隊(duì)進(jìn)一步指出,這些在染色體上呈共線性區(qū)段的旁系同源基因很多都并非是鱗翅目昆蟲或者家蠶特有的(圖4B),也就是說(shuō)它們至少不是鱗翅目或家蠶基因組倍增的結(jié)果。而反過(guò)來(lái),不論是鱗翅目特有還是蠶特有的旁系同源基因,在家蠶基因組中都缺乏(肉眼可見的)明顯基因組共線性區(qū)域,相反這些旁系同源基因的分布都是很分散的,并沒有聚成很好的共線性區(qū)段(圖5)。
圖5
但不要忘記,還有一種可能性,就是會(huì)不會(huì)是由于在蠶的進(jìn)化歷史中出現(xiàn)了某些基因組大幅重排導(dǎo)致基因序列變化,致使基因共線性難覓蹤影呢?為探求這一假設(shè),中谷與一郎和導(dǎo)師比較了蠶和非鱗翅目生物蜜蜂(圖6左)以及甲蟲(圖6右)基因組之間的共線性(縱軸方向?yàn)樾Q,橫軸代表蜜蜂和甲蟲)。
圖6
都柏林大學(xué)的學(xué)者們發(fā)現(xiàn),蠶基因組居然與蜜蜂和甲蟲這兩種非鱗翅目昆蟲的基因組保持有不錯(cuò)的共線性關(guān)系,并據(jù)此認(rèn)為蠶基因組內(nèi)部發(fā)生了大面積染色體重排的可能性微乎其微——因?yàn)槿绻娴挠邪l(fā)生大面積重排的話,那么家蠶基因組不可能與非鱗翅目昆蟲還保留有較好的共線性關(guān)系。
對(duì)于都柏林大學(xué)團(tuán)隊(duì)的這篇文章,原文作者、也就是亞利桑那大學(xué)團(tuán)隊(duì)也做了針鋒相對(duì)的回應(yīng)【5】。亞利桑那大學(xué)團(tuán)隊(duì)首先表示,他們所報(bào)道的現(xiàn)象應(yīng)該被理解為大規(guī)?;蚪M倍增(large-scale gene duplication)比較合理,而不是都柏林大學(xué)團(tuán)隊(duì)所解釋的簡(jiǎn)單的“全基因組倍增(whole genome duplication;WGD)”。請(qǐng)注意,這里一字之差其實(shí)還是有很大的差別的,畢竟全代表的是所有基因都要翻倍,而大規(guī)模這個(gè)詞,就有一定的靈活的空間了。不過(guò)小編這里要說(shuō),如果通讀亞利桑那大學(xué)團(tuán)隊(duì)去年的文章的話不難發(fā)現(xiàn),盡管在題目里寫得很嚴(yán)謹(jǐn)Multiple large-scale gene and genome duplications during the evolution of hexapods,但是,全文統(tǒng)共出現(xiàn)有92次WGD,比如摘要部分已經(jīng)6次使用WGD??傊【巶€(gè)人認(rèn)為,正文應(yīng)該是存在誤導(dǎo)的。
接下來(lái),亞利桑那大學(xué)團(tuán)隊(duì)對(duì)于來(lái)自都柏林的同行們提出的“共線性的喪失”這一問(wèn)題進(jìn)行了解釋。他們表示,都柏林大學(xué)團(tuán)隊(duì)對(duì)于共線性的檢測(cè)雖然仔細(xì)但都是基于裸眼觀察,而很顯然,裸眼檢測(cè)并非一項(xiàng)十分精確的操作。此外,原文中報(bào)道了昆蟲進(jìn)化過(guò)程中的多次大規(guī)?;虮对觯悦恳环N現(xiàn)存生物的基因組都可能是多次基因組倍增疊加的結(jié)果,這也就導(dǎo)致了不同的基因可能有不同的拷貝數(shù)(copy number;或說(shuō)不同旁系同源基因的數(shù)目)。而這一切,都使得裸眼觀測(cè)共線性具有挑戰(zhàn)性。所以,即使真的看不到共線性,并不能排除是因?yàn)榧夹g(shù)局限和其他諸多的可能性。此外,亞利桑那大學(xué)團(tuán)隊(duì)還對(duì)都柏林大學(xué)團(tuán)隊(duì)提出的其他一些技術(shù)疑問(wèn)進(jìn)行了闡釋,在此為節(jié)省篇幅不再贅述。
遙相呼應(yīng)
與這兩篇PNAS文章的一唱一和相呼應(yīng)的是來(lái)自近年來(lái)迅速躥紅的植物學(xué)期刊molecular plant的兩篇文章。該雜志去年年初刊登了來(lái)自復(fù)旦大學(xué)戚繼老師和馬紅老師的文章,通過(guò)ks比較和基因樹拓?fù)浣Y(jié)構(gòu)分析等方法全面而細(xì)致地梳理了被子植物中的全基因組倍增事件【6】。
圖7
今年年初,來(lái)自比利時(shí)根特大學(xué)(University of Ghent)的Yves van de peer等人在該雜志上以Correspondence的形式撰文發(fā)表了自己的一些不同見解【7】。最重要的一點(diǎn)在于,來(lái)自根特大學(xué)的學(xué)者們聲稱,原文作者可能高估了被子植物演化過(guò)程中發(fā)生過(guò)的全基因組倍增的次數(shù)。為闡明這一點(diǎn),文中舉了一個(gè)例子:對(duì)于第一個(gè)完成基因組測(cè)序的蕨類植物Selaginella moellendorffii(卷柏),如果只看ks分布的話,那么其KDE(kernal density estimate)會(huì)呈現(xiàn)大概下圖中黑色曲線的樣子。
圖8
會(huì)發(fā)現(xiàn)一個(gè)峰。那么,會(huì)據(jù)此認(rèn)為然卷柏中存在全基因組倍增嗎?答案是否定的,因?yàn)榫戆氐幕蚪M中完全不存在前面提到的旁系同源基因共線性區(qū)域。問(wèn)題來(lái)了,既然如此,為什么我們會(huì)在卷柏中觀測(cè)到上圖中黑色曲線所描繪的ks的峰呢?答案正是單獨(dú)的基因倍增,或者按照作者所言,small scale duplication(SSD)。這些小規(guī)模的基因加倍不同與全基因組倍增,可以說(shuō)在進(jìn)化中,它是時(shí)時(shí)刻刻都在發(fā)生的,而一般來(lái)說(shuō),所以發(fā)生時(shí)期較為晚近的小規(guī)模倍增基因容易被保留下來(lái)(就好比清朝的文物和史料要比唐宋時(shí)期豐富),便形成了如上圖展示的情形,在ks很?。ㄒ簿褪请x現(xiàn)今時(shí)間很近的時(shí)候)的位置會(huì)出現(xiàn)一個(gè)峰。而當(dāng)作者通過(guò)數(shù)學(xué)模型去除這些小規(guī)?;虮对鰩?lái)的干擾之后,就會(huì)看到上圖綠色的曲線——并沒有明顯的ks峰(圖8)。根特大學(xué)的研究人員認(rèn)為,這一點(diǎn)似乎并未在復(fù)旦大學(xué)團(tuán)隊(duì)的原文中得到很好的處理。這一點(diǎn),以及其他的根特大學(xué)團(tuán)隊(duì)提到的一些問(wèn)題,都在同期發(fā)表的來(lái)自復(fù)旦大學(xué)團(tuán)隊(duì)的回應(yīng)中有很好的解釋,感興趣的讀者歡迎直接閱讀原文【8】。
BTW:話音未落,根特大學(xué)團(tuán)隊(duì)反手又是一篇手稿發(fā)到bioRxiv上,詳細(xì)闡述了他們的觀點(diǎn)(該文已于日前正式在雜志上發(fā)表【9】)。
最后小編想說(shuō),這幾篇文章存在不同觀點(diǎn)的交鋒,但大家都是有理有據(jù)地交流自己的看法。特別是對(duì)于提出反對(duì)的聲音,原文的作者都對(duì)對(duì)方的批評(píng)表達(dá)了感謝。亞利桑那大學(xué)團(tuán)隊(duì)在文尾表示,Overall, we are excited to see deeper exploration of these ancient duplications with the growing number of high-quality insect genomes to complement our phylogenomic analyses.相信這些理性的討論會(huì)激發(fā)學(xué)界更多、更深的思考,這大概也是科學(xué)應(yīng)有的發(fā)展方式吧。
引文
1. Li Z, Tiley GP, Galuska SR, et al. Multiple large-scale gene and genome duplications during the evolution of hexapods. Proc Natl Acad Sci U S A. 2018;115(18):4713-4718
2. Nakatani Y, McLysaght A. Macrosynteny analysis shows the absence of ancient whole-genome duplication in lepidopteran insects. Proc Natl Acad Sci U S A. 2019;116(6):1816-1818
3. Wolfe KH, Shields DC. Molecular evidence for an ancient duplication of the entire yeast genome. Nature. 1997;387: 708–713.
4. Li, Zheng et al. “Early genome duplications in conifers and other seed plants.” Science advances vol. 1,10 e1501084. 20 Nov. 2015, doi:10.1126/sciadv.1501084
5. Li Z, Tiley GP, Rundell RJ, Barker MS. Reply to Nakatani and McLysaght: Analyzing deep duplication events. Proc Natl Acad Sci U S A. 2019;116(6):1819-1820
6. Ren R, Wang H, Guo C, et al. Widespread Whole Genome Duplications Contribute to Genome Complexity and Species Diversity in Angiosperms. Mol Plant. 2018;11(3):414-428
7. Zwaenepoel A, Li Z, Lohaus R, Van de Peer Y. Finding Evidence for Whole Genome Duplications: A Reappraisal. Mol Plant. 2019;12(2):133-136
8. Wang H, Guo C, Ma H, Qi J. Reply to Zwaenepoel et al.: Meeting the Challenges of Detecting Polyploidy Events from Transcriptomic Data. Mol Plant. 2019;12(2):137-140
9. Zwaenepoel A, Van de Peer Y. Inference of Ancient Whole-Genome Duplications and the Evolution of Gene Duplication and Loss Rates. Mol Biol Evol. 2019;36(7):1384-1404
聯(lián)系客服