免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
華大醫(yī)學(xué)執(zhí)行總裁尹燁:基因大數(shù)據(jù)


全世界已經(jīng)測(cè)序完成的高等動(dòng)植物基因組大概有800個(gè),華大貢獻(xiàn)了70%。

主講嘉賓:尹燁

尹燁:華大醫(yī)學(xué)執(zhí)行總裁。尹燁,1979年生,籍貫山東煙臺(tái)。2002年畢業(yè)于大連理工大學(xué)生物工程專(zhuān)業(yè)獲學(xué)士學(xué)位, 2013年獲華南理工大學(xué)生物工程(基因組學(xué))工程碩士學(xué)位。2002年加入華大基因,先后從事體外診斷試劑研發(fā)、管理及基因組研究行業(yè),曾任華大科技總裁,華大集團(tuán)首席運(yùn)營(yíng)官(COO),現(xiàn)任華大醫(yī)學(xué)總裁,率領(lǐng)團(tuán)隊(duì)積極推動(dòng)前沿生物醫(yī)學(xué)技術(shù)和基因組學(xué)研究成果的臨床應(yīng)用,降低出生缺陷及其他重大疾病對(duì)人類(lèi)健康的危害。

以下為分享實(shí)景全文:

各位好,華大基因的尹燁。基因這個(gè)詞一直是我非常喜歡的詞,也是英文翻譯的最好的詞,gene-基因,基因基因,基本之因。

第一個(gè)話題,基因,基因組,大數(shù)據(jù)。對(duì)于目前我們已知的生物圈,碳鏈作為基本骨架的生命,我們都是通過(guò)DNA來(lái)進(jìn)行遺傳的。基因可以簡(jiǎn)單的理解成一段有意義的DNA序列,而全部的DNA就成為一個(gè)物種的基因組。

地球誕生了46億年,最早的細(xì)胞化石是30億年,我們從簡(jiǎn)單到復(fù)雜,從水生到陸生,從低等到高等,從無(wú)性到有性,從單細(xì)胞到多細(xì)胞……

我只能說(shuō)部分同意進(jìn)化論,但是關(guān)于生命的起源,的確是一個(gè)爭(zhēng)議很大的學(xué)科。

但分析現(xiàn)有的物種(包括部分滅絕的),從DNA的角度來(lái)看,的確有著極強(qiáng)的進(jìn)化或演化關(guān)系,我們稱(chēng)之為同源性。

最簡(jiǎn)單的基因組來(lái)自于病毒,比如乙型肝炎病毒的DNA總量(基因組大小)只有3.2Kb.然后到了細(xì)菌,比如大腸桿菌,基因組就有4Mb,而到了酵母,也就是真菌就有了10Mb。他們的基因組不斷的插入外源DNA,越來(lái)越大,功能也越來(lái)越多。然后高等真菌已經(jīng)有30Mb-80Mb 的基因組了,到了最簡(jiǎn)單的植物也只有100Mb左右的基因組,比如擬南芥。再向上,比如梅花200Mb,水稻400Mb,大豆1Gb,兩爬類(lèi)2Gb,哺乳類(lèi)3Gb。所以人類(lèi)的基因組也就是3Gb,即30億個(gè)堿基。

然而還有更大的,比如辣椒在3G以上,而大麥要5G-6G,大蒜10G,小麥16G,銀杏20G……肺魚(yú)50G-100G。

基因組的大小與物種進(jìn)化高低并無(wú)一致性,我們稱(chēng)為C值悖論,或者說(shuō)很多物種仍然是處于進(jìn)化狀態(tài)的。全世界(范圍內(nèi)),我們基本的預(yù)估,所有生命信息只測(cè)一次的數(shù)據(jù)量是 10的60次方,然而現(xiàn)在只有10的21次方-22次方左右。以人類(lèi)舉例,這個(gè)群體有70億數(shù)量,如果每人都測(cè)一次,則測(cè)序的數(shù)據(jù)量至少就是3Gb*70億這么大。且受到技術(shù)和方法學(xué)限制,目前每一個(gè)人至少要測(cè)100G(大約是基因組的30倍),才能得到相對(duì)準(zhǔn)確的全基因組信息,所以剛才的數(shù)量就達(dá)到了100G*70億人次這么大。

水稻,玉米,小麥……這些都要育種,每一個(gè)也都需要按照這樣的方式來(lái)做,所以這個(gè)數(shù)據(jù)量就變得無(wú)可估量了?,F(xiàn)在是從每個(gè)物種只測(cè)一次的角度來(lái)講,而對(duì)于活著的生命體,還需要測(cè)很多次,比如每個(gè)人睡覺(jué)、吃飯、思考、生病的基因表達(dá)都不一樣,這個(gè)數(shù)據(jù)量還會(huì)有數(shù)量級(jí)的增加。


存活不到“一秒”的人類(lèi)個(gè)體有多大數(shù)據(jù)?這里說(shuō)的一秒是指把生命出現(xiàn)到現(xiàn)在當(dāng)作一年時(shí)間來(lái)看。

所以你會(huì)發(fā)現(xiàn),原來(lái)我們還有基因組萬(wàn)倍的細(xì)胞,還有十萬(wàn)倍的菌群。這些如果都測(cè)出來(lái),那是不得了的數(shù)據(jù)量。


我們計(jì)算過(guò),一個(gè)人如果從出生下來(lái)就開(kāi)始取樣,生化、免疫、影像、基因,表型數(shù)據(jù),如果都開(kāi)始積累,那么一起步就是665個(gè)G,一輩子差不多就到了1個(gè)P。如果一個(gè)人1P,1000人就是1E,1M(Million)人就是1Y,1B(Billion)人就是1個(gè)Z,這就是10的24次方。這個(gè)數(shù)據(jù)還只是人類(lèi),如果把上千萬(wàn)個(gè)物種,都這樣來(lái)一下,那么可能就達(dá)到了N或者D的級(jí)別。


大家看這個(gè),如果說(shuō)20世紀(jì)是物理學(xué)世紀(jì)的話,那么21世紀(jì)毫無(wú)疑問(wèn)的就是生命的世紀(jì)。物理在有了熱力學(xué)三大定律特別是熵的概念提出后,開(kāi)始進(jìn)入快速發(fā)展階段。生命科學(xué)至今還沒(méi)有一個(gè)可以用數(shù)學(xué)語(yǔ)言可以闡述的定律。


看下這張,生命科學(xué)從1859年物種起源來(lái)看,不過(guò)就是150年的時(shí)間?;蛞彩?911年才出現(xiàn)的提法。迄今為止,全世界已經(jīng)測(cè)序完成的高等動(dòng)植物基因組大概有800個(gè),華大貢獻(xiàn)了70%。

基因數(shù)據(jù)這對(duì)于這個(gè)行業(yè)來(lái)講就是巨大的油田。

一個(gè)行業(yè)如果要興起,需要經(jīng)過(guò)科學(xué)發(fā)現(xiàn),技術(shù)發(fā)明,再到產(chǎn)業(yè)發(fā)展。比如富蘭克林發(fā)現(xiàn)了電,愛(ài)迪生發(fā)明了電燈,而GE把照明做到了全世界。制造業(yè)包括IT,一般可以直接從發(fā)明到發(fā)展,所有學(xué)科里面唯獨(dú)生命不行。這是因?yàn)?,生命科學(xué)直接作用于人體,即使你知道了青蒿素可以治療瘧疾,但一定要從機(jī)理上證明,即回歸發(fā)現(xiàn),才可以允許你做產(chǎn)業(yè)發(fā)展。而生命的科學(xué)發(fā)現(xiàn),必須依賴(lài)于大數(shù)據(jù),重視相關(guān)關(guān)系,而不是因果關(guān)系。

美國(guó)在1980年啟動(dòng)了腫瘤大戰(zhàn),希望通過(guò)蛋白等片段的信息來(lái)搞清楚腫瘤,十年后發(fā)現(xiàn)失敗。所以在1990年正式啟動(dòng)了人類(lèi)基因組,不去搞明白為什么,而是先把whole picture搞定,即解決是什么的問(wèn)題。

這就是基因組的起源和生命科學(xué)的大發(fā)展。一次核磁從幾十個(gè)G到幾百個(gè)G都有,看分辨率。

下面進(jìn)入今天最后一個(gè)問(wèn)題,生物大數(shù)據(jù)到底能做什么。先說(shuō)育種。相當(dāng)程度上,我們現(xiàn)在可以不通過(guò)種地,而直接通過(guò)運(yùn)算的方式來(lái)進(jìn)行虛擬育種。


大家可以對(duì)比一下。

按目前的算法推測(cè),如果做到相關(guān)性90%,對(duì)于玉米(基因組大小是2.5Gb),10000株玉米就可能讓天河一號(hào)全年計(jì)算能力飽和。目前最快的測(cè)序儀,每一秒的數(shù)據(jù)產(chǎn)出會(huì)達(dá)到幾十個(gè)G,除了用裸光纖,根本沒(méi)法解決傳輸問(wèn)題。如果個(gè)人基因組得到普及,以100萬(wàn)人的數(shù)據(jù)庫(kù)如果要進(jìn)行兩兩比較,那么天河二號(hào)也遠(yuǎn)遠(yuǎn)不夠。這就是生命大數(shù)據(jù)帶來(lái)的計(jì)算,存儲(chǔ),傳輸?shù)奶魬?zhàn),瓶頸在IT。再來(lái)講生命科學(xué)的應(yīng)用,比如腫瘤,大家應(yīng)該知道,腫瘤本身不是均質(zhì)的,即不是簡(jiǎn)單的區(qū)分為癌癥組織和癌旁組織,腫瘤的生長(zhǎng)過(guò)程本身就是一個(gè)動(dòng)態(tài)的進(jìn)化過(guò)程,說(shuō)的通俗點(diǎn),最早的腫瘤細(xì)胞逃脫了細(xì)胞周期,戰(zhàn)勝了普通細(xì)胞,然后搶到了離血管近的位置,開(kāi)始快速繁殖,逐漸地,遠(yuǎn)離血管的就打不過(guò)離血管近的了,所以要進(jìn)一步進(jìn)化成更“厲害”的癌細(xì)胞。所以,所以腫瘤靶向藥物,如果是直接針對(duì)的勻漿狀態(tài)的,那很可能是無(wú)效的。我們發(fā)過(guò)幾篇高水平文章都是關(guān)于單細(xì)胞測(cè)序的--即我們挑選腫瘤組織中的上百個(gè)細(xì)胞,一個(gè)一個(gè)測(cè)基因組,然后看他們基因組的進(jìn)化關(guān)系,從而正確判斷出這些癌細(xì)胞的出場(chǎng)順序,知道了正在起作用的基因。這個(gè)時(shí)候的有的放矢就變得很重要了。


在生命科學(xué)里,很多是數(shù)十個(gè)甚至數(shù)千個(gè)客觀規(guī)律在同時(shí)作用,所以因果關(guān)系本身說(shuō)不清。

比如血糖和糖尿病真的有必然關(guān)系么?在科學(xué)上,我們這個(gè)領(lǐng)域用相關(guān)關(guān)系的很多,比如GWAS,全基因組關(guān)聯(lián)分析就是最典型的例子。但是只看靜態(tài)是不對(duì)的。正如看見(jiàn)影片中一個(gè)人手里拿著刀,是無(wú)法判斷他是否殺人的。

我們不能憑借image來(lái)說(shuō)事,而要靠video.所以未來(lái)的健康領(lǐng)域,一定是綜合了基因,環(huán)境,運(yùn)動(dòng),營(yíng)養(yǎng),菌群,睡眠,心理共同作用的結(jié)果。在這個(gè)基礎(chǔ)上,會(huì)產(chǎn)生全新的行業(yè),即所謂的真正意義上的健康咨詢(xún)師,目前的遺傳咨詢(xún)也只能解決20%或者更少的問(wèn)題。比如精子,每次射精有50億個(gè)左右,但任意兩個(gè)精子的DNA都不一樣,這就是進(jìn)化或演化的根本。

最后一個(gè)例子說(shuō)說(shuō)菌群,每一個(gè)人100斤的人有4斤的細(xì)菌。


通常認(rèn)為的菌群是我截圖這張,但實(shí)際上腫瘤有上千種,但豐度譜是不同的,所以依次可以區(qū)分腸道菌群分型,我們稱(chēng)之為“腸型”。這些菌很大程度上決定了你的吸收,可以簡(jiǎn)單的理解為,它們的次生代謝產(chǎn)物才是我們吸收的營(yíng)養(yǎng)。我們?cè)?jīng)測(cè)過(guò)歐洲亞洲不同食譜的人群菌群,在健康的時(shí)候是不一致的,但比如罹患了大腸癌,則菌群的多樣性下降,到晚期趨同性更有一致的趨勢(shì)。所以現(xiàn)在通過(guò)測(cè)糞便就可以分別相當(dāng)多的疾病狀態(tài),包括大腸癌,包括糖尿病,甚至抑郁和很多精神性疾病,都和菌群釋放的內(nèi)毒素有關(guān)。


這是華大CEO王俊提出的第一定律。表型組和基因組通過(guò)某種環(huán)境條件起作用。我們希望能夠發(fā)現(xiàn)部分?jǐn)?shù)學(xué)定律來(lái)闡述。


最后一張片子,生命周期表,里面給出了從174噬菌體開(kāi)始發(fā)表的所有頂尖的物種文章。我們希望能夠找到生命周期表。

以此結(jié)束 A citation from,“Genetics and the Origin of Species” (1973) T. Dobzhansky (1900-1975) “Nothingin biology makes sense, except in the light of evolution. Without that light itbecomes a pile of sundry facts - some of them interesting or curious but makingno meaningful picture as a whole”。

互動(dòng)內(nèi)容:

施建旭:這么多計(jì)算資源和數(shù)據(jù)都找不出規(guī)律,還說(shuō)瓶頸在

尹燁:@施建旭 我們已經(jīng)發(fā)現(xiàn)了很多規(guī)律,但是更多的規(guī)律不是今天的計(jì)算資源能夠滿足的。另外說(shuō)一句,我們是民企,所有資源都是我們自己的產(chǎn)業(yè)利潤(rùn)納稅后支撐的。

花甲青年:@尹燁 新的品種可以計(jì)算出來(lái),而并非經(jīng)過(guò)年復(fù)一年的種植培育出來(lái)?有關(guān)系嗎?

尹燁:@花甲青年 虛擬育種的概念 是和蓋茨基金會(huì)合作中一起討論出來(lái)的方向?,F(xiàn)在通過(guò)對(duì)大量物種的重測(cè)序,我們可以瞬間知道很多基因的功能,然后利用矢量計(jì)算的算法可以對(duì)每一個(gè)基因每一個(gè)堿基加權(quán),來(lái)預(yù)測(cè)后代可能的狀態(tài)。當(dāng)然,這里面有一些限制,比如環(huán)境要控制的相對(duì)穩(wěn)定。

尹燁:所以 現(xiàn)在通過(guò)測(cè)糞便就可以分別相當(dāng)多的疾病狀態(tài),包括大腸癌,包括糖尿病,甚至抑郁和很多精神性疾病,都和菌群釋放的內(nèi)毒素有關(guān)。

濬:@尹燁 細(xì)菌平衡才是王道,多樣性才是穩(wěn)定性基礎(chǔ)。

尹燁:@harry 濬 肝癌、大腸癌有關(guān)系,認(rèn)可,或者說(shuō),現(xiàn)在以器官來(lái)命名癌癥out了,EGFR癌,RAS癌……@張涵誠(chéng) @harry 濬 對(duì)于生態(tài)系統(tǒng),多樣性是穩(wěn)定的基礎(chǔ);對(duì)于內(nèi)環(huán)境,要看怎么理解。比如血液,只有紅細(xì)胞、白細(xì)胞、血小板,不能太多樣,不然就毒血或者膿血或者菌血了。但是換一個(gè)角度,如果血液中只有紅細(xì)胞、白細(xì)胞、血小板的情況下,那么他們的免疫細(xì)胞是兵強(qiáng)馬壯的,這也可以理解為穩(wěn)定。

楊力偉:@尹燁 多樣性是穩(wěn)定性的基礎(chǔ),在生物中適用,在社會(huì)中也適用。

尹燁:@楊力偉, 修行、冥想、打坐、樂(lè)觀積極的心理狀態(tài)能夠影響生理指標(biāo),這些心理狀態(tài)都會(huì)直接影響基因表達(dá),有物質(zhì)基礎(chǔ)。

:請(qǐng)問(wèn):進(jìn)化論在多大程度上是正確的?

尹燁:@Bright Star 我部分認(rèn)可進(jìn)化論,包括拉馬克的用盡廢退在特定條件下也是有道理的,但對(duì)于目前的生命起源學(xué)說(shuō)比較不認(rèn)可。

郝鵬洲:@尹燁尹總有幾個(gè)問(wèn)題,1.去年11月我去過(guò)美國(guó)國(guó)立研究院,專(zhuān)門(mén)做大數(shù)據(jù)關(guān)于基因的話題,目前國(guó)際千人基因計(jì)劃進(jìn)展如何。2.拜訪了幾位專(zhuān)家,未來(lái)人類(lèi)基因測(cè)序?qū)⒑统檠粯?,目前成本是否仍然很高?/p>

尹燁:@郝鵬洲 前幾期基本做完了,結(jié)果符合預(yù)期,現(xiàn)在各個(gè)國(guó)家都在爭(zhēng)做1M基因組。測(cè)序會(huì)便宜到和高端體檢差不多,但是解讀很難。

張涵誠(chéng):是否只有上帝掌握大數(shù)據(jù),我們?nèi)祟?lèi)可以認(rèn)識(shí)自己?jiǎn)幔?/p>

尹燁:已知圈子越大,未知圈子更大,人類(lèi)不可能徹底研究明白人類(lèi)或者任何物種。

張涵誠(chéng):是否基因這個(gè)提法本身就有問(wèn)題?或者有其他的表達(dá)我們身體的方式?

尹燁:基因只是其中的一個(gè)最有代表性的指標(biāo),包括蛋白,小分子,細(xì)胞、組織,系統(tǒng)都是生命的“通貨”;

張涵誠(chéng):物種對(duì)于環(huán)境的的改變是不是微不足道?

尹燁:實(shí)際上是非常大,特別是人本主義的破壞。

張涵誠(chéng):生命的描述維度有多少?目前華大有什么新的思路?

尹燁:至少有長(zhǎng),寬,高,數(shù)量,時(shí)間、溫度、速度,我們?cè)谂Φ姆较蚴侨珪r(shí)全景的生命全信息;

張涵誠(chéng):華大提供什么普惠的項(xiàng)目?

尹燁:宮頸癌篩查,耳聾基因篩查,地中海貧血檢測(cè)等都是我們現(xiàn)在做的公共衛(wèi)生項(xiàng)目。

花甲青年:@尹燁 有了育種大數(shù)據(jù)和超級(jí)計(jì)算,以后人類(lèi)吃飯不用愁了,這是大數(shù)據(jù)的人類(lèi)的第一大貢獻(xiàn)!謝謝你的報(bào)告!

尹燁:@花甲青年 謝謝鼓勵(lì),我們叫做基因組指導(dǎo)下的定向聚合育種,我們做的雜交谷子去年最高的試驗(yàn)田畝產(chǎn)達(dá)到了950 kg。

金耀星:請(qǐng)問(wèn):人一生的記憶,大約是多大數(shù)據(jù)量,可以測(cè)嗎?

尹燁:這個(gè)很難講,如果神經(jīng)元的結(jié)合方式我們能解決的話,我相信會(huì)有很大的突破?,F(xiàn)在來(lái)看差不多就是G級(jí)別的。

曾經(jīng)的小盧:@尹燁 剛才你說(shuō)的計(jì)算能力不是問(wèn)題,存儲(chǔ)是更大挑戰(zhàn),請(qǐng)問(wèn)如何用DNA做如此大量數(shù)據(jù)的存儲(chǔ)呢?

尹燁:@曾經(jīng)的小盧 合成生物學(xué),用0101的底層編碼引導(dǎo)合成。只要你0101能存,我ATCG就能存。舉一個(gè)最簡(jiǎn)單的例子,大腸桿菌,4M的基因組,可能在十幾分鐘就合成完畢了。如果我可以用1P的大腸桿菌定向做存儲(chǔ),不就很快解決了一個(gè)Y的存儲(chǔ)了么?A——腺嘌呤 T——胸腺嘧啶 C——胞嘧啶G——鳥(niǎo)嘌呤,堿基,就是化學(xué)物質(zhì)。比如A,就是HCN 氰化氫的五聚體,也是所謂的海洋起源的重要標(biāo)志之一。

楊力偉:基因的因果關(guān)系你怎么判定呢?

尹燁:@楊力偉 現(xiàn)在的通用做法就是轉(zhuǎn)基因?qū)嶒?yàn),比如敲除這個(gè)基因,看功能變化。

曾經(jīng)的小盧:可以認(rèn)為這是一種4進(jìn)制計(jì)算嗎?

尹燁:@曾經(jīng)的小盧 它不存在“進(jìn)”的概念,還有先后順序,還有更多的奇怪規(guī)矩,比如AAAA這樣不能連續(xù)太多次。

曾經(jīng)的小盧:這還是四進(jìn)制了啊,你的計(jì)算單元已經(jīng)是4種了啊

尹燁:本質(zhì)上還是二進(jìn)制,00,01,10,11。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
關(guān)于基因的常識(shí)——觀《圓桌派第五季》之基因和生命篇(1)
我的基因我知道:基因檢測(cè)服務(wù)走向大眾
尹燁:人世間最寶貴的東西,是對(duì)生命意義的覺(jué)知
演講實(shí)錄 | 尹燁:你,就是大數(shù)據(jù)
楊爽:生物科技的進(jìn)展帶給我們對(duì)未來(lái)無(wú)限的想象
《覺(jué)者》尹燁,第二輯
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服