翹首以盼8個(gè)月的 AlphaFold2 的論文與源碼發(fā)布后一周,今天 DeepMind 再度公布關(guān)于 AlphaFold2 的重磅信息:用 AlphaFold2 完全預(yù)測(cè)了人、大腸桿菌、果蠅、斑馬魚等21種生物的全蛋白質(zhì)組內(nèi)35萬(wàn)個(gè)蛋白質(zhì)結(jié)構(gòu)!這項(xiàng)工作發(fā)表在了本周出版的Nature上。https://alphafold.ebi.ac.uk/
今天(2021.7.22),DeepMind與歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)聯(lián)合宣布:DeepMind與EMBL合作,用AlphFold2 預(yù)測(cè)了人類蛋白質(zhì)組內(nèi)的全部20000個(gè)蛋白質(zhì)結(jié)構(gòu),并將其免費(fèi)開放給學(xué)術(shù)界。歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)是歐洲生命科學(xué)研究的旗艦(flagship)實(shí)驗(yàn)室。
業(yè)內(nèi)各方對(duì)這項(xiàng)工作評(píng)價(jià)甚高。
DeepMind創(chuàng)始人兼CEO Demis Hassabis說,“一直以來,DeepMind的目標(biāo)都是將人工智能作為工具,以加速科學(xué)發(fā)現(xiàn),進(jìn)而增進(jìn)我們對(duì)周遭世界的了解。我們用AlphaFold獲得了一幅迄今最全、最準(zhǔn)的人類蛋白質(zhì)組的圖像。我們相信這是目前為止人工智能對(duì)促進(jìn)科學(xué)進(jìn)步做出的最重要的貢獻(xiàn),極好地展示了人工智能將如何造福社會(huì)?!?/span>Demis Hassabis在上周發(fā)布的推特說,more very soon!才隔一周,大新聞就來了。
AlphaFold已經(jīng)在加速科學(xué)發(fā)現(xiàn)通過氨基酸序列計(jì)算預(yù)測(cè)蛋白質(zhì)構(gòu)象——而非通過長(zhǎng)時(shí)間的艱苦、費(fèi)力而昂貴的實(shí)驗(yàn)手段來確定蛋白質(zhì)的構(gòu)象,已經(jīng)幫助科學(xué)家在數(shù)月內(nèi)實(shí)現(xiàn)了此前須耗時(shí)數(shù)年的目標(biāo)。
Protein structures representing the data obtained via AlphaFold. Source image: AlphaFold. Design credit: Karen Arnott/EMBL-EBI
EMBL主任Edith Heard說,“這個(gè)利用 AlphaFold 建立的數(shù)據(jù)庫(kù)是開放科學(xué)(open science)良性循環(huán)的完美例證。用來訓(xùn)練 AlphaFold 模型的數(shù)據(jù)來自學(xué)術(shù)界建立的公共數(shù)據(jù)庫(kù),因而 AlphaFold 的預(yù)測(cè)結(jié)果向公眾開放也是符合邏輯的。公開、自由地分享 AlphaFold 的計(jì)算結(jié)果,將有力地促進(jìn)各處的研究者從結(jié)構(gòu)中獲得新的洞見和發(fā)現(xiàn)。我相信,AlphaFold是生命科學(xué)的一次革命,如同幾十年前的基因組學(xué)。我為EMBL能協(xié)助DeepMind開源這個(gè)重要的數(shù)據(jù)資源而深感驕傲?!?/span>AlphaFold 已經(jīng)被一些合作伙伴使用,如被忽視疾病藥物倡議(Drugs for Neglected Diseases Initiative, DNDi),該倡議推動(dòng)了對(duì)那些不成比例地影響世界上較貧困地區(qū)的疾病的研究;又如,酶創(chuàng)新中心(Centre for Enzyme, CEI)正利用 AlphaFold 幫助設(shè)計(jì)催化效率更高的酶,以回收造成最嚴(yán)重污染的一次性塑料。對(duì)于那些依賴實(shí)驗(yàn)來測(cè)定蛋白質(zhì)結(jié)構(gòu)的科學(xué)家來說,AlphaFold 的預(yù)測(cè)加速了他們的研究。例如,科羅拉多大學(xué)博爾德分校的一個(gè)研究小組正在用 AlphaFold 來研究抗生素耐藥性,而加州大學(xué)舊金山分校的一個(gè)小組則使用 AlphaFold 來增進(jìn)其對(duì) SARS COV-2的認(rèn)識(shí)。https://www.wired.co.uk/article/deepmind-alphafold-protein-diseases
AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(the AlphaFold Protein Structure Database)的建立基于國(guó)際科學(xué)界的諸多貢獻(xiàn),以及 AlphaFold 的復(fù)雜算法創(chuàng)新和 EMBL-EBI 在共享世界生物數(shù)據(jù)方面的數(shù)十年經(jīng)驗(yàn)。DeepMind和EMBL的歐洲生物信息研究所(EMBL-EBI)共同提供了AlphaFold 預(yù)測(cè)結(jié)果的訪問服務(wù),以便他人可將之作為一種工具來啟動(dòng)和加速研究,并開辟全新的科學(xué)發(fā)現(xiàn)途徑。
EMBL副主任、EMBL-EBI主任Ewan Birney說,“這是自人類基因組(the Human Genome)以來最重要的數(shù)據(jù)庫(kù)。將AlphaFold的預(yù)測(cè)結(jié)果對(duì)國(guó)際科學(xué)界開放,打開了許多條嶄新的研究方向,包括以前被忽視的疾病、生物工程的新型酶等,拓展我們對(duì)世界認(rèn)知的邊界?!?/span>National Human Genome Research Institute
除了人類蛋白質(zhì)組,該數(shù)據(jù)庫(kù)囊括多達(dá) 350000 個(gè)結(jié)構(gòu),包括20種具有重要生物學(xué)研究意義的模式生物,如大腸桿菌、果蠅、小鼠、斑馬魚、瘧原蟲、肺結(jié)核菌等。對(duì)這些生物的研究催生了無數(shù)的論文和科研成果。這么多蛋白質(zhì)結(jié)構(gòu)將使得從神經(jīng)生物學(xué)到藥學(xué)的廣闊領(lǐng)域的研究者都能加速他們的科研工作。該數(shù)據(jù)庫(kù)和系統(tǒng)將定期更新,DeepMind與EMBL將繼續(xù)投資于AlphaFold的未來改進(jìn),在未來數(shù)月,我們計(jì)劃將蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的覆蓋范圍擴(kuò)大到幾乎所有已知的測(cè)序蛋白質(zhì),超過1億個(gè)結(jié)構(gòu),涵蓋UniProt參考數(shù)據(jù)庫(kù)的大部分。
Paul Nurse,2001諾貝爾生理學(xué)醫(yī)學(xué)獎(jiǎng),F(xiàn)rancis Crick研究所主任,EMBL科學(xué)顧問委員會(huì)主席“計(jì)算方法正在改變科學(xué)研究,為有益于公共利益的發(fā)現(xiàn)和應(yīng)用開辟新的可能性。了解蛋白質(zhì)的功能對(duì)于提高我們對(duì)生命的認(rèn)識(shí)至關(guān)重要,并將最終導(dǎo)致醫(yī)療保健、糧食可持續(xù)性、新技術(shù)等等方面的改進(jìn)。DeepMind 與 EMBL 共同發(fā)布了AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù),這是生物學(xué)創(chuàng)新的一個(gè)重大飛躍,展示了跨學(xué)科合作對(duì)科學(xué)進(jìn)步的影響。有了這些免費(fèi)和公開的資源,科學(xué)界將能夠利用集體知識(shí)加速發(fā)現(xiàn),開創(chuàng)人工智能生物的新紀(jì)元。”Venki Ramakrishnan,2009諾貝爾化學(xué)獎(jiǎng),英國(guó)皇家科學(xué)會(huì)前主席“蛋白質(zhì)折疊問題是生物學(xué)50年來的重大挑戰(zhàn),這項(xiàng)計(jì)算工作代表了對(duì)該問題研究的驚人進(jìn)展。這出乎許多業(yè)內(nèi)人士的預(yù)料。看到它將從根本上改變生物學(xué)研究,我們將感到振奮。”Elizabeth Blackburn,2009年諾貝爾生理學(xué)醫(yī)學(xué)獎(jiǎng),加州大學(xué)舊金山分校榮休教授“隨著這些由DeepMind首創(chuàng)的革命性蛋白質(zhì)結(jié)構(gòu)研究方法的普及,這將為科學(xué)界打開了解基因組序列的生物學(xué)意義的新窗口。”Patrick Cramer,馬克思·普朗克生物物理化學(xué)所主任“DeepMind和EMBL提供的絕佳資源將改變我們進(jìn)行結(jié)構(gòu)生物學(xué)的方式。這些預(yù)測(cè)展示了機(jī)器學(xué)習(xí)的力量,并服務(wù)于全世界的科學(xué)機(jī)構(gòu),這些機(jī)構(gòu)提供了開放數(shù)據(jù),使這一突破性成就得以實(shí)現(xiàn)。這是一個(gè)開創(chuàng)性的例證:21世紀(jì)如何開展科學(xué)研究。” Ben Perry, 被忽視疾病藥物倡議(DNDi)的領(lǐng)導(dǎo)者“我們需要為全世界數(shù)百萬(wàn)面臨被忽視疾病風(fēng)險(xiǎn)的人極大地加速新藥發(fā)現(xiàn)。人工智能可以改變游戲規(guī)則:通過快速準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),AlphaFold開辟了新的研究視野,提高了研發(fā)的范圍和效率,促進(jìn)了我們?cè)诩膊×餍械膰?guó)家的研究。看到強(qiáng)大的尖端人工智能能夠解決幾乎只集中在貧困人口中的疾病,令人鼓舞。”John McGeehan,樸茨茅斯大學(xué)酶創(chuàng)新中心主任,結(jié)構(gòu)生物學(xué)教授“我們的任務(wù)是為塑料的循環(huán)利用開發(fā)創(chuàng)新酶的解決方案。這項(xiàng)技術(shù)正在以一種無人能預(yù)料到的方式加速我們的研究。DeepMind提供的開放訪問將改變整個(gè)社區(qū),讓每個(gè)人都能做這些類型的實(shí)驗(yàn)。我們花了數(shù)月和數(shù)年的時(shí)間,AlphaFold在一個(gè)周末就能完成。我覺得我們比昨天至少提前了一年。”https://www.port.ac.uk/research/research-centres-and-groups/centre-for-enzyme-innovation
Marcelo Sousa,科羅拉多大學(xué)博爾德分校生物化學(xué)系教授“AlphaFold的預(yù)測(cè)最終解決了困擾了我們10多年的實(shí)驗(yàn)難題,加速了我們對(duì)抗生素耐藥性的研究。這些預(yù)測(cè)是如此精準(zhǔn),以至于開始時(shí)我認(rèn)為我可能做錯(cuò)了實(shí)驗(yàn)設(shè)置?!?/span> Sundar Pichai,Google & Alphabet CEO
“AlphaFold數(shù)據(jù)庫(kù)顯示了人工智能深刻加速科學(xué)進(jìn)步的潛力。DeepMind的機(jī)器學(xué)習(xí)系統(tǒng)不僅在一夜之間極大地?cái)U(kuò)展了我們對(duì)蛋白質(zhì)結(jié)構(gòu)和人類蛋白質(zhì)組所積累的知識(shí),而且它對(duì)生命組成部分的深刻見解為科學(xué)發(fā)現(xiàn)的未來帶來了非凡的希望。”Pushmeet Kohli,DeepMind,AI for Science首席科學(xué)家“我們的團(tuán)隊(duì)一直在通過AlphaFold預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu),進(jìn)而破譯和解鎖蛋白質(zhì)世界。我們正通過一個(gè)數(shù)據(jù)庫(kù)向每個(gè)人提供AlphaFold的預(yù)測(cè),最大限度地利用這些由結(jié)構(gòu)帶來的洞見來取得科學(xué)進(jìn)步。這個(gè)數(shù)據(jù)庫(kù)和 AlphaFold 有可能開辟科學(xué)研究的新途徑,最終將促進(jìn)我們對(duì)生物學(xué)和生命本身的理解。我們相信,這將對(duì)與健康和疾病、藥物設(shè)計(jì)過程和環(huán)境可持續(xù)性等問題的研究產(chǎn)生變革性影響,我們非常興奮地期待在未來數(shù)月和數(shù)年內(nèi)開發(fā)出什么樣的應(yīng)用。”John Jumper, DeepMind,AlphaFold 首席科學(xué)家“隨著數(shù)據(jù)庫(kù)的擴(kuò)展,幾乎每一類蛋白質(zhì)的結(jié)構(gòu)都將可以獲得。AlphaFold數(shù)據(jù)庫(kù)很可能變革我們處理生物信息學(xué)的方式,即DNA和蛋白質(zhì)的大規(guī)模研究,因?yàn)樗鼘⑹刮覀兡軌蛞越踉泳妊芯克幸阎锏牡鞍踪|(zhì)。我們樂觀地認(rèn)為,AlphaFold的前景和機(jī)器學(xué)習(xí)的進(jìn)步將推動(dòng)蛋白質(zhì)研究進(jìn)入一個(gè)令人興奮的新階段,在這一階段,深度學(xué)習(xí)工具能夠與實(shí)驗(yàn)方法一起定量理解生物學(xué)。”Kathryn Tunyasuvunakool,DeepMind,研究科學(xué)家“AlphaFold模型可以用來幫助實(shí)驗(yàn)確定結(jié)構(gòu)。對(duì)結(jié)構(gòu)有一個(gè)足夠準(zhǔn)確的初步預(yù)測(cè),將使研究人員能夠重新訪問和解決以前無法建立模型的舊X-ray數(shù)據(jù)集和cryo-EM maps。這是計(jì)算方法與實(shí)驗(yàn)方法相輔相成的絕佳例子?!?/span> Dame Janet Thornton,EMBL-EBI榮譽(yù)主任
“人工智能是AlphaFold預(yù)測(cè)的基礎(chǔ),而預(yù)測(cè)則基于全世界科學(xué)家在過去50年中收集的數(shù)據(jù)。開放這些模型無疑將激發(fā)蛋白質(zhì)結(jié)構(gòu)的實(shí)驗(yàn)和理論研究人員將此新知識(shí)應(yīng)用到他們自己的研究領(lǐng)域并開拓新領(lǐng)域的興趣。這有助于我們對(duì)生命系統(tǒng)的認(rèn)識(shí),并為人類開啟一切機(jī)會(huì)。”Sameer Velankar,EMBL-EBI首席科學(xué)家“自人類基因組革命20年來,AlphaFold是生物學(xué)研究的重大突破。蛋白質(zhì)的功能由其結(jié)構(gòu)決定,AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)將提供數(shù)以百萬(wàn)計(jì)的蛋白質(zhì)結(jié)構(gòu),加速發(fā)現(xiàn)過程。前所未有的數(shù)據(jù)規(guī)模將掀起新一輪創(chuàng)新浪潮,幫助我們應(yīng)對(duì)從健康到氣候變化的挑戰(zhàn)。”Christoph Müller,EMBL,結(jié)構(gòu)與計(jì)算生物學(xué)小組首席科學(xué)家“這是巨大的進(jìn)步。AlphaFold的結(jié)構(gòu)預(yù)測(cè)將大大加快結(jié)構(gòu)生物學(xué)研究,并將使蛋白質(zhì)三維結(jié)構(gòu)更成為生命科學(xué)研究的焦點(diǎn)。”DeepMind 發(fā)布詳細(xì)的算法,公開源代碼,共享訓(xùn)練數(shù)據(jù),對(duì)學(xué)術(shù)界而言,可謂幾家歡喜幾家愁。無數(shù)實(shí)驗(yàn)研究組和應(yīng)用型計(jì)算研究組都將獲益,花幾十萬(wàn)人民幣,或者實(shí)驗(yàn)室單獨(dú)購(gòu)買,或者學(xué)校平臺(tái)合資購(gòu)買,配置一臺(tái)能跑動(dòng) AlphaFold2 的工作站,就將能自主地、大大加速自己的研究。
然而,對(duì)于開發(fā)方法的競(jìng)爭(zhēng)者而言,打擊不可謂不大 —— 原因也簡(jiǎn)單,跑死馬也追不上?。?/span> 如果DeepMind不開源,那么各家還可以根據(jù)推測(cè)的算法自行開發(fā),聲稱只是根據(jù)科學(xué)原理完成了相似的工作;但是,AlphaFold2 開源之后,任何一個(gè)有志于開發(fā)獨(dú)立方法的團(tuán)隊(duì)都不可能不讀 AlphaFold2 的論文,不研習(xí)它的方法。這樣就無法回避知識(shí)產(chǎn)權(quán)問題 —— 這點(diǎn)對(duì)工業(yè)界的競(jìng)爭(zhēng)者尤甚。可是,憑借學(xué)術(shù)界的小團(tuán)隊(duì)人員配備與經(jīng)濟(jì)實(shí)力,除非 DeepMind 如對(duì)待AlphaGo一般停止對(duì) AlphaFold 的更新訓(xùn)練,否則,如何趕得上?須知道David Baker的研究組已經(jīng)是首屈一指的航母般的巨型研究組了。一般小組三五七個(gè)人怎么追趕?另一方面,我感慨、贊美DeepMind開源數(shù)據(jù)庫(kù)的胸襟和氣魄。誠(chéng)然如上文 EMBL主任 Edith Heard 所說,DeepMind 采用PDB等公共數(shù)據(jù)庫(kù)內(nèi)的數(shù)據(jù)訓(xùn)練了AlphaFold模型,而那些數(shù)據(jù)來自過去50年來全世界科學(xué)家點(diǎn)點(diǎn)滴滴的積累;由此觀之,DeepMind將預(yù)測(cè)模型免費(fèi)開放給全世界符合邏輯,似乎理所應(yīng)當(dāng)。但是依此邏輯,Springer, Elsevier, Wiley 等出版商就應(yīng)該免費(fèi)向?qū)W術(shù)界提供論文,不是嗎?配置超算設(shè)備不花錢么?訓(xùn)練模型不花錢么?雇傭頂級(jí)科學(xué)家和工程師不花錢么?DeepMind不用賺錢么?即使將這樣龐大的數(shù)據(jù)庫(kù)商業(yè)化,愿意付費(fèi)者恐怕也應(yīng)者如云吧?藥廠爭(zhēng)著就要用。把它當(dāng)作 IPO 時(shí)討價(jià)的資本不香嗎?所以,哪有那么多理所應(yīng)當(dāng)?科學(xué)國(guó)際主義萬(wàn)歲!這是變革的時(shí)代。DeepMind 讓大家認(rèn)識(shí)到工業(yè)界也可以做出不遜于學(xué)界的前瞻性、探索性的基礎(chǔ)科研,而不是僅僅亦步亦趨地做工程性科研。所需要的是,雄厚資本的傾注,對(duì)短期商業(yè)化收支平衡表的無視,單純的科學(xué)探索之心,造福全人類的無私情懷,一群對(duì)的人,以及對(duì)科研員的尊重:待遇給夠、更專業(yè)的人領(lǐng)導(dǎo)專業(yè)的人。https://alphafold.ebi.ac.uk/https://www.ebi.ac.uk/about/news/press-releases/alphafold-database-launchhttps://www.blopig.com/blog/2021/07/alphafold-2-is-here-whats-behind-the-structure-prediction-miracle/
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。