(北京大學(xué) 趙鵬巍 編譯自Marric Stephens. Physics World,2019,(3):45)
當(dāng)銀行打電話提醒你的信用卡在陌生時間發(fā)生可疑大額消費(fèi)時,這不大可能是經(jīng)由一位親自梳理過你個人帳戶的好心銀行員工發(fā)現(xiàn)的,相反,這更像是機(jī)器學(xué)會了判斷與犯罪活動相關(guān)聯(lián)的行為,并在你的賬單中發(fā)現(xiàn)了一些意外情況。銀行的計(jì)算機(jī)系統(tǒng)利用算法可以靜靜地、高效地監(jiān)控你帳戶上的盜刷跡象。
監(jiān)控信用卡只是“機(jī)器學(xué)習(xí)”的一個例子。機(jī)器學(xué)習(xí)是指計(jì)算機(jī)系統(tǒng)通過在給定的示例集上訓(xùn)練,從而發(fā)展出靈活自主地執(zhí)行任務(wù)的能力的過程。作為更廣義的人工智能領(lǐng)域的一個子集,機(jī)器學(xué)習(xí)技術(shù)能夠被應(yīng)用于任意可挖掘輸入輸出之間關(guān)聯(lián)的大型復(fù)雜數(shù)據(jù)集中。對于上面提到的銀行,算法將分析大量合法以及非法交易數(shù)據(jù),以便從給定輸入(“凌晨3 點(diǎn)產(chǎn)生的大額消費(fèi)”)產(chǎn)生輸出(“盜刷嫌疑”)。
機(jī)器學(xué)習(xí)不僅僅應(yīng)用于金融領(lǐng)域,也正在被應(yīng)用于醫(yī)療保健、交通運(yùn)輸、刑事司法以及科學(xué)研究等許多其他領(lǐng)域。
圖1 新型學(xué)習(xí)。人工神經(jīng)網(wǎng)絡(luò)近似模擬真實(shí)生物大腦的工作模式,每個輸入經(jīng)由一層或多層隱藏的人工神經(jīng)元處理
機(jī)器學(xué)習(xí)對量子物理,特別是“量子多體問題”的求解可能產(chǎn)生深遠(yuǎn)的意義。這類問題產(chǎn)生于一組相互作用著的物體,且只能通過考慮其量子性質(zhì)才能理解整個體系。美國紐約西蒙斯基金會Flatiron 研究所的物理學(xué)家Giuseppe Carleo 指出:“量子多體問題的共性在于研究體系的性質(zhì)原則上需要完全了解體系的多體波函數(shù)這一事實(shí)”,而多體波函數(shù),用Carleo 的話說,“是一個怪物,其復(fù)雜程度隨著體系組分?jǐn)?shù)量的增加而呈現(xiàn)出指數(shù)級的增長”。例如,考慮一組由若干粒子組成的系統(tǒng),每個粒子均有順時針和逆時針兩個自旋方向。對于兩粒子系統(tǒng),共有四種可能的狀態(tài),三粒子系統(tǒng)則有八種可能狀態(tài),這時體系仍然是容易處理的。但隨著粒子數(shù)增多,復(fù)雜程度很快就會超出可控范圍。
傳統(tǒng)方法無法有效地處理具有一定組分?jǐn)?shù)量的量子多體問題,所以Carleo 及其瑞士蘇黎世聯(lián)邦理工學(xué)院的同事Matthias Troyer 使用了機(jī)器學(xué)習(xí)方法。他們發(fā)現(xiàn)一個相對較“淺”的神經(jīng)網(wǎng)絡(luò)——僅使用單個隱藏層,已經(jīng)可以有效地“學(xué)習(xí)”表征體系的波函數(shù)了,一維或二維晶格上的自旋問題便是一例。
與求解量子多體問題相同的困難也出現(xiàn)在“ 量子態(tài)層析成像”中。正如層析成像從外部測量來重建物體的內(nèi)部結(jié)構(gòu)一樣,量子態(tài)層析成像通過對量子態(tài)易于測量的部分進(jìn)行少量次數(shù)的測量來確定一個系統(tǒng)的量子狀態(tài)。與量子多體問題一樣,編碼在波函數(shù)中的信息量隨著系統(tǒng)中組分?jǐn)?shù)量的增加而呈指數(shù)增長。
量子比特在量子計(jì)算機(jī)中的糾纏方式是一個值得描述的量子態(tài),這使得量子態(tài)層析成像對于理解量子計(jì)算機(jī)應(yīng)該如何應(yīng)對噪聲和退相干性至關(guān)重要。問題在于任何實(shí)用的量子計(jì)算機(jī)都將包含數(shù)十或數(shù)百個量子比特,故直接去確定其量子態(tài)的方法是不合適的。這正是人工神經(jīng)網(wǎng)絡(luò)可以發(fā)揮作用的地方,Carleo 發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)可以高效地重建含100 個量子比特的量子計(jì)算機(jī)的量子態(tài),而標(biāo)準(zhǔn)方法僅限于大約8個量子比特。
機(jī)器學(xué)習(xí)的應(yīng)用還遠(yuǎn)沒有結(jié)束。機(jī)器學(xué)習(xí)方法僅是最近才被應(yīng)用于量子物理領(lǐng)域,這意味著研究仍處于原理論證階段。實(shí)際上,Carleo 及其同事展示的方法通常涉及僅含一或兩個隱藏層的神經(jīng)網(wǎng)絡(luò), 而更成熟的商業(yè)應(yīng)用—— 如Google 和Facebook 等,能夠利用更深層的架構(gòu),并在針對特定任務(wù)優(yōu)化的專用硬件上運(yùn)行。
不幸的是,量子物理的奇異特性使得這些更復(fù)雜的神經(jīng)網(wǎng)絡(luò)不能簡單地直接移植到量子問題上,Carleo 等人不得不幾乎從頭開始設(shè)計(jì)算法,目前還未達(dá)到與機(jī)器學(xué)習(xí)應(yīng)用前沿相當(dāng)?shù)膹?fù)雜度,而趕上那些成熟的算法,將允許人工神經(jīng)網(wǎng)絡(luò)解決更復(fù)雜的量子問題。Carleo指出:“我認(rèn)為未來幾年會看到原理方法與技術(shù)實(shí)現(xiàn)之間的鴻溝越來越小,并帶來我們現(xiàn)在甚至無法想象的應(yīng)用?!?/p>
雖然人工神經(jīng)網(wǎng)絡(luò)在給出有用的結(jié)果前通常必須有大量數(shù)據(jù)集作為輸入,但美國弗吉尼亞大學(xué)的Prasanna Balachandran 使用一些數(shù)據(jù)需求并不是很大的方法。他的研究目標(biāo)是從巨大的多維可能性空間中找出相對較小的能制造有益材料的配方空間。通過試錯法來尋找這樣的空間將會花費(fèi)太長時間,而且對應(yīng)屬性已知材料的區(qū)域也僅僅是全空間的極小一部分。
Balachandra 用來解決這一問題的方法是一種特殊類型的機(jī)器學(xué)習(xí),稱為統(tǒng)計(jì)學(xué)習(xí)。這種方法通過假設(shè)數(shù)據(jù)特征遵循嚴(yán)格的統(tǒng)計(jì)規(guī)律來繞過機(jī)器學(xué)習(xí)對大量訓(xùn)練集的需求。他解釋道:“我們訓(xùn)練機(jī)器學(xué)習(xí)模型去掌握我們已經(jīng)知道的東西,進(jìn)而用這些模型來預(yù)測我們不知道的東西”。
在新材料研究中,我們知道某些材料組合的行為,而想要預(yù)測的是每個其他可能組合的性質(zhì)。然而,預(yù)測給定材料性質(zhì)的可信度依賴于對其鄰近材料的了解情況,因此,對于每個預(yù)測,Balachandran 還量化了與每個預(yù)測值相應(yīng)的誤差。
盡管機(jī)器學(xué)習(xí)技術(shù)已經(jīng)在醫(yī)學(xué)、量子和材料物理學(xué)方面形成了具體的成果和無可替代的前景,但在統(tǒng)計(jì)物理學(xué)中的進(jìn)展卻沒有那么清晰。在法國巴黎薩克萊大學(xué)研究機(jī)器學(xué)習(xí)理論的Lenka Zdeborová承認(rèn)道,“我們?nèi)栽诘却粋€被科學(xué)同行認(rèn)可的,沒有機(jī)器學(xué)習(xí)的幫助就無法完成的重要例子?!?/p>
當(dāng)然,機(jī)器學(xué)習(xí)技術(shù)在統(tǒng)計(jì)物理學(xué)中有一些有希望的進(jìn)展,但Zdeborová說這些技術(shù)迄今尚未處于該領(lǐng)域的前沿。她指出,有數(shù)十篇論文使用神經(jīng)網(wǎng)絡(luò)來研究一些統(tǒng)計(jì)模型,例如二維伊辛模型——該模型描述了二維晶格上自旋粒子之間的相互作用,但迄今還沒有得到任何全新的發(fā)現(xiàn)。
機(jī)器學(xué)習(xí)尚未推動統(tǒng)計(jì)物理學(xué)的進(jìn)步也許會令人感到失望,但相關(guān)的知識與前景必定走向另一方向。試想識別圖像所需的神經(jīng)網(wǎng)絡(luò),每個圖像都會包含大量數(shù)據(jù)(像素)并且會伴有噪音(因?yàn)槿魏谓o定的圖像都會被大量不相關(guān)的特征掩蔽),而且網(wǎng)絡(luò)中的不同權(quán)重之間也存在相關(guān)性。
令人高興的是,多維、有噪聲和有關(guān)聯(lián)的問題正是統(tǒng)計(jì)物理學(xué)家自上世紀(jì)中葉以來一直在學(xué)習(xí)如何應(yīng)對的問題。研究一種被稱為“自旋玻璃” 材料的Zdeborová 說道:“試想針對無序系統(tǒng)中發(fā)展出來的物理學(xué)理論”。這樣的系統(tǒng)具有許多粒子(即許多的維度),具有有限的溫度(即具有熱噪聲),而且具有許多粒子間的相互作用( 即許多的關(guān)聯(lián))。事實(shí)上,在某些情況下,描述機(jī)器學(xué)習(xí)模型的方程與用于處理統(tǒng)計(jì)物理系統(tǒng)的方程完全相同。
這一發(fā)現(xiàn)可能是發(fā)展一個全面理論的關(guān)鍵,這一理論可以解釋為什么這些方法會如此有效。雖然目前機(jī)器學(xué)習(xí)的發(fā)展也許比幾十年前通常預(yù)測的還要進(jìn)步一些,但其成功仍然主要來自經(jīng)驗(yàn)性的試錯法。Zdeborová總結(jié)道:“我們希望能夠預(yù)測最優(yōu)的機(jī)器學(xué)習(xí)架構(gòu),知道應(yīng)該如何設(shè)置參數(shù)以及采用何種算法,目前我們還沒有線索知道如何在不投入大量人力的情況下獲得這些知識?!?/p>
圖2 大浪淘沙,沉者為金。統(tǒng)計(jì)學(xué)習(xí)可用于從大量可能的材料結(jié)構(gòu)中篩選出可控的數(shù)量以進(jìn)行實(shí)驗(yàn)
本文選自《物理》2019年第4期
1.環(huán)形正負(fù)電子對撞機(jī):物理、技術(shù)以及現(xiàn)狀
2.量子十問之六:量子計(jì)算,這可是一個顛覆性的新技術(shù) | 郭光燦
3.晶體幾何系列之二:平面上圓密排定理的證明
4.單純的元素,復(fù)雜的歷史
5.原位電子顯微學(xué)探索固體中的離子遷移行為(一)
6.愛因斯坦的物理學(xué)成就與年譜 | 曹則賢
7.物理學(xué):A Source of Power for Man
8.回音壁模式光學(xué)微腔傳感
9.楊-米爾斯理論說了啥?為什么說這是楊振寧超越他諾獎的貢獻(xiàn)?
10.周末講堂——三位新晉狄拉克獎得主:開宗立派又風(fēng)格迥異