7月28日,在深圳舉辦的2018中國人工智能大會(huì)上,北京大學(xué)教授王立威發(fā)表了題為《機(jī)器學(xué)習(xí)簡介—方法、應(yīng)用與展望》的演講,對(duì)機(jī)器學(xué)習(xí)的理論發(fā)展做了全面闡述。會(huì)后,王立威教授接受了網(wǎng)易智能的采訪,談到了人工智能的行業(yè)應(yīng)用與未來發(fā)展。
出品 | 網(wǎng)易智能(公眾號(hào) smartman163)
期號(hào) | AI英雄總第91期
作者 | 小羿
作為北京大學(xué)信息學(xué)院教授,王立威對(duì)于人工智能的研究已有十幾年。不同于其他的人工智能專家,王立威的主要研究興趣在于機(jī)器學(xué)習(xí)理論。早在2010年,王立威就入選IEEE的AI’s 10 to Watch,是亞洲首位獲得該獎(jiǎng)項(xiàng)的學(xué)者,并于2012年獲得國家自然科學(xué)基金優(yōu)秀青年基金。
目前,王立威已經(jīng)在機(jī)器學(xué)習(xí)頂級(jí)會(huì)議NIPS、COLT、ICML和頂級(jí)期刊JMLR、IEEE Trans. PAMI發(fā)表多篇論文。其中2008年發(fā)表于機(jī)器學(xué)習(xí)理論最高會(huì)議COLT的論文《On the Margin Explanation of Boosting Algorithms》是中國大陸學(xué)者在該會(huì)議上的首篇論文。
泛化理論:機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的核心理論概念
在此次大會(huì)報(bào)告中,王立威詳細(xì)解釋了“機(jī)器學(xué)習(xí)”的涵義。他說,自然科學(xué)中的“機(jī)器學(xué)習(xí)”是利用方程式描述簡單的數(shù)學(xué)規(guī)律,麥克斯韋方程組、牛頓定律、薛定諤方程、洛倫茲變換這些理論都是如此,而人類也曾像“機(jī)器學(xué)習(xí)”一樣思考。但是,今天的機(jī)器學(xué)習(xí)技術(shù),是設(shè)計(jì)復(fù)雜模型用于解決非常復(fù)雜的問題,比如區(qū)分貓和狗的圖像,這類問題無法通過設(shè)計(jì)簡單規(guī)則來完成?!敖裉鞕C(jī)器學(xué)習(xí)的核心思想是,世界是復(fù)雜的,需要用極復(fù)雜的模型,從大數(shù)據(jù)中來學(xué)習(xí)。”王立威表示。
作為機(jī)器學(xué)習(xí)的一部分,王立威對(duì)深度學(xué)習(xí)的興起以及核心問題做了解釋。他稱,深度學(xué)習(xí)的重要技術(shù)成就在于深度網(wǎng)絡(luò)可以有效表示信號(hào)。早期人工神經(jīng)網(wǎng)絡(luò)是從人腦獲得啟發(fā),有仿生的意味。而最新一輪的深度學(xué)習(xí)技術(shù)是2006年提出的,真正取得成果是在2012年。取得成果的核心原因是G.Hinton等人提出逐層預(yù)訓(xùn)練等新興訓(xùn)練方法,以及硬件計(jì)算性能大幅提升和海量數(shù)據(jù)。正因?yàn)槿绱?,深度學(xué)習(xí)在研究上新型網(wǎng)絡(luò)結(jié)構(gòu)不斷提出,在應(yīng)用上一些領(lǐng)域的表現(xiàn)不斷被刷新。
“但是,目前我們?nèi)鄙賹?duì)深層理論的理解,人工智能在學(xué)術(shù)上最重要的問題就是要建立新的理論,解釋深度學(xué)習(xí)所觀察到的現(xiàn)象?!蓖趿⑼f到。
在機(jī)器學(xué)習(xí)理論的研究上,王立威提到了泛化理論,他認(rèn)為,泛化能力是機(jī)器學(xué)習(xí)區(qū)分于其他領(lǐng)域的核心概念。而泛化理論的目標(biāo)是解釋和證明為什么以及怎樣提高訓(xùn)練集的準(zhǔn)確性可以提高測(cè)試集的準(zhǔn)確性。
王立威在會(huì)后的采訪中向網(wǎng)易智能更加詳細(xì)地解釋了泛化理論的發(fā)展。他表示,早期的經(jīng)典泛化理論認(rèn)為,有多少數(shù)據(jù),就需要相應(yīng)復(fù)雜度的模型,如果少量數(shù)據(jù)用了非常復(fù)雜的模型,在已有的數(shù)據(jù)上的效果會(huì)非常好,但是在新的數(shù)據(jù)上效果會(huì)很差,新舊數(shù)據(jù)差異非常大。但是到了深度學(xué)習(xí)觀察到的結(jié)果是矛盾的,“就像我們現(xiàn)在看牛頓定律并不是在所有場(chǎng)合都適用的,經(jīng)典泛化理論也有自己的適用范圍?!蓖趿⑼硎荆瑥膶W(xué)術(shù)的角度來說,我們希望建立一個(gè)理論去理解深度學(xué)習(xí),而且近一兩年有很多的學(xué)者在關(guān)注這樣的問題。
誠然,如果用物理學(xué)理論來看人工智能學(xué)科理論發(fā)展,后者顯然還沒有到達(dá)“牛頓定律”的階段。但是泛化理論讓我們看到了人工智能理論發(fā)展的一些希望。
AI應(yīng)用的兩大限制四個(gè)商業(yè)領(lǐng)域
談到人工智能應(yīng)用,王立威認(rèn)為,人工智能目前的成功主要是工程技術(shù)的成功。但是有兩大限制:
第一,人工智能技術(shù)目前只適用于知識(shí)相對(duì)封閉、狹窄的領(lǐng)域。比如,人工智能在圖像分類的運(yùn)用上,所訓(xùn)練的圖像必須預(yù)定分好類,如果圖像沒有提前分類是不可以用的。
第二,凡是需要人類通過常識(shí)、經(jīng)驗(yàn)判斷的領(lǐng)域,人工智能技術(shù)目前遠(yuǎn)未達(dá)到廣泛應(yīng)用的程度。比如2016年全國高考語文作文(見下圖),對(duì)人來說這張圖像容易理解,但對(duì)機(jī)器來說,雖然機(jī)器可以識(shí)別圖像內(nèi)容,但卻無法理解背后的涵義,因?yàn)闋砍短嗟谋尘靶畔ⅰ?/p>
2016年全國高考語文作文
在具體的商業(yè)應(yīng)用上,王立威提到了四個(gè)領(lǐng)域:
首先是無人駕駛,王立威認(rèn)為在無人駕駛領(lǐng)域,大大小小的公司已經(jīng)積累了大量的訓(xùn)練數(shù)據(jù),在常規(guī)道路上常規(guī)行駛不是問題,但真正落地應(yīng)用還是很難,這其中的關(guān)鍵是無法應(yīng)對(duì)極端情況,包括罕見的路況和天氣。所以,王立威建議,無人駕駛領(lǐng)域現(xiàn)在要加大極端場(chǎng)景和突發(fā)情況的模擬訓(xùn)練。
其次是金融保險(xiǎn),目前人工智能在這一領(lǐng)域的應(yīng)用熱度很高,涉及量化交易、金融風(fēng)控等。
再次是傳統(tǒng)業(yè)務(wù),比如AI賦能電力調(diào)度,智能養(yǎng)豬等等。
最后是是醫(yī)療健康領(lǐng)域,目前人工智能主要用于醫(yī)療影像識(shí)別,藥物研發(fā)。
王立威表示,目前自己在醫(yī)療影像領(lǐng)域涉足較深。依托北京大學(xué)的一系列附屬醫(yī)院,王立威教授所在的北大信息學(xué)院與北大醫(yī)學(xué)部聯(lián)合成立了醫(yī)信交叉中心,兩個(gè)部門合作共同探索醫(yī)療影像的應(yīng)用。
王立威向網(wǎng)易智能闡述了AI醫(yī)療影像發(fā)展的看法:
首先,醫(yī)療行業(yè)的AI應(yīng)用比較碎片化,即使只考慮醫(yī)療影像這一個(gè)應(yīng)用領(lǐng)域,不同病種都需要一個(gè)個(gè)去攻克,不同病種用到的具體技術(shù)也有差異巨大。
其次,在推動(dòng)AI醫(yī)療影像的過程中,王立威認(rèn)為,醫(yī)院必須認(rèn)識(shí)到積累數(shù)據(jù)的重要性,而數(shù)據(jù)收集工作最好是由政府來主導(dǎo),醫(yī)療行業(yè)制定標(biāo)準(zhǔn),而且數(shù)據(jù)收集也需要有一個(gè)軟件工具,不能增加醫(yī)生的負(fù)擔(dān)。
最后,算法系統(tǒng)最終會(huì)成為醫(yī)生輔助工具,不僅讓醫(yī)生的效率更高,最大的價(jià)值是讓醫(yī)生從AI中學(xué)習(xí),制定一個(gè)看病的標(biāo)準(zhǔn)。
面向未來:數(shù)據(jù)收集需要標(biāo)準(zhǔn)化,行業(yè)變革將加速
對(duì)于人工智能未來幾年的發(fā)展趨勢(shì),王立威認(rèn)為,從技術(shù)上說,AI將會(huì)解決更多封閉環(huán)境下的任務(wù),但是沒有突破性的進(jìn)展很難解決需要常識(shí)的開放環(huán)境的任務(wù)。
從行業(yè)的發(fā)展來看,王立威認(rèn)為,未來5-10年數(shù)據(jù)的積累被人們所重視,當(dāng)某個(gè)行業(yè)的數(shù)據(jù)形成一定規(guī)模后,行業(yè)變革將加速。
“對(duì)于當(dāng)前重要的任務(wù),是培養(yǎng)行業(yè)內(nèi)收集數(shù)據(jù)的習(xí)慣與標(biāo)準(zhǔn)化流程,隨著數(shù)據(jù)的增多與數(shù)據(jù)質(zhì)量的提升,一些行業(yè)將在十年內(nèi)發(fā)生革命性的變化,包括醫(yī)療行業(yè)。”王立威憧憬到。(完)
- 加入社群吧 -
聯(lián)系客服