徐立:看得見的人工智能
徐立:非常感謝大家。我的演講題目是《看得見的人工智能》。我想表達兩個意思。第一,商湯科技是做人工智能里的視覺的;第二,這是一個創(chuàng)業(yè)的態(tài)度,做事情要做看得見摸得著的,要落地。
講到人工智能,我在這里講一下人工智能的三起兩落。有人說你怎么看人工智能的三起兩落?從1991年開始的第三波浪潮,從人工智能的角度來說,時間真的不算長。但最近的這波浪潮有些不一樣。很多人工智能的突破不是漸變式慢慢增長起來,而是突變的。
不信我們看一看Google的搜索關(guān)鍵字,人工智能背后核心的驅(qū)動技術(shù)是深度學(xué)習(xí)。深度學(xué)習(xí)06年才有。深度學(xué)習(xí)的出現(xiàn)是非常突然的,是到某一個點開始爆發(fā)的,并不是從91年慢慢積累被大眾所認識的概念。我們自己問員工,大家怎么看這個事,怎么解釋?
員工給了一個解釋,深度學(xué)習(xí)爆發(fā)的時間點在2012年底到2013年初,當(dāng)時Alex在ImageNet競賽上第一次利用深度學(xué)習(xí)取得突破,所以視覺可能是引發(fā)這波深度學(xué)習(xí)浪潮的核心。這個熱潮突然興起是因為在2012年底的時候GPU第一次被用在深度學(xué)習(xí)上,所以可以說是GPU的興起引發(fā)了這波浪潮。
人工智能的發(fā)展是突變性的,簡單定義為三個階段。第一個階段,人工智能技不如人,大部分時候沒有人做得好;第二個階段,超過普通人;第三個階段,超過專家。
為什么這么定義?技不如人,我們一直說人工智能帶來的是生產(chǎn)力工具,在人工智能算法沒有達到人的水平的情況下,我們可以認為它可能有一定的作用,但是絕對不會用大規(guī)模計算把這個事干了,行業(yè)的機會比較少。我剛創(chuàng)業(yè)的時候看到有一篇采訪報道說,咱們大家看人臉識別視覺做得很火熱,其實就是一個事。如果只是一個普通的工具,在沒有快速突破的情況下得到了大量的資源,它的覆蓋率就會很高。
第二個階段,超過普通人的階段。這是我們現(xiàn)在所處的階段,機器學(xué)習(xí)在某些垂直領(lǐng)域確實能夠超越普通人,比如我們在陌生人識別上,在精準的物體移動識別上面。這個帶來什么?生產(chǎn)效率的提升,對我們來說到底有什么變化?其實沒有變化。這種情況下我們每一天用的東西,每一天做的事情都有可能被人工智能所代替,被人工智能所改變,但是你感覺不到。因為它是潛移默化地改變?nèi)藗兩磉叺氖虑椋徊贿^是一個替代,替代現(xiàn)有的人工,以潤物細無聲的形式出現(xiàn)。
第三個階段,超越專家。超越普通人和超越專家是不同的。專家的知識通常是非常難獲取的,只有很少數(shù)人擁有專家的知識。很多情況下專家是需要通過十年、二十年的學(xué)習(xí)才成為專家。在我們的算法中普通人的知識可以通過標注數(shù)據(jù),通過所謂的監(jiān)督學(xué)習(xí)學(xué)會。但是一旦超過專家的水平,我們認為它會帶來真正的效率升級或者說服務(wù)的徹底升級。我以前有一個說法,人工智能來了,未來會變成什么樣?未來所謂的“老”字號工種就會消失,比如老教師、老司機、老棋手漸漸沒有了。
我們在做的事情是什么?超人的生意。機器是不是可以做到超越人?左圖是原始圖,右圖是機器算法的圖。對同樣一張圖,模糊的圖放大之后我們希望能夠識別。在算法引進之前我們用傳統(tǒng)的算法識別出來的圖片,有一種動物的感覺。
放大有什么作用?我們的研究員兩年前做了超規(guī)范算法,在日本的waifu2x網(wǎng)站應(yīng)用,應(yīng)用到全實場景當(dāng)中。SRCNN 是我們第一個用深度學(xué)習(xí)做的算法,一開始用Existing Hallucination,現(xiàn)在完成的深度學(xué)習(xí)做超分辨率,是以最后能夠提高識別準確率為目的,這種情況下我們可以發(fā)現(xiàn)機器真的能夠做到超越人。還有幾個實際的案例,例如監(jiān)控逃犯,能夠無中生地有把真正的細節(jié)恢復(fù)出來。
人工智能來了,新問題是到底要解決什么樣的問題?第一個要面臨的技能提升。像以前人類用馬車來運輸,就要學(xué)會騎馬。當(dāng)人工智能工具來臨時,不是帶來大量工人的失業(yè)而是帶來新的職業(yè),這就是技能提升。生產(chǎn)效率的提升的是核心的改變。
鋼鐵俠、蜘蛛俠給我們另外一個啟示,人工智能的核心就是怎么樣做到人和機器融合,人機融合是接下來面臨的第二個問題。
時間關(guān)系,非常感謝大家,我的演講到此為止。謝謝新智元。
戴文淵:人工智能工業(yè)應(yīng)用的必要條件
戴文淵:感謝新智元。這么多年,人工智能的發(fā)展其實經(jīng)過很多階段,經(jīng)歷人工智能要毀滅人類——人工智能是騙子——人工智能又要毀滅人類——人工智能又變成騙子?,F(xiàn)在又到了新的一個階段——人工智能要毀滅人類。但是,其實在很多領(lǐng)域,大家測試之后覺得人工智能是騙子,比如通用的人工智能。
我們一直在致力于通過人工智能的技術(shù)去改造各行各業(yè),所以我們需要告訴各行各業(yè),人工智能在什么樣的情況可以使用,什么樣的情況不可以使用。今天我想談一談,如果人工智能在各行各業(yè)落地,需要什么樣的條件。我們要給予人工智能更長久的耐心。
必要條件1:目前的技術(shù)水平無法達到通用人工智能,需要有一個邊界,就是解決封閉的問題。做個類比,現(xiàn)在人工智能其實只能當(dāng)我們的徒弟或是下屬,并不能當(dāng)我們的老板。因此,當(dāng)我們自己都不知道要干什么,人工智能是不可能告訴我們要干什么。比如我現(xiàn)在招一個下屬,把你教會。同樣,我把AI教會之后,AI可以替我做很多事情。在這樣的情況下,你有很多忠實的下屬,而且容易管理。
必要條件2:大家一直在說,人工智能要基于大數(shù)據(jù),但是并不是所有的數(shù)據(jù)都能夠產(chǎn)生人工智能。真正能夠產(chǎn)生人工智能的是有意義的大數(shù)據(jù)。以圍棋為例,能夠讓你能夠?qū)W會圍棋的是怎么下棋,而不是看圍棋的世界排名是多少的新聞。所以,我們有一些誤區(qū)。
過去的3-5年內(nèi),我們建立了很多系統(tǒng),收集了很多數(shù)據(jù),但是并不能產(chǎn)生人工智能。最典型的就是結(jié)果數(shù)據(jù)。比如,每個公司都會記錄員工考核的數(shù)據(jù)ABCD,但是這些數(shù)據(jù)并不能讓我們學(xué)會這些員工的技能。還有統(tǒng)計數(shù)據(jù),統(tǒng)計局收集大量的統(tǒng)計數(shù)據(jù),比如全球各地的PM2.5統(tǒng)計數(shù)據(jù),這些數(shù)據(jù)并不能讓我們產(chǎn)生預(yù)測PM2.5的能力。真正能夠讓機器掌握AI能力的其實是過程數(shù)據(jù)。如果,你能夠看到每個員工每天都在做什么,那么可以基于這些數(shù)據(jù)學(xué)習(xí)他。比如,最近比較火的智能投顧(Robo-Advisor),我們有很多人類投顧,可以記錄人類投顧在干什么,然后讓機器學(xué)習(xí),最后產(chǎn)生機器智能投顧的機會。
必要條件3:要有反饋。對于圍棋來說,贏就是贏,輸就是輸,可以被數(shù)字化。我們通常會遇到什么問題?我們經(jīng)常給機器一些數(shù)據(jù)讓機器去學(xué)習(xí),或者就告訴機器把這件事情做好就行了,但是整個過程不能被數(shù)據(jù)化。我們不知道計算機怎么理解數(shù)字。
必要條件4:算法。是不是跟著科學(xué)家走就可以了?因為有很多細分的場景,所以我們面臨的各種問題并不能夠順利解決。舉個例子,這是一個銀行做分析的利率表,這個利率表的規(guī)律就是——基數(shù)大的利率都比基數(shù)小的更難實現(xiàn)。即使使用深度學(xué)習(xí),預(yù)測24期的利率比預(yù)測12期的利率更難。其實,在面對紛紜復(fù)雜的應(yīng)用時,我們會遇到各種不同的場景,需要根據(jù)具體的場景來調(diào)整算法。
必要條件5:系統(tǒng)能力。過去我們更強調(diào)科學(xué)家的能力,其實架構(gòu)師的能力也同樣重要。這是Jeff Dean。谷歌并沒有發(fā)明深度學(xué)習(xí),但是能把深度學(xué)習(xí)做得很大很大,應(yīng)該歸功于架構(gòu)師。
舉個例子,這是經(jīng)典的梯度下降的算法。如果數(shù)據(jù)量很小,只有幾百個,大家只要將代碼復(fù)制粘貼進去就可以了。但是如果討論更大的數(shù)據(jù)量時,問題就很復(fù)雜。10臺機器運作時,要考慮負載均衡的問題;100臺機器運作時,要考慮每跑一次算法都可能會丟數(shù)據(jù)(硬盤數(shù)量很大);1000臺機器運作時,要使用交換機,交換機、網(wǎng)線、數(shù)據(jù)傳輸都會出現(xiàn)問題。這些都說明,當(dāng)數(shù)據(jù)量很大,可能需要全世界最好的架構(gòu)師。
所以,要做到人工智能其實需要很多必備條件??偨Y(jié)一下,有5個條件。首先是封閉問題,然后需要有過程數(shù)據(jù)(不僅僅是大數(shù)據(jù))。之后需要有頂尖科學(xué)家、頂尖架構(gòu)師。這就是為什么BAT能夠做別人做不出的事情。其實科學(xué)家并不少,每一年畢業(yè)的AI領(lǐng)域的碩士博士也有幾千甚至,但是科學(xué)家只是其中的一環(huán)。以上提到的5個條件很難全部實現(xiàn)。
我們在做什么?我們把科學(xué)家、架構(gòu)師、包括反饋數(shù)據(jù)閉環(huán)中的系統(tǒng)和算法都解決。將前提條件減少到兩個——數(shù)據(jù)和業(yè)務(wù)量級封閉場景。我們之前做過測試,讓沒有機器學(xué)習(xí)背景的人,哪怕是根本不是計算機系專業(yè)的人去做測試,最后發(fā)現(xiàn)有70%的人能夠達到專業(yè)人士的水平。在這種情況下,我們可以增加很多AI的從業(yè)人員,最后達到我們所謂的效果。這就是我的介紹,謝謝。
劉穎博:ROOBO的人工智能之路
劉穎博:謝謝新智元給我們這個機會。站在這么多科學(xué)家面前我有點緊張,我本科畢業(yè),謝謝大家!而且我還是學(xué)會計的。
今天想跟跟大家說一說,我們做了一點什么事情。六個月前我們開了一場發(fā)布會,楊靜也去給我們做了一個簡短的發(fā)言,非常感謝。那時候我們核心的是發(fā)布了一個計算系統(tǒng)的東西,現(xiàn)在的名字定為ROSAI。這件事情我們持續(xù)在做,現(xiàn)在已經(jīng)有幾十個人工智能相關(guān)的服務(wù)對接到里面來,跟傳統(tǒng)的企業(yè)在做這方面的合作等等。等項目真正落地了,會拿出來給大家看一下。
大家知道艾菲還有紅點,JELLY得了紅點的獎,還有艾菲的三個獎,產(chǎn)品、包裝、OS。還有一款產(chǎn)品PUDDING BEANQ,4月或者5月會上線,得了紅點的bestof the best。
我們做這么多事情不取決于我們自己,還有一系列的合作伙伴。比如NUANCE、全志,還有跟新東方的多納合作,還有和清華、普林斯頓等大學(xué)做的一系列相關(guān)的合作,希望今年還能做一些更落地一點的事情。我本來不太會科研,盡量落地就好了,盡量做toC的事情,做更多的落地。
大概是這樣的狀況,謝謝大家!
3月27日,新智元開源·生態(tài)AI技術(shù)峰會暨新智元2017創(chuàng)業(yè)大賽頒獎盛典隆重召開,包括“BAT”在內(nèi)的中國主流 AI 公司、600多名行業(yè)精英齊聚,共同為2017中國人工智能的發(fā)展畫上了濃墨重彩的一筆。
點擊閱讀原文,查閱文字版大會實錄