?楊強老師提出的問題非常深刻,也非常有前瞻性——對于人工智能的研究者,厘清“機器智能與人類智能的重要區(qū)別”,并進一步探索消除這些區(qū)別的方法,可能會是深度學習之后人工智能下一次革命的起點;而對于家長和教育工作者,理解人類智能相較于當前機器智能的核心優(yōu)勢,也或許能夠讓我們抓住人類智力發(fā)展的重點,在子女的智力培養(yǎng)方面少走一些彎路。
我從大約十年前開始對人工智能產生興趣,而思考人的智力培養(yǎng)的時間還要更久。后來從本科到博士,學習了從神經科學、認知科學到統(tǒng)計推斷、機器學習理論等等橫跨數個領域的十幾門課,也見證了人工智能的前沿從概率圖模型變成神經網絡的這個過程。對于這兩個問題,我有一些想法,算是按照自己目前的認識水平,對未來的預言吧。
機器智能和人類智能的最重要區(qū)別,在于我們尚不知道如何讓機器有效地生成和操作概念的表征(representation of concepts),通俗地說就是,機器還沒有廣泛地把知識抽象化的能力。
舉個例子,AlphaGo是當前最先進的人工智能系統(tǒng)的一個代表了。它和它的繼承者AlphaGo Zero在圍棋問題上無人能敵,除了靠強大的計算機算力,也靠著積累了數百萬盤自我對弈經驗的大型神經網絡的參數。這一系列中最強的AlphaGo Zero模型[1]的參數數量大約是五千萬。這樣大的信息量,顯然是無法作為人類知識傳授給棋手的。對比之下,人類獲取和傳播知識的方法就要高效得多。我們知道前人在幾千年的探索過程中,精煉出一些圍棋的定式、經典的對弈,用于圍棋的教學研究。寥寥數言,卻往往深刻地總結了圍棋游戲的本質規(guī)律。棋手若是能夠把相對少量的定式理解透徹、活學活用,就足以戰(zhàn)勝絕大多數業(yè)余對手了。有趣的是,機器智能和人類智能也是有相似性的——除了自古流傳的定式,經驗豐富的頂尖棋手思考走子時也有極為準確的“直覺”,而這種“直覺”即是沒有經過符號化抽象的知識,很可能和AlphaGo的知識是類似的。
再舉一個例子,我國很多家庭重視孩童的文學啟蒙教育,其中一項內容就是教孩子熟背唐詩。諺云:”熟讀唐詩三百首,不會吟詩也會吟?!?b>這其實說的是一種類似機器智能的現象——訓練數據多了,就能找到一些統(tǒng)計上的規(guī)律。對于人類來說,這種找規(guī)律的過程是不需要意識主動參與的。類似的例子還有語言的學習,其中很重要的所謂”語感的培養(yǎng)“,也是一個基于大數據提取統(tǒng)計規(guī)律的過程。以上觀點的一個佐證就是,經過大量語料庫的訓練,現在的機器也可以培養(yǎng)出”詩意“和”語感“,比如會寫詩、會修改病句的神經網絡。但人類智能的高明之處在于,我們超越了單一地從大數據中積累統(tǒng)計規(guī)律的學習方式。全中國有數幾億計的青少年學習英語,其中的絕大多數并非在雙語或純英語的環(huán)境里生活,因此我們會在英語教學中講解語法和句法、音標和語調。學生掌握了這些提煉的規(guī)則,就能以較少的數據獲得類似的語言學習效果。更進一步來說,語言學的先驅們將復雜的人類語言現象歸納提取出普遍規(guī)則,才使得非語言環(huán)境中的語言學習成為可能,這可以稱得上人類智能的一個高光時刻了。
那么,未來的機器智能有沒有可能也超越目前的大數據驅動的學習方式呢?我認為前景尚不明確,但希望還是有的。關于如何解決這個問題,人工智能的不同研究流派之間有很大的分歧。人工智能研究的符號主義流派堅持認為語義、概念要用符號來表征,核心的研究問題是如何處理這些符號。這一流派實踐上的挑戰(zhàn)一是工程浩大難于規(guī)?;遣灰着c感知數據結合。從認知心理學出發(fā)的認知主義,包括在本問題里解釋”通用人工智能“(AGI)的答主,基于對人類學習過程的建模提出了一些認知模型。這一領域的挑戰(zhàn)是理論的可證偽性(falsifiability):任何智能的行為或心理活動,本質上都需要信息的處理,即算法和它的物理實現,而它的效率和有效性也應該有數學以及實踐的支持。一些非常符合直覺的認知理論,或者有意無意忽略了對實現細節(jié)的討論,或者實現上會遇到嚴重的瓶頸??v觀人工智能的發(fā)展歷史,它其實是一門較為接近物理、化學或生物的經驗科學,甚至可能更接近化學和生物一些。正確的理論不會憑空而來,即使是相對論這樣石破天驚的理論,也是建立在”邁克耳孫-莫雷實驗“這樣強有力的實驗證據基礎之上的。因此,我認為那些沒有建立在實驗證據上、又無法由實踐檢驗的理論,也很難成為人工智能發(fā)展的動力。
未來我們怎么去填補機器智能相比人類智能的差距,目前來說,我最看好的仍然是由深度學習所代表的聯(lián)結主義。它認為包括概念和語義在內的知識,以及對這些概念和語義進行處理的知識,都應該由分布式的網狀連接來表征;具體對應到目前的人工智能實踐,就是表示為向量(矩陣、張量)或者由向量(矩陣、張量)參數化表示的函數??偨Y近幾年人工智能在幾個應用領域的進展,共性是十分明顯的:
最后來回答楊強老師提出的第二個問題。既然目前機器智能和人類智能的最大區(qū)別在于把知識抽象化的能力,可以說這就是目前人類在智力方面的核心競爭力了。因此我們在培養(yǎng)后代的智力方面,也要尤其注意培養(yǎng)其基于事實、歸納總結、提取本質、舉一反三、質疑求證的能力。在具體操作上,一方面許多古今中外的科學家、發(fā)明家或者能人智者的事跡,可以成為鼓勵其模仿的正面例子;另一方面,可以從生活中的簡單事例出發(fā),循循善誘,引導其掌握由表象到本質的思考方式。