措手不及。
之前在圍棋大戰(zhàn)火得一塌糊涂的AlphaGo,風(fēng)頭絲毫還沒消散,最近又登上了世界頂級科學(xué)雜志《自然》。
AlphaGo已經(jīng)是該雜志2016年1月28日當(dāng)期的封面文章,當(dāng)時(shí)Deepmind公司發(fā)表重磅論文,介紹了這個(gè)讓整個(gè)人類世界都震驚的人工智能程序,因?yàn)樗鼡魯×藲W洲圍棋冠軍。
時(shí)至今日,人類還是那個(gè)人類,但AlphaGo已經(jīng)不再是那個(gè)AlphaGo。它變了,更智能、更先進(jìn)、也讓人類更惶恐。它現(xiàn)在的名字叫AlphaGo Zero。
如果你要問它可怕成什么樣子?
——完全不需要人類輸入條件,自學(xué)圍棋。你沒聽錯(cuò),自學(xué)。
AlphaGo Zero僅用了3天時(shí)間自學(xué)和訓(xùn)練,就以100比0的絕對比分完勝此前AlphaGo。
之前“封神”的AlphaGo,它可是參考學(xué)習(xí)了大量人類專業(yè)棋手的圍棋經(jīng)驗(yàn),最終才有和人類對決中的勝算優(yōu)勢,但新版的AlphaGo Zero則是自我對弈,即通過跟不同版本的自己下棋來學(xué)習(xí)。
我們來梳理下邏輯關(guān)系:AlphaGo輕松打敗人類,AlphaGo Zero輕松打敗AlphaGo。由此可得,如果人類和AlphaGo Zero對決,結(jié)果就是——毫無勝算。
1、AlphaGo的“封神”之路全回顧
2016 年 3 月,AlphaGo 首次挑戰(zhàn)韓國棋手李世石時(shí),當(dāng)時(shí)大多數(shù)持觀望態(tài)度的人都希望AI 獲勝,驗(yàn)證下新技術(shù)的崛起。眾望所歸,AlphaGo真的贏了。世界排名第一的中國圍棋選手柯潔當(dāng)時(shí)拋出言論“就算阿法狗贏了李世石,它也贏不了我”。
2017 年 1 月, AlphaGo開始對人類世界的圍棋冠軍們掃蕩了一輪。世界第一柯潔、韓國冠軍樸廷桓、日本冠軍井山裕太時(shí),AI的崛起讓之前放出豪言的柯潔感嘆“人類千年的實(shí)戰(zhàn)演練進(jìn)化,計(jì)算機(jī)卻告訴我們,人類全都是錯(cuò)的……”
2017年5月23日中國烏鎮(zhèn),AlphaGo與柯潔將對弈三局比賽,柯潔在賽前說,“能夠代表人類出戰(zhàn),是我以前不敢想象的事情,這次選擇我作為主角,我也會(huì)竭盡全力去一爭勝負(fù)”,人類世界態(tài)度發(fā)生了很大的改變,大家都希望世界冠軍至少能贏一盤,為人類“挽尊”。但,結(jié)果終究沒有發(fā)生。
這次“人機(jī)終極對決”第一局中,世界排名第一的中國圍棋選手柯潔,輸給了Google 旗下的人工智能程序 AlphaGo,AlphaGo贏四分之一子。阿爾法圍棋團(tuán)隊(duì)也宣布,阿爾法圍棋將不再參加圍棋比賽。
到了2017年10月19日,DeepMind發(fā)布新版本AlphaGo程序,經(jīng)過三天的訓(xùn)練,該系統(tǒng)能夠擊敗AlphaGo Lee,后者是去年擊敗了韓國選手李世石,勝率是100比0。經(jīng)過大約40天的訓(xùn)練后,AlphaGo Zero完勝AlphaGo Master。
2、對不起,不需要人類來教我。
DeepMind發(fā)表這篇文章,文字很簡單:《不使用人類知識(shí)掌握圍棋》。
一臺(tái)機(jī)器,不需要人類幫助和教育,掌握了人類世界中代表智慧比拼的一項(xiàng)技能——中國圍棋。
話說回來,本來人工智能的一項(xiàng)重要目標(biāo),就是在沒有任何先驗(yàn)知識(shí)的前提下,通過完全的自學(xué),在極具挑戰(zhàn)的領(lǐng)域,達(dá)到超人的境地。
前幾代AlphaGo都需要人類的幫助教導(dǎo),如分析上萬場優(yōu)秀人類玩家間的對決,記住一些招數(shù)和套路,取得制勝的關(guān)鍵邏輯等等。但AlphaGo Zero根本不需要,只需對它做的就是知道游戲的規(guī)則和目標(biāo),它就能開始游戲。
“它學(xué)游戲僅僅是通過跟自己玩,從完全的隨機(jī)玩游戲開始,”DeepMind首席執(zhí)行官杰米斯·哈薩比斯(Demis Hassabis)說?!霸谕娴倪^程中,它很快就超過了人類的水平,并以100比0的戰(zhàn)績擊敗了在論文中介紹過的上一代AlphaGo?!?/span>
他的同事、AlphaGo項(xiàng)目負(fù)責(zé)人戴維·西爾弗(David Silver)補(bǔ)充稱:“我們不以任何方式使用人類數(shù)據(jù),就可以讓它從一塊白板創(chuàng)造知識(shí)?!痹趲滋鞎r(shí)間里,AlphaGo不僅學(xué)會(huì)了下圍棋,而且還勝過了人類歷經(jīng)數(shù)千年在該游戲上累積的智慧。
AlphaGo Zero 是自己的老師,也相當(dāng)于自己是自己的創(chuàng)造者!
研發(fā)團(tuán)隊(duì)只需讓它自己隨意在棋盤下棋,自我博弈。只用到了一臺(tái)機(jī)器和4個(gè)TPU的它,已經(jīng)可以達(dá)成這樣的造詣。
AlphaGo Zero強(qiáng)化學(xué)習(xí)下的自我對弈。
經(jīng)過幾天的訓(xùn)練,AlphaGo Zero完成了近5百萬盤的自我博弈后,已經(jīng)可以超越人類,并擊敗了此前所有版本的AlphaGo。據(jù)DeepMind團(tuán)隊(duì)稱,Zero用更新后的神經(jīng)網(wǎng)絡(luò)和搜索算法重組,隨著訓(xùn)練地加深,系統(tǒng)的表現(xiàn)一點(diǎn)一點(diǎn)地在進(jìn)步。自我博弈的成績也越來越好,同時(shí),神經(jīng)網(wǎng)絡(luò)也變得更準(zhǔn)確。
AlphaGo Zero習(xí)得知識(shí)的過程
AlphaGo Zero使用新的強(qiáng)化學(xué)習(xí)方法,它主要圍繞神經(jīng)網(wǎng)絡(luò)強(qiáng)大的搜索算法,進(jìn)行了自我對弈。從一開始不知道圍棋,到變成這方面的頂級行家。
并且在自我博弈的增加情況下,神經(jīng)網(wǎng)絡(luò)可以升級預(yù)測到下一步的能力,從而贏得比賽。而且最讓人稱奇的是,AlphaGo Zero根據(jù)游戲規(guī)則,能自我發(fā)現(xiàn)走出新策略,真正開創(chuàng)了屬于自己的理解和判斷。
AlphaGo-Zero的訓(xùn)練時(shí)間軸
人類世界隨AlphaGo-Zero的誕生而來,是一片嘩然。
來自果殼網(wǎng)編輯、美國加州伯克利大學(xué)博士生@Ent_evo評論:
拋棄人類經(jīng)驗(yàn)是不是AI進(jìn)步的必由之路呢?人類圍棋棋手積攢了這么多年的歷史是好事兒還是壞事兒呢?阿法狗畢竟還看了3000萬人類棋局,這些棋局對AI圍棋水平到底是什么影響呢?
現(xiàn)在有答案了。阿法狗·零根本就不需要這些東西。人類經(jīng)驗(yàn)是好是壞,對AI而言無關(guān)。完全無關(guān)。
我個(gè)人覺得,這是所有AI末世中最令人恐懼的一個(gè)場景。
你又怎么看?
作為人類棋手,輸棋并不可怕,拿不到第一也是有存在和進(jìn)步的意義,因?yàn)樗械谋荣惗紩?huì)讓人對棋的理解有進(jìn)一步的深層看法,有進(jìn)步。但AI拿第一以后將會(huì)不一樣,因?yàn)槿祟惼迨謱?huì)很悲哀的發(fā)現(xiàn)自己的貢獻(xiàn)根本就對棋藝的發(fā)展影響不大,AI可以不需要你的指導(dǎo)和輔助,它自己就能作出判斷,你的輸贏對它來說都毫無影響,這難道不暗示著人類棋手失去了對圍棋的控制權(quán)么?整個(gè)圍棋的世界相當(dāng)于是坍塌后又重新洗牌了。
類似事情,其實(shí)已經(jīng)發(fā)生過一次。歐洲人曾經(jīng)認(rèn)為自己是世界的中心,萬事萬物圍繞自己的罪惡和救贖而展開;結(jié)果發(fā)現(xiàn),人類只是宇宙里的一粒微塵,這世界上幾乎所有的東西甚至都不會(huì)被我們影響到,更別說在乎我們了。這個(gè)思想沖擊,至今還沒有完全消散。
不擔(dān)心AI會(huì)毀滅人類;因?yàn)樗鼈儧]特別充分的理由這么做。其實(shí)也不擔(dān)心圍棋界,因?yàn)槿祟悤?huì)尋找到新的意義來源。但AI證明自己在越來越多的領(lǐng)域不再需要人,某些領(lǐng)域一旦知道自己不再被需要時(shí),能夠怎么辦?
比如說,金融圈怎么辦?
告訴大家一個(gè)消息,人工智能正在重塑華爾街。
人工智能已不再是對沖基金的專用投資方式,除了文藝復(fù)興、雙西格瑪和元盛等老牌對沖基金,傳統(tǒng)的價(jià)值投資派也開始嘗試AI的新路子。英國老牌資產(chǎn)管理公司Baillie Gifford,就決定聘任一名數(shù)學(xué)家組建團(tuán)隊(duì)設(shè)立AI項(xiàng)目,將AI技術(shù)應(yīng)用于資產(chǎn)管理運(yùn)作。一旦成功,這將是顛覆性的提高管理的能效。
巴美列捷福是一家注重長期投資、擅長選股的資產(chǎn)管理公司,該公司的投資對象包括阿里巴巴、百度以及美國的臉書和亞馬遜。巴美列捷福對于AI技術(shù)的嘗試,代表了對AI浪潮持歡迎態(tài)度的公司的意愿。
實(shí)際上,AI融入到投資管理中已經(jīng)被越來越多海外資產(chǎn)公司接受。據(jù)《養(yǎng)老金與投資》雜志發(fā)起的一項(xiàng)網(wǎng)絡(luò)調(diào)查中,有36.69%的投資者認(rèn)為,在未來3到5年內(nèi),AI就能夠融入資產(chǎn)管理的主要環(huán)節(jié),將成為投資界的主流。
從目前情況看,交易環(huán)節(jié)是AI進(jìn)軍資產(chǎn)管理領(lǐng)域的先行地帶,也是AI被認(rèn)為最有可能突破的領(lǐng)域。美國最大投行JP摩根就雇傭了一批AI專家重塑其全球交易中心。今年年初,JP摩根已經(jīng)在歐洲開始結(jié)合AI執(zhí)行交易,并計(jì)劃在今年年末推廣到亞洲和美洲機(jī)構(gòu)的交易中。
管理著全球最大對沖基金橋水聯(lián)合的達(dá)里奧,雖然已經(jīng)年近古稀,但也希望AI能夠在公司管理方面有所突破。他的目標(biāo)是即使他本人不再管理公司,仍能通過一套自動(dòng)化的管理系統(tǒng)維持公司的正常運(yùn)作,剔除情緒對工作的干擾。
無獨(dú)有偶,金融資格認(rèn)證工作也在不斷提高持證人對大數(shù)據(jù)、人工智能、智能投顧等AI領(lǐng)域知識(shí)的了解程度。今年5月,特許金融分析師(CFA)組織聲明,從2019年開始,考生都需要掌握電腦編程、分析數(shù)據(jù)以及處理機(jī)器交易算法。
在普華永道今年發(fā)布的人工智能分析報(bào)告中指出,一些老牌的量化對沖基金在使用人工智能方面已有很長時(shí)間,而現(xiàn)在的趨勢是整個(gè)資產(chǎn)管理行業(yè)都開始考慮廣泛采用人工智能技術(shù),以更好地提高投資效率,更廣泛地覆蓋資產(chǎn)公司的投研范圍,獲得更多投資機(jī)會(huì)。
選股為價(jià)值突破口
回溯發(fā)現(xiàn)交易機(jī)會(huì)
如今,不管是傳統(tǒng)的價(jià)值投資、還是大型的共同基金公司甚至以交易為主的對沖基金,都在尋找AI帶來的新機(jī)遇,它輔助人工投資決策,同時(shí)具備在數(shù)據(jù)處理、公司以及數(shù)據(jù)建模等方面具有較強(qiáng)的綜合實(shí)力。
巴美列捷福的投資分析師麥克恩利表示,考慮到目前數(shù)據(jù)爆炸性的增長以及計(jì)算機(jī)性能的提升,資產(chǎn)管理公司非常必要充分考慮AI具有的潛力。麥克恩利認(rèn)為,AI的潛力巨大,如果發(fā)現(xiàn)有人力完成耗時(shí)耗力而效果不如機(jī)器的情況,就會(huì)考慮使用AI。
而在擅長的選股環(huán)節(jié)上,巴美列捷福已經(jīng)開始了人工智能的探索。該公司正在測試一套算法體系來判斷某一個(gè)股更適合何種投資風(fēng)格,其國際股票投資小組正在考慮使用這套算法來篩選符合某些特定要求的個(gè)股。
在對沖基金方面,則著重希望AI能夠模擬他們過去的輝煌。被稱為“對沖基金之王”的72點(diǎn)資產(chǎn)管理公司創(chuàng)始人史蒂文·科恩,希望通過AI找到過去成功交易之間的關(guān)聯(lián),幫助他在當(dāng)下市場中復(fù)制這些交易成果。而大型基金管理公司則可以通過中心化的AI處理系統(tǒng),來更加智能化、系統(tǒng)化的處理資產(chǎn)管理、交易和運(yùn)營。
深度學(xué)習(xí)進(jìn)入探索
大公司紛紛大膽嘗試
深度學(xué)習(xí)成為“網(wǎng)紅”,一些大型資產(chǎn)管理公司已經(jīng)意識(shí)到,對大數(shù)據(jù)價(jià)值的挖掘程度決定著在未來競爭格局中的地位,那些更好采用深度學(xué)習(xí)等人工智能方式的資產(chǎn)管理公司,將比傳統(tǒng)公司有機(jī)會(huì)更好地把握金融市場脈動(dòng)。
貝萊德,應(yīng)對變革反應(yīng)最為迅速的大型基金公司之一。在2017年4月,貝萊德加強(qiáng)了公司量化團(tuán)隊(duì)的權(quán)重,以量化投資方式替代部分傳統(tǒng)選股的投資經(jīng)理,此舉在整個(gè)華爾街引起轟動(dòng),有報(bào)道也發(fā)出基金經(jīng)理將被機(jī)器替代的預(yù)測。同樣,英仕曼集團(tuán)旗下的量化研究團(tuán)隊(duì)GLG也正在將深度學(xué)習(xí)應(yīng)用到選股運(yùn)作之中。目前,GLG通過深度學(xué)習(xí)對新聞、社交媒體、市場事件等多方面信息進(jìn)行數(shù)據(jù)分析,從中得出有助于投資決策的信號(hào)。
高盛則是使用一套利用深度學(xué)習(xí)的自然語言處理系統(tǒng)來處置研究報(bào)告,并對報(bào)告的正面或負(fù)面訊息進(jìn)行評分,這個(gè)評分最終會(huì)用來指導(dǎo)有效選股。
文轉(zhuǎn)載 | 中國基金報(bào) 泰勒 姚波
聯(lián)系客服