国语自产偷拍精品视频偷最新 ,深夜福利日韩,视频二区素人欧美日韩

柯潔應(yīng)決勝前半盤戰(zhàn)AlphaGo要有自信 | 陳經(jīng)

2017-05-22 陳經(jīng) 風(fēng)云之聲

風(fēng)云之聲

微信號 fyvoice

功能介紹科技與戰(zhàn)略風(fēng)云學(xué)會，科學(xué)素養(yǎng)，家國情懷，橫跨文理，縱覽風(fēng)云?！吨芤住の难浴罚骸熬盼逶唬猴w龍在天，利見大人，何謂也？子曰，同聲相應(yīng)，同氣相求。水流濕，火就燥。云從龍，風(fēng)從虎。圣人作而萬物覩?！?/span>

提升思維層次

解讀科學(xué)，洞察本質(zhì)

戳穿忽悠，粉碎謠言

導(dǎo)讀

柯潔與AlphaGo的三番棋即將在2017年5月23日上午10:30開戰(zhàn)。2017年1月28日，新浪棋牌就本次比賽在深圳對陳經(jīng)進(jìn)行了視頻專訪。在多次傳出風(fēng)聲之后，二次人機大戰(zhàn)終于真的要開始了。柯潔雖然處于明顯下風(fēng)，但并非毫無機會。

陳經(jīng)

2017年4月，谷歌DeepMind宣布AlphaGo重出江湖，將在5月在中國烏鎮(zhèn)與現(xiàn)世界圍棋第一人柯潔展開三番棋較量。新浪就此相關(guān)話題采訪了人工智能專家陳經(jīng)（采訪于早些時候）。

　　新浪：用幾句話談?wù)勀鷮宓睦斫?/span>

　　陳經(jīng)：因為我是搞技術(shù)的，所以圍棋在我眼里是所有游戲里最復(fù)雜的一種。我說的游戲是“完全信息博弈”游戲的一種，比如中國象棋、國際象棋，子力都攤開了，大家都打明牌，但是它又很復(fù)雜。這類游戲里圍棋是最復(fù)雜的一個。

　　新浪：請您談?wù)勀^看AlphaGo和李世石的人機大戰(zhàn)以及master的這60盤棋之后的感受？

　　陳經(jīng)：既非常震驚，又非常高興。因為我長久以來對圍棋人工智能的發(fā)展很關(guān)注之前有幾次突破，比如日本的DeepZen能夠戰(zhàn)勝像我這樣的業(yè)余棋手了，但能夠戰(zhàn)勝職業(yè)棋手還是難以想象的，以至于我們期待一個程序什么時候能夠戰(zhàn)勝人類的頂尖高手，但忽然之間，好像AlphaGo已經(jīng)實現(xiàn)了戰(zhàn)勝人類最頂尖棋手的目標(biāo)。這個進(jìn)度還是超乎了我們的預(yù)期。所以我一方面對計算機算法技術(shù)的進(jìn)步感到震驚，另一方面，有個人工智能能夠領(lǐng)先人類棋手好像一先，有點科幻色彩，又能夠看到這種棋譜，令人很興奮。因為職業(yè)高手的棋譜有的時候就會顯得千篇一律，但是AlphaGo突破了以前的固有思維，不走尋常路，能夠讓職業(yè)棋手的技藝有飛躍的提升。

　　新浪：您能否直觀的從技術(shù)的角度讓我們了解AlphaGo在第一次人機大戰(zhàn)中谷歌公司使用的資源有多么龐大？

　　陳經(jīng)：第一次人機大戰(zhàn)時候，AlphaGo是用了分布式版本的一個機器，在論文里提到有一個單機版，單機版是一個小規(guī)模的機器，它有48個CPU，以及8個GPU。

　　分布式版有1202個CPU，GPU有176個，比單機版要多大約幾十倍，從規(guī)模上來說還不是很驚人。真正規(guī)模比較大的是AlphaGo平時用于訓(xùn)練的機器，據(jù)我們估計應(yīng)該是在10萬個服務(wù)器以上。因為它要生成很多棋局，所以訓(xùn)練用的機器CPU以及GPU規(guī)模要大得多。但是下棋的時候用分布式的機器和單機版其實棋力相差并不是太大。我們得到的數(shù)據(jù)是AlphaGo單機版對分布式版也有百分之三十的勝率。

　　新浪：從技術(shù)的角度怎么看待master快棋的60連勝？

　　陳經(jīng)：我們可以從兩方面看這個問題。一方面是從master對人類碾壓性的60勝可以看出它是遠(yuǎn)高于人類水平的，這是肯定的。另一方面又是快棋，我們認(rèn)為應(yīng)該是放大了人類的弱點。我們估計master快棋和慢棋基本實力不會差很多，所以是一個具有完全實力的master對的是只有20、30秒的時間思考的人類，所以人類實力是打折扣了，而人類對AlphaGo產(chǎn)生恐懼情緒的話就更容易出現(xiàn)錯著。應(yīng)該說人類的發(fā)揮并不足以說明這是一個完全的測試。但有些高手覺得快棋和慢棋好像也差不多，給他更多時間他也想不出更好的招法來，或者有些高手說快棋和慢棋差一先，這是比較正常的估計。如果兩個差距在一先的高手對局60局取得60全勝也是不太可能的，所以即使人類快棋打折扣我想master和人類的差距應(yīng)該也在一先以上。

　　新浪：請您來介紹一下圍棋的AI與象棋、國際象棋AI有什么區(qū)別？

　　陳經(jīng)：中國象棋和國際象棋的AI至少在10年以前用傳統(tǒng)的搜索技術(shù)就已經(jīng)能打敗人類。當(dāng)然它產(chǎn)生轟動效應(yīng)該是1997年深藍(lán)與卡斯帕羅夫在國際象棋領(lǐng)域的突破。那個時候在傳統(tǒng)方面的搜索技術(shù)人們還是比較容易理解的。但是到圍棋網(wǎng)面程序就不一樣了。主要是引入了一個“機器學(xué)習(xí)”的東西，下棋和評估局面的過程都不是用人工代碼寫的，而是用“多層神經(jīng)網(wǎng)絡(luò)”來做計算的?！岸鄬由窠?jīng)網(wǎng)絡(luò)”在中國象棋和國際象棋代碼里是沒有的。而且AlphaGo用這兩個神經(jīng)網(wǎng)絡(luò)的系數(shù)是非常多的，多達(dá)幾百兆。AlphaGo更像一個在人類督促下自我訓(xùn)練慢慢成為高手的人工智能。之前中國象棋和國際象棋的AI并沒有自我對局的訓(xùn)練過程。關(guān)于AlphaGo的論文里提到一種技術(shù)叫“強化學(xué)習(xí)”技術(shù)。通過自己對弈的過程修改神經(jīng)網(wǎng)絡(luò)中的數(shù)據(jù)，棋力就會一點點的上升。這是一個革命性的技術(shù)。

　　新浪：那您覺得目前的AlphaGo還有什么弱點？

　　陳經(jīng)：以圍棋的復(fù)雜度來說，不可能就說master已經(jīng)達(dá)到了完美的程度。Master的60盤雖然沒輸，但中間有沒有吃一點虧也還是可以找的到的。比如一開始和孟泰齡下的一局可能被孟泰齡的手筋擊中了，導(dǎo)致優(yōu)勢縮水。所以我們希望能夠繼續(xù)強化AlphaGo，能夠在棋藝上探索出更深層的東西。它是利用一種算法對局面進(jìn)行評估，它的論證肯定不是完善的，而是用兩個幾百兆的神經(jīng)網(wǎng)絡(luò)計算?？隙ú粫耆咏胬恚?dāng)然有些情況下它的理解比人要深，我們也不排除有些時候人的理解要比AlphaGo深。所以人一定要有一個平穩(wěn)的心態(tài)，在局面判斷上和AlphaGo進(jìn)行一個正面的較量。這次柯潔和AlphaGo的挑戰(zhàn)用時還沒有商定，我建議用比較長的時間比為好。AlphaGo的用時其實是無所謂的，要求時間完全是為了人類。從棋藝的角度時間長也可以讓觀眾看到更精彩的對局。柯潔比較容易犯隨手的錯誤，經(jīng)常在前半盤領(lǐng)先，但后面就會開始下隨手棋，把大好的局面葬送了出去。如果和AlphaGo下棋發(fā)生下隨手棋這種情況就太可惜了，所以一定要有充足時間來杜絕這種情況。

　　新浪：請您介紹一下圍棋這種完全信息博弈和麻將、德?lián)浞峭耆畔⒉┺牡娜斯ぶ悄軈^(qū)別？

　　陳經(jīng)：完全信息博弈就是所有信息都是攤開的，不完全信息博弈是你不知道對手的信息，所以完全信息博弈的結(jié)果一定是確定的，推理的結(jié)果是一定勝或者負(fù)。在非完全信息博弈里，比如德州撲克、橋牌，AI的思維不是這局我一定要勝，而是在一萬手牌里會有一次獲得較高的勝利，所以思維方式是很不一樣的。非完全信息博弈就要引入概率論情況下的搜索技術(shù)。一般認(rèn)為非完全信息博弈的難度是高于完全信息博弈的。人類的優(yōu)勢更多在于信息不完全的情況下。

　　新浪：您覺得AlphaGo對人工智能發(fā)展的意義是什么？

　　陳經(jīng)：AlphaGo是人工智能歷史上意義最大的幾件事之一。有很多次人工智能都陷入了發(fā)展瓶頸，但這次AlphaGo在一個看似很困難的領(lǐng)域打敗了人類，似乎挑戰(zhàn)了人類的信心，從算法本身來說AlphaGo也是很有意義的，引入了“強化學(xué)習(xí)”的技術(shù)，等于一方面它學(xué)習(xí)了人類的棋譜，另一方面它還可以自我對局進(jìn)行提升。這樣一個自我學(xué)習(xí)的框架是人類不能達(dá)到的。人類受身理條件的限制不可能一直下棋，而且人類還可能出現(xiàn)水平下降的情況，但是機器不會，它是穩(wěn)定提升的。AlphaGo開發(fā)出的“訓(xùn)練流水線”，對人工智能的意義是重大的，之前的人工智能研發(fā)都是小規(guī)模。這次是十幾萬臺服務(wù)器產(chǎn)生海量數(shù)據(jù)，這樣一種理念對整個人工智能界都是一個沖擊。

　　新浪：AlphaGo價值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)相配合的這種方式，是否可以應(yīng)該用到更多的領(lǐng)域？

　　陳經(jīng)：AlphaGo下棋首先像人類一樣產(chǎn)生一個直覺，選擇最有價值的幾個選點。另外還對局面進(jìn)行判斷，對不同的選點判斷結(jié)果，和人類棋手的思維方式有一定的相似性。如果能將這個技術(shù)應(yīng)用到其他比如醫(yī)療領(lǐng)域，讓機器吸收醫(yī)生的經(jīng)驗和思維，然后在一些關(guān)鍵的節(jié)點使用策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)做出選擇和判斷。研究AlphaGo更大的意義是為了在醫(yī)療程序上取得突破，實際上他們團(tuán)隊已經(jīng)有很多人轉(zhuǎn)去做醫(yī)療程序了。AlphaGo在策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)已經(jīng)得到驗證的訓(xùn)練方法是很有價值的，已經(jīng)在醫(yī)療程序上有所應(yīng)用了。谷歌可能會投入更多精力到其他領(lǐng)域。

　　新浪：您覺得從master現(xiàn)身到挑戰(zhàn)柯潔這段時間能否再次完成實力上的飛躍或者說算法上的升級？

　　陳經(jīng)：我覺得存在兩種可能性，一種從它本身的架構(gòu)來說，它每天都在自我對局，這個提升肯定不會停止，但這個過程能否使AlphaGo的棋力有本質(zhì)的提升是不確定的，因為任何自我提升都是有一個上限的，它是有一個曲線的過程，一開始進(jìn)步很快，后面會趨于平緩，如果AlphaGo的水平已經(jīng)到了一定程度的話，給它再多的時間也很難有所提升。還有另外一種可能性，引入一種新的技術(shù)，重新開始新的訓(xùn)練，研發(fā)產(chǎn)生算法實力的本質(zhì)飛躍也是可能的。

　　新浪：有一種觀點說AlphaGo的代碼在人工智能領(lǐng)域并不算大工程，自動駕駛領(lǐng)域需要的代碼很多，比AlphaGo的代碼要多很多，這種觀點您怎么看？

　　陳經(jīng)：這種觀點是完全正確的，AlphaGo應(yīng)該比之前的圍棋程序代碼量還要少，但是AlphaGo的神經(jīng)網(wǎng)絡(luò)的系數(shù)特別多，高達(dá)幾百兆，人寫代碼不可能達(dá)到這么多。AlphaGo的棋力秘密是隱藏在它的兩個神經(jīng)網(wǎng)絡(luò)里，不可能通過代碼得到，而是通過十幾萬臺服務(wù)器將數(shù)據(jù)灌注到神經(jīng)網(wǎng)絡(luò)的系數(shù)里，所以它不是一個簡單的工程。

　　新浪：您如何看待AlphaGo與柯潔的這個慢棋對決？

　　陳經(jīng)：這次AlphaGo和之前與李世石對局不同，之前并沒有公布太多的棋譜。這次和柯潔對戰(zhàn)有60局高質(zhì)量的棋譜，而且取得了60比0的勝利，應(yīng)該完全展現(xiàn)了它的實力。人類對柯潔的預(yù)期也是比較一致的：柯潔如果能取得一局的勝利應(yīng)該已經(jīng)算很大的一個成功了。如果柯潔全負(fù)也不是一件很震驚的事情。之前是AlphaGo挑戰(zhàn)李世石，甚至有人說一盤都不能讓AlphaGo贏，而這次是柯潔如果能夠取勝一盤就表明AlphaGo還存在缺陷，讓AlphaGo繼續(xù)提升，到最后和國際象棋一樣宣稱不可能輸給人類了。當(dāng)然我相信現(xiàn)在還沒達(dá)到這種程度?？聺崒lphaGo能夠有1到2局勝利對職業(yè)棋手來說是件很歡欣鼓舞的事情。

　　新浪：既然現(xiàn)在AlphaGo已經(jīng)如此強大，為什么還要和柯潔對戰(zhàn)？

　　陳經(jīng)：首先谷歌公司二老板個人對圍棋是非常感興趣的，包括AlphaGo和李世石對戰(zhàn)的時候還親自到了韓國。即使不考慮勝負(fù)，從棋藝本身來說也是非常有價值的。只有在慢棋這種比較公平的測試情況下才能夠不僅讓職業(yè)棋手信服，也讓開發(fā)團(tuán)隊比較有信心。谷歌團(tuán)隊在這方面還是比較保守的和謙虛的，在沒有充足的證據(jù)時不會做出夸張的宣稱。Master60連勝后他們只是說一起和職業(yè)棋手探討圍棋中美妙的部分。

　　新浪：請您給柯潔一些建議

　　陳經(jīng)：首先柯潔的目標(biāo)應(yīng)該是對AlphaGo取得一局勝利就成功了，他應(yīng)該作為一個完全挑戰(zhàn)的心態(tài)準(zhǔn)備這次比賽，這有利于他實力的發(fā)揮。同時他必須對AlphaGo下棋的過程有了解，如果不知道對手是怎么做出決策的就會感到慌張，所以一定要把AlphaGo看成一個可以理解的對手。和懂算法的人進(jìn)行交流，理解AlphaGo的思維。第二，如果AlphaGo在中盤取得優(yōu)勢，不建議柯潔糾結(jié)于如何收官子，應(yīng)該把決勝點放在前半盤，當(dāng)然后半盤要頂住，不能將優(yōu)勢葬送?？聺崙?yīng)該主動把局面倒向自己擅長的部分，應(yīng)該建立信心，對一些局面自己估算比AlphaGo要準(zhǔn)確的時候，要相信自己確實取得了優(yōu)勢。（文玄）

背景簡介：本文作者筆名陳經(jīng)，香港科技大學(xué)計算機科學(xué)碩士，科技與戰(zhàn)略風(fēng)云學(xué)會會員，微博@風(fēng)云學(xué)會陳經(jīng)，文章2017年5月17日發(fā)表于新浪微博（https://sports.sina.com.cn/go/2017-05-17/doc-ifyfeius8031558.shtml）。
責(zé)任編輯：孫遠(yuǎn)

閱讀

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

柯潔應(yīng)決勝前半盤 戰(zhàn)AlphaGo要有自信 | 陳經(jīng)

柯潔應(yīng)決勝前半盤戰(zhàn)AlphaGo要有自信 | 陳經(jīng)