免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
人工智能“阿爾法狗”告訴你學(xué)霸是怎樣煉成的




20171019日凌晨,谷歌下屬公司 Deepmind 在《自然》(Nature)刊文,報告了新版、也是終版圍棋程序AlphaGoZero,可以從空白狀態(tài)學(xué)起,在無任何人類輸入的條件下,迅速自學(xué)圍棋,并已經(jīng)以100:0的戰(zhàn)績擊敗老版 AlphaGo,當(dāng)然,也能夠完勝任何人類對手。

 

柯潔,這位世界圍棋史上最年輕的四冠王,此前輸給阿爾法狗的世界頂級棋手在19號凌晨發(fā)了一條微博,“一個純凈、純粹自我學(xué)習(xí)的Alphago是最強的...對于alphago的自我進步來講...人類太多余了?!?/span>



 

當(dāng)阿爾法狗第一次戰(zhàn)勝人類圍棋冠軍的時候,一個新的時代來臨了,雖然那時它還要大量的依賴人類已有的圍棋經(jīng)驗。

 

這次,又一個時代來臨了,新的人工智能系統(tǒng)可以從零學(xué)起,超越人類。

 

這是一個所有的人和公司,都容易掉隊的時代。

 

讓我們再回顧一下阿爾法狗的進化歷程:

 

2016127日,國際頂尖期刊《自然》封面文章報道,谷歌研究者開發(fā)的名為“阿爾法圍棋”(AlphaGo)的人工智能機器人,以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。

 

201639日,韓國首爾,在谷歌發(fā)起的“人機大戰(zhàn)”第一局中,手握14個世界冠軍頭銜的韓國圍棋天王李世石轟然倒下,最終AlphaGo41贏得這場比賽。

 

2017年年初,AlphaGo Master創(chuàng)造了連續(xù)60場對人類不敗的恐怖戰(zhàn)績,因此圍棋界都希望能夠有一名大神站出來打敗AlphaGo,以證明人類的實力。

 

2017523-27日,AlphaGo將與圍棋世界冠軍柯潔等為代表的中國頂尖棋手進行圍棋對弈。最終柯潔負(fù)于AlphaGo

 

20171019日,DeepMind今天發(fā)布新版本AlphaGo程序,經(jīng)過三天的訓(xùn)練,該系統(tǒng)能夠擊敗AlphaGo Lee,后者是去年擊敗了韓國選手李世石,勝率是1000。經(jīng)過大約40天的訓(xùn)練后,AlphaGo Zero完勝AlphaGo Master。

 



如果說,此前的阿爾狗戰(zhàn)勝李世石跟絕大多數(shù)人沒什么直接關(guān)系,那么,這次阿法狗的新進化跟每個人都有關(guān)系。不是未來有關(guān)系,而是現(xiàn)在就有關(guān)。

 

我在北大讀博士期間陰差陽錯機緣巧合,做過一個智能“專家系統(tǒng)”項目。專家系統(tǒng)是人工智能的一個領(lǐng)域。這兩天看到阿爾法狗的新聞,忍不住聊聊。 


 

1. 狗大師的學(xué)霸秘訣

 

戰(zhàn)勝柯潔的阿爾法狗系統(tǒng)稱為AlphaGo Master,也就是“阿爾法狗大師”,簡稱狗大師。

 

DeepMind公司給這款人工智能起的名字一點兒都沒夸張,因為,最終結(jié)果是狗大師把人類圍棋大師打的一敗涂地。

 

拋開技術(shù)細(xì)節(jié),狗大師的秘訣其實非常簡單。

 

第一, 精準(zhǔn)的讀懂棋譜。


讀懂棋譜首先意味著知道基本的游戲規(guī)則,比如在什么情況下一個子會被吃掉(無論是象棋還是圍棋),比如什么算輸,什么算贏。


顯然,這一切都能用數(shù)學(xué)表達,棋盤上的所有東西都是可以數(shù)字化的。


在這個階段,阿爾狗不需要人類任何經(jīng)驗,只要懂得已經(jīng)訂好的規(guī)則。


讀懂棋譜的更進一步是得讀懂以往的棋局。


實際上它不需要讀懂,它只需要把以往的棋局都存儲起來方便調(diào)用就行了。而這對于它來說非常簡單,因為,任何棋局都是可以數(shù)字化的。


所以,狗大師的第一步就是把規(guī)則和以往的棋局?jǐn)?shù)字化。


第二,  會決策。

 

簡單的說,狗大師得知道,好歹。例如,在同樣的情況下,哪一招更高明。這一點至關(guān)重要,但是對于阿爾狗來說,并不困難。因為一切都是計算,并且最終變成了加減法的計算。

 

一旦狗大師從以往的棋局中看懂了同樣情境下哪一招更高明,那么它就厲害了。

 

比如,柯潔在棋盤上放了一顆子。狗大師在以往的棋局里搜索,同樣的情境下,下那個子勝算最大。把最大的找出來就可以了。

 

所以,說到底,這第二步就是會模仿就行了。

 

狗大師根本不需要自己想出什么妙招,它需要做的就是拷貝以往人類大師的棋招。在對弈的每一時刻,它只需要找到最有效的干掉對方的招,拿出來用就行了。

 

實際情形是阿爾法狗有兩個復(fù)雜的決策系統(tǒng):策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)。策略網(wǎng)絡(luò)負(fù)責(zé)預(yù)測對手的下一個子放在哪兒,而價值網(wǎng)絡(luò)負(fù)責(zé)判斷相應(yīng)對手的招數(shù)自己怎么下才能贏。兩者都需要計算大量的可能性,都需要找出最可能的選擇。




 

第三,  大量模仿

 

顯然,狗大師能夠找到最有效的干掉對方的招,取決于它的“腦子”里有多少以往的棋局,取決于它到底有多少可供選擇的高招。

 

顯然,它學(xué)習(xí)的量越大,所學(xué)習(xí)的棋譜質(zhì)量越高,它就越厲害。

 

顯然,在這一點上,計算機是具有絕對優(yōu)勢的。人類能夠記住多少棋譜還沒有統(tǒng)計過,但肯定是有上限的,而計算機的存儲量沒有上限!

 

當(dāng)然,下棋是要有時間限制的,落子的速度很重要,而對于計算機而言,這個速度顯然是可以無限提升的。

 

起初戰(zhàn)勝李世石和柯潔的阿爾狗系統(tǒng)是依賴人類經(jīng)驗的。不但如此,它要學(xué)習(xí)巨量的曾經(jīng)有過的棋譜,做巨大量的計算,在大量可能性中最大概率的預(yù)測對手的下一步,并找出最有可能致勝的招數(shù)。



 

這就相當(dāng)于一個人要學(xué)一門知識和技能,需要閱讀、鉆研、模仿大量的參考書。這個段位學(xué)習(xí)者的水平高下,取決于研習(xí)速度的快慢、和研習(xí)量的大小。

 

比如面對同樣的知識領(lǐng)域,研習(xí)過100本書/做過10萬道題目的人,輕松秒殺另外一個只研習(xí)過一本書/做了100道題目的人。當(dāng)然,假設(shè)二者對學(xué)習(xí)都是一樣認(rèn)真的。

 

說幾個具體的例子。

 

我的一位學(xué)弟叫童哲,物理競賽保送到北大。他高中的時候,做過40本物理參考書,包含高考級和競賽級的。每本1000題,總共4萬題左右。

 

你問他憑什么保送北大?憑這個。

 

我的兄弟大威,也是同班同學(xué),從英語30多分到全班第一,用了兩個月的時間,總共做了1萬多道英語題目(包含詳細(xì)的筆記)。他后來上了清華。

 

你問他憑什么上清華?憑這個。

 

比如我,高三平均每天做了20頁學(xué)習(xí)筆記,一年按320天計算,總計6400頁筆記。我憑什么一年逆襲進北大?很容易回答。

 

所以,對于許多叫囂“題海戰(zhàn)術(shù)不管用”的人來說,不是別有用心,就是……(說出來很難聽,不說了,你懂得)。

 

當(dāng)一個人沒有什么高級的學(xué)習(xí)方法之前,題海戰(zhàn)術(shù)就是方法。

 

無論在什么領(lǐng)域,當(dāng)你想不出什么妙招的時候,用“量”壓倒對方,就是妙招。

 

阿法狗此前戰(zhàn)勝人類冠軍就是這么干的!它的學(xué)習(xí)量可以遠(yuǎn)遠(yuǎn)超過任何人類,它的學(xué)習(xí)速度永遠(yuǎn)可以更快,而且它目標(biāo)明確,永不疲倦,不帶有任何情緒!

 

中國古人形容一個人的高境界有個說法,“心空似水,意冷于冰,神靜如岳,氣行如泉”。

 

顯然,狗大師做到了。人類在愁眉苦臉,它在夯吃夯吃的干。由于計算機技術(shù)的發(fā)展,它連夯吃夯吃的聲音的都沒有了,而是不動聲色的干掉了一個個人類大師。

 

所以,對于絕大多數(shù)行業(yè)和領(lǐng)域,尤其是對于有標(biāo)準(zhǔn)化考試的領(lǐng)域,如果你目標(biāo)明確,能夠定量的、精準(zhǔn)的、大量的模仿,不需要有什么情緒,你就可以不動聲色、悄無聲息的干掉絕大大多數(shù)對手!

 

這就是學(xué)霸的秘密。

 

2. 狗小零的學(xué)神秘訣

 

AlphaGo Zero它的獨門秘籍,是把自己當(dāng)做老師,從一張白紙開始,零基礎(chǔ)學(xué)習(xí),在短短3天內(nèi),成為頂級高手。

 

AlphaGo在兩年內(nèi)達到的成績令人震驚?,F(xiàn)在,AlphaGo Zero是我們最強版本,它提升了很多。Zero提高了計算效率,并且沒有使用到任何人類圍棋數(shù)據(jù),”AlphaGo之父、DeepMind聯(lián)合創(chuàng)始人兼CEO 戴密斯·哈薩比斯(Demis Hassabis)說。

 

AlphaGo此前的版本,結(jié)合了數(shù)百萬人類圍棋專家的棋譜,以及強化學(xué)習(xí)的監(jiān)督學(xué)習(xí)進行了自我訓(xùn)練。在戰(zhàn)勝人類圍棋職業(yè)高手之前,它經(jīng)過了好幾個月的訓(xùn)練,依靠的是多臺機器和48TPU(谷歌專為加速深層神經(jīng)網(wǎng)絡(luò)運算能力而研發(fā)的芯片)。

 

AlphaGo Zero的能力則在這個基礎(chǔ)上有了質(zhì)的提升。最大的區(qū)別是,它不再需要人類數(shù)據(jù)。也就是說,它一開始就沒有接觸過人類棋譜。研發(fā)團隊只是讓它自由隨意地在棋盤上下棋,然后進行自我博弈。值得一提的是,AlphaGoZero還只用到了一臺機器和4TPU,極大地節(jié)省了資源。

 

“這些技術(shù)細(xì)節(jié)強于此前版本的原因是,我們不再受到人類知識的限制,它可以向圍棋領(lǐng)域里最高的選手——AlphaGo自身學(xué)習(xí)?!?/span> AlphaGo團隊負(fù)責(zé)人大衛(wèi)·席爾瓦(Dave Sliver)說。

 

據(jù)大衛(wèi)·席爾瓦介紹,AlphaGo Zero使用新的強化學(xué)習(xí)方法,讓自己變成了老師。系統(tǒng)一開始甚至并不知道什么是圍棋,只是從算法開始,進行了自我對弈。

 

隨著自我博弈的增加,系統(tǒng)提升預(yù)測下一步的能力,最終贏得比賽。更為厲害的是,隨著訓(xùn)練的深入,DeepMind團隊發(fā)現(xiàn),AlphaGo Zero還獨立發(fā)現(xiàn)了游戲規(guī)則,并走出了新策略,為圍棋這項古老游戲帶來了新的見解。



 

對于DeepMind來說,圍棋并不是AlphaGo的終極奧義,他們的目標(biāo)始終是要利用AlphaGo打造通用的、探索宇宙的終極工具。

 

顯然,如果沒有意外,未來將出現(xiàn)一個探索宇宙的人工智能大軍!而對于人類來說,還有什么比探索宇宙更具根本性的事情呢?因為,宇宙就是一切。

 

阿爾法狗新進化最殘酷的地方是,它已經(jīng)不再需要人類以往的圍棋經(jīng)驗!

 

我們該怎樣理解這個事實?


阿爾法狗的最新超級版稱之為AlphaGo Zero,也就是“阿爾法狗零號”,簡稱“狗小零”。

 

顯然,狗小零比狗大師厲害太多。厲害在哪里呢?負(fù)責(zé)人說,他們搞出來了一個“自我學(xué)習(xí)算法”。它在自己跟自己下棋的過程中,不斷學(xué)習(xí)進化。這聽起來像是周伯通的雙手互博。打輸了的那只手,就要想辦法贏了另外一只手,于是,兩只手越來越厲害。如此下去,自然越來越容易打敗對手。

 

自我學(xué)習(xí)算法的實質(zhì)是什么?舉一個大家都知道的例子。

 

比如做數(shù)學(xué)題,有兩種思維套路。

 

一種做法是參考書做法。遇到一道題目,首先想自己曾經(jīng)做過的參考書上的類似題目。如果類型一致,一步步套上去,就能搞定。哪怕題目的具體數(shù)字不一樣,都沒關(guān)系。比如這套題是3個蘋果,參考書上的類似題目是4個橙子。

 

第二種做法是從基本概念、基本定義、基本運算法則出發(fā),甚至是從歸納出來的解題套路(也是算法)出發(fā),無需別人的經(jīng)驗,直接解題!

 

顯然第二種比第一種更厲害,因為不但知其然而且還知其所以然。第二種類型的人,更有深度,而且學(xué)習(xí)方法的可擴展性強,很容易把一門知識的成功移植到另外一門知識。

 

阿爾法零號就是第二種類型,也就是所謂的從“第一性原理”出發(fā)解決問題。

 

那么這些原始的“自我學(xué)習(xí)算法”是誰設(shè)計的呢?是知識工程師!

 

搞出“自我學(xué)習(xí)算法”是知識密集型的工作。阿爾法狗團隊是全世界最聰明的大腦。他們抽象出學(xué)習(xí)策略,然后將它們轉(zhuǎn)化成算法。



 

事實上,人類的頂尖高手都有自己的學(xué)習(xí)策略、致勝策略,但是與計算機相比,個體的人進化速度實在太慢了。

 

再舉個例子。

 

比如橋水基金是世界上規(guī)模最大的對沖基金,管理著好幾千億美元的資金。橋水的創(chuàng)始人雷.達里奧(Ray Dalio)總結(jié)出了他的解決問題的套路。如下,分為5步。

 

第一,有明確的目標(biāo)。

第二,識別問題,這些問題不能容忍,因為它們阻礙你實現(xiàn)目標(biāo)。

第三,準(zhǔn)確診斷問題,找到原因。

第四,制定計劃,圍繞你的問題和目標(biāo)而明確地制定任務(wù)。

第五,執(zhí)行這些計劃,即完成這些任務(wù)。

 


達里奧說,“為了成功,你需要做好所有這些步驟”。他的意思是說,做不好這5步中的任何一步,你都很難成功,甚至根本不可能成功。如果成功意味著達成目標(biāo)的話。

 

如果你曾深度的思考過你切身經(jīng)歷過的事情,尤其是你曾經(jīng)取得成功的經(jīng)歷,你會發(fā)現(xiàn):

 

只要你持續(xù)認(rèn)真的做到如上5步,那么你就一定會把一件事情做的越來越好!

 

這就是所謂“自我學(xué)習(xí)的算法”。一個人如果這么去做,他就能從自己的經(jīng)驗中學(xué)習(xí),把一件事情越做越好。

 

橋水基金之所以厲害,是因為他的創(chuàng)始人Ray Dalio開發(fā)出了“狗零號”的“自我學(xué)習(xí)算法”,他本人和他的公司都在運行這個系統(tǒng)。

 

如果反思自己的經(jīng)歷,你會發(fā)現(xiàn),你思維清晰的按照這5個步驟做的經(jīng)歷其實并不多。

 

反思周圍人的經(jīng)歷,你會發(fā)現(xiàn),人們思維清晰的按照這個5個步驟做的人也不多。

 

這就是很少的人能夠高效達成目標(biāo)的原因。

 

但是,人們?yōu)槭裁春茈y實施上述5個步驟呢?

 

再舉一個例子。

 

例如我高考的時候所做的筆記,不是一般的筆記,而是稱之為進步本。

 

這個技術(shù)有三個步驟:

第一,  針對當(dāng)天所學(xué),把做錯之后改正的題目,不會做的弄懂的題目,當(dāng)天新學(xué)到的內(nèi)容,記錄到本子上;


第二,  隨時隨地的復(fù)習(xí)已經(jīng)記錄在本子上的內(nèi)容,如果是題目需要重做,如果是知識需要在大腦中復(fù)現(xiàn);


第三,  做測試題(模擬題),檢驗自己的進步,把做錯的不會做的題目弄懂記錄在進步本上。

 

我寫了一系列的長文介紹這個方法的來龍去脈,以及產(chǎn)生的效果。

事實上這個方法對于一切標(biāo)準(zhǔn)化考試都有效,是可以快速拿高分的。


有些人的成績突飛猛進,當(dāng)天就有效。

 

我的史詩般的高考逆襲路【第2版】

初三少年3周自學(xué)高中三年數(shù)學(xué),高考真題135

兩天學(xué)完1冊高中生物拿到90分是怎樣的體驗


而有些人則沒有什么效果。

 

所有上述現(xiàn)象原因都是復(fù)雜的,但也可以歸結(jié)為一個原因:絕大多數(shù)人都不知道思維需要編程!

 

各行各業(yè)很厲害的人,都深知思維的法則。

 

例如剛剛提到的Ray Dalio。例如芒格稱巴菲特為“學(xué)習(xí)機器”,他自己意識一架超級“學(xué)習(xí)機器”。例如硅谷鋼鐵俠馬斯克自己成功的秘密在于善于從“第一性原理”思考。我可以說說的更具體一些。

 

比如,股神巴菲特在給格雷厄姆的《證券分析》(被成為投資圣經(jīng))寫的序言中寫到,他“讀遍了讀書館里每一本有關(guān)股票交易的書”。

 

這就是狗大師的秘訣!

 

巴菲特在給格雷厄姆的另外一本名著《聰明的投資者》寫的序言中寫道:


 1950年年初,我閱讀了本書的第一版,那年我19歲。當(dāng)時,我認(rèn)為它是有史以來投資論著中最杰出的一本。時至今日,我仍然認(rèn)為如此。

 

要想在一生中獲得投資成功,并不需要頂級的智商、超凡的商業(yè)頭腦或內(nèi)幕消息,而是需要一個穩(wěn)妥的知識體系作為決策基礎(chǔ),并且有能力控制自己的情緒,使其不會對這種體系造成侵蝕。

 

如果你遵從格雷厄姆所倡導(dǎo)的行為和商業(yè)準(zhǔn)則,那么,你將會獲得不錯的投資結(jié)果。這種結(jié)果所反映出的更多成就,要超出你的想象。

 

巴菲特推崇、深究并遵從的格雷厄姆的“商業(yè)準(zhǔn)則”,本質(zhì)上就是算法,就是思維程序!

 

說了半天,要成為任何領(lǐng)域的高手,既需要前人的經(jīng)驗、又需要自己總結(jié)套路。這背后的關(guān)鍵是思維編程!


誰都知道,人是有情緒、有情感的。


普遍的人生錯位是該動情的時候不動情,不該動情的時候亂動情。


人生的高級的模式是,用情感提供動力,用精準(zhǔn)無情的思維編程來實現(xiàn)自己的目標(biāo)。


無論阿爾法狗再厲害,人工智能再怎么厲害,人生永恒不變的主題是:勇猛精進!


雷打不動的勇猛精進!


在一切的如意與不如意之中,勇猛精進!

 



借阿爾法狗進化事件,這里播一個廣告

 

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
樹澤:假如讓阿爾法狗狗來做A股
如何成為飯桌上的人工智能專家?你需要掌握10個燒腦知識點
哪些職業(yè)會被人工智能取代?行政、服務(wù)業(yè)等最危險
AlphaGo深度揭秘:走近戰(zhàn)勝人類的這條“狗”!
【柯潔烏鎮(zhèn)終敗】全盤回顧人類最后希望與圍棋上帝終極PK
李嘉誠請AlphaGo之父“上課”,聽到激動處數(shù)度站起,兩創(chuàng)始人連忙陪站(圖)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服