AlphaGO與李世石一戰(zhàn)成名,其背后的谷歌DeepMind人工智能團(tuán)隊(duì)也走到世人面前。據(jù)外媒報道,DeepMind的最新AI已經(jīng)掌握了超高難度的雅達(dá)利游戲《Montezuma’s revenge》,表現(xiàn)讓人咋舌。
據(jù)了解,在AlphaGO之前,DeepMind都是用雅達(dá)利的游戲來自測AI。老版本的AI在《Montezuma’s revenge》中表現(xiàn)一般,但經(jīng)過長時間的學(xué)習(xí)、試錯之后,新版本的AI已經(jīng)掌握了該游戲的大師級技巧。
現(xiàn)在,它可以像人類一樣,躲避、拾取要是,并努力取得更高分。而且整個學(xué)習(xí)過程沒有通過任何捷徑,完全是AI自學(xué)。
此外,DeepMind還為新版AI增加了一種“好奇心”激勵機(jī)制,趨勢AI獲得更高分,并因此獲得回報。
據(jù)悉,老版本的AI在游戲中僅僅探索了2間游戲房間,而新版本的AI由于新的驅(qū)動機(jī)制,探索了15間游戲房間。