2016 年 3 月,“李世石對 AlphaGo”人機大戰(zhàn)讓全世界都知道了人工智能的威力。這場大戰(zhàn)半年前,Google 就已經(jīng)把它的人工智能底層能力開放給了全世界。
2015 年 11 月 9 日,Google 正式對外開源了機器學(xué)習(xí)框架 TensorFlow,到 2018 年 11 月正好 3 年。TensorFlow 這三年一直保持著更新,2019 年即將布 2.0 版本。應(yīng)用方面也沒落下,Google 用 TensorFlow 優(yōu)化了旗下許多產(chǎn)品。
借助 TensorFlow,Google 讓產(chǎn)品更智能
在 Gmail 里寫郵件,系統(tǒng)會智能建議下一個單詞或完整的句子。在 Google Photos 里瀏覽時看到一張偏暗的照片,系統(tǒng)會自動提示你調(diào)整曝光,讓照片更亮一點。在 Google 翻譯里寫入一個句子,系統(tǒng)可以對整個句子進行翻譯而非逐字翻譯,大幅提高翻譯精確度和流暢度。跟 Google 的人工智能助理 Google Assistant 對話,再也不用一次次說出喚醒詞“Hey,Google”,一次喚醒就能持續(xù)多輪對話。
Gmail 智能補充
Google 內(nèi)部超過 80% 的軟件項目都采用了基于 TensorFlow 的機器學(xué)習(xí),最新案例是可以自己打電話的 AI 系統(tǒng)——Duplex。
Google 在 2018 年的 Google I/O 大會上發(fā)布的 Duplex,具備語言理解、交互、時間控制、語言生成方面的能力,可以幫你打電話給發(fā)廊、餐廳等消費場所,詢問信息或預(yù)定。在和店員交談中,它還能模仿人類的語調(diào),在說話間停頓、拉長,甚至使用“嗯“、”呃“一類語氣助詞。
Google Duplex 演示視頻:https://v.qq.com/x/page/d0744m1i5n6.html?start=2
將 TensorFlow 用于自己產(chǎn)品智能化,這是再也常規(guī)不過的操作了。在一些有足夠標(biāo)注數(shù)據(jù)的垂直行業(yè),TensorFlow 可以發(fā)揮出更大的潛能。
上能發(fā)現(xiàn)“第二個太陽系”,下能預(yù)測余震位置
2017 年 12 月,Google 和得克薩斯大學(xué)奧斯丁分校合作,用 TensorFlow 分析開普勒望遠鏡獲取的數(shù)據(jù),成功發(fā)現(xiàn)了兩顆新的地外行星:開普勒-90i 和開普勒-80g,其中開普勒-90i 所在的星系開普勒 90,更是太陽系之外首個已知的八行星星系。
眾所周知,天
凌星測光法的原理是,當(dāng)行星從恒星前方經(jīng)過,會遮擋住一部分光線,開普勒望遠鏡就能探測到恒星光線減弱,體現(xiàn)在光變曲線中有一個“U”型下沉。
凌星測光法
原理很簡單,但開普勒望遠鏡收集的數(shù)據(jù)實在太多,若逐一進行人工檢查,實在太耗時耗力。而且有的行星很小、很黯淡,對應(yīng)的恒星卻非常明亮、巨大,觀察起來非常困難,就像在聚光燈下尋找一只螢火蟲一樣難。
Google 的 AI 科學(xué)家想到,這個問題和 Google Photos 給照片分類十分類似,于是在 TensorFlow 的基礎(chǔ)上搭建了一個機器學(xué)習(xí)模型,對 15000 個已經(jīng)被標(biāo)注過的地外行星數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,判斷開普勒望遠鏡接收到的信號是否來自某顆地外行星。經(jīng)過訓(xùn)練后,該模型的判斷準(zhǔn)確率達到了 96%。
成功運作后,這個模型被用在了實戰(zhàn)中,很快從 670 顆恒星周圍找到了兩顆地外行星,分別是開普勒 90 星系中的開普勒-90i 和開普勒 80 星系中的-80g。
得益于開普勒-90i 的發(fā)現(xiàn),開普勒 90 星系成為太陽系之外首個已知的八行星星系。
天
概念圖:上為開普勒-90 星系,下為太陽系。
TensorFlow 不僅可以處理天上的事情,還能解決地面的麻煩,比如地震。地震造成破壞不可避免,但如果可以及時營救,能最大程度減少損失。
每次主震之后,災(zāi)難并沒有完全過去,還可能有余震維持?jǐn)?shù)月,繼續(xù)摧殘著被主震動搖的建筑物。地震學(xué)家一直致力于通過數(shù)據(jù)預(yù)測余震發(fā)生的時間、規(guī)模和地點,以安排及時的營救。
但是,地震學(xué)領(lǐng)域的數(shù)據(jù)非常復(fù)雜,每次地震事件都有很多變量,如不同區(qū)域地表的構(gòu)成元素、地震模塊之間的交互、地震波傳遞能量的方式,單純靠人工在數(shù)據(jù)中找到聯(lián)系、繼而預(yù)測余震成本很高。基于過去的經(jīng)驗定律和模型,地震學(xué)家們已經(jīng)可以較好預(yù)測余震發(fā)生的時間和規(guī)模,但預(yù)測位置則相對困難。
為此,Google 和哈佛大學(xué)的研究人員利用 TensorFlow 開發(fā)了一個深度學(xué)習(xí)模型,并且用包含超過 13 萬次主要地震的數(shù)據(jù)集去訓(xùn)練。這個深度學(xué)習(xí)模型引入了一種以前常用于冶金術(shù)的馮·米賽斯屈服準(zhǔn)則,以更好地找到復(fù)雜地震數(shù)據(jù)間的相關(guān)性,從而對余震位置進行預(yù)測。
這個模型目前還只能應(yīng)用于靜態(tài)應(yīng)力(更好預(yù)測),對于動態(tài)應(yīng)力還有心無力。但正如哈佛研究團隊里的領(lǐng)隊 Phoebe DeVries 所說:“完全準(zhǔn)確預(yù)測出余震位置還有很長的路要走,但我想機器學(xué)習(xí)在這方面有很大的潛力?!?/p>
行醫(yī)濟世,AI For Good
醫(yī)學(xué)一直是 TensorFlow 應(yīng)用的重點領(lǐng)域,目前在檢測糖尿病視網(wǎng)膜病變、檢測轉(zhuǎn)移性乳腺癌、心血管疾病評估、癌癥檢測和分析病歷中小有成果。
以檢測糖尿病視網(wǎng)膜病變?yōu)槔H蚍秶鷥?nèi)有 4.15 億糖尿病患者面臨視網(wǎng)膜病變的風(fēng)險,若是發(fā)現(xiàn)及時可被治愈的,但若是未能及時診斷,則可能導(dǎo)致不可逆轉(zhuǎn)的失明。
??漆t(yī)生檢測糖尿病視網(wǎng)膜病變最常用的方法之一,是用眼球后部的掃描片進行分析,觀察是否有病變的征兆(例如微動脈瘤、出血、硬性滲出等),并判斷其嚴(yán)重程度。但世界上許多糖尿病高發(fā)的地區(qū),并沒有足夠的專業(yè)醫(yī)療人士去檢測該疾病。這個問題在南亞地區(qū)尤為嚴(yán)重。
為此,Google 于 2016 年和美國、印度醫(yī)生合作,創(chuàng)建了一個包含 12.8 萬張眼底掃描圖片的數(shù)據(jù)集,用于訓(xùn)練一個檢基于 TensorFlow 的深度神經(jīng)網(wǎng)絡(luò)。Google 把神經(jīng)網(wǎng)絡(luò)的診斷結(jié)果,和 7 個專業(yè)醫(yī)生的診斷結(jié)果對比,結(jié)果表明前者的結(jié)果與眼科醫(yī)生小組的診斷相當(dāng)。
2016 年這個研究公布后,深受醫(yī)學(xué)界好評。哈佛醫(yī)學(xué)院的安德魯 · 比姆和艾薩克 · 柯漢表示,“這一研究展示了醫(yī)學(xué)新世界的樣子?!?/p>
目前,Google 在醫(yī)學(xué)領(lǐng)域最新的消息是,新成立 Google Health 部門,并把一手締造了 AlphaGo 的 DeepMind 的健康業(yè)務(wù)納入其中。
實用之余,還會畫畫
別看 TensorFlow “一本正經(jīng)”,又是發(fā)現(xiàn)行星、預(yù)測余震,又是診斷糖尿病視網(wǎng)膜病變的,其實搞起藝術(shù)來也有兩把刷子。像AutoDraw,能幫助你將自己的一些涂鴉轉(zhuǎn)變成規(guī)整的畫作。
操作步驟也很簡單,點擊左側(cè)第二個按鈕,啟動機器學(xué)習(xí)識別模式,再隨便涂上幾筆。AutoDraw 會即時識別這是什么,并給出一些圖形供你選擇,點擊一下即可替換。
我自己畫的貓很抽象,AutoDraw 能瞬間轉(zhuǎn)變一只現(xiàn)實畫風(fēng)的貓。
AutoDraw 之所以能猜出你畫的是什么,得益于一個名為“Quick,Draw!”的項目。這個項目采用眾包的模式來搜集成千上萬的涂鴉,組成數(shù)據(jù)集后用于訓(xùn)練模型。模型能理解人們在繪制涂鴉時是在何時起筆、走筆方向、何時停筆,以及畫的是什么。
Quick, Draw! 數(shù)據(jù)集里,有超過 12 萬個不同人畫的大腦涂鴉
這個項目后來在中國也落地了,被做成一個叫“猜畫小歌”的小程序,7 月份剛出來的時候火過一段時間,現(xiàn)在你可以掃描小程序碼體驗一下 TensorFlow 的智能之處: