2016年6月2日,有“互聯(lián)網(wǎng)女皇”之稱的瑪麗·米克爾在美國(guó)Code大會(huì)上第21次公布了年度《互聯(lián)網(wǎng)趨勢(shì)》報(bào)告,闡述了2016年最為重要的全球互聯(lián)網(wǎng)現(xiàn)象、判斷以及發(fā)展趨勢(shì)。根據(jù)報(bào)告,在技術(shù)終端和平臺(tái)方面,持續(xù)近十年的以智能手機(jī)為核心的移動(dòng)互聯(lián)網(wǎng)模式正逐步增速放緩,而在家居、車載和移動(dòng)場(chǎng)景中,新的以語音為核心的交互模式漸成風(fēng)口,巨頭和創(chuàng)新者紛紛涌入。
新平臺(tái)已經(jīng)出現(xiàn)!
根據(jù)報(bào)告數(shù)據(jù),全球智能手機(jī)用戶數(shù)量和出貨量在2015年增速大幅放緩,作為智能手機(jī)典型代表的iPhone的銷量在2015年也已經(jīng)接近天花板,而亞馬遜智能音箱Echo銷量正在大幅增長(zhǎng),現(xiàn)在銷量已超過400萬臺(tái)。
這些數(shù)據(jù)都與近期眾多科技界的其他動(dòng)向相關(guān)。例如,最近英國(guó)媒體BBC就曾報(bào)道,微軟宣布了針對(duì)于移動(dòng)事業(yè)部門的裁員,并且除此之外,微軟很有可能將智能手機(jī)業(yè)務(wù)從公司主體業(yè)務(wù)中剝離。而《金融時(shí)報(bào)》在采訪復(fù)蘇后的諾基亞時(shí),其技術(shù)部門總裁也表示諾基亞1.7億歐元收購(gòu)法國(guó)Withings后,將開發(fā)一系列主打健康和健身追蹤的消費(fèi)類電子設(shè)備,并不會(huì)重返手機(jī)市場(chǎng)。
正如“女皇報(bào)告”所指出的,在過去的75年中,基本的人機(jī)交互每隔十年就會(huì)出現(xiàn)創(chuàng)新變革。換句話說,在2016年我們極有可能看到以Siri和亞馬遜Echo為代表的語音智能時(shí)代到來。而從“鍵盤模式”進(jìn)入到“鍵盤+麥克風(fēng)模式”,可能并不只是軟件的變化,還意味著終端工具的變革。
語音爆發(fā)?傳統(tǒng)巨頭撬動(dòng)的杠桿
根據(jù)報(bào)告,在過去數(shù)年間,包括谷歌、百度和SoundHound在內(nèi)的巨頭語音軟體技術(shù)提供商的性能和用戶使用數(shù)量都呈幾何級(jí)增長(zhǎng)。
而女皇眼中,語音交互的用戶普及率也大幅上升最主要取決于技術(shù)性能的顯著提高,以及語音界面隨時(shí)訪問、容易操作、成本低且便攜等特點(diǎn)。而傳統(tǒng)巨頭的語音技術(shù)在低噪音環(huán)境語音識(shí)別和搜索,單詞識(shí)別準(zhǔn)確率已達(dá)90%,甚至達(dá)到人類級(jí)別,從而使得語音界面漸漸流行。
然而正如報(bào)告本身所指出的,百度、谷歌和Sound Hound等巨頭的識(shí)別準(zhǔn)確率仍然與顛覆性的99%存在差距。這意味著巨頭本身的技術(shù)可能仍不能令用戶完全滿意。
一個(gè)被忽略的數(shù)據(jù)是,在用戶使用語音技術(shù)的原因方面,2014年到2015年最明顯的變化是用戶對(duì)于語音技術(shù)的意識(shí)和知曉度原因占比有明顯提高,和技術(shù)改善并駕齊驅(qū)。
而這與各大巨頭自2016年蜂擁入語音交互領(lǐng)域,造成的強(qiáng)大宣傳攻勢(shì)可以說不無關(guān)系。
報(bào)告中引以為典例的亞馬遜Echo,代表了語音硬件發(fā)展模式的兩大核心方向。通過Echo硬件平臺(tái)載體,以Alexa語音服務(wù)為核心,越來越多的第三方硬件OEM和軟件服務(wù)開始出現(xiàn),一方面,不斷針對(duì)用戶在家居、車載和移動(dòng)場(chǎng)景下的需求痛點(diǎn),完善語音服務(wù)的技能,另一方面,增強(qiáng)不同設(shè)備之間的連接性。而其今年連發(fā)兩款分支產(chǎn)品,迅速讓Alexa成為科技界明星。
在前不久的谷歌I/O大會(huì)上,谷歌大力推出了其語音交互軟體核心Google Assistant以及以此為基礎(chǔ)的Google Home智能家居體系。同時(shí),據(jù)傳言,蘋果也正基于Siri SDK體系研發(fā)自己的智能音響,從而在語音硬件領(lǐng)域搶灘登陸。
如此之多的巨頭動(dòng)向,確實(shí)很大程度上撬動(dòng)了消費(fèi)者認(rèn)知,同時(shí)反觀巨頭們?cè)谀承iT技術(shù)上存在的局限,可能它們是更大意義上的技術(shù)普及者。
創(chuàng)新者的歷史突破
語音崛起的時(shí)代除了巨頭參與,實(shí)際上也不乏越來越多的創(chuàng)新者加入游戲,而且實(shí)際上一些語音交互創(chuàng)新者在專門領(lǐng)域的積累遠(yuǎn)早于巨頭。語音交互時(shí)代來臨實(shí)際遠(yuǎn)非“后知后覺”的拐點(diǎn)。
據(jù)美國(guó)《連線》雜志報(bào)道,1979年,年輕的喬布斯參觀了Xerox PARC一個(gè)位于加利福尼亞的傳奇研發(fā)實(shí)驗(yàn)室,親眼見證了“圖形用戶界面”,這就是如今PC和手機(jī)硬件的主要交互基礎(chǔ)。而也恰恰是在此次訪問的同時(shí),PARC的另一個(gè)團(tuán)隊(duì)正在研究另一項(xiàng)完全不同的人機(jī)交互模型,即我們今天看到的“語音對(duì)話式交互界面”。
當(dāng)時(shí)這個(gè)團(tuán)隊(duì)中一個(gè)名叫Ron Kaplan的矮胖科學(xué)家,如今則是Nuance Communications的副總裁和首席科學(xué)家?!?0年后,”2016年,Kaplan在接受媒體采訪時(shí)說,“我們準(zhǔn)備好了”。Nuance成立于2005年,時(shí)間早于包括亞馬遜、谷歌、蘋果和百度等巨頭的大多數(shù)語音研發(fā)團(tuán)隊(duì)立項(xiàng),并且是Siri最主要的技術(shù)供應(yīng)商。
同樣是在泛場(chǎng)景的軟件技術(shù)層面,除了谷歌、百度和SoundHound,諸如科大訊飛、云之聲等國(guó)內(nèi)語音技術(shù)供應(yīng)商也正在建立完整的軟件體系,提供中文語音和方言識(shí)別、聲紋識(shí)別等技術(shù),以及教育、會(huì)議、家居、車載、醫(yī)療等特殊場(chǎng)景。在這些具體的垂直領(lǐng)域中,它們的語音識(shí)別正確率甚至達(dá)到了95%以上,遠(yuǎn)超諸如百度、谷歌和SoundHound平均正確率約90%的水平。正如報(bào)告所指出的,語音識(shí)別率和延遲一直是語音識(shí)別的技術(shù)難點(diǎn),在這個(gè)層面上,創(chuàng)業(yè)團(tuán)隊(duì)似乎已經(jīng)取得了優(yōu)于一些傳統(tǒng)巨頭的先機(jī)。
國(guó)內(nèi)已有公司將語音智能產(chǎn)品投放到消費(fèi)市場(chǎng)。近期,出門問問開始通過“開車問問”App涉足語音車載系統(tǒng),它能夠提供語音查詢天氣、語音導(dǎo)航、語音接打電話、語音車內(nèi)娛樂等服務(wù)。出門問問于2015年10月獲得谷歌C輪融資,估值約3億美元,而在“開車問問”之前,其研發(fā)的智能語音手表TicWatch也是較早搭載語音控制的智能手表之一。
在移動(dòng)場(chǎng)景中,包括VINCI智能頭機(jī)和Bragi Dash等在內(nèi)的語音智能硬件,則更深入地將場(chǎng)景細(xì)分,讓用戶能夠真正地在通勤、旅行、逛街等具體場(chǎng)景下解放雙手和雙眼,而如此完整且獨(dú)立的戶外聽音語音識(shí)別體系。其功能類似于戶外場(chǎng)景下的耳機(jī)版亞馬遜Echo,實(shí)際上,以耳機(jī)為基礎(chǔ)的語音硬件仍然是傳統(tǒng)巨頭的空白領(lǐng)域。
觀察整個(gè)語音技術(shù)行業(yè),巨頭雖然在把握大趨勢(shì)、體驗(yàn)完整性和市場(chǎng)占領(lǐng)方法上尚領(lǐng)先于創(chuàng)新者,但是如果針對(duì)某項(xiàng)特定技術(shù)或某個(gè)特定場(chǎng)景,創(chuàng)新者卻有著更多的深入探索。
不過共識(shí)是,巨頭和創(chuàng)新者們的競(jìng)爭(zhēng)與合作正在催生一個(gè)新的智能平臺(tái),然而這一次,沒有人后知后覺。
------------------
聯(lián)系客服