上市是企業(yè)發(fā)展到一定階段的自然結(jié)果?!暗珜ξ覀兌裕F(xiàn)在首要任務(wù)是把技術(shù)和服務(wù)做扎實,一定程度上,上市是一個自然結(jié)果。不能反過來講,為了上市我們要做什么特別的事情。
“當(dāng)人們徹底解放了雙手之后,就會有神奇的事情發(fā)生。”聲智科技戰(zhàn)略合伙人兼CSO李智勇告訴融中財經(jīng)。2014年,亞馬遜發(fā)布Echo后,國內(nèi)掀起一陣智能音箱的熱潮,它與Siri最大的不同就在于,解決了遠場語音交互問題。所謂遠場智能語音,簡單來講,當(dāng)我們坐在客廳沙發(fā)上的時候,對著某項家居產(chǎn)品說出一句指令(播放一首歌),就能讓電視或機頂盒做出反應(yīng)。“Echo出來之后,中國各類科技公司開始對這類智能產(chǎn)品紛紛做出新的期待,大家都不明白未來的智能生活會什么樣子,但都明白這是新的趨勢,就像當(dāng)年iphone出現(xiàn)時一樣!”成立于2016年的聲智科技,專注聲學(xué)和人工智能的融合創(chuàng)新,主要提供SoundAI Azero智能操作系統(tǒng)和服務(wù),以及深度結(jié)合應(yīng)用場景的人工智能技術(shù)和產(chǎn)品解決方案。像騰訊王者榮耀機器人、小米小愛音箱、天貓精靈魔盒、百度智能音箱、華為榮耀YOYO音箱、聯(lián)想MINI系列、360智能攝像頭、360兒童故事機和陪伴機器人、小米小沐智能馬桶蓋等多款市場大熱產(chǎn)品,均搭載了聲智科技SoundAI Azero智能操作系統(tǒng)。當(dāng)音箱、機頂盒、機器人等設(shè)備越來越頻繁地出現(xiàn)在我們的日常生活中,加入語音交互技術(shù)后,我們只要“動動嘴”就可以控制一切,不管是音樂電影等內(nèi)容娛樂,還是開啟或關(guān)閉控制等基礎(chǔ)操作,小巧的智能設(shè)備們在生活中越來越多的被利用著,而舒適自然的用戶體驗,便成為想要挖掘這一市場的科技企業(yè)目標。賽道擁擠、競爭慘烈
智能語音技術(shù)的研究是以語音識別技術(shù)為開端,可以追溯到20世紀50年代。而伴隨近幾年人工智能產(chǎn)業(yè)的持續(xù)火熱,以及大量資本進入,在智能語音賽道上不僅誕生了大批明星企業(yè),市場規(guī)模也在急劇擴大。相關(guān)數(shù)據(jù)統(tǒng)計顯示,2017年全球智能語音市場規(guī)模達到110.3億美元,同比增長30%。2018年,僅中國智能語音市場規(guī)模就突破100億元。現(xiàn)在,我們看到的市場上絕大多數(shù)消費類電子設(shè)備,幾乎都加上了語音功能,涉及到基礎(chǔ)操控、內(nèi)容選擇、游戲辦公等眾多場景,而機器想要實現(xiàn)智能,首要問題就是要聽懂人所說的話。
從智能語音交互的應(yīng)用場景來看,其主要在兩個維度率先實現(xiàn)落地,一個是以智能音箱為核心的智能家居市場持續(xù)快速發(fā)展,二是正面臨產(chǎn)業(yè)互聯(lián)網(wǎng)轉(zhuǎn)型的傳統(tǒng)行業(yè),如金融、電力、電信等售前、售后服務(wù)中也在更多使用語音交互技術(shù)。按照美國市場調(diào)研分析公司Cnanalys報告,全球智能音箱安裝總數(shù)將從2018年的1.14億部增長到2019年的2.079億部,增幅達到82.4%。隨著移動互聯(lián)網(wǎng)、智能家居、汽車、醫(yī)療、教育等領(lǐng)域的應(yīng)用帶動,預(yù)計2019年中國智能語音市場規(guī)模將突破200億元。也正是因為市場如此巨大,競爭才十分激烈。只有全棧技術(shù)不行,還要有規(guī)?;a(chǎn)品驗證
從2011年Siri橫空出世,各大公司加入語音助手陣列,到亞馬遜發(fā)布Echo,打響以智能音箱為代表的語音交互硬件時代第一槍,如今的市場已經(jīng)被各大廠商的智能語音產(chǎn)品和語音操作平臺所占據(jù),而對用戶而言,交互體驗始終才是首要的選擇標準。“我們經(jīng)常聽到一些'可怕’的新聞報道,某種智能音箱半夜突然響起、自己說話放起歌曲等情景,這些都是與語音交互相關(guān)技術(shù)有密切聯(lián)系的。”李智勇對融中財經(jīng)介紹,整體語音交互技術(shù)鏈條上包括有五個關(guān)鍵的技術(shù)點——喚醒、麥克風(fēng)陣列、遠場語音識別、自然語言處理以及語音合成技術(shù)(TTS)。不同的點難度不同。對喚醒來講,必須解決喚醒率,降低誤喚醒率;而麥克風(fēng)陣列需要不同的硬件匹配對應(yīng)的環(huán)境。如果一個點解決不好,體驗就不會好。“把體驗和服務(wù)做到極致,是我們要做的事情。”截至目前,聲智科技自主研發(fā)的SoundAI Azero智能操作系統(tǒng)已經(jīng)廣泛落地于智能家居、汽車、安防、教育、醫(yī)療等行業(yè),并經(jīng)過了數(shù)十億次人機交互真實場景的規(guī)模驗證,可為家居、辦公、車載、可穿戴等20+場景和設(shè)備提供高效的人機交互和智能決策能力,并默認集成了信息查詢、影音娛樂、IOT控制等200+項常用技能與服務(wù)。以360小水滴智能攝像機為例,聲智科技為其提供了消費級智能安防解決方案,包括雙工通話,語音識別,嬰兒哭聲識別,異常聲音檢測等技術(shù),賦予了智能攝像機雙工通話和聲音監(jiān)控能力。小米生態(tài)鏈產(chǎn)品“小沐”智能馬桶蓋搭載了聲智科技為其定制的“在線+離線”融合的遠場喚醒識別合二為一的語音交互技術(shù)。
再比如,聲智為“堅果”智能投影儀提供的遠場語音降噪、識別、喚醒技術(shù),搭配4麥麥克風(fēng)陣列,在家居噪聲環(huán)境下依然可以實現(xiàn)無障礙喚醒,一句“堅果堅果”可在5m范圍內(nèi)實現(xiàn)呼叫并下達指令,語音直接搜索影音資源、生活資訊等內(nèi)容,控制暫停、播放、快進快退等功能,更可以語音切換正投、背投兩種投影方式,真正實現(xiàn)人聲遠程自由操作。整體來講,從最初選擇智能音箱,幫助像小米(音箱)這類企業(yè)生產(chǎn)行業(yè)的標桿性產(chǎn)品,到后來將語音交互產(chǎn)品品類擴大、場景擴充,再把單獨的語音技術(shù)集合成完整系統(tǒng)。聲智科技正在構(gòu)建并打造自己技術(shù)特色的服務(wù)和壁壘。李智勇稱,面對激烈的市場競爭和角逐,我們必須有過硬的技術(shù),但并不是說有全棧技術(shù)就好,還要經(jīng)過大規(guī)模的產(chǎn)品驗證;此外,創(chuàng)新企業(yè)還必須要明確自己擅長的技術(shù)特點究竟是什么。“因為客戶多,產(chǎn)品品類多,有些需要數(shù)據(jù)驅(qū)動的東西,如果沒有數(shù)據(jù)識別率會很低。聲智對復(fù)雜的聲學(xué)環(huán)境處理更加擅長,而且我們有針對場景的數(shù)據(jù)處理能力。”專注系統(tǒng)化和平臺化,連接產(chǎn)業(yè)上下游
從2018年上半年開始,國內(nèi)數(shù)家語音技術(shù)創(chuàng)業(yè)公司陸續(xù)推出了AI語音專用芯片。云知聲發(fā)布面向物聯(lián)網(wǎng)領(lǐng)域AI系列芯片UniOne以及第一代“雨燕”;出門問問在北京也發(fā)布AI語音芯片模組問芯Mobvoi A1;隨后Rokid在杭州發(fā)布AI語音專用芯片KAMINO18。但聲智對于芯片的態(tài)度卻是:“AI芯片解決特定產(chǎn)品問題,而通用芯片解決通用問題。這屬于不同人選擇做不同的事。聲智科技的路線類似于亞馬遜,不同的設(shè)備接進來要有不同的協(xié)議,不同的技能開發(fā)也有不同的協(xié)議,我們的原則是在設(shè)備端往簡單了做,而其他更多復(fù)雜的東西搬到云上。”李智勇對融中財經(jīng)強調(diào)。有人認為,目前“端”上的計算量是不足的,為了解決AIoT問題所以需要專用芯片,這在某些場景下是成立的。比如視覺識別,有時候帶寬不夠,傳輸量不夠,尤其是實時的3D數(shù)據(jù),需要端上處理部分數(shù)據(jù)。但在聲智,云端已經(jīng)可以實現(xiàn)基本的數(shù)據(jù)處理。比如,要求播放劉德華的歌,歌單里可能20首歌,下一首的維護是在端上還是在云上?我們就會把這些東西都放在云上,設(shè)備端搜到下一首的時候,只負責(zé)播放,我們認為更多的東西應(yīng)該是放在云上。“聲智科技要做中國版的Alexa。”除此之外,當(dāng)市場上眾多人工智能領(lǐng)域獨角獸紛紛做起產(chǎn)業(yè)投資,企圖擴展生態(tài)時,聲智科技的選擇再一次顯得“另類”。“本質(zhì)上講,聲智科技有很好的技術(shù),接下來要做的是系統(tǒng)化和平臺化。我們希望服務(wù)更多廠商,但這距離生態(tài)化還很遠。”李智勇告訴融中財經(jīng),聲智科技還是一家創(chuàng)業(yè)公司,創(chuàng)業(yè)公司的資源、人力都是有限的,企業(yè)如果想把服務(wù)做到極致就必須特別專注,不可能面面俱到。“我們定位是以技術(shù)為主的平臺服務(wù)商,未來,我們上游要鏈接各類設(shè)備廠商,比如手機、平板、音箱以及白色家電、電視盒子、機器人、VR/AR等設(shè)備,下游要連接的則是像歌曲、相聲、天氣預(yù)報、新聞等通用內(nèi)容廠商,涵蓋各種生活化智能場景。這是很難的一條路,但我們必須這么做。平臺必須是連接兩端,他們有產(chǎn)品,我們有的則是技術(shù)和服務(wù)。”升級的老設(shè)備,才是未來更大的市場
從遙控按鍵到觸屏控制再到語音交互,事實上改變的并不僅僅是人們的控制方式,而是在重新構(gòu)建人和機器的全新關(guān)系。談到這兩年的市場變化,李智勇稱,主要體現(xiàn)在兩方面。首先,從用戶角度來看,人們對于語音交互的接受度越來越高,交互次數(shù)和輪次也越來越多,這是用戶習(xí)慣改變的過程。“從技術(shù)到產(chǎn)品再到體驗是一種循環(huán)。從行業(yè)來看,第一個循環(huán)是音箱打造的,從用戶知道這個東西到習(xí)慣的建立,之后產(chǎn)品品類進一步擴寬,致使用戶體驗越來越好,這是體驗循環(huán)放大的一個過程。”其次,從產(chǎn)品端看,語音交互產(chǎn)品的創(chuàng)新,一類是新設(shè)備的出現(xiàn),包括智能音箱、VR/AR等,增速最快的就是智能音箱和airpod耳機,兩者都是語音交互驅(qū)動的。而另一類是基于老設(shè)備的升級創(chuàng)新,語音作為新的功能被加進去之后出現(xiàn)的“新物種”,比如智能燈、智能馬桶、智能手辦,而這才是一個新的巨大市場,增長曲線更加明顯。“與此同時,5G時代的到來,也讓很多東西變成現(xiàn)實”李智勇告訴融中財經(jīng)。“移動互聯(lián)網(wǎng)發(fā)展到當(dāng)下階段,紅利漸漸消失,在這種時間節(jié)點上,從業(yè)者其實是痛苦的,因為產(chǎn)品想要獲得新的快速增長很難。任何事物發(fā)展到一定階段,一定會有新的東西來打破原有的平衡。而很多人現(xiàn)在迷茫的是,這個新東西到底是什么?特別哲學(xué)地講,我們相信,這個世界是持續(xù)往前的,不是靜止不動的。”上市是自然結(jié)果,先把技術(shù)和服務(wù)做扎實
天眼查顯示,2018年12月,聲智科技完成2億人民幣B輪融資,由毅達資本領(lǐng)投,峰瑞資本、正居資本跟投,這也是聲智科技四次融資中金額最大的一次。2016年12月,聲智曾完成1600萬Pre-A輪;2017年10月完成近億元A輪融資,而公司成立之初便獲得過峰瑞資本的天使投資。對于投資方選擇,“我們最關(guān)注的其實是戰(zhàn)略認同,投資人認可我們正在做的這件事的未來價值”。當(dāng)問到新一輪的融資時,李智勇也透露,除了雙方對市場的認知匹配為第一優(yōu)先級外,聲智科技堅持關(guān)注國內(nèi)資本市場。
“對未來上市而言,聲智科技還是會優(yōu)先選擇國內(nèi)上市,比如科創(chuàng)板。”上市是企業(yè)發(fā)展到一定階段的自然結(jié)果。“但對我們而言,現(xiàn)在首要任務(wù)是把技術(shù)和服務(wù)做扎實,一定程度上,上市是一個自然結(jié)果。不能反過來講,為了上市我們要做什么特別的事情。坦率講,市場和行業(yè)要向前走,必須有人真真實實解決一些問題”。
媒體合作:010-84464881
商務(wù)合作:010-84467811
如需轉(zhuǎn)載請點擊標題欄原創(chuàng)轉(zhuǎn)載,
加入開白群后聯(lián)系開白名單~
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。