InfoQ:您是如何與計算機(jī)視覺結(jié)緣的,并在這個領(lǐng)域深耕二十余年的?
任海兵: 本科五年級上學(xué)期的時候,我后來的博士導(dǎo)師徐光佑教授跟我說,計算機(jī)視覺是特別富有挑戰(zhàn)性的研究領(lǐng)域,研究的課題都很困難,可以研究一輩子。我覺得:這個方向可以研究一輩子,感覺挺有意思的,所以就選擇了計算機(jī)視覺做為我的直博專業(yè)方向。從此就跟計算機(jī)視覺結(jié)緣,一路下來二十多年了。
InfoQ:深耕計算機(jī)視覺二十余年,您能否用幾句話總結(jié)下您的心得和收獲?
任海兵: 在這二十年中,我主要從事將計算機(jī)視覺算法落地工業(yè)場景的工作。最大的體會是,由于計算機(jī)視覺算法的局限性,我們需要對落地場景非常了解,定制化的設(shè)計解決方案,不能閉門造車。因為看似非常相似的落地場景,具體分析下來對算法的要求、評估方式等差別很大,常常需要結(jié)合實際場景定制化的去設(shè)計最優(yōu)解決方案。那種希望用一種算法解決各種問題的想法是不切實際的。
InfoQ:過去一年中(2019 年),您認(rèn)為在計算機(jī)視覺領(lǐng)域最值得關(guān)注的技術(shù)突破有哪些?能否談?wù)勗颉?/strong>
任海兵: 在過去的一年中,我最關(guān)注的技術(shù)是視頻物體分割。2019 年出現(xiàn)的 space-time memory network 算法極大的提高了視頻物體分割的準(zhǔn)確性和計算速度,指出了視頻物體分割技術(shù)的新發(fā)展方向。結(jié)合 CVPR 2020 該方向的論文投稿來看,視頻物物體分割技術(shù)沿著這個方向?qū)谐掷m(xù)的提高,逐漸成熟起來。
InfoQ:能否請您用幾個例子來談?wù)?,目前阿里巴巴在計算機(jī)視覺方面有哪些應(yīng)用場景?
任海兵: 阿里巴巴是個巨大的經(jīng)濟(jì)體,其業(yè)務(wù)涉及非常多的領(lǐng)域。其中很多領(lǐng)域中,計算機(jī)視覺起著重要的作用。例如智慧城市中的安防監(jiān)控,智能交通中 3D 城市重建、文化娛樂產(chǎn)業(yè)中素材智能生產(chǎn)等。
InfoQ:在這些場景中,您負(fù)責(zé)的項目有哪些?有哪些重要的突破是您認(rèn)為值得分享的?
任海兵: 跟阿里文娛相關(guān)的場景是文化娛樂產(chǎn)業(yè)中素材智能生產(chǎn)。由于素材生產(chǎn)的目的是給人觀看,因此不能有肉眼可見的瑕疵,這對素材智能生產(chǎn)提出了很高的要求。以前的素材生產(chǎn),例如圖像摳圖,都是純手工 PS,費時費力。這兩年在圖像分割領(lǐng)域取得了巨大的成就。既有圖像語義理解、實例分割、全景分割,又有精細(xì)摳圖 (image matting) 和顯著性區(qū)域分割。綜合這些技術(shù),我們可以得到高精度的圖像摳圖解決方案。下面給出幾個我們的摳圖結(jié)果:
這些已經(jīng)廣泛用于阿里文娛的各項業(yè)務(wù)場景中。
InfoQ:從技術(shù)的研發(fā)到落地,您認(rèn)為最大的挑戰(zhàn)是什么?是否有可以分享的經(jīng)驗?
任海兵: 我最近的工作主要跟 視頻內(nèi)容智能生產(chǎn) 相關(guān),從這個方面看,目前最大的挑戰(zhàn)還是算法的穩(wěn)定性。在一個視頻中,如果有一幀圖像的結(jié)果不好,那么整個視頻都是不合格的。我的一項經(jīng)驗是,有些領(lǐng)域目前業(yè)界算法還不能達(dá)到全自動的智能生產(chǎn),例如視頻摳圖,但可以輔助很少量的人工交互,利用交互式視頻摳圖算法,達(dá)到效率和精度的一個平衡。
InfoQ:在您看來,計算機(jī)視覺接下來會如何發(fā)展?您和團(tuán)隊有什么重點規(guī)劃?
任海兵: 我認(rèn)為,目前人工設(shè)計網(wǎng)絡(luò)已經(jīng)到達(dá)一個瓶頸階段,接下來深度網(wǎng)絡(luò)的自動搜索將引領(lǐng)計算機(jī)視覺登上一個新的高峰,我的團(tuán)隊也將在這個方向進(jìn)行布局。
采訪嘉賓介紹
任海兵,阿里巴巴資深算法專家,2003 年清華大學(xué)計算機(jī)系計算機(jī)應(yīng)用專業(yè)博士畢業(yè)。先在三星中國技術(shù)院工作 11 年,先后擔(dān)任計算機(jī)視覺和醫(yī)療圖像算法團(tuán)隊負(fù)責(zé)人,曾帶領(lǐng)團(tuán)隊獲得 FRGC 人臉識別競爭第一名。2014 年加入英特爾中國研究院,從事機(jī)器人視覺感知研究工作。2018 年底,任海兵加入阿里文娛摩酷實驗室,從事視頻理解算法研究。任海兵在計算機(jī)視覺領(lǐng)域有 20 多年的研究經(jīng)驗,擔(dān)任 CVPR、ICCV、ECCV 等國際頂級學(xué)術(shù)會議審稿人,發(fā)表 40 余篇論文,擁有 30 多項專利。
任海兵老師將在 7 月份的 AICon 2020 上海站擔(dān)任“計算機(jī)視覺“專場出品人,和你一起談?wù)動嬎銠C(jī)視覺黑科技在工業(yè)界的應(yīng)用,想要跟海兵老師現(xiàn)場面基的同學(xué)千萬不要錯過。
另外,大會還設(shè)置有智能金融、NLP、推薦廣告技術(shù)及應(yīng)用、AI 工程師團(tuán)隊建設(shè)與管理、認(rèn)知智能、大數(shù)據(jù)計算和分析、智能語音前沿技術(shù)等熱門專場,來自 BAT、微軟、小米、華為、PayPal、快手等 50+ 一線 AI 技術(shù)大咖將帶來更多精彩分享,目前大會限時 7 折報名火熱進(jìn)行中,更多內(nèi)容歡迎咨詢票務(wù)小姐姐 Amy:18514549229(同微信),我們 7 月上海不見不散!
你也「在看」嗎???