大數(shù)據(jù)背后,不可忽視的“人”
龔丹韻 2016年06月06日
柳友娟 制圖
當下中國,大數(shù)據(jù)是個熱詞。
無人汽車、人工智能、生物醫(yī)療,各種新科技中,大數(shù)據(jù)的身影無處不在,它像一把萬能鑰匙,開啟了很多不為人知的空間。
但在人們熱捧大數(shù)據(jù)的同時,卻往往就數(shù)據(jù)論數(shù)據(jù),甚至陷入數(shù)據(jù)膜拜,而忽視了大數(shù)據(jù)背后的人的因素。大數(shù)據(jù)是怎樣發(fā)揮價值的?那些不會說話的數(shù)據(jù)又是怎樣講述鮮活的故事的?關注到騰訊近日發(fā)布的大數(shù)據(jù)報告《95后迷之隱私觀大揭秘》,記者走進位于深圳的騰訊總部,走進那些讓數(shù)據(jù)“活”起來的人。
大數(shù)據(jù)給不出解釋
搞大數(shù)據(jù)研發(fā),不就是坐在實驗室、電腦前,整天對著數(shù)字噼里啪啦地運算?可騰訊公司用戶與市場研究中心調研員韓娜,更多地是奔波在見調研對象的路上。
韓娜講了一個對于她來說“家?!钡墓适隆?div style="height:15px;">
一年冬天,她從南方的深圳趕到北方的沈陽,約了一個孩子做用戶調研。本來知情的父母臨時有事不在,孩子的姑姑不讓韓娜進門。韓娜拿出身份證、工作證、介紹信,反復解釋,但所有證明一概無用,對方就是不肯相信。
最終,韓娜被“砰”的一聲拒之門外。
類似的經(jīng)歷,韓娜所在的團隊幾乎人人都遇到過。
很多人不理解,一個互聯(lián)網(wǎng)公司怎么還用上門調研這種“老土”的方式?
的確,擁有7.62億月活躍微信賬戶、8.77億月活躍QQ賬戶的騰訊,并不缺乏用戶社交的大數(shù)據(jù),但光有數(shù)字就行了嗎?
“大數(shù)據(jù)給出了結論,但給不了解釋?!庇脩襞c市場研究中心總監(jiān)譚池舉了一個他自己的親身經(jīng)歷。
多年前,他曾經(jīng)參與過早期蘋果手機一代的調研。當時,老外們通過大數(shù)據(jù)驚訝地發(fā)現(xiàn)一個現(xiàn)象:蘋果的幾種輸入法中,中國人特別偏愛某一種??墒抢贤庀氩煌?,這是為什么?
譚池說,“為什么”往往是大數(shù)據(jù)的盲點,而產(chǎn)品改進的關鍵,有時候恰恰就在于這個“為什么”。想要找到答案,目前,還只能依靠傳統(tǒng)的人對人詢問。
當時,經(jīng)過傳統(tǒng)調研,譚池找到了原因:中國抽煙人口比西方國家多,許多公共場合更是想抽就能抽,人們一只手拿煙時,只好單手握著手機打字,因此中國的蘋果一代用戶,特別偏愛單手型、單指型的輸入法。知道這個“為什么”以后,相關產(chǎn)品的開發(fā),開始更多考慮單手模式了。
數(shù)據(jù)會拋出許多令人驚訝的結果。但結果意味著什么,人們仍然一無所知??梢哉f,人與人交流的傳統(tǒng)模式,不僅沒有被掩埋,反而在大數(shù)據(jù)時代,被一個個數(shù)據(jù)又激發(fā)出來。
大數(shù)據(jù)讀不出場景
“滴”“滴”——訪談室里充滿此起彼伏的電子音。研究員們有些震驚。
事情緣起于產(chǎn)品經(jīng)理想做一個無障礙功能的設計。研究員朱丹招募了6位盲人進行訪談。起初,大家做好充分準備,以為盲人們可能不會使用智能手機,不會用APP,需要先教一下。
但沒想到,這群盲人使用互聯(lián)網(wǎng)產(chǎn)品相當熟練。他們利用智能手機的讀屏功能,并且每個人都把聲音調到最快檔,只聽見手機發(fā)出“滴”“滴”這樣短促的電子音,常人的耳朵根本聽不懂是什么,但6位盲人卻在怪誕的聲音中,熟練地使用互聯(lián)網(wǎng),讓在場的“小伙伴都驚呆了”。
“原來網(wǎng)絡對他們的幫助比我想象中大很多?!敝斓じ锌S形幻と烁嬖V她,比如移動支付,對正常人來說只是多了一種支付手段,但對他們而言是一種顛覆式的設計,大大方便了盲人消費。
大數(shù)據(jù)往往會這樣,提供了一個結果,但它并不知道用戶在使用產(chǎn)品時,身處什么樣的場景,懷揣怎樣的心情,有著怎樣的需求。這一切,唯有人與人面對面,才能知曉。
還有一次,譚池找到了成都的一名用戶,興高采烈跑到對方家里。目的是為了知道,用戶使用產(chǎn)品時,真實的生活場景什么樣。一番交流和觀察后,他忽然覺得不太對勁:這戶人家冰箱里只有6罐可樂,沒有多余的食物,房間里也找不到水壺或飲水機。譚池發(fā)短信給同行的同事:留意一下,這是不是他真的家。
等到雙方聊得很開心以后,對方果然露出了口風,原來他確實不住在這兒,這間屋子的主人是他父母,目前租給別人,這次為了接受調研,臨時借用了一下。
“這樣一來,我觀察他的生活場景,有一半信息就沒用了,比如小區(qū)、鄰里關系等?!弊T池遺憾地說。
進一步說,比起直接的數(shù)據(jù),如何解讀數(shù)據(jù)背后的意義,才是把大數(shù)據(jù)用“活”的重頭戲。用戶真正的使用情景,他們的擔憂、開心、困惑與不爽,目前的大數(shù)據(jù)讀不出來。數(shù)據(jù)再大也是死的,只有人能激活它。
大數(shù)據(jù)不知道怎么做
多年前,有一位調研員曾經(jīng)接過一個項目,對方要求調研某產(chǎn)品在用戶心中是多少分,如果得分在80分以下,整個相關團隊就要被撤銷?!捌鋵?,給79分還是80分,有很大區(qū)別嗎?”譚池反問,“不談評分機制,就算根據(jù)數(shù)據(jù)得分,判了一個團隊的生死又怎樣?問題還是在那兒,依然沒有得到解決?!?div style="height:15px;">
大數(shù)據(jù)本身,并不能給出一個既定做法。面對數(shù)據(jù)運算的結果,之后的步驟可能更加重要。
調研員小迪同時負責1-3個調研項目,一般9點半從公司出發(fā),去深圳市里與用戶一對一訪談。中午回公司,下午另外一個項目的招募和策劃會議又開始了,當中偶有空隙,他就回到座位寫一些訪談總結。這就是一名調研員每天的工作日常。
每一年,研究中心負責調研的項目數(shù)以百計,這些課題并非調研員自己“拍腦袋”想的,大部分來自產(chǎn)品策劃的需求方,比如產(chǎn)品經(jīng)理,改進一個產(chǎn)品功能時可能會冒出一個問題,希望通過調研來解答。
韓娜說,剛入這一行,自己與產(chǎn)品經(jīng)理交流時,經(jīng)常需要磨合。比如一位產(chǎn)品經(jīng)理很糾結,關于“簽到”有兩種改進方案,究竟95后用戶更喜歡哪一種呢?他不知道。他可能先去找數(shù)據(jù)師,去調相關的大數(shù)據(jù)。大數(shù)據(jù)顯示,95后更熱衷于每天上網(wǎng)“簽到”。但是他們“簽到”究竟是出于什么心理,獲得了什么滿足,數(shù)據(jù)并不懂。
于是,產(chǎn)品經(jīng)理接著找韓娜,請她進行用戶研究。結果顯示,95后樂意“簽到”,更多是為了滿足自己的情感需求,尤其是“刷存在感”??墒侵懒诉@一點后,產(chǎn)品經(jīng)理依然無法抉擇,究竟哪個方案更好。
時間久了,韓娜漸漸明白,自己做完調研,不能僅僅解答“為什么”,“用戶怎么想”,還要給出“怎么做”的建議。
當然,再細致的調研,最終也不一定能找到產(chǎn)品經(jīng)理想要的答案。有時候,答案是有了,但考慮到成本營收、缺乏供應商、缺乏可操作性等因素,改進方案依然不了了之。大數(shù)據(jù)和訪談就都白做了。
另一位調研員馬建說,自己工作最開心的那刻,就是調研的建議被采納,最終體現(xiàn)到產(chǎn)品中。
今天的企業(yè)、政府,乃至整個社會,很容易通過大數(shù)據(jù)對市場一目了然,但一目了然之后怎么做?漠視它、改正它、還是適應它?
大數(shù)據(jù)未必懂得價值
羅英、何文是“數(shù)據(jù)挖掘師”。但這份工作想做得好,單純依靠算數(shù)據(jù)并不夠,其實還要動用“情商”。
比如,QQ音樂有一個功能叫“猜你喜歡”。根據(jù)用戶的數(shù)據(jù),軟件會自動推薦一些陌生歌曲,它們往往符合你的音樂品位。這種推薦,顯然是基于大數(shù)據(jù)平臺。一般我們以為,只要提供一些算法,大數(shù)據(jù)平臺照此運算就成,但事實沒那么簡單。
首當其沖的是準確率?!安履阆矚g”究竟能猜對多少首歌?不同的數(shù)據(jù)師,可能會設計不同的算法,有的人效果明顯比較好,他把“年齡”的數(shù)據(jù)用起來,而另外一個人沒用,就會導致兩者準確率差很大。
究竟需要考慮哪些數(shù)據(jù)維度,薦歌才會最符合心意呢?沒有標準答案,不同數(shù)據(jù)師有自己的判斷。同樣的大數(shù)據(jù)庫,一個運算下來比較準確,一個不準,其中唯一的變化就是人。
第二個問題是,為什么有人能想到“年齡”,而有人卻想不到?憑借的也是個人經(jīng)驗?;蛘哒f,憑借的是人對事物的理解,考驗的正是數(shù)據(jù)師的“情商”。
“在我們行內有一個不等式:業(yè)務知識>數(shù)據(jù)>算法?!绷_英解釋,“而業(yè)務知識就是你的理解能力?!庇猛械脑拋碚f,就是“你的架構是否合理?!?div style="height:15px;">
沒什么課題的時候,數(shù)據(jù)師的常規(guī)工作十分枯燥。
每天上班第一件事,就是低頭看手機。手機上,已經(jīng)裝有數(shù)據(jù)展示的平臺,到點就會自動發(fā)布一些基本情況,比如當天登錄用戶數(shù)多少,這些已經(jīng)無需太多人工干預。
然而一旦看出今天的數(shù)據(jù)有異常波動,數(shù)據(jù)師就要馬上查找原因,比如去各個相關部門詢問,是不是因為今天有大型活動?如果有,那算是幸運的。比較棘手的情況是,今天更新了一個新版本,而用戶在新版本上,上傳照片的完成率很低,那也是一種異常,需要趕緊找原因。
如果產(chǎn)品經(jīng)理提出一個課題,需要與小伙伴們湊在一起開會討論,那數(shù)據(jù)師的工作會稍微有趣些。
比如最近,產(chǎn)品經(jīng)理提出:能不能根據(jù)大數(shù)據(jù),觀察每座城市的人口遷移,隨后做一份《城市年輕指數(shù)》報告?
策劃會上,數(shù)據(jù)師們給出了這樣一些數(shù)據(jù):用戶的登錄地,再比對他們的年齡信息等。最后給出來的數(shù)據(jù),大家一看都覺得有價值,《城市年輕指數(shù)》報告就這樣出爐了。
當然,更多時候,理想很完美,但運算出來的數(shù)據(jù)卻沒什么變化,被判定“數(shù)據(jù)價值不大”,議題便會不了了之。
“大數(shù)據(jù)就好像是一杯水,我們需要去廚房煮菜,水只是材料之一。我們不能直接把水賣給客戶,我們需要煮好一碗菜,才能端給客戶。”羅英形容。
何文則說,他工作的成就感,不在于運算大數(shù)據(jù),而在于最終“能給出有價值的數(shù)據(jù)”。
大數(shù)據(jù)還能做什么
第一張與家人的合影、第一張旅行的照片、第一張寶寶的笑容……
已經(jīng)活躍了11年的社交平臺QQ空間有著豐富的用戶數(shù)據(jù),最近,騰訊運用這些數(shù)據(jù),為個人生成一份“社交回顧互動”H5,比如顯現(xiàn)出你第一次注冊空間的時間,跳出第一張上傳的家人合照。
“其實也捏了一把汗,這對圖片的數(shù)據(jù)解讀要求非常高?!睆氖翾Q空間運營的琪琪說,“試想,第一張與家人的合影,萬一大數(shù)據(jù)判斷錯誤,跳出來的照片是與男同事的合影,豈不是很尷尬?”怎么抽取數(shù)據(jù),讓數(shù)據(jù)判斷準確很重要。
小迪做調研時遇到一名初中男孩,對方很有傾訴欲。男孩告訴他,自己有5個QQ號,4個已經(jīng)被媽媽“破解”了,可能是因為密碼太簡單,都是生日之類,媽媽太容易猜到。于是他想出了第5個QQ密碼,復雜到連自己也記不住。他把密碼放在帶鎖的儲錢罐里,再把儲錢罐藏在床底下,每次用這個賬號登錄QQ時,他都要先從床底下把密碼翻出來才行。即便如此,為了屏蔽父母,他還準備再注冊一個賬號。
這個故事,后來被小迪寫進了《95后迷之隱私觀大揭秘》報告中。該報告揭示,95后是一群非常注重隱私的群體,近4成95后認為,自己的隱私遭到過侵犯,他們?yōu)榱吮Wo隱私采取過各種小手段。
然而隱私報告誕生后,也讓一些媒體和學者產(chǎn)生了危機感。報告既有大數(shù)據(jù)的樣本分析,這點比高??蒲械娜舆€大;又有案例故事,這點又與媒體的角度重合。長此以往,是不是一家互聯(lián)網(wǎng)公司就能自己完成科研報告了?大數(shù)據(jù)會不會讓一些科研機構被取代呢?
除了活動、推薦、科研,大數(shù)據(jù)目前已經(jīng)用來進行精準的廣告投放。比如一個平臺,經(jīng)大數(shù)據(jù)分析,把1000萬流量分成兩半,一半是對汽車感興趣的人,一半是對奶粉感興趣的人。只需要把500萬流量給車商打廣告,它的轉化率就非常高。
而最讓人期待的是,大數(shù)據(jù)在某個領域正發(fā)揮著超乎想象的作用——城市公共空間的實時數(shù)據(jù)檢測。
類似功能,其實微信上已經(jīng)有了。打開微信個人錢包,選擇城市服務,右下方有一條“城市熱力圖”。點擊進入,熱力圖能實時顯現(xiàn)你所在的位置附近,有多少人流,它意味著交通是否擁擠。當然,擴大使用的話,它還能實時監(jiān)測某塊區(qū)域,是否短時間內人流密度過高,及時提出預警。
也是基于相同的原理,近幾年騰訊發(fā)布了春運遷徙報告,實時監(jiān)測每年春運的遷徙情況。
以上這些,都是已經(jīng)使用大數(shù)據(jù)的方面,而未來,很多人都對大數(shù)據(jù)賦予了想象空間——
當每個人的身體信息都能被實時收集,形成個人的大數(shù)據(jù)時,人會怎樣?當整個社會被大數(shù)據(jù)連接起來,形成一個龐大的系統(tǒng),不僅交通、運輸,整座城市管理,都可以用大數(shù)據(jù)運算出一個“最佳方案”時,城市又會怎樣?
我們已經(jīng)邁入一個大數(shù)據(jù)的時代。有人說,終究有一天,數(shù)據(jù)的價值將超過土地的價值。但是也有人說,世界就是一個“黑盒子”,永遠無法窺探內部的秘密。
遠古時代,宇宙對于人類就是一個巨大的黑盒子。如今,科學技術正在解開一個又一個黑盒子,可是大數(shù)據(jù)的終解會通往哪里?目前依然沒人說得清楚。
“技術是有局限性的?!碑斘覀円恢痹谡雇萍嫉臒o限可能時,反倒是這些一直與大數(shù)據(jù)打交道的人,不斷強調著這一點。
(文中的人名均為化名)
對話
人始終無法被替代
解放周一:企業(yè)對大數(shù)據(jù)的估值一直都很高,不會輕易公開。你們怎么會想到免費對公眾發(fā)布一些大數(shù)據(jù)的社會報告?這本身就是一種試驗嗎?
李航(騰訊集團市場與公關部總經(jīng)理):這幾年,社會上的大數(shù)據(jù)報告很多,每家互聯(lián)網(wǎng)公司各有偏重。
社交平臺本身就是一個濃縮的小社會,社會的新變化、新趨勢,都會在這個平臺有所反應。比如,大家越來越覺得,當代年輕人變得無法定義了,他們似乎喜歡追星、喜歡消費,他們究竟是怎樣一群人呢?能否做出一些描述?那么,在我們的社交數(shù)據(jù)平臺上,是否可以觀察到年輕人的一些變化?意識到這是一個社會共同關注的話題,我們就基于大數(shù)據(jù)發(fā)布了相關的報告。
另一方面,大數(shù)據(jù)是個很大的盤。但是這個大盤上也可以有許多小的切面和故事。大數(shù)據(jù)未必一定要生成一個宏觀的大報告,從特別的角度切入,以小見大,也是一種嘗試。這次我們推出95后的隱私觀,那么下次可以繼續(xù)推出當代年輕人的審美觀、擇業(yè)觀等,持續(xù)聚焦一些可長期跟蹤的社會話題。
解放周一:這份報告既有宏觀數(shù)據(jù),又有微觀故事,看起來似乎“搶”了高校和媒體的活,您覺得,你們做的調研,與高校和媒體的調研本質區(qū)別在哪里?
李航:我們是一個平臺,也許從能力上,我們可以做到像高校那樣,或者像媒體那樣,但從自身的定位來說,我們盡量只做平臺該做的,那就是客觀陳述。有些洞見,不輕易進行價值判斷。社會現(xiàn)象一擊即中講清楚即可。這些大數(shù)據(jù)發(fā)布出去以后,如果高校、媒體引用,進一步就這個社會現(xiàn)象深入分析下去,我們也很高興。
大家知道,騰訊一直在做平臺服務,提倡“開放”,這個思路也適用于傳播。我們現(xiàn)在的社會類報告,大數(shù)據(jù)依然是開放狀態(tài),未來外部機構可以一起策劃做下去,共同搭建一個挖掘數(shù)據(jù)價值的生態(tài)圈。
解放周一:是不是因為互聯(lián)網(wǎng)行業(yè)變化太快,所以你們對社會的細微變化很敏感,也因此對調研投入了很大精力?
李航:Pony(指馬化騰)曾經(jīng)說:巨人倒下的時候,身體還是溫的。互聯(lián)網(wǎng)這個行業(yè),分分秒秒都在變化,特別讓人敬畏,所以我們始終有一種危機意識。基于此,我們專門有課題研究社交如何改變人。今天,我們愿意開放一部分資源和數(shù)據(jù),也是希望能與全社會一起去解讀互聯(lián)網(wǎng)的動向,可以說是為了社會,同時也是為了我們自己的生存前景。
解放周一:那么您對大數(shù)據(jù)的未來怎么看?有了人工智能、深度學習,未來人還有用武之地嗎?
李航:目前看待和處理大數(shù)據(jù)有幾種方式。一類是對年齡、性別、星座等基礎結構型數(shù)據(jù)進行呈現(xiàn)和總結。第二類是視頻數(shù)據(jù)、語音數(shù)據(jù)、圖像數(shù)據(jù)。我們有像優(yōu)圖這樣世界領先的技術團隊,他們在音頻、人臉、圖片識別等領域都有深入研究。現(xiàn)在我們正在研究,如何讓語音數(shù)據(jù)與圖像數(shù)據(jù)結合進行分析。第三類就是人工智能,它的想象空間非常大,或許通過深度學習,未來人工智能自己會對數(shù)據(jù)產(chǎn)生洞察力,理解數(shù)據(jù)背后的意義、原因、提供建議,一切皆有可能。
未來也許人機之間有新的協(xié)作模式,但我相信人無法被替代。人性很復雜,即使人與人的當面交流,所知也是有限的。人的情感、動機、心理,這些都是目前機器解讀不了的。
越是與大數(shù)據(jù)打交道,我越是對人性保有敬畏之心。