免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
【數(shù)據(jù)科學(xué)家】LInkedin數(shù)據(jù)科學(xué)家如何工作

在互聯(lián)網(wǎng)企業(yè)中,LinkedIn是一家出了名的“慢公司”,但LinkedIn也是最成功的社交網(wǎng)絡(luò),用戶品質(zhì)、廣告價(jià)值都是行業(yè)翹楚,秘密在于LinkedIn有一個(gè)高效的數(shù)據(jù)科學(xué)家團(tuán)隊(duì)。

作為社交網(wǎng)絡(luò), LinkedIn并不是最大的,也不是生長(zhǎng)最快的。 成立于2003年的LinkedIn, 花了500天, 才達(dá)到了100萬(wàn)用戶。 然而, 作為全球最大的職業(yè)社交網(wǎng)絡(luò),LinkedIn的后勁十足。今天, LinkedIn每6天就新增100萬(wàn)用戶。 平均每秒有兩個(gè)新增用戶。 每年, LinkedIn的用戶搜索量達(dá)到了42億。 LinkedIn的數(shù)據(jù)分析團(tuán)隊(duì)每天要分析200TB的數(shù)據(jù)來(lái)更好地了解用戶。

為什么人們現(xiàn)在如此的關(guān)心統(tǒng)計(jì)和數(shù)據(jù),為什么數(shù)據(jù)科學(xué)家成了最性感的工作, 最近,在TiE的峰會(huì)上, LinkedIn的首席數(shù)據(jù)科學(xué)家Manu Sharma 接受了采訪, 揭秘了LinkedIn的數(shù)據(jù)分析的工作。

問(wèn): 能介紹一下LinkedIn的數(shù)據(jù)科學(xué)嗎?

答: LinkedIn就是用戶的職業(yè)社交網(wǎng)絡(luò), 在這個(gè)網(wǎng)絡(luò)上, 如果人們想找你卻找不到那么你就可能失去一個(gè)機(jī)會(huì)。 因此, 對(duì)用戶來(lái)說(shuō),保持狀態(tài)和資料的時(shí)時(shí)更新非常重要。 LinkedIn的業(yè)務(wù), 就是建立在對(duì)這些數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上的。 為了達(dá)到對(duì)數(shù)據(jù)實(shí)時(shí)快速處理的目的,我們開(kāi)發(fā)了自己獨(dú)特的算法, 叫Metropolis。它可以每天實(shí)時(shí)處理10億條數(shù)據(jù)。 具備開(kāi)源的解決方案 Voldemort,Kafka,和Zoie 那樣的功能。

數(shù)據(jù)科學(xué)家需要具備好奇心和直覺(jué)。 他們需要想的問(wèn)題是:我能用這些數(shù)據(jù)來(lái)做什么呢? 我需要問(wèn)什么樣的問(wèn)題?這些數(shù)據(jù)能告訴我什么? 他們還需要足夠的直覺(jué)來(lái)了解他們所采用方法的局限性。 數(shù)據(jù)科學(xué)家的工作包括, 采集數(shù)據(jù), 整理數(shù)據(jù), 建立正確的模型, 測(cè)試模型, 還要有一定的編程能力。 一個(gè)數(shù)據(jù)科學(xué)家需要具備這些技能, 而這些技能也是一個(gè)初創(chuàng)企業(yè)在建立它的數(shù)據(jù)科學(xué)家團(tuán)隊(duì)所需要的技能。

問(wèn): LinkedIn數(shù)據(jù)應(yīng)用的重點(diǎn)是那幾個(gè)方面?

答:LinkedIn的數(shù)據(jù)應(yīng)用主要在三個(gè)方面:

1. 開(kāi)發(fā)創(chuàng)新的數(shù)據(jù)產(chǎn)品

2. 從內(nèi)部數(shù)據(jù)發(fā)現(xiàn)趨勢(shì)和機(jī)會(huì)

3. 推動(dòng)業(yè)務(wù)成長(zhǎng)

比如”推理算法”被用來(lái)根據(jù)用戶的數(shù)據(jù)進(jìn)行一些信息的推測(cè)。 這一點(diǎn)對(duì)于將來(lái)的產(chǎn)品設(shè)計(jì)尤其重要。比如說(shuō), LinkedIn就采用了“推理算法”推出了“你可能知道的人”這個(gè)功能。 這對(duì)增加用戶粘性和提高用戶口碑傳播有極大的幫助。 LinkedIn是最早推出這一功能的。 現(xiàn)在, 這個(gè)功能已經(jīng)成為了社交網(wǎng)絡(luò)的必備功能了。

此外, 通過(guò)用戶在資料里關(guān)于技能的描述文本,我們通過(guò)文本提取和文本分析, 建立起一套技能的關(guān)鍵子字典。 通過(guò)聚類算法, 可以產(chǎn)生很多很有意思的發(fā)現(xiàn)來(lái)幫助我們提高服務(wù)或者推出產(chǎn)品。

此外, 通過(guò)對(duì)各個(gè)行業(yè)的用戶數(shù)據(jù)分析,還可以對(duì)行業(yè)或者整個(gè)經(jīng)濟(jì)進(jìn)行一些預(yù)測(cè)。(編者: 比如說(shuō)某個(gè)行業(yè)進(jìn)行了裁員, 或者某些行業(yè)的招聘計(jì)劃增加等等) 這樣做的一個(gè)優(yōu)點(diǎn)是, 這些數(shù)據(jù)不是來(lái)自與問(wèn)卷調(diào)查,這些是用戶實(shí)實(shí)在在的行為數(shù)據(jù)。 所以,在美國(guó)總統(tǒng)經(jīng)濟(jì)政策報(bào)告里, 這些數(shù)據(jù)也會(huì)被采用。 這些數(shù)據(jù)同樣的對(duì)企業(yè)的發(fā)展也很重要。

問(wèn):數(shù)據(jù)分析最佳實(shí)踐的原則是什么?

答:

1. 數(shù)據(jù)量越大越好

2. 原始數(shù)據(jù)比加工數(shù)據(jù)好

3. 數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)質(zhì)量非常重要

4. 簡(jiǎn)單模型比復(fù)雜模型要好

5. 建模就是要不斷進(jìn)行試錯(cuò)。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
大數(shù)據(jù)改造在線招聘,精準(zhǔn)匹配求職者和目標(biāo)職位,獵頭還有存在的價(jià)值嗎?
LinkedIn首席科學(xué)家:創(chuàng)業(yè)公司如何善用數(shù)據(jù),加入下一個(gè)千億美元市場(chǎng)?
數(shù)據(jù)科學(xué)、大數(shù)據(jù)和數(shù)據(jù)分析之間的區(qū)別?
大數(shù)據(jù)入門的四個(gè)必備常識(shí)
專訪Google數(shù)據(jù)科學(xué)家彭晨:大數(shù)據(jù)成為潮流走近各行各業(yè)!
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服