互聯(lián)網(wǎng)金融的發(fā)展與擴大在這近十年的時間取得非常迅速的進展,這當然一個很重要的原因是得益于大數(shù)據(jù)分析和大數(shù)據(jù)挖掘的影響和助攻。說到大數(shù)據(jù)發(fā)展,目前很多公司的形式都是獨立或聯(lián)合一個部門出來專門進行數(shù)據(jù)分析和數(shù)據(jù)挖掘的工作,這也為數(shù)據(jù)分析師和數(shù)據(jù)挖掘師提供了用武之地。不過這個世界好多人都是不滿意現(xiàn)狀或有自己的個性追求的,面對大數(shù)據(jù)分析的發(fā)展,有人開始著手進行大數(shù)據(jù)創(chuàng)業(yè)了。說到大數(shù)據(jù)創(chuàng)業(yè),可能大家都會比較陌生,大數(shù)據(jù)創(chuàng)業(yè),到底是怎么個創(chuàng)發(fā),主營業(yè)務(wù)是什么,需要有哪些必備條件或因素。下面,就來和大家講講:大數(shù)據(jù)創(chuàng)業(yè),你必須要了解的5大關(guān)鍵因素。
1.基礎(chǔ)設(shè)施非常難
不僅開發(fā)基礎(chǔ)設(shè)施技術(shù)產(chǎn)品很難,銷售起來也很難,具體到大數(shù)據(jù)基礎(chǔ)設(shè)施工具如Hadoop、NoSQL數(shù)據(jù)庫和流處理系統(tǒng)則更是難上加難??蛻粜枰罅颗嘤柡徒逃?,付費喲娜谷需要大量支持和及時跟進的產(chǎn)品開發(fā)工作。
這意味著需要大量的資金支持,例如Greenplum在2010年獲得1億美元投資但仍然不足以完成所有工作,最終不得不選擇賣給EMC。今天最出名的幾家大數(shù)據(jù)創(chuàng)業(yè)公司融的錢更多,例如Cloudera。基礎(chǔ)設(shè)施類的大數(shù)據(jù)創(chuàng)業(yè)公司通常需要數(shù)百萬美元種子資金啟動,但是A輪融資的道路異常艱辛。
新興的大數(shù)據(jù)創(chuàng)業(yè)公司還必須與那些在客戶那里已經(jīng)有一些知名度甚至合作項目的公司競爭,例如Cloudera、Hortonworks、10gen、亞馬遜AWS、IBM、Oracle等。
反觀大數(shù)據(jù)應(yīng)用創(chuàng)業(yè)則相對簡單的多,無論面向垂直行業(yè)應(yīng)用還是數(shù)據(jù)可視化這樣的通用大數(shù)據(jù)應(yīng)用都是如此。因為這些大數(shù)據(jù)應(yīng)用的價值對于客戶來說更為直觀,距離業(yè)務(wù)也更近,進入企業(yè)IT系統(tǒng)的摩擦也更小。
2.云計算是朋友
無論你是銷售大數(shù)據(jù)基礎(chǔ)設(shè)施還是應(yīng)用,云計算都是更有效的業(yè)務(wù)載體。選擇云計算不僅僅是在云端托管,更重要的是通過云計算向客戶提供服務(wù)。你將擁有更多控制權(quán),同時在有限的資源上優(yōu)化運行也會讓你對產(chǎn)品的理解更加透徹。
云計算也降低了潛在用戶試用產(chǎn)品的成本和門檻,從NewRelic到亞馬遜AWS都從云計算+大數(shù)據(jù)模式中獲益。
3.開發(fā)者是朋友
如果你主要從事大數(shù)據(jù)分析,例如ClearStory、Platfora或者CRM營銷應(yīng)用,數(shù)據(jù)分析師就是你的朋友。無論那種情況,最好的辦法就是圍繞以開發(fā)者和市場人員為主的目標受眾進行開發(fā)和營銷工作,CIO反而不是很好的目標受眾!
4.將數(shù)據(jù)科學家推向前臺中央
這既是市場也是銷售策略,數(shù)據(jù)科學家才是能夠展示數(shù)據(jù)和平臺威力的人,他們也是會議上最受歡迎的演講者。
但大數(shù)據(jù)科學家也需要慎重選擇傳播內(nèi)容。如今大家都接受了Hadoop和NoSQL,所以沒必要每次開會言必稱4V之類的科普。至于如何配置和集成大數(shù)據(jù)系統(tǒng)也只能吸引小部分聽眾,除非你的項目規(guī)模超大。
5.開源有多重要,取決于你自己
幾乎所有的大數(shù)據(jù)公司都依賴開源軟件,有些是“借”來的,如Hadoop、Storm以及各種數(shù)據(jù)庫,有些是自行開發(fā)的,有些則是混合模式,例如在HBase上增加的一些功能應(yīng)用。這些開源項目如此流行是因為社區(qū)的力量。
本文摘自西線學院,轉(zhuǎn)載請注明出處