首先在大學(xué)里要學(xué)習(xí)好數(shù)學(xué),數(shù)學(xué)是一門基礎(chǔ)學(xué)科,相關(guān)課程包括《高等數(shù)學(xué)》《線性代數(shù)》《數(shù)值分析》《多元分析》《泛函分析》等。
其次學(xué)習(xí)好統(tǒng)計(jì)學(xué),統(tǒng)計(jì)學(xué)是所有大數(shù)據(jù)應(yīng)用的基礎(chǔ),《概率與數(shù)理統(tǒng)計(jì)》課程一定要好好上,課外推薦書籍包括:《深入淺出統(tǒng)計(jì)學(xué)》、《統(tǒng)計(jì)學(xué):從數(shù)據(jù)到結(jié)論》 等。
學(xué)習(xí)數(shù)據(jù)分析技能,包括數(shù)據(jù)清洗,數(shù)據(jù)建模,運(yùn)用合適的統(tǒng)計(jì)方法來分析數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)算法,檢驗(yàn)?zāi)P偷恼_與否,實(shí)現(xiàn)數(shù)據(jù)可視化,推薦書籍:《深入淺出數(shù)據(jù)分析》、《數(shù)據(jù)分析與圖形藝術(shù)》等。
學(xué)習(xí)數(shù)據(jù)編程技能, 精通一種或多種數(shù)據(jù)分析工具(R/Matlab/SPSS/SAS) ,精通一種或多種面向?qū)ο蚓幊陶Z(yǔ)言(Python、C++、Java、C#、perl 等),以及其他IT公司經(jīng)常需要的技能(互聯(lián)網(wǎng)公司可能會(huì)要求熟悉HTML/CSS),推薦書籍:《R語(yǔ)言實(shí)戰(zhàn)》、《復(fù)雜數(shù)據(jù)統(tǒng)計(jì)方法 基于R的應(yīng)用》、《利用Python進(jìn)行數(shù)據(jù)分析》《Python for Data Analysis》等。
學(xué)習(xí)數(shù)據(jù)管理技能: Hadoop(尤其是hive/HBase、HDFS和MapRdeuce) ,SQL NoSL 其他IT公司常用的數(shù)據(jù)管理技能,推薦書籍:《機(jī)器學(xué)習(xí)及其應(yīng)用》、《大數(shù)據(jù):互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理》、《Web數(shù)據(jù)挖掘》等。
最后是相關(guān)業(yè)務(wù)知識(shí),熟悉瀑布模型和敏捷模型等軟件開發(fā)模式,理解公司運(yùn)行規(guī)則,對(duì)于產(chǎn)業(yè)所屬領(lǐng)域有所了解,以及其他公司常用商業(yè)技巧,推薦書籍 :《數(shù)據(jù)之巔》、《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》等。
聯(lián)系客服