本書單是鑒于本人多年浸淫大數(shù)據(jù)領(lǐng)域的經(jīng)驗,按照學習大數(shù)據(jù)的階段和技術(shù)所列的書單,適合剛剛接觸大數(shù)據(jù)領(lǐng)域的新人。
話不多說,直接上書單!
推薦書籍:
本書為我們帶來了共78條程序員必備的經(jīng)驗法則,針對你每天都會遇到的編程問題提出了有效、實用的解決方案。 書中的每一章都包含幾個'條目',以簡潔的形式呈現(xiàn),自成獨立的短文,它們提出了具體的建議,對于Java平臺精妙之處的獨到見解,以及優(yōu)秀的代碼范例。每個條目的綜合描述和解釋都闡明了應(yīng)該怎么做,不應(yīng)該怎么做,以及為什么。
Linux體系、Hadoop離線計算大綱、分布式數(shù)據(jù)庫Hbase、數(shù)據(jù)倉庫Hive、數(shù)據(jù)遷移工具Sqoop、Flume分布式日志框架
推薦書籍:
在大數(shù)據(jù)的背景下,我很少看到關(guān)于數(shù)據(jù)建模,數(shù)據(jù)層,數(shù)據(jù)處理需求分析以及數(shù)據(jù)架構(gòu)和存儲實現(xiàn)問題。這本書卻提供了令人耳目一新的全面解決方案。
《Hadoop權(quán)威指南(中文版)》從Hadoop的緣起開始,由淺入深,結(jié)合理論和實踐,全方位地介紹Hadoop這一高性能處理海量數(shù)據(jù)集的理想工具。
《Hive編程指南》是一本Apache Hive的編程指南,旨在介紹如何使用Hive的SQL方法HiveQL來匯總、查詢和分析存儲在Hadoop分布式文件系統(tǒng)上的大數(shù)據(jù)集合。
推薦書籍:
《Spark 快速大數(shù)據(jù)分析》是一本為Spark 初學者準備的書,它沒有過多深入實現(xiàn)細節(jié),而是更多關(guān)注上層用戶的具體用法。不過,本書絕不僅僅限于Spark 的用法,它對Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然。
本書采用理論與大量實例相結(jié)合的方式幫助開發(fā)人員掌握使用Spark進行分析和實現(xiàn)機器學習算法。通過這些示例和Spark在各種企業(yè)級系統(tǒng)中的應(yīng)用,幫助讀者解鎖Spark機器學習算法的復(fù)雜性,通過數(shù)據(jù)分析產(chǎn)生有價值的數(shù)據(jù)洞察力。
數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)、數(shù)據(jù)應(yīng)用
推薦書籍:
數(shù)據(jù)分析經(jīng)典入門。通俗簡單,看這本書雖學不到什么數(shù)據(jù)分析的技能點,卻能夠讓你對數(shù)據(jù)分析的相關(guān)概念有大致的了解。有利于你構(gòu)建數(shù)據(jù)思維的基石,嘗試跟著作者的思維邏輯去思考、感悟,記住其中提到的一些數(shù)據(jù)分析原則。
結(jié)合生活講解統(tǒng)計知識,生動有趣。作者從自身出發(fā),講述自己從一個只知道學習的學霸,開始發(fā)現(xiàn)統(tǒng)計學的樂趣,并將其運用到生活中的故事。因此避免了統(tǒng)計學一上來就是各種暈頭暈?zāi)X的專業(yè)概念的枯燥感。
這本書舉例了多種產(chǎn)品,分析了它們的指標、模型。同時將企業(yè)分成了幾個大的行業(yè)類別,并分門別類的講解了每個行業(yè)的商業(yè)模式特點及分析技巧。
ps. 對使用者的分析能力要求較高,且必須具備相應(yīng)的業(yè)務(wù)知識。
主要是講解Data Analyze數(shù)據(jù)分析基礎(chǔ)、數(shù)據(jù)可視化、sklearn中三類樸素貝葉斯算法以及python機器學習等提升個人能力的內(nèi)容!
推薦書籍:
如果要用R語言做數(shù)據(jù)分析,建議讀完《深入淺出數(shù)據(jù)分析》之后,就開始讀這本。從工具的安裝,到具體分析方法在R語言中的實現(xiàn),講解詳細,可操作性極強,是一本非常值得讀的數(shù)據(jù)分析書。
這本書被業(yè)內(nèi)譽為是“數(shù)據(jù)分析和機器學習之間的橋梁”。
網(wǎng)評:對于做了一段時間數(shù)據(jù)分析工作的人,這無疑是進階更高維度的好書,很難有一本書,能夠讓你從簡單的數(shù)據(jù)分析平滑地過渡到機器學習和數(shù)據(jù)挖掘,這本書我認為是這方面做的最好的一本。
國內(nèi)第一本數(shù)據(jù)可視化教材,如果你學習可視化是剛需,看這本。
是數(shù)據(jù)可視化的入門書籍,系統(tǒng)介紹了可視化的相關(guān)概念和常識,教材相對于工具書更為難讀,但卻能為你增長不少對可視化的認知。