在過去的幾個(gè)月中,我一直在收集有關(guān)人工智能的相關(guān)資料。隨著各種的問題被越來越頻繁的提及,我決定整理并分享有關(guān)人工智能、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)與大數(shù)據(jù)的技術(shù)合輯。同時(shí)為了內(nèi)容更加生動易懂,本文將會針對各個(gè)大類展開詳細(xì)解析。
神經(jīng)網(wǎng)絡(luò)



機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí): Scikit-learn 算法
此部分內(nèi)容可以幫助你解決機(jī)器學(xué)習(xí)中最難的部分,即找到正確的估計(jì)器(Estimator)。下圖可幫助快速查找文檔與簡介,更快了解問題并找到解決方法。

Scikit-Learn
Scikit-learn(更正式的叫法為 scikits.learn)是 Python 的一個(gè)用于機(jī)器學(xué)習(xí)的免費(fèi)庫。庫中有大量的分類,回歸與聚類算法,并支持向量機(jī)、隨機(jī)森林、梯度提升、 K 均值與 DBSCAN。 旨在與 Python 數(shù)字庫 NumPy 和科學(xué)庫 SciPy 進(jìn)行交互。

機(jī)器學(xué)習(xí):算法
此部分旨在介紹如何根據(jù)預(yù)測分析方案選擇合適的機(jī)器學(xué)習(xí)算法。下圖可以根據(jù)數(shù)據(jù)性質(zhì)提出最佳算法。

用于數(shù)據(jù)科學(xué)的 Python


TensorFlow
谷歌于 2017 年 5 月宣布了第二代 TPU 并在谷歌計(jì)算引擎中加入了對 TPU 的支持。第二代 TPU 擁有高達(dá) 180 萬億次浮點(diǎn)運(yùn)算性能(180 teraflops)。當(dāng) 64 個(gè) TPU 組合在一起時(shí),可以提供高達(dá) 11.5 千萬億次浮點(diǎn)運(yùn)算性能(11.5 petaflops)。

Keras
2017 年,谷歌在 TensorFlow 的核心庫中加入了對 Keras 的支持。有學(xué)者認(rèn)為,認(rèn)為相較于端到端的機(jī)器學(xué)習(xí)框架,Keras 更適合作為接口來使用。它提供了更高級別,更直觀的抽象集合,使得無論后端科學(xué)計(jì)算庫如何,都可以輕松配置神經(jīng)網(wǎng)絡(luò)。

Numpy
NumPy 是針對 Python 的 CPython 參考實(shí)現(xiàn),是一個(gè)非優(yōu)化的字節(jié)碼解釋器。針對目前版本的Python編寫數(shù)學(xué)算法的運(yùn)行速度相對較慢的問題,Numpy 使用多維數(shù)組和函數(shù)與運(yùn)算符來改寫部分代碼來提高運(yùn)行效率。

Pandas
名稱 “Pandas” 源于“面板數(shù)據(jù)”(Panel Data)一詞,是多維結(jié)構(gòu)化數(shù)據(jù)集的計(jì)量經(jīng)濟(jì)學(xué)術(shù)語。

數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理一詞已經(jīng)開始滲透進(jìn)流行文化中。在2017年電影“金剛:骷髏島”中,演員馬克·埃文·杰克遜(Marc Evan Jackson)飾演的角色為“我們的數(shù)據(jù)處理者–史蒂夫·伍德沃德。


用 Dplyr 與 Tidyr 進(jìn)行數(shù)據(jù)預(yù)處理


SciPy
SciPy 是基于 NumPy 數(shù)組對象進(jìn)行構(gòu)建,為 NumPy 堆棧的一部分。包括 Matplotlib,pandas 和 SymPy 等工具,以及擴(kuò)展的科學(xué)計(jì)算庫集。該 NumPy 堆棧與其他應(yīng)用程序(如MATLAB,GNU Octave 和 Scilab)具有類似的使用者。 NumPy 堆棧有時(shí)也被稱為 SciPy 堆棧。

Matplotlib
Matplotlib 是 Python 編程語言及其數(shù)學(xué)數(shù)學(xué)擴(kuò)展 NumPy 的繪圖庫。它提供了面向?qū)ο蟮腁PI,用于使用 Tkinter,wxPython,Qt 或 GTK +等通用 GUI 工具包將圖形嵌入到應(yīng)用程序中。還有一個(gè)基于狀態(tài)機(jī)(如 OpenGL)的程序 “pylab” 接口。接口類似 MATLAB,但不鼓勵(lì)使用。
Pyplot 是一個(gè) matplotlib 模塊,他提供了一個(gè)類似 MATLAB 的界面。Pyplot 擁有跟MATLAB 一樣易上手,兼容 Pyhton 并且免費(fèi)的優(yōu)點(diǎn)。

數(shù)據(jù)可視化


PySpark
