GrowthNudge
你的成長,我來助推!
公眾號《成長助推》致力于分享成長需要的實用工具、技能、思維方式,以助推你的成長為目標,直接省心的提供高效有價值的內容。
今日助推小目標:
1. 工具箱簡單說明。統(tǒng)計與機器學習工具箱;
2. 8046頁的PDF文檔下載。MathWorks的關于該工具箱的超詳細用戶手冊:Statistics and Machine Learning Toolbox User's Guide。
統(tǒng)計與機器學習工具箱
MathWorks公司有很多屬于機器學習分支的軟件包,提供用于數據分析的高質量算法以及用于可視化圖形工具。這些軟件包可以相互集成或與其他Matlab函數集成,用以生成用于機器學習中的強大系統(tǒng)。
這些工具箱包括但不限于以下幾種:統(tǒng)計與機器學習工具箱;神經網絡工具箱;計算機視覺系統(tǒng)工具箱;系統(tǒng)辨識工具箱等;
今天主要給大家簡單介紹《統(tǒng)計與機器學習工具箱》,它提供用于從大量數據中獲取趨勢和模式的數據分析方法,包括分類工具、回歸工具和聚類工具等;
分類方法用于將數據區(qū)分為不同的類別。例如圖像形式的數據可用于按照是否有腫瘤對器官圖像分類。分類學習通常應用于手寫識別,信用評分和面部識別等問題中。分類方法包括支持向量機(SVM),決策樹和神經網絡等。
回歸方法允許基于當前數據構建模型預測未來的數據。在有新數據可用時可以持續(xù)更新回歸模型;數據只使用一次來創(chuàng)建模型,那么它處于批處理方法;在數據可用時合并新數據的回歸方法,屬于遞歸方法。
聚類方法在數據中發(fā)現自然分組,目標識別是聚類方法的一個應用。例如,如果想識別圖像中的汽車,那么就去查找圖像中屬于汽車部分的關聯數據,雖然汽車具有不同的形狀和尺寸,但他們仍然有許多共同的特征。
工具箱具有許多功能來支持這些應用領域。
用戶手冊(User's Guide)
該手冊內容豐富,共8046頁,2016年。
分類算法可以將一個分類應變量建模為一個或多個預測元的函數。工具箱提供了涵蓋多種參數化和非參數化分類算法的應用程序和函數,如:
邏輯回歸;
促進式和袋裝決策樹;
樸素貝葉斯分類;
K-最近鄰(kNN)分類;
判別分析(線性和二次變量);
支持向量機(SVM);
回歸方法可將一個連續(xù)應變量建模為一個或多個預測元的函數。工具箱提供各種回歸算法,包括線性回歸、廣義線性模型、非線性回歸和混合效應模型。
線性回歸是一種用于描述作為一個或多個預測元變量的連續(xù)應變量的統(tǒng)計建模技術。它有助于您理解和預測復雜系統(tǒng)的行為,或者分析實驗、金融和生物數據。
非線性回歸是一種有助于描述實驗數據中非線性關系的統(tǒng)計建模技術。通常將非線性回歸模型假設為參數模型,將該模型稱為非線性方程。工具箱還提供強大的非線性擬合,用于處理數據中的異常值。
工具箱提供包括用于執(zhí)行聚類分析的算法,通過根據相似度測量對數據分組來發(fā)現數據集中的規(guī)律??捎玫乃惴ò?k-均值、k-中心點、分層聚類、高斯混合模型和隱馬爾可夫模型。當不知道聚類的數量時,可以使用聚類評估技術根據特定指標確定數據中存在的聚類數量。
進入《成長助推》公眾號,給后臺發(fā)送關鍵詞“機器學習”即可,自動回復已備好。