Python機器學習實踐:測試驅動的開發方法

《Python機器學習實踐:測試驅動的開發方法》是2017年機械工業出版社出版的圖書,作者是(美)馬修·柯克(Matthew Kirk)。

目錄,內容簡介,目錄,

目錄

Python機器學習實踐:測試驅動的開發方法
Python機器學習實踐:測試驅動的開發方法
作者:(美)馬修·柯克(Matthew Kirk)著
ISBN(書號):978-7-111-58166-6
出版日期:2017-11
版次:1/1
開本:16

內容簡介

獲得在日常工作中套用機器學習所需的信心。不需要你擁有高深的學術背景,作者Matthew Kirk通過這本實用的指南向你展示了如何在代碼中集成和測試機器學習的算法。
通過書中的圖表和重點標記的代碼示例,本書著重介紹了Python的NumPy、Pandas、Scikit-learn和SciPy等數據科學相關類庫的測試。 如果你是對數據科學感興趣的軟體工程師或業務分析師,本書將幫助你:
 參考一些實例,來參與、動手練習每個算法。
 在開始編寫代碼之前,套用測試驅動開發(TDD)來編寫和運行測試。
 利用數據抽取和特徵開發,來探索改進機器學習模型的技術。
 注意機器學習的風險,例如數據的欠擬合或過擬合。
 學會使用K-最近鄰(KNN)、神經網路、聚類和其他算法。

目錄

前言1
第1章 5
可能近似正確的軟體5
正確地編寫軟體6
編寫正確的軟體10
本書計畫16
第2章 快速介紹機器學習18
什麼是機器學習18
有監督學習18
無監督學習19
強化學習20
機器學習能完成什麼20
本書中使用的數學符號21
結論22
第3章 K最近鄰算法23
如何確定是否想購買一棟房子23
房子的價格究竟幾何24
愉悅回歸24
什麼是鄰域25
K最近鄰算法簡介26
K先生最近的鄰居26
距離27
維度災難33
如何選擇K34
給西雅圖的房子估價37
結論43
第4章 樸素貝葉斯分類44
通過貝葉斯定理來發現欺詐訂單44
條件機率45
機率符號45
反向條件機率(又名貝葉斯定理)47
樸素貝葉斯分類器47
貝葉斯推理之樸素48
偽計數 49
垃圾郵件過濾器50
標記化和上下文55
結論67
第5章 決策樹和隨機森林68
蘑菇的細微差別69
使用民間定理實現蘑菇分類70
找到最佳切換點71
修剪樹74
結論83
第6章 隱馬爾可夫模型84
使用狀態機來跟蹤用戶行為84
輸出/觀測隱含狀態86
使用馬爾可夫假設化簡87
隱馬爾可夫模型88
評估: 前向-後向算法89
通過維特比算法解碼93
學習問題94
詞性標註與布朗語庫94
結論105
第7章 支持向量機106
客戶滿意度作為語言的函式107
SVM背後的理論108
情緒分析器113
聚合情緒124
將情緒映射到底線126
結論127
第8章 神經網路128
什麼是神經網路129
神經網路史129
布爾邏輯129
感知器130
如何構建前饋神經網路130
構建神經網路144
使用神經網路來對語言分類145
結論154
第9章 聚類155
無任何偏差的研究數據155
用戶群組 156
測試群集映射 157
K均值聚類159
最大期望(EM)聚類161
不可能性定理 163
案例:音樂歸類 164
結論 174
第10章 模型改進與數據提取175
辯論俱樂部175
選擇更好的數據176
最小冗餘最大相關性的特徵選擇181
特徵變換與矩陣分解183
結論189
第11章 將這些方法融合在一起:結論191
機器學習算法回顧191
如何使用這些信息來解決問題193
下一步做什麼193

熱門詞條

聯絡我們