Python高級數據分析:機器學習、深度學習和NLP實例

Python高級數據分析:機器學習、深度學習和NLP實例

《Python高級數據分析:機器學習、深度學習和NLP實例》是機械工業出版社出版的圖書,作者是[印] 薩揚·穆霍帕迪亞(Sayan Mukhopadhyay)

基本介紹

  • 作者:[印] 薩揚·穆霍帕迪亞(Sayan Mukhopadhyay)
  • 出版社:機械工業出版社
  • 頁數:156 頁
  • ISBN:9787111617020
  • 定價:59 元
  • 裝幀:平裝-膠訂
  • 叢書:數據分析與決策技術叢書
內容簡介,圖書目錄,

內容簡介

本書介紹高級數據分析概念的廣泛基礎,以及*近的資料庫革命,如Neo4j、彈性搜尋和MongoDB。本書討論了如何實現包括局部爬取在內的ETL技術,並套用於高頻算法交易和目標導向的對話系統等領域。還有一些機器學習概念的例子,如半監督學習、深度學習和NLP。本書還涵蓋了重要的傳統數據分析技術,如時間序列和主成分分析等。

圖書目錄

譯者序
作者簡介
技術審核員簡介
致謝
第1章 簡介001
1.1 為何選擇Python001
1.2 何時避免使用Python002
1.3 Python中的面向對象編程002
1.4 在Python中調用其他語言010
1.5 將Python模型作為微服務011
1.6 高性能API和並發編程014
第2章 Python結構化數據提取、轉換和載入019
2.1 MySQL020
2.1.1 如何安裝MySQLdb020
2.1.2 資料庫連線020
2.1.3 INSERT操作020
2.1.4 READ操作021
2.1.5 DELETE操作022
2.1.6 UPDATE操作023
2.1.7 COMMIT操作023
2.1.8 ROLL-BACK操作024
2.2 Elasticsearch026
2.3 Neo4j Python驅動029
2.4 neo4j-rest-client029
2.5 記憶體資料庫029
2.6 Python版本MongoDB030
2.6.1 將數據導入集合031
2.6.2 使用pymongo創建連線031
2.6.3 訪問資料庫對象032
2.6.4 插入數據032
2.6.5 更新數據032
2.6.6 刪除數據032
2.7 Pandas033
2.8 Python非結構化數據提取、轉換和載入034
2.8.1 電子郵件解析034
2.8.2 主題爬取036
第3章 基於Python的監督學習043
3.1 使用Python實現降維043
3.1.1 相關性分析044
3.1.2 主成分分析046
3.1.3 互信息048
3.2 使用Python進行分類049
3.3 半監督學習050
3.4 決策樹050
3.4.1 哪個屬性優先050
3.4.2 隨機森林分類器052
3.5 樸素貝葉斯分類器052
3.6 支持向量機054
3.7 最近鄰分類器055
3.8 情緒分析056
3.9 圖像識別057
3.10 使用Python進行回歸058
3.10.1 最小二乘估計059
3.10.2 邏輯回歸060
3.11 分類和回歸060
3.12 使模型高估或低估061
3.13 處理分類型數據062
第4章 無監督學習—聚類067
4.1 K均值聚類068
4.2 選擇K—肘部法則071
4.3 距離或相似性度量071
4.3.1 屬性072
4.3.2 一般及歐氏距離072
4.3.3 平方歐氏距離074
4.3.4 字元串之間的編輯距離074
4.4 文檔上下文的相似性076
4.5 什麼是層次聚類077
4.5.1 自下而上的方法078
4.5.2 聚類之間的距離079
4.5.3 自上而下的方法080
4.5.4 圖論方法084
4.6 如何判斷聚類結果是否良好085
第5章 深度學習和神經網路087
5.1 反向傳播088
5.1.1 反向傳播方法088
5.1.2 廣義Delta規則088
5.1.3 輸出層權重更新089
5.1.4 隱藏層權重更新090
5.1.5 反向傳播網路小結091
5.2 反向傳播算法092
5.3 其他算法094
5.4 TensorFlow094
5.5 遞歸神經網路099
第6章 時間序列107
6.1 變化的分類107
6.2 包含趨勢的序列分析107
6.2.1 曲線擬合108
6.2.2 從時間序列中去除趨勢109
6.3 包含周期性的序列數據分析110
6.4 從時間序列中去除周期性111
6.4.1 濾波111
6.4.2 差分112
6.5 轉換112
6.5.1 穩定方差112
6.5.2 使周期效應累加113
6.5.3 使數據呈常態分配113
6.6 平穩時間序列114
6.6.1 平穩過程114
6.6.2 自相關和相關圖114
6.6.3 自協方差和自相關函式的估計115
6.7 使用Python進行時間序列分析116
6.7.1 有用的方法116
6.7.2 自回歸過程118
6.7.3 估計AR過程的參數119
6.8 混合ARMA模型122
6.9 集成ARMA模型123
6.10 傅立葉變換124
6.11 一個特殊的場景125
6.12 數據缺失127
第7章 大數據分析129
7.1 Hadoop129
7.1.1 MapReduce編程129
7.1.2 partitioning函式130
7.1.3 combiner函式131
7.1.4 HDFS檔案系統140
7.1.5 MapReduce設計模式140
7.2 Spark146
7.3 雲分析148
7.4 物聯網156

相關詞條

熱門詞條

聯絡我們