O\x27Reilly:Python文本分析

《O'Reilly:Python文本分析》是2022年中國電力出版社出版的圖書。

基本介紹

  • 中文名:O'Reilly:Python文本分析
  • 出版時間:2022年8月1日
  • 出版社:中國電力出版社
  • ISBN:9787519864446
內容簡介,圖書目錄,

內容簡介

將文本轉換成有價值的信息是企業尋求競爭優勢的關鍵。隨著近年來自然語言處理(NLP)的發展,如今用戶可以通過各種方式來解決複雜的難題。但用戶不清楚選擇何種NLP工具或庫才能滿足業務需求,他們不知道應該使用何種技術以及按照怎樣的順序使用這些技術。
  《O'Reilly:Python文本分析》這本實戰手冊為數據科學家和開發人員提供了文本分析與自然語言處理中常見任務的非常好的實踐解決方案。
  《O'Reilly:Python文本分析》中介紹了各種Python真實案例研究,並提供了詳細的代碼示例,可以幫助你快速入門。
  提取API與網頁的數據。
  統計分析和機器學習的文本數據預處理。
  機器學習分類、主題建模與摘要。
  解釋AI模型與分類的結果。
  利用單詞嵌入,探索及可視化語義相似性。
  分析產品評論中的客戶情感。
  根據命名實體及其關係創建知識圖。

圖書目錄

前言 . 1
第1 章 洞悉文本數據 11
1.1 本章內容概要 .11
1.2 探索性數據分析 12
1.3 數據集簡介 13
1.4 案例:使用Pandas 獲取數據概要 14
1.4.1 計算列的匯總統計結果 15
1.4.2 檢查缺少的數據 16
1.4.3 繪製值的分布圖 17
1.4.4 比較各個類別的分布 .18
1.4.5 可視化一段時間內的變化 19
1.5 案例:構建簡單的文本預處理流水線 21
1.5.1 使用正則表達式分詞 .21
1.5.2 刪除停用詞 .22
1.5.3 通過一行代碼處理流水線 24
1.6 詞頻分析案例 .26
1.6.1 案例:使用Counter 統計單詞個數 26
1.6.2 案例:創建詞頻圖 29
1.6.3 案例:創建詞雲 30
1.6.4 案例:TF-IDF 排名 32
1.7 案例:查找上下文關鍵字 .35
1.8 案例:n 元語法分析 37
1.9 案例:比較不同時間段和類別的詞頻 40
1.9.1 創建詞頻時間表 40
1.9.2 創建詞頻熱圖 42
1.10 小結 44
第2 章 利用API 提取文本 45
2.1 本章內容概要 .45
2.2 應用程式編程接口 45
2.3 案例:使用requests 模組通過API 提取數據 .47
2.3.1 分頁 52
2.3.2 速率限制53
2.4 案例:使用Tweepy 提取推特數據 57

相關詞條

熱門詞條

聯絡我們