基於Python的智慧型文本分析

基於Python的智慧型文本分析

《基於Python的智慧型文本分析》是2019年中國電力出版社出版的圖書,作者是Benjamin Bengfort / Rebecca Bilbro / Tony Ojeda。

基本介紹

  • 中文名:基於Python的智慧型文本分析
  • 作者:Benjamin Bengfort 、 Rebecca Bilbro、 Tony Ojeda
  • 譯者:陳光
  • 出版時間:2019年12月1日 
  • 出版社:中國電力出版社 
  • 頁數:328 頁 
  • ISBN:9787519838294
  • 定價:88 元 
  • 裝幀:平裝 
內容簡介,圖書目錄,

內容簡介

·預處理並將文本向量化成高維特徵表示。
·執行文檔分類和主題建模。
·通過可視化診斷指導模型選擇過程。
·提取關鍵短語、命名實體和圖結構,實現文本數據推斷。
·建立對話框架,實現聊天機器人和語言驅動互動。
·用Spark擴展處理能力,用神經網路實現對更複雜模型的支持。

圖書目錄

前言 1
第1章 語言與計算 13
數據科學範式 14
語言感知數據產品 .16
語言即數據 21
小結 .29
第 2 章 構建自定義語料庫 31
語料庫是什麼? .32
語料庫數據管理 .35
語料庫讀取器 39
小結 .49
第3章 語料庫預處理與處置 50
分解文檔.50
語料庫的轉換 60
小結 .67
第4章 文本向量化和轉換流水線 68
空間中的詞 69
Scikit-Learn API .81
流水線 .88
小結 .93
第5章 面向文本分析的文本分類 95
文本分類.96
構建文本分類套用 .99
小結 .110
第6章 文本相似性聚類 . 112
文本上的無監督學習 112
文檔相似性聚類 .114
文檔主題建模 127
小結 .139
第7章 上下文感知文本分析 140
基於語法的特徵提取 141
n-Gram特徵提取 147
n-Gram語言模型 155
小結 .165
第8章 文本可視化 166
可視化特徵空間 .167
模型診斷.185
可視化操縱 193
小結 .196
第9章 文本的圖分析 .198
圖計算與分析 200
從文本中抽取圖 .204
實體解析.216
小結 .221
第10章 聊天機器人 223
對話基礎.224
禮貌對話規則 231
有趣的問題 239
學習幫助.250
小結 .257
第11章 利用多處理和Spark擴展文本分析259
Python多處理 .260
Spark集群計算 271
小結 .289
第12章 深度學習與未來 .291
套用神經網路 292
神經網路語言模型 .292
情感分析.303
未來(幾乎)已來 .309
辭彙表 311

相關詞條

熱門詞條

聯絡我們