Python社會媒體挖掘

Python社會媒體挖掘

《Python社會媒體挖掘》是2018年10月人民郵電出版社出版的圖書,作者是[意]馬爾科·邦扎尼尼(Marco Bonzanini)。

基本介紹

  • 中文名:Python社會媒體挖掘
  • 作者:[意]馬爾科·邦扎尼尼(Marco Bonzanini)
  • ISBN:9787115494016
  • 頁數:229頁
  • 定價:69元
  • 出版社:人民郵電出版社
  • 出版時間:2018年10月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

本書共分為9章,從社會媒體API、數據挖掘技巧和Python的數據科學工具這3個主題進行闡釋。主要內容包括:如何用Python通過公共API與社會媒體平台互動,如何以方便的格式為數據分析存儲社端擊承會媒體數據,如何使用Python數據科學工具分割社會媒體數據,如何用文本分析方法理解社會媒體數據,如何用先進的統計和分析手段從海量數據中挖掘出有用信息,以及如何用Web技術來可視化數據。

圖書目錄

第 1章 社會媒體、社交數據和Python 1
1.1 入門 1
1.2 社會媒體——機遇和挑戰 2
1.2.1 機遇 3
1.2.2 挑戰 4
1.2.3 社會媒體挖掘技術 7
1.3 Python的數據科學工具 10
1.3.1 Python開發環境的安裝 11
1.3.2 高效的數據分析 14
1.3.3 機器學習 17
1.3.4 自然語言處理 21
1.3.5 社會網路分析 25
1.3.6 數據可視化 26
1.4 Python中的數據處理 28
1.5 創建複雜的數據管道 29
1.6 小結 30
第 2章 Twitter數據挖掘——標籤、話題和時間序列 31
2.1 入門 31
2.2 Twitter API 32
2.2.1 接口訪問頻率限制 32
2.2.2 搜尋與流 33
2.3 從Twitter收集數據 34
2.3.1 從時間線獲取推文 35
2.3.2 推文的結構 38
2.3.3 使用流API 42
2.4 分析推文——實體分析 44
2.5 分析推文——文本分析 48
2.6 分析推文——時間序列分析 54
2.7 小結 57
第3章 Twitter用戶、冬粉和社區 58
3.1 用戶、好友和冬粉 58
3.1.1 回到Twitter API 58
3.1.2 用戶資料的結構 59
3.1.3 下載好友和冬粉的資料 62
3.1.4 分析你的社會網路 64
3.1.5 度量影響力和參與度 68
3.2 挖掘冬粉 72
3.3 挖掘對話 77
3.4 在地圖上繪製推文 80
3.4.1 將推文轉換為GeoJSON 80
3.4.2 用Folium輕鬆繪製地圖 83
3.5 小結 89
第4章 Facebook帖子、頁面和用戶互動 90
4.1 Facebook Graph API 90
4.1.1 註冊你的套用 90
4.1.2 鑒權和安全 92
4.1.3 用夜坑櫻Python連線Facebook Graph API 93
4.2 挖掘你的帖子 96
4.2.1 帖子的結構 99
4.2.2 時間頻率分析 99
4.3 挖掘Facebook頁面 101
4.3.1 從頁面獲取帖子 103
4.3.2 度量參與度 107
4.3.3 用詞雲可視化帖子 112
4.4 小結 114
第5章 Google+話題分析 115
5.1 Google+ API入門 115
5.2 在Web GUI中嵌入搜尋結果 120
5.2.1 Python的裝飾器 121
5.2.2 Flask路由和模板 122
5.3 Google+頁面的筆記和活動 125
5.4 筆記的文本分析和TF-IDF計算 127
5.5 小結樂請頌 134
第6章 Stack Exchange提問和回答 135
6.1 提問和回答 135
6.2 Stack Exchange API入門 137
6.2.1 搜尋帶標籤的問題 139
6.2.2 搜尋用戶 142
6.3 處理Stack Exchange的存檔數據 144
6.4 問題標籤的文本分類 149
6.4.1 監督學習和文本分類 149
6.4.2 講墊分類算法 153
6.4.3 評估 155
6.4.4 Stack Exchange數據的文本分類 157
6.4.5 在實時套用中嵌入分類器 161
6.5 小結 165
第7章 部落格、RSS、維基百科和自然語言處理 166
7.1 部落格和自然語言處理 166
7.2 從部落格和網站獲取數據 166
7.2.1 使用WordPress.com API 167
7.2.2 使用Blogger API 170
7.2.3 解析RSS和Atom訂囑再棕閱 173
7.2.4 從維基百科獲取數滲危辯燥據 174
7.2.5 關於網路爬取的一點建議 176
7.3 自然語言處理基礎 177
7.3.1 文本處理 177
7.3.2 信息抽取 185
7.4 小結 190
第8章 挖掘所有數據訂槓照坑 191
8.1 很多社交API 191
8.2 挖掘YouTube上的視頻 191
8.3 挖掘GitHub上的開源軟體 196
8.4 挖掘Yelp上的本地商家 203
8.5 創建自定義的Python客戶端 208
8.6 小結 210
第9章 關聯數據和語義網 211
9.1 數據網 211
9.1.1 語義網辭彙 212
9.1.2 微格式 215
9.1.3 關聯數據和開放數據 216
9.1.4 RDF 217
9.1.5 JSON-LD格式 218
9.1.6 Schema.org 219
9.2 從DBpedia挖掘關係 220
9.3 挖掘地理坐標 222
9.3.1 從維基百科抽取地理數據 222
9.3.2 在Google Maps上繪製地理數據 225
9.4 小結 229

相關詞條

熱門詞條

聯絡我們