社交網站的數據挖掘與分析

社交網站的數據挖掘與分析

《社交網站的數據挖掘與分析》是2015年機械工業出版社出版的圖書,作者是Matthew A. Russell,譯者是師蓉。

基本介紹

  • 書名:社交網站的數據挖掘與分析
  • 作者:Matthew A. Russell
  • 譯者:師蓉 
  • ISBN:9787111486992
  • 頁數:301
  • 定價:79.00
  • 出版社:機械工業出版社
  • 出版時間:2015年3月
  • 裝幀:平裝
  • 開本:16開
內容簡介,作者簡介,作品目錄,

內容簡介

社交網站數據如同深埋地下的“金礦”,如何利用這些數據來發現哪些人正通過社交媒介進行聯繫?他們正在談論什麼?或者他們在哪兒?本書第2版對上一版內容進行了全面更新和修訂,它將揭示回答這些問題的方法與技巧。你將學到如何獲取、分析和匯總散落於社交網站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、郵件、網站和部落格等)的數據,以及如何通過可視化找到你一直在社交世界中尋找的內容和你聞所未聞的有用信息。
Facebook、Twitter和LinkedIn產生了大量寶貴的社交數據,但是怎樣才能找出誰通過社交媒介正在進行聯繫?他們在討論些什麼?或者他們在哪兒?本書簡潔而且具有可操作性,它將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網路數據、分析技術,如何通過可視化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用信息。
主要講述了在社交網路的不同領域挖掘數據的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的編程經驗和學習基本的Python工具的意願。
通過本書,你將
. 獲得對社交網路世界的直觀認識
. 使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn等社交網路API中的數據
. 學習如何套用便捷的Python工具來交叉分析你所收集的數據
. 通過XFN探討基於微格式的社交聯繫
. 套用諸如TF-IDF、餘弦相似性、搭配分析、文檔摘要、派系檢測之類的先進挖掘技術
. 通過基於HTML 5和JavaScript工具包的網路技術建立互動式可視化

作者簡介

馬修·羅塞爾(Matthew A.Russell),Digital Reasoning Systems公司的技術副總裁和Zaffra公司的負責人,是熱愛數據挖掘、開源和Web套用技術的計算機科學家。他也是《Dojo: The Dofinitive Guide》(O'Reilly出版社)的作者。在LinkedIn上聯繫他或在Twitter上關注@ptwobrussell,可隨時關注他的最新動態。

作品目錄

前言1
第1章緒論:Twitter 數據的處理9
Python 開發工具的安裝9
Twitter 數據的收集和處理11
小結24
第2章微格式:語義標記和常識碰撞26
XFN 和朋友27
使用XFN 來探討社交關係29
地理坐標:興趣愛好的共同主線37
(以健康的名義)對菜譜進行交叉分析41
對餐廳評論的蒐集43
小結45
第3章信箱:雖然老套卻很好用47
mbox:Unix 的入門級信箱48
mbox+CouchDB= 隨意的Email 分析54
將對話執行緒化到一起70
使用SIMILE Timeline 將郵件“事件”可視化79
分析你自己的郵件數據82
小結84
第4章Twitter :朋友、關注者和Setwise 操作85
REST 風格的和OAuth-Cladded API86
幹練而中肯的數據採集器90
友誼圖的構建108
小結116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
筆PK 劍:和tweet PK 機槍(?!?)118
對tweet 的分析(每次一個實體)121
並置潛在的社交網站(或#JustinBieber VS #TeaParty)144
對大量tweet 的可視化155
小結163
第6章LinkedIn :為了樂趣(和利潤?)將職業網路聚類164
聚類的動機165
按職位將聯繫人聚類167
獲取補充個人信息183
從地理上聚類網路188
小結192
第7章Google Buzz:TF-IDF 、餘弦相似性和搭配194
Buzz=Twitter+ 部落格(???)195
使用NLTK 處理數據198
文本挖掘的基本原則201
查找相似文檔208
在二元語法中發Buzz 215
利用Gmail 221
在中斷之前試著創建一個搜尋引擎……225
小結226
第8章部落格及其他:自然語言處理(等)228
NLP :帕累托式介紹228
使用NLTK 的典型NLP 管線231
使用NLTK 檢測部落格中的句子234
對檔案的總結237
以實體為中心的分析:對數據的深層了解245
小結256
第9章Facebook :一體化的奇蹟257
利用社交網路數據258
對Facebook 數據的可視化274
小結294
第10 章語義網:簡短的討論296
發展中的變革296
人不可能只靠事實生活297
期望301

相關詞條

熱門詞條

聯絡我們