O\x27Reilly 社交網站的數據挖掘與分析

O\x27Reilly 社交網站的數據挖掘與分析

《O'Reilly 社交網站的數據挖掘與分析》是2012年2月機械工業出版社出版的圖書,作者是Mattbew A.Russell。

基本介紹

  • 中文名:O'Reilly 社交網站的數據挖掘與分析
  • 作者:Mattbew A.Russell
  • 譯者:師蓉
  • 出版社:機械工業出版社
  • 出版時間:2012年2月1日
  • 頁數:316 頁
  • 定價:59 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111369608
內容簡介,圖書目錄,作者簡介,

內容簡介

Facebook、Twitter和LinkedIn產生了大量寶貴的社交數據,但是怎樣才能找出誰通過社交媒介正在進行聯繫?他們在討論些什麼?或者他們在哪兒?本書簡潔而且具有可操作性,它將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網路數據、分析技術,如何通過可視化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用信息。
  《社交網站的數據挖掘與分析》每章都介紹了在社交網路的不同領域挖掘數據的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的編程經驗和學習基本的Python工具的意願。
  通過本書,你將:
  獲得對社交網路世界的直觀認識
  使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn等社交網路API中的數據
  學習如何套用便捷的Python工具來交叉分析你所收集的數據
  通過XFN探討基於微格式的社交聯繫
  套用諸如TF-IDF、餘弦相似性、搭配分析、文檔摘要、派系檢測之類的先進挖掘技術
  通過基於HTML 5和JavaScript工具包的網路技術建立互動式可視化

圖書目錄

前言
第1章 緒論:Twitter 數據的處理
Python 開發工具的安裝
Twitter 數據的收集和處理
小結
第2章 微格式:語義標記和常識碰撞
XFN 和朋友
使用XFN 來探討社交關係
地理坐標:興趣愛好的共同主線
(以健康的名義)對菜譜進行交叉分析
對餐廳評論的蒐集
小結
第3章 信箱:雖然老套卻很好用
mbox:Unix 的入門級信箱
mbox+CouchDB= 隨意的Email 分析
將對話執行緒化到一起
使用SIMILE Timeline 將郵件"事件"可視化
分析你自己的郵件數據
小結
第4章 Twitter :朋友、關注者和Setwise 操作
REST 風格的和OAuth-Cladded API
幹練而中肯的數據採集器
友誼圖的構建
小結
第5章 Twitter:tweet ,所有的tweet ,只有tweet
筆PK 劍:和tweet PK 機槍
對tweet 的分析(每次一個實體)
並置潛在的社交網站(或#JustinBieber VS #TeaParty)
對大量tweet 的可視化
小結

相關詞條

熱門詞條

聯絡我們