非結構化大數據分析

非結構化大數據分析

《非結構化大數據分析》是2018年10月中國人民大學出版社出版的圖書,作者是李翠平。

基本介紹

  • 中文名:非結構化大數據分析
  • 作者:李翠平
  • 出版社:中國人民大學出版社
  • 出版時間:2018年10月
  • 定價:36 元
  • ISBN:9787300262970
內容簡介,圖書目錄,

內容簡介

結構化數據是與結構化數據相對應的概念。結構化數據具有固定的格式,看上去非常規整。與結構化數據相反,非結構化數據是指無固定格式的數據,例如,文本、網頁、圖像、視頻、數據流、序列、社交網路、圖結構等。現有數據中絕大多數數據都是非結構化數據。
本書介紹了四種典型非結構化數據的分析和挖掘技術,分別是:文本數據、社交網路數據、數據流數據和多媒體數據(包括圖像、音頻和視頻)。為了便於讀者學習,大部分內容除了理論講解之外,還給出了相應的在大數據環境下的上機實踐案例。

圖書目錄

第1章 文本挖掘概述
1.1 時代背景
1.2 文本挖掘與數據挖掘
第2章 文本預處理
2.1 自然語言處理
2.2 分詞技術
2.3 文本表示
第3章 文本分類
3.1 預測建模
3.2 決策樹分類
3.4 支持向量機分類
3.5 實踐案例———垃圾簡訊識別
第4章 文本聚類和話題檢測
4.1 概述
4.2 基於相似度的文本聚類
4.3 基於模型的文本聚類
4.4 實踐案例———用LDA實現話題檢測
第5章 情感分析和觀點挖掘
5.1 概述
5.2 問題定義
5.3 文檔級情感分析
5.4 句子級情感分析
5.5 方面級情感分析
5.6 存在的問題和挑戰
5.7 實踐案例———發債企業負面新聞識別系統
第6章 社交網路及其統計特性
6.1 社交網路簡介
6.2 相關基本概念
6.3 常見統計特性
6.4 實踐案例———微博用戶關係分析
第7章 社區發現
7.1 概述
7.2 社區發現方法
7.3 社區發現相關的研究領域
7.4 實踐案例———用邊聚類探測算法發現社區
第8章 個體社會影響力分析
8.1 概述
8.2 個體社會影響力及影響強度度量
8.3 實踐案例———用PageRank算法計算個體社會影響力
第9章 鏈路預測
9.1 簡介
9.2 基於相似度的鏈路預測算法
9.3 基於等級結構模型的鏈路預測算法
9.4 實踐案例———鏈路預測
第10章 網路信息擴散
10.1 熱點主題的發現方法
10.2 信息擴散過程的建模與分析
10.3 實踐案例———信息擴散計算過程
第11章 數據流中的數據挖掘
11.1 簡介
11.2 數據流中的變化探測
11.3 實時更新數據流中的直方圖
11.4 數據流中的聚類
11.5 數據流的分類
11.6 數據流方法的評估
第12章 多媒體數據分析
12.1 概述
12.2 基礎知識
12.3 特徵提取
12.4 多媒體內容檢索
12.5 多媒體內容識別
12.6 國際評測
12.7 問題與挑戰

相關詞條

熱門詞條

聯絡我們