輿情計算方法與技術

輿情計算方法與技術

《輿情計算方法與技術》是2016年8月電子工業出版社出版的圖書,作者是饒元。

基本介紹

  • 中文名:輿情計算方法與技術
  • 作者:饒元
  • ISBN:9787121296260
  • 頁數:356頁
  • 定價:88元
  • 出版社:電子工業出版社
  • 出版時間:2016年8月
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

社會計算是近十年來快速發展起來的一個新興的研究領域,它一方面依託於近年社交網路技術以及套用的快速發展,使得越來越多的網路用戶之間產生自聯接、自媒體、自選擇的內容傳播新方式,並且帶來了關於針對文本內容深入挖掘與分析的強大動力基礎;另一方面傳統社會學對於社會活動領域中的分析方法,特別是基於網路化的社會化分析方法,使得人們發現在龐大的網路數據中,可以充分地利用其中的一些指標與算法進行有效的度量與分析,從而使得社會網路分析方法從技術角度上再次獲得了新的生命力。在這兩股力量的共同作用與影響下,社會計算領域中大量的研究成果也在不斷湧現出來。因此,本書從社會計算和自然語言處理與文本挖掘兩個角度出發,針對社會輿情分析過程中存在的核心方法進行綜合介紹。

圖書目錄

目 錄
第 1章社會計算與社會輿情分析概述 1
1.1 社會計算的概念與關鍵技術 1
1.1.1 Web2.0與社會化軟體的特徵 1
1.1.2 社會計算的概念 3
1.1.3 社會計算與社會智慧型研究的核心內容 6
1.2 社會輿情的特徵與分析方法 10
1.2.1 社會輿情的概念與特徵 10
1.2.2 網路輿情的形成和演化過程 11
1.2.3 網路輿情的關鍵技術與方法 13
1.3 本書的知識結構 15
參考文獻 17
實驗室相關工作文獻 17
第 2章社會網路分析理論與相關技術基礎 18
2.1 社會網路分析方法 18
2.1.1 社會網路分析方法的發展與研究的問題域 18
2.1.2 社會網路分析方法的主要理論與概念體系 24
2.1.3 社會網路分析的主要研究方法與分析工具 28
2.2 自然語言處理 31
2.2.1 自然語言處理的基本問題 31
2.2.2 中文分詞 32
2.2.4 共指消解 34
2.2.5 實體關係的抽取 34
2.2.6 事件探測與追蹤 35
2.3 數據挖掘與機器學習方法概述 35
2.3.1 數據挖掘與機器學習方法 35
2.3.2 基於 Web的文本挖掘 39
2.4 本章小結 41
參考文獻 42
第 3章中文文本特徵與詞分析技術 43
3.1 中文文本的基本特徵 43
3.1.1 中文文本的基本特徵 43
3.1.2 中文文本分析的任務與數據結構特徵 45
3.1.3 中文文本句法結構分析 50
3.1.4 基於統計的句法分析方法 54
3.2 中文分詞技術 55
3.2.1 中文分詞的核心問題 55
3.2.2 基於規則的中文分詞的關鍵技術與算法 58
3.2.3 基於統計的中文分詞的關鍵技術與算法 60
3.2.4 基於理解的分詞方法 65
3.2.5 主要中文分詞工具 65
3.3 主題詞庫的構建 67
3.3.1 主題詞基本概念 67
3.3.2 主題詞間的關係定義 69
3.3.3 主題詞的抽取方法 71
3.3.4 主題詞庫的構建 73
3.4 本章小結 79
參考文獻 80
實驗室相關工作 80
第 4章社會網路環境下的文本數據預處理技術 81
4.1 文本數據的詞義衝突與數據消歧 81
4.1.1 文本數據存在的詞義衝突與消歧 81
4.1.2 基於知識的詞義消歧方法 83
4.1.3 無監督的詞義消歧技術 86
4.1.4 有監督的詞義消歧技術 89
4.2 文本數據的稀疏性與降維 90
4.2.1 數據稀疏問題及解決 91
4.2.2 數據平滑技術 92
4.2.3 數據降維方法 93
4.3 數據融合 97
4.3.1 數據融合的概念與方法 98
4.3.2 實體的識別與統一表示 99
4.3.3 數據衝突處理 102
4.3.4 數據關聯 103
4.4 本章小結 104
參考文獻 104
實驗室相關工作 106
第 5章文本聚類方法分析 107
5.1 聚類基礎概念 107
5.1.1 聚類算法的定義 107
5.1.2 聚類算法的目標與基本數據結構 108
5.1.3 數據對象距離及相似度度量 109
5.1.4 其他數據類型與相似度度量 111
5.2 常用的文本聚類算法 113
5.2.1 文本聚類的基本需求 113
5.2.2 文本聚類方法 114
5.2.3 文本聚類結果的評價方法 120
5.3 基於文本數據流的聚類方法121
5.3.1 數據流問題的背景 121
5.3.2 數據流基本概念與模型 122
5.3.3 數據流聚類方法 124
5.3.4 演化分析技術 129
5.4 本章小結 131
參考文獻 131
實驗室相關工作 133
第 6章文本分類方法134
6.1 分類基礎概念 134
6.1.1 分類問題的定義 134
6.1.2 文本分類與目標 135
6.1.3 分類算法的評價 136
6.2 基於機率的貝葉斯分類方法137
6.2.1 貝葉斯機率公式 138
6.2.2 樸素貝葉斯分類原理 138
6.2.3 基於樸素貝葉斯分類算法的文本分類器設計 139
6.2.4 貝葉斯網路模型 141
6.3 基於核的分類算法 143
6.3.1 支持向量機算法 143
6.3.2 核函式的定義 145
6.3.3 多類問題的求解算法 147
6.4 其他分類器的常用構造算法149
6.4.1 Rocchio分類算法 149
6.4.2 KNN算法 149
6.4.3 Boosting算法 151
6.5 本章小結 152
參考文獻 153
第 7章信息抽取與摘要自動生成技術 154
7.1 命名實體的識別與抽取技術154
7.1.1 命名實體識別的基本任務 154
7.1.2 人名實體抽取 156
7.1.3 地名實體抽取方法 160
7.1.4 機構名實體抽取方法 163
7.2 網路文本數據中的實體間關係的抽取165
7.2.1 實體關係的定義與基本分類 165
7.2.2 存在關係的實體對抽取方法 166
7.2.3 基於核函式的實體關係抽取方法 168
7.3 話題識別與追蹤技術(TDT)171
7.3.1 話題識別與追蹤需要解決的問題與目標 171
7.3.2 話題識別與追蹤的經典方法 173
7.3.3 話題識別與追蹤的評價方法 175
7.4 自動摘要生成技術 176
7.4.1 自動文檔摘要生成所需要解決的問題與目標 176
7.4.2 單文檔自動摘要生成技術 178
7.4.3 多文檔自動文摘生成的關鍵技術 181
7.4.4 自動摘要系統的評價標準 183
7.5 本章小結 185
參考文獻 185
第 8章社會網路中社區識別與信息傳播188
8.1 網路社區的識別 188
8.1.1 網路社區的概念 189
8.1.2 網路社區的特徵與關鍵問題 191
8.1.3 基於非重疊社區的發現算法 195
8.1.4 基於重疊的網路社區發現與識別算法 198
8.1.5 社區發現算法評價方法 201
8.2 網路信息的傳播模型 203
8.2.1 網路信息傳播中的基本問題 203
8.2.2 行動者影響力分析 204
8.2.3 信息傳播動力學模型 207
8.3 連結預測模型與方法 211
8.3.1 連結預測的概念與主要目標 212
8.3.2 連結預測存在的主要算法分類與指標 212
8.3.3 連結預測存在的經典算法 215
8.4 本章小結 218
參考文獻 218
第 9章社會網路下的情感分析221
9.1 情感計算的基本概念與問題挑戰221
9.1.1 情感分析的概念與研究目標 221
9.1.2 情感詞的識別與標註 223
9.1.3 情感詞典的構建 225
9.2 文本的主/客觀分析與觀點挖掘分析方法228
9.2.1 文本的主/客觀分析方法 228
9.2.2 觀點挖掘分析方法 229
9.3 情感分析與計算方法 232
9.3.1 基於詞的經典情感計算與分析方法 232
9.3.2 不同粒度下的情感分析方法 234
9.3.3 文檔主體對象的情感傾向分析方法 240
9.3.4 跨領域文檔的情感傾向分析方法 245
9.3.5 情感計算評價方法 245
9.4 本章小結 246
參考文獻 247
第 10章數據可視化技術250
10.1 可視化技術概述 250
10.1.1 可視化技術的基本概念與目標 250
10.1.2 可視化技術的分類 252
10.2 社會網路可視化的靜態分析方法260
10.2.1 社會網路環境下的可視化方法介紹 260
10.2.2 力導引布局(Force-directed Layout)相關算法 262
10.2.3 層次布局(Tier-based Layout) 264
10.2.4 樹形布局(Tree-based Layout) 269
10.3 動態可視化互動方法與可視化模式挖掘技術273
10.3.1 可視化的動態互動與形變技術 274
10.3.2 可視化模式挖掘與分析方法 277
10.4 數據可視化的質量評價方法278
10.4.1 數據可視化的質量評價模型 278
10.4.2 數據可視化的質量評價指標 280
10.5 本章小結 281
參考文獻 282
第 11章社會計算與輿情分析套用284
11.1 社會網路輿情分析與套用284
11.1.1 分析指標體系與分析模型的建立 284
11.1.2 分析平台的建立與套用 288
11.2 企業社會網路分析與套用289
11.2.1 企業社會網路構造方法 290
11.2.2 企業特徵的抽取 291
11.2.3 企業社會網路服務平台與可視化分析 292
11.3 專家網路與知識圖譜套用293
11.3.1 專家模型的構建與屬性抽取規則 293
11.3.2 專家模型中的屬性消歧與網路構建 297
11.4 專利地圖的套用298
11.4.1 專利地圖的研究與製作方法 298
11.4.2 專利地圖的構建與分析 299
11.5 金融風險預測與分析套用302
11.6 本章小結304
參考文獻 305
第 12章社會計算與輿情分析的技術發展趨勢307
12.1 大數據與數據世系 308
12.2 基於機器學習的類人腦科學的演化310
12.3 社會計算向社會智慧型的演化312
12.4 小結 314
參考文獻 315
附錄 A基於信息傳播的分類及網站示例 317
附錄 B 基於 LDA模型的候選主題詞抽取算法描述318
附錄 C常用的中文停用詞表321
附錄 D TBDC4TS聚類算法偽代碼示意333
後記335

相關詞條

熱門詞條

聯絡我們