《R語言與網路輿情處理》是2018年1月出版的圖書,作者是於衛紅。
基本介紹
- 中文名:R語言與網路輿情處理
- 作者:於衛紅
- 語言:中文
- 出版時間:2018年1月1日
- 出版社:清華大學出版社
- ISBN:9787302482574
- 定價:39 元
- 印次:1-1
- 印刷日期:2017年11月28日
內容簡介,目錄,
內容簡介
進入網際網路時代後,網路輿情形成迅速,影響著社會生活的方方面面,如何高效全面地採集輿情數據並利用數據挖掘算法及數據分析工具將輿情文本中有價值的信息挖掘出來,對於輿情監管、輿情研判、輿情引導至關重要。本書以R語言作為輿情分析的工具,在闡述相關原理的基礎上,介紹了網路輿情信息採集、輿情信息預處理、輿情文本分類、輿情文本聚類、輿情數據關聯規則挖掘、輿情相關指標預測等輿情分析環節,所有分析都使用R語言進行實現,給出了完整的過程和代碼。
目錄
第1章網路輿情與輿情分析概述
1.1輿情與網路輿情的基本概念
1.1.1輿情的起源及定義
1.1.2網路輿情
1.2網路輿情的特徵及表現形式
1.3網路輿情分析技術
1.3.1網路輿情分析的研究熱點
1.3.2網路輿情分析的步驟
1.3.3網路輿情分析的常用技術
第2章R語言基礎
2.1R語言簡介
2.1.1R語言的起源、特點及安裝
2.1.2R語言的基本操作
2.1.3R語言的常用命令
2.1.4包的安裝與載入
2.2數據操作
2.2.1基本數據類型
2.2.2數據結構
2.2.3數據讀寫
2.2.4數據的描述性統計
2.3R語言語法
2.3.1分支結構
2.3.2循環結構
2.3.3R語言函式
2.3.4apply函式族
2.4R語言繪圖
2.4.1條形圖
2.4.2餅圖
2.4.3直方圖
2.4.4散點圖
第3章網路輿情信息採集及R爬蟲的實現
3.1網路輿情信息採集的基本原理
3.1.1網路爬蟲及其主要類型
3.1.2爬蟲的工作流程
3.2免費的網路輿情採集利器——八爪魚數據採集器
3.2.1簡介
3.2.2下載、安裝、啟動與註冊賬號
3.2.3八爪魚採集器的使用
3.3基於R語言的信息採集爬蟲的開發
3.3.1HTTP
3.3.2RCurl包
3.3.3XML包
3.3.4基於RCurl包與XML包的爬蟲示例
第4章基於R語言的輿情信息預處理
4.1分詞處理
4.1.1分詞的基本原理
4.1.2使用Rwordseg包進行分詞
4.1.3使用jiebaR包進行分詞
4.2去停用詞
4.2.1什麼是停用詞
4.2.2R語言中去停用詞的方法
4.3詞頻統計
4.3.1詞頻統計常用函式
4.3.2詞雲可視化
4.4文本向量化
4.4.1語料庫與文本向量空間
4.4.2R語言中語料庫的構建
4.4.3R語言中文本向量的構建——文檔詞條矩陣
第5章基於R語言的網路輿情分類
5.1分類的定義及其基本原理
5.1.1分類的定義
5.1.2分類的基本原理
5.2經典的分類算法——決策樹算法
5.2.1什麼是決策樹
5.2.2決策樹算法的基本思想
5.3分類算法在輿情分析中的套用
5.3.1網路輿情分類的基本原理
5.3.2網路輿情分類的常用算法及其R語言實現
5.4基於R語言的網路輿情分類示例——微信公眾號文章分類
5.4.1問題描述
5.4.2數據採集
5.4.3微信公眾號文章分類的R語言實現
第6章基於R語言的網路輿情熱點話題聚類
6.1聚類的定義及其基本原理
6.1.1聚類的定義
6.1.2聚類的基本原理
6.2經典的聚類算法
6.2.1KMeans聚類
6.2.2層次聚類
6.3聚類算法在輿情分析中的套用及其R語言實現
6.4基於R語言的網路輿情聚類分析示例——電商顧客評論熱點話題聚類
6.4.1問題描述
6.4.2數據採集
6.4.3電商商品評論聚類分析的R語言實現
第7章基於R語言的網路輿情關聯規則挖掘
7.1關聯規則挖掘的定義及其基本原理
7.1.1什麼是關聯規則挖掘
7.1.2關聯規則挖掘的基本原理
7.2常用的關聯規則挖掘算法
7.2.1Apriori算法
7.2.2Eclat算法
7.3關聯規則挖掘在輿情分析中的套用及其R語言實現
7.4基於R語言的網路輿情關聯分析示例——霧霾輿情熱點詞關聯
模式挖掘
7.4.1問題描述
7.4.2數據採集
7.4.3霧霾輿情熱點詞關聯模式挖掘的R語言實現
8.1BP神經網路概述
8.1.1什麼是人工神經網路
8.1.2什麼是BP神經網路
8.2BP神經網路的算法原理
8.2.1BP神經網路的算法流程
8.2.2數據的歸一化處理
8.3BP神經網路在輿情分析中的套用及其R語言實現
8.4基於R語言與神經網路的輿情分析示例——微博轉發數與評論數預測
8.4.1問題描述
8.4.2數據採集
8.4.3基於R語言與神經網路的微博轉發數與評論數預測的實現
參考文獻