《大數據視角下的觀點挖掘》是余傳明創作的工業技術類著作,首次出版於2018年9月。
該書從現實問題出發,探究了觀點挖掘的核心算法和理論,闡明了算法的運行過程、相應的實驗過程以及實驗結果。全書為大數據環境下的觀點挖掘提出了一套較為完整的理論機制,對解決領域與語言跨度下的文本表示、共同特徵抽取等問題提出了解決思路,對大數據環境下深度學習用於觀點挖掘進行了嘗試和探索。
基本介紹
- 作品名稱:大數據視角下的觀點挖掘
- 作者:余傳明
- 首版時間: 2018年9月
- 字數: 232千字
- 類別:工業技術類著作
內容簡介,作品目錄,創作背景,作品思想,出版信息,作者簡介,
內容簡介
該書共十二章。第一章導論部分概述了大數據視角下觀點挖掘的相關研究與不足,提出了大數據環境下所面臨的規模跨度、領域跨度以及語言跨度等挑戰,從而引出了該書的研究問題。第二章論述了大數據環境下觀點挖掘的研究方法。第三章論述了虛假評論的識別問題。第四章論述了產品名稱識別問題。第五章論述了產品屬性識別問題。第六章論述了觀點的情感分析問題。第七章研究了觀點挖掘的領域適配問題。第八章研究了觀點挖掘的語言適配問題。第九章討論了觀點挖掘的規模適配問題。第十章以自然語言處理技術與深度學習為切入點,探索了觀點摘要的相關思路和研究問題。第十一章以西非伊波拉爆發的微博作為研究對象,探索了觀點挖掘的主題分析的相關思路和研究問題,包括主題時序分析和演化等。第十二章對全書進行了總結。
zhua曲子白渡白顆
作品目錄
第一章 導論 第二章 大數據環境下的觀點挖掘研究方法 第三章 虛假評論識別 第四章 產品名稱識別 第五章 產品屬性識別 第六章 觀點的情感分析 | 第七章 觀點挖掘的領域適配 第八章 觀點挖掘的語言適配 第九章 觀點挖掘的規模適配 第十章 觀點摘要 第十一章 觀點主題分析 第十二章 總結與展望 |
創作背景
21世紀初,隨著信息技術的快速發展,計算機網際網路逐漸成為人們表達觀點、情感的重要渠道。網路平台上的觀點、評論等主觀信息迅速增長,對這些信息進行分析能夠幫助企業和公司改進產品與服務,及時修復可能潛在惡化的客戶關係,提高企業在市場中的競爭力,因而具有重要的理論與實踐意義。在這種情況下,越來越多的企業和公司把關注投向網際網路上的產品和服務評論,分析這些評論中所傳遞的重要信息。然而,由於評論信息的數量龐大且非結構化,通過人工閱讀的方式往往難以完成,如何使用觀點挖掘技術來解決海量的評論信息與個人有限的閱讀能力之間的矛盾,已成為研究者亟待解決的重要問題。為了嘗試解決上述問題,余傳明於2008年開始申報國家自然科學基金項目“WEB2.0環境下基於本體學習的觀點挖掘研究”,並展開了相關的研究。歷時10年,完成了專著《大數據視角下的觀點挖掘》。
作品思想
該書為大數據環境下的觀點挖掘提出了一套較為完整的理論機制,對解決領域與語言跨度下的文本表示、共同特徵抽取等問題提出了解決思路,對大數據環境下深度學習用於觀點挖掘進行了嘗試和探索。理論分析與實踐操作相結合,建立了一套大數據環境下的觀點挖掘框架體系,相關的實證研究為大數據環境下的跨語言、跨領域觀點挖掘提供新的借鑑,為大數據環境下的網路信息組織提供新的有力手段。將數據挖掘、機器學習、人工智慧、統計學、資訊理論、計算複雜性、自然語言處理和情報學等學科的知識,套用於觀點挖掘這一新的研究問題,並以此來理解觀點挖掘各種算法的背景、問題和其中的推導過程。有助於幫助不同背景和經驗的人交換關於觀點挖掘的見解,為進一步促進這個迅速發展的領域的成長做出貢獻。
該書力求平衡觀點挖掘的理論分析與實踐操作,在廣度與深度方面保持均衡。其內容既包含分類、聚類、序列標註模型、領域適配、語言適配、深度學習和可視化等方面的理論成果,又涵蓋條件隨機場、自組織映射、潛在狄利克雷分布、支持向量機以及卷積神經網路等方面的具體算法,以及算法的運行過程與結果分析等,便於讀者從理論與實踐兩方面同時理解和掌握該書的內容。其次,力求體現多學科性以及學科交叉性,將統計學、人工智慧、資訊理論等學科的前沿知識融入大數據視角下的觀點挖掘這一具體問題,將觀點挖掘和大數據議題糅合成有機的整體,為讀者提供一個全面的視圖。這種跨學科、跨領域的研究成果服務於多個學科領域,適應了學科的交叉發展大趨勢。最後,力求體現系統性,系統而詳細的介紹觀點挖掘的理論和方法體系。
該書提出了面向大數據的觀點挖掘模型,與以往研究更多側重於某一特定領域或特定語言不同,提出了基於遷移學習的觀點挖掘模型,對解決大數據環境下的跨領域跨語言文本表示、共同特徵抽取等問題提出了應對思路,使得模型能夠更好地處理領域跨度、語言跨度和規模跨度情境下的觀點挖掘。其次,提出了面向大數據的觀點挖掘框架體系。與以往研究通常在情感極性判斷、屬性識別或者主題分析等單一方面展開研究不同,將系統架構劃分為虛假評論識別、產品名稱和屬性識別、觀點極性判斷、領域適配、語言適配、規模適配、觀點摘要、觀點主題分析及可視化展示等模組,使得模組之間共同一個有機整體,同時在模組內部採用不同的算法,使其保持高度內聚。最後,以面向大數據的觀點挖掘模型和觀點挖掘框架體系為基礎,在領域適配、語言適配和規模適配等方面開展了相關的實證研究,為大數據環境下的跨語言、跨領域觀點挖掘提供新的借鑑,為大數據環境下的網路信息組織提供新的有力手段。
出版信息
書名 | 出版時間 | 出版社 | ISBN |
---|---|---|---|
《大數據視角下的觀點挖掘》 | 2018年9月 | 中國社會科學出版社 | 978-7-5203-3092-3 |
作者簡介
余傳明,博士,教授,文瀾青年學者。熟悉法語、日語等語言,長期專注於語義相關的網路信息處理研究課題,在跨語言信息處理與數據挖掘方面積累了豐富的經驗。