海量網路學術文獻自動分類研究

海量網路學術文獻自動分類研究

《海量網路學術文獻自動分類研究》是2016年1月人民出版社出版的圖書,作者是王效岳、白如江。

基本介紹

  • 中文名:海量網路學術文獻自動分類研究
  • 作者:王效岳、白如江
  • ISBN:9787010148472
  • 定價:38元
  • 出版社:人民出版社
  • 出版時間:2016年1月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

本書針對文本分類方法在發展過程中出現的問題,圍繞“本體及其在文本分類中的套用”和“海量網路學術文獻自動分類”兩個方面展開探討。深入研究了海量網路學術文獻處理技術,比較分析了適合網路文獻自動獲取及並行處理的工具;設計了基於Heritrix與Hadoop平台的海量網路學術文獻獲取及並行處理模型和基於WordNet與SUMO本體集成的語義驅動自動文檔分類模型;梳理了本體以及本體集成理論、方法和工具;開發了海量網路學術文獻並行獲取和自動分類原型系統。

圖書目錄

緒論
第一章 網路爬蟲
第一節 網路爬蟲
一、開源網路爬蟲工具
二、爬蟲工具比較分析
第二節 Hadoop平台
一、Hadoop與其他系統的比較
二、Hadoop項目及結構
四、MapReduce編程模型
五、Hadoop平台搭建
第二章 海量網路學術文獻獲取及並行處理模型
第一節 網路學術文獻的主要來源及常用檔案格式
一、網路學術文獻的主要來源及特點
二、網路學術文獻的常用檔案格式
第二節 網路學術文獻自動獲取實驗
一、實驗環境
二、實驗平台搭建
第三節 網路學術文獻資源獲取
一、網路學術文獻獲取方案
二、種子站點的選擇
三、抓取任務的配置
四、檔案類型和大小過濾
五、網路學術文獻獲取實驗結果
第四節 網路學術文獻資源判定
第五節 網路學術文獻並行處理
一、數據預處理
二、並行處理
第六節 MapReduce任務最佳化
一、任務調度
二、任務數量
三、Combine函式
四、檔案壓縮
五、重用JVM
六、網路學術文獻並行處理模組實驗結果
第三章 本體集成
第一節 本體研究
一、本體概念
二、本體基本構成要素
三、本體類型
四、本體表示語言
第二節 本體庫研究
一、國內外主要本體庫
二、本體庫比較分析
第三節 本體集成基本過程
第四節 本體集成工具
一、工具介紹
二、工具比較與分析
第五節 本體集成方法
一、基於形式概念分析(FCA)的本體集成方法
二、基於範疇論的本體集成方法
三、基於RDFS圖閉包的本體集成方法
第四章 基於語義驅動文本自動分類研究
第一節 文檔自動分類基本理論
一、文檔自動分類基本概念
二、文檔自動分類基本流程
三、文檔自動分類性能評價指標
第二節 基於語義驅動文檔自動分類概念
第三節 基於語義驅動文檔自動分類實現基礎
第四節 基於語義驅動文檔自動分類方法模型
一、詞向量空間構建
二、語義向量空間構建
第五章 基於本體集成的文檔語義分類模型
第一節 SUMO和WordNet本體庫概述
一、WordNet本體庫
二、SUMO本體庫
第二節 WordNet與SUMO本體庫映射機制研究
一、映射動機
二、映射模型
三、映射實例
四、映射效果及套用分析
第三節 基於WordNet與SUMO本體集成文檔語義分類模型設計與實現
一、實驗平台構建
二、實驗數據集及方法
三、集成本體庫構建
四、詞向量空間到概念向量空間的映射
五、概念向量空間通用化
六、分類模型訓練與測試過程描述
七、實驗評估指標
八、實驗及結果分析
第六章 海量網路學術文獻自動分類系統
第一節 海量網路學術文獻自動分類系統
一、開發環境
二、海量網路學術文獻自動獲取模組
三、海量網路學術文獻詞一文檔矩陣處理模組
四、本體集成模組
五、基於語義驅動的分類模組
第二節 海量網路學術文獻自動分類系統實現
一、系統主要技術及標準
二、系統功能
第七章 總結及展望
第一節 總結
第二節 展望
附錄A
附錄B
附錄C
附錄D
參考文獻
索引
後記

相關詞條

熱門詞條

聯絡我們