基於認知概念信息量的文本語義相似度模型研究

基於認知概念信息量的文本語義相似度模型研究

《基於認知概念信息量的文本語義相似度模型研究》是2021年北京理工大學出版社出版的圖書。

基本介紹

  • 中文名:基於認知概念信息量的文本語義相似度模型研究
  • 作者:吳昊//黃河燕
  • 出版社:北京理工大學出版社
  • 出版時間:2021年
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787568295277
內容簡介,作者簡介,圖書目錄,

內容簡介

本書面向計算機科學、信息科學、認知科學、語言學等專業的本科生、研究生、研究學者或者軟體研發人員,由淺入深、跨學科地介紹了認知概念信息量、基於認知概念信息增益的文本信息量計算方法、融合認知概念信息權重的全文本信息量計算方法,一步一步實現了基於認知概念信息量的文本語義相似度的模型。本書模型建立在認知概念網路基礎上,計算方法接近人類的思維習慣,更加符合人工智慧初衷。本書模型具有可解釋性,參數含義十分明確,易於根據套用領域或場景調優性能,具有優良的發展前景。本書研究方法另闢蹊徑,在深度學習大行其道的今天對相關研究人員是不失為一種啟發和補充。

作者簡介

吳昊,博士,碩士生導師,北京理工大學計算機學院、人工智慧研究院教師。北京市海量語言信息處理與雲計算套用工程技術研究中心、信息智慧型處理與內容安全工信部重點實驗室骨幹成員。

圖書目錄

第1章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究目標
1.4 研究內容
1.5 本書組織結構
第2章 文本語義相似度研究現狀
2.1 標註數據及評估方法
2.1.1 早期評估數據
2.1.2 SemEval STS任務數據
2.1.3 系統評估方法
2.2 文本語義相似度研究方法
2.2.1 無監督模型
2.2.2 有監督模型
2.3 認知概念信息量方法
第3章 基於認知概念信息量的文本語義相似度基本模型
3.1 引言
3.2 相關工作
3.3 認知概念空間中的文本語義相似度
3.3.1 認知概念空間與認知概念信息量
3.3.2 基於容斥原理的文本認知概念信息量
3.3.3 文本語義相似度基本模型
3.4 模型的實現
3.4.1 知識庫與資料庫的使用
3.4.2 獲取認知概念的頻率
3.4.3 選擇詞語對應的認知概念
3.5 實驗
3.5.1 模型的整體性能
3.5.2 知識庫和資料庫的影響分析
3.5.3 模型的適應性分析
3.5.4 模型準確率和效率的關係分析
3.6 本章小結
第4章 基於認知概念信息增益的文本信息量計算方法
4.1 引言
4.2 預備知識
4.3 文本信息量的計算與證明
4.3.1 基本概念和函式
4.3.2 文本信息量計算公式的推導
4.3.3 文本信息量的高效算法
4.4 算法複雜性分析與實驗
4.4.1 算法複雜性分析
4.4.2 算法效率對比實驗
4.5 本章小結
第5章 融合認知概念信息權重的全文本信息量計算方法
5.1 引言
5.2 相關工作
5.3 融合認知概念信息權重的全文本信息量
5.3.1 基於WordNet的名詞化方法
5.3.2 未登錄詞和功能詞的計算
5.3.3 加權的文本信息量
5.4 實驗
5.4.1 實驗設定
5.4.2 增強模型的整體性能
5.4.3 與句嵌入表示方法的比較
5.4.4 增強模型對其他方法性能的提升
5.4.5 增強模型的各核心模組分析
5.4.6 名詞化方法分析
5.4.7 基於WordNet的派生方法分析
5.4.8 未登錄命名實體計算分析
5.4.9 信息權重融合分析
5.5 本章小結
第6章 基於增強模型的測評系統
6.1 SemEval STS測評任務簡介
6.2 SemEval STS測評系統
6.2.1 增強模型測評系統(Run 1)
6.2.2 融合詞語對齊模型的系統(Run 2)
6.2.3 融合深度學習模型的系統(Run 3)
6.3 測評數據集
6.4 系統評估
6.4.1 數據預處理
6.4.2 成績及討論
6.5 STS Benchmark
6.6 本章小結
總結和展望
參考文獻

相關詞條

熱門詞條

聯絡我們