跨語言信息檢索中雙語主題模型及算法研究

跨語言信息檢索中雙語主題模型及算法研究

《跨語言信息檢索中雙語主題模型及算法研究》是2015年復旦大學出版社出版的圖書,作者羅遠勝。

基本介紹

  • 中文名:跨語言信息檢索中雙語主題模型及算法研究
  • 作者:羅遠勝 
  • 出版時間:2015年
  • 出版社復旦大學出版社
  • ISBN:9787309119435 
內容簡介,圖書目錄,

內容簡介

本書是基於雙語主題空間的跨語言信息檢索總體框架研究,在統一的框架下,從雙語平行語料庫抽取出一系列的主題構成每種語言的主題空間。每種語言的主題空間獨立存在,且通過雙語語義對應關係建立雙語主題空間。雙語主題空間反映了文檔與文檔、文檔與詞、詞與詞的語義對應關係,揭示了語言之間、語言內部的固有結構和內在聯繫,是抽象的概念空間,是各語言原始文檔的中間表示。表示方式可以是線性或者非線性的。從數學原理上來說,兩個主題空間是近似等價的。我們將查詢和文檔投影到雙語主題空間上,不需要直接翻譯,可以實現跨語言的檢索、分類和聚類。

圖書目錄

1引言
1.1研究背景和意義
1.1.1研究背景
1.1.2研究意義
1.2國內外研究現狀
1.2.1跨語言信息檢索的概念
1.2.2跨語言檢索方法研究
1.2.3跨語言文本分類方法研究
1.2.4跨語言文本聚類方法研究
1.2.5研究現狀述評
1.3主要研究內容
1.4本書的基本結構
1.5本章小結
2基於雙語主題空間的跨語言信息檢索總體框架
2.1相關理論概述
2.1.1常用信息檢索模型
2.1.2偏最小二乘統計理論
2.2跨語言檢索問題的提出
2.3基於雙語主題空間的CLIR總體框架
2.3.1基本思路
2.3.2總體框架
2.3.3跨語言檢索過程
2.3.4跨語言文本分類過程
2.3.5跨語言文本聚類過程
2.4本章小結
3面向跨語言信息檢索的中英平行語料庫構建
3.1相關工作
3.2構建中英語料庫的基本流程
3.3中英平行語料庫構建
3.3.1中英平行語料庫
3.3.2跨語言信息檢索評測語料庫
3.3.3跨語言文本分類評測語料庫
3.3.4構建TREC-9中英平行語料庫
3.4本章小結
4基於主題對偶空間的跨語言檢索模型
4.1相關工作和問題的提出
4.2主題對偶空間的構建
4.3主題對偶空間模型的推導和算法實現
4.3.1模型推導
4.3.2算法設計
4.3.3算法複雜度分析
4.4實驗結果和分析
4.4.1實驗設計方案
4.4.2中英文詞的翻譯結果分析
4.4.3TDS模型抽取雙語主題結果分析
4.4.4文檔配對搜尋性能對比分析
4.4.5跨語言檢索性能對比分析
4.4.6模型參數敏感性分析
4.5本章小結
5跨語言中的雙語主題相關性檢索模型
5.1問題的提出
5.2雙語主題空間的構建
5.3BiTC模型的推導和算法分析
5.3.1模型推導
5.3.2BiTC模型的跨語言信息檢索過程
5.3.3算法複雜度分析
5.4實驗結果和分析
5.4.1實驗設計方案
5.4.2BiTC模型抽取雙語相關主題結果分析
5.4.3文檔配對搜尋性能對比分析
5.4.4偽查詢跨語言檢索性能對比分析
5.4.5TREC-9中英平行文檔集上的性能分析
5.5本章小結
6基於雙語語義對應分析的跨語言文本分類/聚類方法
6.1相關工作和問題的提出
6.2方法推導和算法實現
6.2.1方法推導
6.2.2跨語言文本分類/聚類過程
6.2.3算法複雜度分析
6.3實驗結果和分析
6.3.1實驗設計方案
6.3.2小數據集舉例分析
6.3.3BiSCAN抽取的雙語主題數對分類性能的影響
6.3.4各方法的跨語言文本分類性能對比分析
6.3.5跨語言文本聚類性能對比分析
6.4本章小結
7總結與展望
7.1本書總結
7.2研究展望
參考文獻
後記

相關詞條

熱門詞條

聯絡我們