內容簡介
《翻譯最佳化理論與技術:跨語言信息檢索》全面深入地介紹了跨語言信息檢索技術的理論、重要方法和研究進展,重點探討了基於相關反饋的翻譯最佳化理論與技術,並研究了其在互動式跨語言信息檢索中的套用。
圖書目錄
第1章 導論
1.1 跨語言信息檢索的意義
1.1.1 網路資源呈現多語言特徵
1.1.2 用戶對跨語言信息檢索的需求
1.2 國內外研究現狀述評
1.2.1 國外跨語言信息檢索研究歷程
1.2.2 國內跨語言信息檢索研究現狀
1.3 翻譯最佳化技術的提出
1.3.1 翻譯捉微臘最佳化的依據
1.3.2 翻譯最佳化的意義
1.4 本書的結構
1.4.1 研究內容
1.4.2 技術路線
1.4.3 研究方法
1.4.4 結構安排
第2章 跨語言信息檢索基礎理論
2.1 跨語言信息檢索基礎
2.1.1 跨語言信息檢索的概念
2.1.2 跨語言信息檢索的白疊烏套用
2.2 跨語言信息檢索的語言預處理
2.2.1 中文信息處理
2.2.2 歐洲語言信息處理
2.2.3 其他語言信息處理
2.3 跨語言信息檢索模型
2.3.1 檢索模型及其分類
2.3.2 檢索模型在跨語言信息檢索中的套用
2.4 跨語言信息檢索相關資源
2.4.1 相關會議
2.4.2 相關語料
2.5 跨語言信息檢索研究展望
2.6 本章小喇戀刪結
第3章 跨語言信息檢索關鍵技術
3.1 跨語言信息檢索中的翻譯策略
3.1.1 翻譯策略的選擇
3.1.2 翻譯資源的構建
3.1.3 翻譯歧義性問題
3.2 查笑辯鞏詢翻譯消歧方法
3.2.1 利用結構化查詢消歧
3.2.2 通過語言分析消歧
3.2.3 藉助語言資源消歧
3.2.4 基於用戶互動消歧
3.3 命名實體識別與翻譯
3.3.1 命名實體的識別方法
3.3.2 命名實體的翻譯方法
3.4 機器翻譯與跨語言信息檢索
3.4.1 機器翻譯在跨語言信息檢索套用中的基本問題
3.4.2 統計機器翻譯與跨語言信息檢索
3.5 數據融合
3.5.1 查詢表達式融合
3.5.2 檢索結果融合
3.6 本章小結
第4章 跨語言信息檢索的相關反饋技術
4.1 相關性理論與相關反饋技術
4.1.1 相關性與相關性模型
4.1.2 相關性判斷
4.1.3 相關反饋技術
4.2 相關反饋技術在不同檢索模型中的套用
4.2.1 基於經典模型的相關反饋
4.2.2 基於語言模型的相關反饋
4.2.3 基於語義模型的相關反饋
4.3 跨語言查詢擴展
4.3.1 不同翻譯資源下的查詢擴展
4.3.2 不同語言轉換中的查詢擴展
4.3.3 翻譯資源質量對查詢擴展的影響
4.4 基於語言模型的跨語言相關反饋
4.5 跨語言相關反饋中存在的問題
4.6 本章小結
第5章 基於相關反饋的翻譯最佳化技術
5.1 翻譯最佳化技術的基礎理論
5.1.1 翻譯最佳化的海罪前提假設
5.1.2 翻譯最佳化的基本思想
5.1.3 翻譯最佳化的理論依據
5.2 翻譯最佳化技術的處理過程
5.2.1 從相關文獻對中抽取檢索詞及其翻譯關係
5.2.2 利用檢索詞及其翻譯關係最佳化查詢翻譯
5.3 相關文獻集合中檢索詞的翻譯機率估計算法
5.3.1 基於詞對齊的翻譯算法TWA
5.3.2 保留所有翻譯的算法KAT
5.3.3 保留最好翻譯的算法K1T
5.3.4 保留最高頻率翻譯的算法KFT
5.4 翻譯最佳化的數學建模
5.4.1 對齊模型
5.4.2 翻譯機率重新估計模型
5.5 本章小結
第6章 跨語言檢索相關反饋綜合模型構建
6.1 翻譯最佳化與查詢擴展的比較研究
6.1.1 翻譯最佳化與查詢擴展的對比
6.1.2 翻譯最佳化與查詢擴展的結合
6.2 跨語言檢索相關反饋綜合模型(RFIM)的構建
6.2.1 模型要解決她漿笑腿的問題
6.2.2 跨語言檢索中已有的相關反饋建模分析
6.2.3 層次分析法
6.2.4 具有層次結構的跨語言相關反饋綜合模型總體框架
6.3 跨語言相關反饋綜合模型各層次要素分析
6.3.1 用戶行為層
6.3.2 方法技術層
6.3.3 影響因子層
6.4 模型的檢驗駝淋阿采
6.5 本章小結
7.1 系統功能與資源
7.1.1 系統功能設計
7.1.2 系統實現的流程與環境
7.1.3 系統的語料
7.2.1 查詢翻譯模組
7.2.2 文本預處理模組
7.2.3 檢索模組
7.2.4 結果顯示模組
7.2.5 相關反饋模組
7.3 人機互動接口設計
7.3.1 互動性設計
7.3.2 多級相關性判斷
7.4 系統評價體系
7.4.1 跨語言信息檢索評價模型
7.4.2 跨語言信息檢索評價指標
7.5 本章小結
第8章 基於自動相關反饋的翻譯最佳化實驗
8.1 實驗設計
8.1.1 實驗目標
8.1.2 實驗內容
8.1.3 實驗數據收集
8.2 基準(Baseline)實驗結果分析
8.2.1 單語言檢索基準實驗結果
8.2.2 跨語言檢索基準實驗結果
8.3 翻譯最佳化實驗結果分析
8.3.1 基於詞對齊的翻譯方法TWA的實驗結果
8.3.2 保留所有翻譯的方法KAT的實驗結果
8.3.3 保留最好翻譯的方法K1T的實驗結果
8.3.4 保留最高頻率翻譯的方法KFT的實驗結罘
8.3.5 四種翻譯最佳化方法的實驗結果比較
8.4 查詢擴展實驗結果分析
8.4.1 翻譯前查詢擴展方法Pre—QE的實驗結果
8.4.2 翻譯後查詢擴展方法Post—QE的實驗結果
8.4.3 混合式查詢擴展方法Comb—QE的實驗結果
8.4.43種查詢擴展方法的實驗結果比較
8.5 翻譯最佳化與查詢擴展相結合的實驗結果分析
8.5.1 翻譯最佳化與查詢擴展的實驗結果對比
8.5.2 翻譯最佳化與查詢擴展相結合的實驗結果分析
8.6 實驗結論
8.7 本章小結
……
第9章 基於用戶相關反饋的翻譯最佳化實驗
第10章 其他最佳化技術的跨語言信息檢索實驗
第11章 結論與展望
附錄1 相關反饋實驗的英文檢索主題(標題)
附錄2 相關反饋實驗的中文檢索主題(標題)
附錄3 四種翻譯最佳化方法的平均查準率均值MAP
附錄4 ICE—TEA系統用戶研究調查問卷
參考文獻
作者簡介
吳丹,女,1978年生,博士,現為武漢大學信息管理學院副教授,珞珈青年學者。2008年畢業於北京大學情報學專業,獲管理學博士學位。2006年至2007年公派赴
美國匹茲堡大學從事跨語言信息檢索研究。近年先後在國內外發表學術論文60餘篇,其中被SCI和SSCI檢索4篇,參編著作8部,主持國家級、省部級、校級科研課題10項。主要研究領域為跨語言信息檢索、語言處理技術、數字圖書館、知識組織等。
3.5 數據融合
3.5.1 查詢表達式融合
3.5.2 檢索結果融合
3.6 本章小結
第4章 跨語言信息檢索的相關反饋技術
4.1 相關性理論與相關反饋技術
4.1.1 相關性與相關性模型
4.1.2 相關性判斷
4.1.3 相關反饋技術
4.2 相關反饋技術在不同檢索模型中的套用
4.2.1 基於經典模型的相關反饋
4.2.2 基於語言模型的相關反饋
4.2.3 基於語義模型的相關反饋
4.3 跨語言查詢擴展
4.3.1 不同翻譯資源下的查詢擴展
4.3.2 不同語言轉換中的查詢擴展
4.3.3 翻譯資源質量對查詢擴展的影響
4.4 基於語言模型的跨語言相關反饋
4.5 跨語言相關反饋中存在的問題
4.6 本章小結
第5章 基於相關反饋的翻譯最佳化技術
5.1 翻譯最佳化技術的基礎理論
5.1.1 翻譯最佳化的前提假設
5.1.2 翻譯最佳化的基本思想
5.1.3 翻譯最佳化的理論依據
5.2 翻譯最佳化技術的處理過程
5.2.1 從相關文獻對中抽取檢索詞及其翻譯關係
5.2.2 利用檢索詞及其翻譯關係最佳化查詢翻譯
5.3 相關文獻集合中檢索詞的翻譯機率估計算法
5.3.1 基於詞對齊的翻譯算法TWA
5.3.2 保留所有翻譯的算法KAT
5.3.3 保留最好翻譯的算法K1T
5.3.4 保留最高頻率翻譯的算法KFT
5.4 翻譯最佳化的數學建模
5.4.1 對齊模型
5.4.2 翻譯機率重新估計模型
5.5 本章小結
第6章 跨語言檢索相關反饋綜合模型構建
6.1 翻譯最佳化與查詢擴展的比較研究
6.1.1 翻譯最佳化與查詢擴展的對比
6.1.2 翻譯最佳化與查詢擴展的結合
6.2 跨語言檢索相關反饋綜合模型(RFIM)的構建
6.2.1 模型要解決的問題
6.2.2 跨語言檢索中已有的相關反饋建模分析
6.2.3 層次分析法
6.2.4 具有層次結構的跨語言相關反饋綜合模型總體框架
6.3 跨語言相關反饋綜合模型各層次要素分析
6.3.1 用戶行為層
6.3.2 方法技術層
6.3.3 影響因子層
6.4 模型的檢驗
6.5 本章小結
7.1 系統功能與資源
7.1.1 系統功能設計
7.1.2 系統實現的流程與環境
7.1.3 系統的語料
7.2.1 查詢翻譯模組
7.2.2 文本預處理模組
7.2.3 檢索模組
7.2.4 結果顯示模組
7.2.5 相關反饋模組
7.3 人機互動接口設計
7.3.1 互動性設計
7.3.2 多級相關性判斷
7.4 系統評價體系
7.4.1 跨語言信息檢索評價模型
7.4.2 跨語言信息檢索評價指標
7.5 本章小結
第8章 基於自動相關反饋的翻譯最佳化實驗
8.1 實驗設計
8.1.1 實驗目標
8.1.2 實驗內容
8.1.3 實驗數據收集
8.2 基準(Baseline)實驗結果分析
8.2.1 單語言檢索基準實驗結果
8.2.2 跨語言檢索基準實驗結果
8.3 翻譯最佳化實驗結果分析
8.3.1 基於詞對齊的翻譯方法TWA的實驗結果
8.3.2 保留所有翻譯的方法KAT的實驗結果
8.3.3 保留最好翻譯的方法K1T的實驗結果
8.3.4 保留最高頻率翻譯的方法KFT的實驗結罘
8.3.5 四種翻譯最佳化方法的實驗結果比較
8.4 查詢擴展實驗結果分析
8.4.1 翻譯前查詢擴展方法Pre—QE的實驗結果
8.4.2 翻譯後查詢擴展方法Post—QE的實驗結果
8.4.3 混合式查詢擴展方法Comb—QE的實驗結果
8.4.43種查詢擴展方法的實驗結果比較
8.5 翻譯最佳化與查詢擴展相結合的實驗結果分析
8.5.1 翻譯最佳化與查詢擴展的實驗結果對比
8.5.2 翻譯最佳化與查詢擴展相結合的實驗結果分析
8.6 實驗結論
8.7 本章小結
……
第9章 基於用戶相關反饋的翻譯最佳化實驗
第10章 其他最佳化技術的跨語言信息檢索實驗
第11章 結論與展望
附錄1 相關反饋實驗的英文檢索主題(標題)
附錄2 相關反饋實驗的中文檢索主題(標題)
附錄3 四種翻譯最佳化方法的平均查準率均值MAP
附錄4 ICE—TEA系統用戶研究調查問卷
參考文獻
作者簡介
吳丹,女,1978年生,博士,現為武漢大學信息管理學院副教授,珞珈青年學者。2008年畢業於北京大學情報學專業,獲管理學博士學位。2006年至2007年公派赴
美國匹茲堡大學從事跨語言信息檢索研究。近年先後在國內外發表學術論文60餘篇,其中被SCI和SSCI檢索4篇,參編著作8部,主持國家級、省部級、校級科研課題10項。主要研究領域為跨語言信息檢索、語言處理技術、數字圖書館、知識組織等。