跨語言信息檢索翻譯最佳化理論與技術

內容簡介

多語言性是網路社會交流的重要特徵之一，跨語言信息檢索旨在通過以某種

語言來檢索表達為另外一種語言的信息，達到消除信息檢索中語言差異的目的，從而成為近年來信息檢索領域很活躍的研究方向。我們對國內外相關研究進行了全面調研，發現目前跨語言信息檢索在查詢翻譯消歧問題上還有待進一步改善，而有關跨語言信息檢索的中文研究則缺乏局部的技術實現以及整體的理論框架。鑒於此，本書的研究重點是引入相關反饋技術來提高英漢跨語言信息檢索的精準度，嘗試對基於相關反饋的翻譯最佳化技術進行一些開創性的研究。

本書全面深入地介紹了跨語言信息檢索技術的理論、重要方法和研究進展，重點探討了基於相關反饋的翻譯最佳化理論與技術，對互動式跨語言信息檢索進行了研究。在此基礎上，通過將翻譯最佳化技術與查詢擴展技術進行比較研究，並結合系統相關性與用戶相關性理論，構建了一個跨語言檢索相關反饋綜合模型理論框架(RFIM模型)，開發並實現了一個基於相關反饋的互動式英漢跨語言信息檢索系統。最後，進行了一系列實驗研究，其中包括：(1)通過自動相關反饋與用戶相關反饋兩組實驗，驗證了翻譯最佳化技術的有效性與RFIM模型的合理性；(2)將翻譯最佳化技術與其他技術如命名實體翻譯、機器翻譯、數據融合等技術進行比較與結合，驗證了翻譯最佳化技術在眾多最佳化技術中的效果。相信翻譯最佳化這種新的跨語言信息檢索技術可以幫助用戶跨越語言障礙從而無縫獲取信息。

本書的創新之處主要體現在以下3個方面：一是提出了一種嶄新的跨語言相關反饋技術——翻譯最佳化技術。基於相關反饋的翻譯最佳化技術完全不同於單語言檢索中傳統的相關反饋思想，它是利用檢索結果中相關文獻對來最佳化跨語言檢索的查詢翻譯，解決了部分查詢翻譯的歧義性問題。二是建立了一個全新的跨語言檢索相關反饋綜合模型理論框架(RFIM模型)。具有三層結構的跨語言相關反饋綜合模型結合了系統與用戶相關性理論、各項相關反饋技術、影響相關反饋的各種因素以及用戶行為因素。RFIM模型的建立合理地解釋了在跨語言信息檢索中各種相關反饋方法之間的關係及其套用環境。三是開發了一個新穎的具

有相關反饋功能的互動式英漢跨語言信息檢索系統ICE_1"EA，並首次進行了跨語言檢索的自動相關反饋與用屍相關反饋比較實驗研究，同時將翻譯最佳化技術與其他技術進行了比較與結合研究。ICE—TEA系統的構建和一系列實驗的結論為翻譯最佳化技術在跨語言信息檢索中的實際套用提供了參考。

本書是一部論述跨語言信息檢索技術的專著。書中既有對跨語言信息檢索技術的理論方法研究的全面、深入的綜述，又有針對其中翻譯最佳化理論與技術的專門論述，還結合了大量系統實現與實驗研究。因此，本書是一部理論與實踐相結合的著作。本書適合高等院校信息管理專業、計算機科學技術專業以及相關專業的教學科研人員、高年級學生和研究生閱讀參考，也適合工作範圍涉及該領域的工程技術人員參閱。

全書共分11章。第1章“導論”介紹了跨語言信息檢索的意義和國內外研究現狀，提出了翻譯最佳化技術，並介紹了全書的內容、技術路線、研究方法與結構。第2章“跨語言信息檢索基礎理論”和第3章“跨語言信息檢索關鍵技術”分別概述了跨語言信息檢索領域的基礎理論與關鍵技術問題。第4章“跨語言信息檢索的相關反饋技術”描述了相關性理論與相關反饋技術及其在不同檢索模型中的套用，提出了跨語言查詢擴展。第5章“基於相關反饋的翻譯最佳化技術”重點論述了翻譯最佳化技術的理論基礎、處理過程、相關算法與數學模型。第6章“跨語言檢索相關反饋綜合模型構建”將翻譯最佳化與查詢擴展進行了對比與結合，提出了跨語言檢索相關反饋綜合模型理論框架(RFIM)，並對模型的各層次進行了要素分析第7章“基於相關反饋的英漢跨語言檢索系統實現”詳細介紹了所構建系統的功能、結構、設計與評價方法。第8章“基於自動相關反饋的翻譯最佳化實驗”和第9章“基於用戶相關反饋的翻譯最佳化實驗”，分別採用自動相關反饋方法和用戶相關反饋方法對翻譯最佳化技術進行了實驗檢驗。第10章“其他最佳化技術的跨語言信息檢索實驗’’是將翻譯最佳化技術與命名實體翻譯、機器翻譯、數據融合等技術進行比較與結合，並給出了實驗檢驗結果。第11章“結論與展望”總結了全書的研究內容，指出了未來的研究方向。

跨語言信息檢索翻譯最佳化理論與技術

相關詞條

熱門詞條