《跨語言信息檢索翻譯最佳化理論與技術》是於2011年8月科學技術文獻出版社出版的一本圖書,作者是吳丹。
基本介紹
- 中文名:跨語言信息檢索翻譯最佳化理論與技術
- 作者: 吳丹
- 出版社:科學技術文獻出版社
- ISBN: 9787502369637
作者簡介,
作者簡介
內容簡介
多語言性是網路社會交流的重要特徵之一,跨語言信息檢索旨在通過以某種
語言來檢索表達為另外一種語言的信息,達到消除信息檢索中語言差異的目的,從而成為近年來信息檢索領域很活躍的研究方向。我們對國內外相關研究進行了全面調研,發現目前跨語言信息檢索在查詢翻譯消歧問題上還有待進一步改善,而有關跨語言信息檢索的中文研究則缺乏局部的技術實現以及整體的理論框架。鑒於此,本書的研究重點是引入相關反饋技術來提高英漢跨語言信息檢索的精準度,嘗試對基於相關反饋的翻譯最佳化技術進行一些開創性的研究。
本書全面深入地介紹了跨語言信息檢索技術的理論、重要方法和研究進展,重點探討了基於相關反饋的翻譯最佳化理論與技術,對互動式跨語言信息檢索進行了研究。在此基礎上,通過將翻譯最佳化技術與查詢擴展技術進行比較研究,並結合系統相關性與用戶相關性理論,構建了一個跨語言檢索相關反饋綜合模型理論框架(RFIM模型),開發並實現了一個基於相關反饋的互動式英漢跨語言信息檢索系統。最後,進行了一系列實驗研究,其中包括:(1)通過自動相關反饋與用戶相關反饋兩組實驗,驗證了翻譯最佳化技術的有效性與RFIM模型的合理性;(2)將翻譯最佳化技術與其他技術如命名實體翻譯、機器翻譯、數據融合等技術進行比較與結合,驗證了翻譯最佳化技術在眾多最佳化技術中的效果。相信翻譯最佳化這種新的跨語言信息檢索技術可以幫助用戶跨越語言障礙從而無縫獲取信息。
本書的創新之處主要體現在以下3個方面:一是提出了一種嶄新的跨語言相關反饋技術——翻譯最佳化技術。基於相關反饋的翻譯最佳化技術完全不同於單語言檢索中傳統的相關反饋思想,它是利用檢索結果中相關文獻對來最佳化跨語言檢索的查詢翻譯,解決了部分查詢翻譯的歧義性問題。二是建立了一個全新的跨語言檢索相關反饋綜合模型理論框架(RFIM模型)。具有三層結構的跨語言相關反饋綜合模型結合了系統與用戶相關性理論、各項相關反饋技術、影響相關反饋的各種因素以及用戶行為因素。RFIM模型的建立合理地解釋了在跨語言信息檢索中各種相關反饋方法之間的關係及其套用環境。三是開發了一個新穎的具
有相關反饋功能的互動式英漢跨語言信息檢索系統ICE_1EA,並首次進行了跨語言檢索的自動相關反饋與用屍相關反饋比較實驗研究,同時將翻譯最佳化技術與其他技術進行了比較與結合研究。ICE—TEA系統的構建和一系列實驗的結論為翻譯最佳化技術在跨語言信息檢索中的實際套用提供了參考。
本書是一部論述跨語言信息檢索技術的專著。書中既有對跨語言信息檢索技術的理論方法研究的全面、深入的綜述,又有針對其中翻譯最佳化理論與技術的專門論述,還結合了大量系統實現與實驗研究。因此,本書是一部理論與實踐相結合的著作。本書適合高等院校信息管理專業、計算機科學技術專業以及相關專業的教學科研人員、高年級學生和研究生閱讀參考,也適合工作範圍涉及該領域的工程技術人員參閱。
全書共分11章。第1章“導論”介紹了跨語言信息檢索的意義和國內外研究現狀,提出了翻譯最佳化技術,並介紹了全書的內容、技術路線、研究方法與結構。第2章“跨語言信息檢索基礎理論”和第3章“跨語言信息檢索關鍵技術”分別概述了跨語言信息檢索領域的基礎理論與關鍵技術問題。第4章“跨語言信息檢索的相關反饋技術”描述了相關性理論與相關反饋技術及其在不同檢索模型中的套用,提出了跨語言查詢擴展。第5章“基於相關反饋的翻譯最佳化技術”重點論述了翻譯最佳化技術的理論基礎、處理過程、相關算法與數學模型。第6章“跨語言檢索相關反饋綜合模型構建”將翻譯最佳化與查詢擴展進行了對比與結合,提出了跨語言檢索相關反饋綜合模型理論框架(RFIM),並對模型的各層次進行了要素分析第7章“基於相關反饋的英漢跨語言檢索系統實現”詳細介紹了所構建系統的功能、結構、設計與評價方法。第8章“基於自動相關反饋的翻譯最佳化實驗”和第9章“基於用戶相關反饋的翻譯最佳化實驗”,分別採用自動相關反饋方法和用戶相關反饋方法對翻譯最佳化技術進行了實驗檢驗。第10章“其他最佳化技術的跨語言信息檢索實驗’’是將翻譯最佳化技術與命名實體翻譯、機器翻譯、數據融合等技術進行比較與結合,並給出了實驗檢驗結果。第11章“結論與展望”總結了全書的研究內容,指出了未來的研究方向。
本書是在我的北京大學博士畢業論文的基礎上,補充了近幾年的最新研究成果寫成的。在此,首先衷心感謝我的博士導師——中國科學技術信息研究所的王惠臨研究員,他的悉心教導和不斷鼓勵,使我在讀博士期間收穫了很多知識和經驗。本書涉及的研究是在美國匹茲堡大學何大慶教授的直接指導與長期合作下完成的,他點明了方向,給了我許多新的思考,並幫助我在美國完成了部分實驗,在此,對他表示衷心的感謝。同時,本書內容中的後續研究是我在武漢大學從事博士後工作期間完成的,在此期間得到了博士後合作導師——武漢大學陳傳夫教授的中肯指導與大力幫助,他對本書內容提出了許多切合實際的建議,並為我提供了良好的工作條件,在此,表示衷心的感謝。另外,武漢大學信息管理學院信息檢索實驗室、中國科學技術信息研究所語言技術實驗室、美國匹茲堡大學信息科學學院信息檢索實驗室都為本書的撰寫提供了大力幫助,為本書部分實驗內容的完成提供了條件,在此對所有提供過幫助的人深表感謝。本書在撰寫和出版過程中得到了科學技術文獻出版社周國臻編輯的大力支持,武漢大學信息管理學院的領導和同事們對本書的出版給予了熱情鼓勵和指導,北京大學信息管理系的老師與同學們給予了我支持與幫助,我的家人給了我極大的關心和愛護,以及其他諸多有關人士付出了辛勤勞動,特此一併致以衷心謝忱!
此外,本書的出版還得到了4個項30目的資助,分別是:2009年度國家科學技術學術著作出版基金項目“跨語言信息檢索:翻譯最佳化理論與技術”、2009年度國家社會科學基金項目“網路學術信息的多語言表示與獲取模式研究(項目編號:09CTQ026)”、2009年度教育部人文社會科學研究項目“多語言信息獲取中的用戶相關反饋研究(項目編號:09YJC870022)”、2010年武漢大學入文社會科學“70後”學者學術發展計畫項目“跨語言環境下的細粒度信息檢索及可視化研究”。本書的出版是上述項目的研究成果之一。