高精度的跨語言信息檢索查詢詞自動翻譯技術研究

高精度的跨語言信息檢索查詢詞自動翻譯技術研究

《高精度的跨語言信息檢索查詢詞自動翻譯技術研究》是依託蘇州大學,由姚建民擔任項目負責人的面上項目。

基本介紹

  • 中文名:高精度的跨語言信息檢索查詢詞自動翻譯技術研究
  • 項目類別:面上項目
  • 項目負責人:姚建民
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

網際網路上有海量多語言文本資源,通過分析不同類型網頁的內容、結構和連結特徵,利用機器學習方法可以實現文檔、句子和辭彙級雙語資源的自動獲取。.以網路文本挖掘為手段,研究跨語言信息檢索查詢詞翻譯獲取的方法,重點研究基於本地語料庫和基於網路的翻譯技術。.本地鴉戒雅語料庫以網路挖掘方式建設,有低成本、高效率、強時效性,廣覆蓋面等特色。對本地語料庫辭彙和語法覆蓋度進行最佳化,實現最小腿戰歸霸時空開銷下的高翻譯質量。.對本地語料未覆蓋的查詢詞,以網路挖掘的方法解決,並用以擴大本地資源庫。.基於網路的翻譯方法中利用共現信息查詢擴展方法獲取搜尋引擎摘要,克服意譯詞的挖掘瓶頸;利用頻度量影捆埋舉度和鄰接信息,在有噪聲的、規模較小的雙語摘要庫上抽取高質量的候選單元,提高抽取效率;綜合利用音譯、表層模版、語義、頻度-距離等特徵進行譯文格灶充的選擇,提高翻譯精確度。.研究成果可用於跨語言信息檢索、機器翻譯等領域。

結題摘要

大規模語料翻主兆庫應市故在計算語言學和自然語言處理領域中具有廣泛的套用棄臭,它為統計機器翻譯模型提供了不可或缺的訓練數據,同時也是詞典編纂和跨語言信息檢索等研究的重要語料資源。因此,為了提高跨語言信息檢索中查詢詞的自動翻譯性能,本項目一方面重點研究大規模雙語資源的獲取,另一方面側重於研究如何利用雙語資源,實現查詢詞自動翻譯。其中,為了獲取海量的、優質的雙語資源,本項目分別從平行語料庫和可比較語料庫兩方面入手,囊括了平行語料庫對齊質量高、可比較語料庫覆蓋面廣等特點。另外,在基於雙語資源實現跨語言信息檢索查詢詞自動翻譯的過程中,著重探索研究並高效解決了查詢詞中命名實體、專業術語以及縮略語等未登錄詞的翻譯難題,從而提高了跨語言信息檢索的準確性和有效性。

相關詞條

熱門詞條

聯絡我們