面向查詢的多文檔自動文摘技術研究

面向查詢的多文檔自動文摘技術研究

《面向查詢的多文檔自動文摘技術研究》是依託華中師範大學,由何婷婷擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向查詢的多文檔自動文摘技術研究
  • 項目類別:面上項目
  • 項目負責人:何婷婷
  • 依託單位:華中師範大學
  • 負責人職稱:教授
  • 申請代碼:F0211
  • 研究期限:2008-01-01 至 2010-12-31
  • 批准號:60773167
  • 支持經費:26(萬元)
項目摘要
面向查詢的多文檔自動文摘將查詢結果文檔集合的內容提煉為包含與查詢相關的主題、滿足個性化需求的摘要,它能夠顯著提高信息獲取和利用的效率。本項目的研究策略有以下特色:提出了文本、段落兩階段聚類發現潛在子主題的策略;設計了五種文摘模式,滿足個性化的信息需求;以主題為單位構造文本集合的網路拓撲圖,支持按照邏輯順序瀏覽信息。在具體的技術和算法研究上,有以下創新:把複雜網路的理論與方法套用於面向查詢的多文檔自動文摘,它在文摘主題發現、拓撲結構顯示等方面有鮮明特色;提出了利用聚類差異度-不純度最佳化法自動確定聚類個數的方法;提出了利用用戶自反饋信息與弱指導的機器學習策略自動判定相關與不相關文檔的方法,能避免靠經驗確定相關文檔數的主觀性;提出了基於主題詞對分布的文檔排序策略。同時,還將建設為多文檔自動文摘服務的中文語料庫,這是相關研究急需的語言資源。

相關詞條

熱門詞條

聯絡我們