基於機器學習的高性能自適應信息抽取關鍵技術研究

基於機器學習的高性能自適應信息抽取關鍵技術研究

《基於機器學習的高性能自適應信息抽取關鍵技術研究》是依託蘇州大學,由周國棟擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於機器學習的高性能自適應信息抽取關鍵技術研究
  • 項目類別:面上項目
  • 項目負責人:周國棟
  • 依託單位:蘇州大學
  • 負責人職稱:教授
  • 批准號:60673041
  • 研究期限:2007-01-01 至 2009-12-31
  • 申請代碼:F0211
  • 支持經費:27(萬元)
項目摘要
從非結構化的文本中抽取出結構化的特定信息是信息抽取技術研究的重要課題。目前,系統性能和系統可移植性兩大關鍵問題嚴重製約著信息抽取技術的廣泛套用。本項目將在前期研究的基礎上,重點解決信息抽取領域的幾個關鍵技術,通過研究機器學習方法,提高信息抽取系統的整體性能,解決系統可移植性問題,開發出適合於中英文的基於機器學習的高性能的自適應信息抽取系統。主要研究內容有:提出一個新穎的互信息依存模型,有效集成不同特徵,進一步提高命名實體識別的性能,並具有較好的可擴展性;利用網路挖掘技術和弱指導機器學習方法,減輕命名實體識別和關係抽取對大規模手工標註語料庫的依賴,解決信息抽取系統的可移植性問題;通過建立多層學習策略,探索相關類之間的共性,解決關係抽取小類的訓練數據不足問題;研究基於機器學習的多代理策略和全局最佳化方案,深化指代消解的研究;並通過跨文本的指代消解研究,解決多文本中的相關信息的融合問題。

相關詞條

熱門詞條

聯絡我們