基於機器學習的Web圖像和文本協同挖掘技術的研究

基於機器學習的Web圖像和文本協同挖掘技術的研究

《基於機器學習的Web圖像和文本協同挖掘技術的研究》是依託南京大學,由姜遠擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於機器學習的Web圖像和文本協同挖掘技術的研究
  • 項目類別:青年科學基金項目
  • 項目負責人:姜遠
  • 依託單位:南京大學
  • 批准號:60505013
  • 申請代碼:F0603
  • 負責人職稱:教授
  • 研究期限:2006-01-01 至 2008-12-31
  • 支持經費:23(萬元)
項目摘要
傳統的Web內容挖掘技術主要是利用網頁上的文本數據來進行分析,但實際上,Web網頁上往往同時存在著多種類型的數據,這些多模態數據之間往往隱含了一定的聯繫,如果能夠有效地協同利用這些不同類型的數據,可望能夠更有效地對網頁內容進行分析。這方面的研究不僅引起了學術界的關注,還引起了軟體業的巨頭微軟的重視。本課題擬對基於機器學習的Web上圖像和文本協同挖掘技術進行研究,擬提出一種快速準確地對Web網頁上與考察主題有關的圖像和文本定位的方法;提出一種高效且有效地提取Web圖像和文本包含的語義特徵信息的方法;提出一種有效地對Web圖像和文本包含的語義信息特徵進行結合分析的方法;提出一種有效利用未標記網頁數據提高協同挖掘性能的方法;在國際刊物、會議和國內一級學報上發表5~8篇高質量論文;申請國家發明專利1-2項;培養研究生3-4名。

熱門詞條

聯絡我們