《Web圖像的語義表示及在聚類與排序中的套用》是依託山東大學,由馬軍擔任項目負責人的面上項目。
基本介紹
- 中文名:Web圖像的語義表示及在聚類與排序中的套用
- 項目類別:面上項目
- 項目負責人:馬軍
- 依託單位:山東大學
中文摘要,結題摘要,
中文摘要
雖然目前Web上的圖像資源急速膨脹,但對Web圖像檢索的研究還處在相當不成熟的階段。本課題的研究目標是提出一種新穎的Web圖像語義表示方法,並在此基礎上研究更加有效的Web圖像聚類和排序算法。具體研究:1、根據Web多媒體網頁內容,建立Web圖像的文本和視覺特徵的標註、類別和類型標註和發表時間等元數據描述,並把實體和突發詞作為重要的標註詞源。根據上述描述,利用領域本體和圖算法對語義描述進行進一步的精化;2、研究新型的Web圖像表示下的圖像平面和層次聚類算法,以及通過聚類進行面向主題的圖像聚類和對事件與熱點的發現算法;3、研究根據Web多媒體網頁自身的特點和分類信息,利用基於內容的圖像檢索中的反饋技術,結合用戶查詢日誌,研究更有效的Web圖像檢索排序算法。上述研究問題是Web圖像搜尋引擎設計中最迫切需要解決的關鍵問題,並有著廣泛的市場前景。
結題摘要
如何有效地從Web海量圖像中檢索到用戶感興趣的圖像是下一代搜尋引擎設計中必需考慮的關鍵問題之一。其中主要的科學研究問題包括對Web圖像建立語義描述、發現合理的檢索排序算法和基於共享圖像的事件發現模型。本課題主要針對上述三個問題開展了研究。具體圍繞著Web圖像的語義自動標註方法、基於多維空間描述的新型圖像檢索排序算法和利用對Web圖像及相關文本的聚類分析和摘要方法發現突發事件展開了研究。所取得的主要學術成果可歸結為:一、給出了若干關於Web圖像自動標註的新穎算法、基於機器學習的對用戶已有標註的改善算法、以及面向用戶自行標註的圖像標註詞推薦算法;二、給出針對Web圖像的視覺特徵、相關文本特徵和時間特徵等多維語義空間描述下方法,以及基於這種描述的圖像檢索排序算法;分別提出了利用遺傳、克隆和免疫等生物學計算的學習排序算法。根據提出的圖像多特徵語義描述方法,給出了把檢索結果的相關性和多樣性作為綜合最佳化目標的Web圖像搜尋排序算法和對商業搜尋引擎的檢索結果的再排序算法。三、利用前述的理論成果,加上對圖像的聚類分析、文本摘要技術和事件生命周期理論,給出了適合社會媒體上基於共享圖像資源的突發事件發現方法。在上述理論研究的基礎上,實現了多個原型系統,為未來Web 圖像的檢索和事件發現給出了若干實現技術。 在本課題的研究中,已發表論文為 53 篇,其中,被SCI索引論文 6 篇、EI 索引論文 38 篇和ISTP 論文2篇。國際期刊論文18篇和國核心心期刊13篇。在ACM SIGIR,CIKM,MM,ICMR和WI國際會議上發表論文 15篇。培養出9名博士和12名碩士生。