一種統一的具有可分級的體育視頻內容理解方法研究

一種統一的具有可分級的體育視頻內容理解方法研究

《一種統一的具有可分級的體育視頻內容理解方法研究》是依託西安交通大學,由錢學明擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:一種統一的具有可分級的體育視頻內容理解方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:錢學明
  • 依託單位:西安交通大學
中文摘要,結題摘要,

中文摘要

對體育視頻進行事件檢測和事件層語義關係挖掘是體育視頻內容瀏覽和檢索中的一個重要環節。現有體育視頻語義內容挖掘方法的不足之處在於其往往針對某些特定的類型,方法不具有普適性。而採用與領域無關的分析方法雖然具有較好的普適性,但性能較差。本課題的研究目標是在一個統一的系統框架下完成不同類型的體育視頻進行高效的分析和挖掘出不同語義粒度的內容。因此在本課題研究中,一方面要有效地利用體育視頻領域相關知識,另外一方面又要考慮到所提出的方法對不同類型的體育視頻的適用性。為了很好的兼顧這兩個方面,本課題中提出了一種統一的具有可分級的體育視頻內容理解方法,其包括魯棒的局部特徵描述方法、鏡頭的語義分類方法和體育視頻高級語義事件檢測方法等研究內容。其中鏡頭劃分方法採用領域無關的統計學習方法,而高級語義事件檢測是通過統計學習方法來融合鏡頭語義類型信息、領域相關信息以及事件間共生機率等完成的。

結題摘要

深入研究了體育視頻事件檢測方法、視頻關鍵幀(圖像)特徵描述和提取方法、基於語義的圖像分類和標註、圖像分類和識別中多分類器融合等問題。在特徵描述、分類器融合、圖像標註以及體育視頻事件檢測方面取得了一系列成果。 提出了一種增強型隱馬爾科夫模型及隱條件隨機場的體育視頻事件檢測方法,將視頻序列首先進行事件單元的劃分,然後再融合事件片段內的中級語義的鏡頭類型信息以及關於該事件的總體描述信息,克服了傳統隱馬爾科夫模型在事件檢測中的不足之處達到了高效的檢測性能。 提出一種按照化學中“相似相容”原理的圖像內容標籤標註方法,該方法根據標籤間的語義相關性和不相容性進行圖像內容相關的標籤推薦。在基於Graph-Cut的圖像標註方法中,對圖像所有可能的標籤用一個全聯通的Graph進行建模,然後採用Graph-cut最佳化的來刪除那些與圖像內容無關的標籤。基於多分類器融合的圖像分類和識別方法中提出,首先對待融合的弱分類器進行內部結構進行有監督的改造,然後再對改造後的分類器方法進行融合,提升了分類器融合的性能。 提出採用可分級的小波包紋理符(HWVP),通過可分級的小波包對圖像進行多尺度和方向的濾波,以捕獲圖像中不同對象在不同子帶上的紋理信息,從而有效增強紋理描述的性能。提出基於空間金字塔結構的局部紋理描述方法使得傳統的LBP具有良好的尺度描述性,深入探討了空間金字塔變換核、空間變換級數以及下採樣模式對描述符的性能與複雜度的影響。 課題中負責人及骨幹成員在國際國內重要刊物和會議上發表論文三十餘篇,其中SCI論文13篇。其中1篇IEEE TCSVT, 1篇IEEE TGRS, 1篇Pattern Recognition, 2篇Neurocomputing,2篇IET Image Processing等. 申請專利4項(3項已授權),撰寫專著章節2篇。

相關詞條

熱門詞條

聯絡我們