《面向多媒體數據分析的幾何拓撲方法研究》是依託北京大學,由姚遠擔任負責人的面上項目。
基本介紹
- 中文名:面向多媒體數據分析的幾何拓撲方法研究
- 項目負責人:姚遠
- 項目類別:面上項目
- 依託單位:北京大學
項目摘要,結題摘要,
項目摘要
隨著網際網路及無線寬頻網路技術的迅猛發展,多媒體數據日益增長,正成為大數據時代的代表之一。為實現多媒體數據的智慧型分析和處理,需要測量或者標註多媒體數據的很多與人的主觀感知相關的重要屬性。由於絕對屬性度量存在若干缺陷,通過網路眾包(crowdsourcing)試驗進行相對屬性度量於是成為多媒體信息技術領域備受關注的一個新熱點。然而如何針對這類數據構建重建被測函式目前在信息技術領域還沒有統一的理論和模型。本項目面向多媒體領域中與人的視覺感知關係密切的三類重要問題:主觀體驗評價,計算機視覺相對屬性和視覺注意顯著度圖,基於組合幾何和拓撲學中的 Hodge 理論,發展相對屬性的統計重建方法。本項目的研究成果將對上述套用領域中日益增長的相對屬性測量數據處理奠定統一的基礎,豐富幾何拓撲數據分析方法的內容並推動其在信息技術中的套用。
結題摘要
本項目面向多媒體領域中與人的視覺感知關係密切的三類重要問題:主觀體驗評價,計算機視覺相對屬性和視覺注意顯著度圖,基於組合幾何和拓撲學中的 Hodge 理論,發展相對屬性的統計重建方法。具體地,本項目從基於隨機圖的採樣機制入手,系統研究了Preferential Attachment隨機圖指導下的採樣機制。此外,由於preferential attachment隨機圖具有“Rich-get-Richer”屬性,使得它在得到top-k的排序時更具優勢。第二,在研究主動採樣的基礎上,我們成功提出了一種效率更高的混合採樣模式,初期採用貪婪式主動採樣後期採用隨機無放回採樣。第三,我們提出了基於Linearized Bregman Iteration的異常樣本檢測方法,與LASSO相比,該方法更加簡單、快速、無偏差,因而適合大數據。在此基礎上提出了基於iLTS (iterative Least Trimmed Squares)的自適應異常樣本檢測方法。最後,我們還可以對網路眾包中的用戶行為分析分析,有效控制其誤發現率。總之,本項目中我們所提出的方法在仿真和真實數據上效果都較理想,為套用領域中日益增長的相對屬性測量數據處理奠定統一的基礎,豐富幾何拓撲數據分析方法的內容並推動其在信息技術中的套用。