《複雜多視圖高維數據子空間聚類方法研究》是依託大連理工大學,由於紅擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:複雜多視圖高維數據子空間聚類方法研究
- 依託單位:大連理工大學
- 項目類別:青年科學基金項目
- 項目負責人:於紅
《複雜多視圖高維數據子空間聚類方法研究》是依託大連理工大學,由於紅擔任項目負責人的青年科學基金項目。
《複雜多視圖高維數據子空間聚類方法研究》是依託大連理工大學,由於紅擔任項目負責人的青年科學基金項目。項目摘要多視圖子空間聚類是多視圖高維數據聚類的重要方法。現有的方法沒有深入分析不同視圖下數據實例可聚性的差異,並且沒有考...
其中,針對高維數據研究了多視圖協同降維,針對多視圖之間的複雜關聯研究了基於隱表示的多視圖子空間聚類,針對層次聚類缺乏全局目標研究了全局可最佳化的層次聚類方法。項目對如何在無監督條件下有效融合多源信息提供了思路,顯著提升了多視圖...
而傳統聚類算法對高維數據空間進行聚類時會遇到困難,為了解決這個問題,R.Agrawal首次提出了子空間聚類的概念 ,以解決高維數據的聚類問題。高維數據聚類已成為數據挖掘中的一個重要研究方向。因為隨著技術的進步使得數據收集變得越來越容易,...
高維混合型數據聚類問題的研究是近年來數據挖掘研究中提出的新問題,因數據的複雜性使得在全空間上聚類效果不理想。本項目瞄準這一焦點問題,通過研究多種類型數據的信息融合,建立基於信息熵理論構建高維混合型數據的子空間聚類模型,開發...
首先,針對社會媒體數據具有的高維、演化、連結約束和多視圖等數據特性,對軟子空間聚類算法的國內外研究現狀進行了總結;其次,分別探討了面向社區演化數據的流數據聚類技術、面向連結約束數據的半監督學習技術和面向社會媒體數據的預測精度...
主要取得了以下成果:(1)分析原始數據中的隱含特徵與特徵之間蘊含的知識機理,實現了多視圖的構建;(2)在多視圖半監督聚類集成模型的研究方面,結合非負矩陣分解、子空間學習以及自動加權技術,提出了一系列多視圖聚類集成算法與半監督...
具體內容包括:研究了子空間表示矩陣具有類間稀疏和類內一致特性的條件,定義了新的保證類間稀疏類內一致的正則項。研究了新的誤差度量準則和數據項,使基於高維特徵的子空間聚類方法對噪聲具有更好的魯棒性。基於新的正則項和誤差度量...
半監督聚類通過引入成對約束提供了判別信息,有助於減少不合理的劃分;進一步對數據降維,可降低過學習風險和計算複雜度。與以往先降維再學習距離測度或聚類導致最終性能依賴於預先降維得到的子空間其質量的方法不同,本項目研究面向高維數據...
本項目主要是通過構建高維數據聚類的具有一定通用性的數學模型,來研究和開發適用於海量高維數據聚類分析的有效方法和工具。我們主要開展以下研究工作:(1)研究從高維數據空間中有效提取候選子空間的方法;(2)研究子空間聚類的數學模型,該...
實現低維數據匿名隱藏中聚類信息核保存;(3)藉助信息熵概念對數據空間進行劃分,借鑑勢能場理論構建子空間數據對象等勢面模型,設計啟發式擾動策略實現高維數據隱藏中聚類信息核保存;(4)提出重發布影響集和邊緣記錄集概念,對更新後數據...
最終本項目高維數據聚類、不確定數據聚類、多視角聚類和多任務聚類等方面取得了大量創新成果。主要創新成果包括: (1)提出基於約束的集成高維數據聚類算法;(2)基於約束的高維不確定數據子空間聚類算法;(3)提出新的基於密度的不確定...
本項目擬研究多視野高維複雜數據融合的方法和理論,內容包括單視野數據的穩定性理論和特點分析,同型多視野數據的協同和一致性降維, 異質多視野數據的多重圖約束線性低秩逼近, 協同稀疏表達、一致性聚類和分類,低秩張量逼近和數據缺損下的...
項目旨在揭示稀疏和低秩對子空間聚類影響的本質規律,提出針對子空間聚類難題的解決方案,為該方法的實際套用奠定理論和技術基礎。結題摘要 子空間聚類是對圖像、視頻等具有較低本徵維數的高維數據進行聚類的有效途徑,它需要同時完成數據的...
本項目瞄準大規模數據聚類分析中的關鍵問題,系統地發展聚類新理論與新方法,研究成果將對大數據環境下的分析挖掘具有重要的理論意義與套用價值。結題摘要 大數據呈現出樣本規模的海量性、特徵規模的高維性、特徵表示的混合性、內在結構的復...
與此同時,還研究了函式型變數的M估計以及變數選擇問題,對函式型數據和多元協變數混合的回歸模型進行理論探索;第四,對複雜類型數據的關聯分析、聚類分析以及模糊聚類的距離範式進行了研究,在高維度數據的餘弦相似度計算方面,提出了“...
針對以上問題,本項目擬 (1)基於高維地理數據特徵提取,從流形學習及模型聚類研究入手,提出新的降維與聚類方法;(2)通過耦合地理距離和屬性距離,提出一種新的空間數據分析距離概念及其有效估測算法;(3) 結合前述的距離概念和新...
本項目利用稀疏表示、低秩表示等數學工具,研究魯棒的線性或非線性多子流形分解的數學模型,以及相應的快速算法,尤其是低複雜度的一階和隨機算法,以解決處理高維數據時計算上的困難。 取得的重要結果有:1、理論方面:在子空間聚類模型...