《基於約束的高維數據聚類》是依託大連理工大學,由張憲超擔任項目負責人的面上項目。
基本介紹
- 中文名:基於約束的高維數據聚類
- 依託單位:大連理工大學
- 項目類別:面上項目
- 項目負責人:張憲超
《基於約束的高維數據聚類》是依託大連理工大學,由張憲超擔任項目負責人的面上項目。
《基於約束的高維數據聚類》是依託大連理工大學,由張憲超擔任項目負責人的面上項目。項目摘要聚類是數據挖掘的基本內容,它幫助發現數據的自然結構,在很多領域起重要作用。近年來產生的大量高維數據給傳統聚類算法帶來被稱為維度災難的...
高維度(high dimensionality):一個資料庫或者數據倉庫可能包含若干維或者屬性。許多聚類算法擅長處理低維的數據,可能只涉及兩到三維。人類的眼睛在最多三維的情況下能夠很好地判斷聚類的質量。在高維空間中聚類數據對象是非常有挑戰性的,特別是考慮到這樣的數據可能分布非常稀疏,而且高度偏斜。基於約束的聚類:現實...
《高維數據聚類信息核保存與隱藏技術研究》是依託東南大學,由倪巍偉擔任項目負責人的青年科學基金項目。中文摘要 數據隱藏發布中聚類可用性的維持在高維及數據動態更新環境下尤為困難:(1)聚類對數據個體差異的依賴與隱藏操作弱化個體差異的主要思想存在截然矛盾;(2)維數災難導致常用的匿名與隨機化隱藏方法失效;(3)...
首先,用統計和聚類分析方法提取高維小樣本數據中蘊含的特徵分布和功能等先驗信息(約束)。其次,用多種策略將先驗約束編碼進PSO進行特徵選擇。再次,將PSO與編碼先驗約束的混合投票方法相結合建立集成ELM模型。最後,在數據和模型的基礎上,編碼先驗約束提高各ELM的性能。本項目以高維小樣本的基因表達譜數據為研究對象,...
沒有一種算法是十全十美的,根據實際情況使用綜合性的半監督聚類算法。 半監督聚類是近幾年機器學習領域的一個 新的研究方向,隨著套用的日益廣泛,需處理的數據量越來越大、越來越複雜,維數越來越高,可以利用有效處理二維和小的數據集的半監督聚類方法進行強化和修改,以使其能處理大的和高維的數據集。背景 將物理...
本項目擬圍繞混合多流行結構數據的分析問題開展研究,利用Vernese映射,Grassmann流形,張量叢,核方法,稀疏與低秩等工具,研究基於結構約束的多流形低秩表示、特徵空間的度量、數據再變換空間中的稀疏性、非線性流行聚類在視覺分析和幾何模型分析和數字幾何中的相關問題,對更一般的大規模高維數據的分析提供理論和算法支撐...
軌跡數據挖掘 軌跡挖掘是數據挖掘的一個新興分支,其研究熱點集中於軌跡聚類、軌跡分類、離群點檢測、興趣區域、隱私保護、位置推薦等方面。如果將時間看做是一維數據,大多數傳統高維數據聚類算法可以很好的適應於當前的軌跡聚類。多維數據距離測量和有效計算方面的研究已經展開。將軌跡數據看做為混合約束模型生成的有序點...
4.1.5 為快速高維olap預計算殼片段 116 4.1.6 計算具有複雜冰山條件的立方體 121 4.2 數據立方體和olap技術的進一步發展 122 4.2.1 數據立方體的發現驅動的探查 122 4.2.2 在多粒度的複雜聚集:多特徵立方體 124 4.2.3 數據立方體中被約束的梯度分析 126 4.3 面向屬性的歸納—另一種數據泛化和概念...
基於上述理論和方法,以BU4DFE數據庫為數據源,實現一個基於三維視頻人臉表情的識別原型系統。特別是,提出的基於序列約束的子空間聚類方法,在BU4DFE資料庫上的表情聚類取得了很高的性能,在不同噪聲水平下得到了小於4%的錯誤率。 項目的研究執行和實現了各項研究任務,完成了預定的研究目標,獲得了較好的研究成果。...
本項目針對建築環評數據的新特點,開展基於數據驅動的建築環境影響評價模型及關鍵問題研究,填補目前建築環評中尚無自動、高效、全面的評估方法的空白。主要研究內容包括:針對建築屬性數據的高維性和複雜性開展多層次代價敏感特徵選擇研究,發現影響環境的主要建築材料;在此基礎上,設計異構社區發現和可移植半監督聚類集成...
數據自表示流形可以充分考慮圖像的二維空間信息,類驅動約束和標籤信息可以使同類樣本相似而異類樣本之間相差很大,四個數據集上進行聚類實驗結果表明,提出的算法具有較高的平均聚類精度和平均互信息。 4. 在理論方法,針對高維數據的維數禍根問題,我們考慮的回歸模型的充分降維問題,給出了回歸模型的方差異性檢驗和偏差...
7.3 基於約束的頻繁模式挖掘 7.3.1 關聯規則的元規則制導挖掘 7.3.2 基於約束的模式產生:模式空間剪枝和數據空間剪枝 7.4 挖掘高維數據和巨型模式 7.5 挖掘壓縮或近似模式 7.5.1 通過模式聚類挖掘壓縮模式 7.5.2 提取感知冗餘的top—k模式 7.6 模式探索與套用 7.6.1 頻繁模式的語義註解 7.6.2 ...
構建新的大間隔特徵提取模型,通過疊代求解線性方程而不是二次規劃問題提高模型訓練速度;考慮多模態分布數據,通過聚類算法挖掘數據的先驗結構,再結合大間隔思想,構建能將不同類的子類有效分離的特徵提取模型;將差準則引入基於L1範數的線性鑑別分析,以顯式地平衡類內緊密性和類間可分性,同時引入矩陣正交約束,以非...
當數據集規模較小時,近鄰傳播算法與傳統算法的差別不大,優勢不明顯;但是當數據集規模增大時,或者說,聚類算法的特徵矩陣變得高維稀疏時,近鄰傳播算法性能明顯優於傳統算法。目前該算法已經成功套用於人臉識別,基因發現、網路文本挖掘、圖像分割以及最優航線設計等領域。優點 不需要事先指定聚類數目,在數據集的元素...
一個資料庫或者數據倉庫可能包含若干維或者屬性。許多聚類算法擅長處理低維的數據,可能只涉及兩到三維。人類的眼睛在最多三維的情況下能夠很好地判斷聚類的質量。在高維空間中聚類數據對象是非常有挑戰性的,特別是考慮到這樣的數據可能分布非常稀疏,而且高度偏斜。基於約束 現實世界的套用可能需要在各種約束條件下進行...
(17)高維數據流聚類及其演化分析研究.計算機研究與發展 2006.(通訊作者)主持與參與的科研項目:(1)醫患糾紛人民調解及類案推薦平台(系列產品).(2)司法行政大數據套用研究. 江蘇司法廳科研項目.(3)基於無線MESH網和動態組件技術的電網監控系統軟體開發. 科技企業開發項目 (4)基於服務組合的系統的系統軟體...
首先改進和設計了動態約束最佳化測試用例,以基於族群的動態粒子群最佳化算法為基礎,設計了相應算法;然後設計了動態多模最佳化測試用例,設計了一種動態多模克隆選擇算法;最後提出了動態約束多模最佳化測試用例,包含了動態、約束和多模的特性,比較了不同最佳化器和不同約束處理技術的性能;(3)針對時間關聯、高維、數據驅動等...