《自然最近鄰居的特性分析與套用研究》是依託重慶大學,由朱慶生擔任項目負責人的面上項目。
基本介紹
- 中文名:自然最近鄰居的特性分析與套用研究
- 項目類別:面上項目
- 項目負責人:朱慶生
- 依託單位:重慶大學
中文摘要,結題摘要,
中文摘要
最近鄰居的概念及鄰居搜尋算法是數據挖掘、模式識別、圖像處理、智慧型推薦等領域的一個基礎科學問題,本項目圍繞這一基礎問題,探索新的思維方法,其研究具有十分重要的學術意義和套用價值。項目重點針對基於最近鄰居的流形學習和聚類學習算法中如何選擇鄰域參數?這一公開問題和如何度量空間結構的相似性?等熱點問題,通過引入新的概念自然最近鄰居,構造新的工具自適應最近鄰域圖,力圖改變傳統的依賴於參數形式的k最近鄰居或ε最近鄰域的格局,探索出新的解決方案。.項目重點研究內容包括:自然最近鄰居的理論模型、自然最近鄰居的高效搜尋算法、自然最近鄰居和自適應最近鄰域圖的特徵分析、自然最近鄰居分類器設計、自然最近鄰居分布的信息熵評估等。項目力爭取得原創性高水平套用基礎研究成果,申請發明專利2-3項,發表高水平論文10篇,培養博士3-4人。
結題摘要
最近鄰居的概念及和鄰居搜尋算法是數據挖掘、離群檢測、聚類分析、智慧型推薦等領域的一個基礎科學問題,本項目圍繞這一基礎問題,通過引入新的概念-自然最近鄰居,構造新的圖形工具-自然鄰居鄰域圖,力圖改變傳統的依賴於參數的k最近鄰居的格局,探索新的解決方案。研究工作具有十分重要的學術意義和套用價值。項目取得的研究成果如下:1)提出一種描述數據點依賴關係的鄰居概念-自然最近鄰居,並構建了完整的自然鄰居知識體系,包括自然鄰居特徵值、自然穩定狀態、自然鄰居鄰域圖、加權自然鄰居鄰域圖、飽和自然鄰居鄰域圖、小值自然鄰居鄰域圖。 2)證明了自然鄰居關係的不變性、自然鄰居特徵值的穩定性、自然鄰居對象的穩定性。提出了自適應的自然鄰居高效搜尋算法和自然鄰居鄰域圖的生成模型和算法。與k-最近鄰居思想相比,自然鄰居思想的突出優勢是在鄰居搜尋及套用時不需要設定鄰域參數。3)提出了基於自然鄰居的離群檢測算法,基於自然鄰域圖的數據挖掘算法,基於自然鄰居的層次聚類算法,基於自然鄰居的無參聚類算法等多種高效算法。大量對比實驗表明這些算法不僅沒有鄰域參數,而且在性能上具有明顯優勢。4)提出了基於大規模高維數據壓縮的協同過濾算法,提出了面向大數據套用的服務計算系統QoS預測模型與資源最佳化算法。 基於以上研究成果,發表標註本項目資助的學術論文21篇。其中,SCI檢索論文14篇,EI檢索論文6篇,境外國際會議宣讀論文4篇。發表論文的期刊包括IEEE TRANS INDUSTRIAL INFORMATICS、IEEE TRANS NEURAL NETWORKS AND LEARNING SYSTEMS、IEEE TRANS AUTOMATION SCIENCE AND ENGINEERING、IEEE TRANS ON SYSTEMS MAN CYBERNETICS-SYSTEMS、KNOWLEDGE-BASED SYSTEMS、SCIENTIFIC REPORTS、NEUROCOMPUTING、PATTERN RECOGNITION LETTERS、CLUSTER COMPUTING等重要國際期刊。朱慶生教授作為大會主席承辦IEEE國際會議ITAIC 2014;申請國家發明專利5項,其中已獲權3項;培養博士生4人,碩士生8人。