《基於認知規律幾何化的流形學習》是依託華南理工大學,由文貴華擔任項目負責人的面上項目。
基本介紹
- 中文名:基於認知規律幾何化的流形學習
- 項目類別:面上項目
- 項目負責人:文貴華
- 依託單位:華南理工大學
項目摘要,結題摘要,
項目摘要
面對大量高維觀察數據,很多方法都存在不可逾越的維數災難。流形學習能夠發現這些高維觀察數據中有意義的低維嵌入流形,因而成為研究這類數據的有效方法,是目前的研究熱點。但流形學習還基本處於理論探討階段,大多數研究是套用驅動的,學習性能還存在問題,需要理論和方法上的創新。事實上流形學習的效果依賴於人類的評價,其有效性需要符合人類的認知規律,而現在的很多方法沒有這種考慮,例如人類比較容易處理噪音和小樣本問題,現在的流形學習方法卻很難處理。原因在於認知科學和心理學中的很多成果在機器學習中並沒有用到。本立項的目的是利用數學架起認知科學與機器學習之間的橋樑,建立認知規律的幾何模型,特別是建立認知的相對性和認知不變性規律的幾何模型,然後用於數據變換,為流形學習提供優質數據,間接提高流形學習性能。另一方面直接用認知規律的幾何模型建立新的流形學習方法,解決目前流形學習方法所面臨的困難。
結題摘要
面對大量高維觀察數據,很多方法都存在不可逾越的維數災難。機器學習特別是流形學習能夠發現這些高維觀察數據中有意義的低維嵌入流形,因而成為研究這類數據的有效方法,是目前的研究熱點。但流形學習還基本處於理論探討階段,需要理論和方法上的創新。例如流形學習方法對數據噪聲和數據稀疏十分敏感,原因在於它們容易產生扭曲的鄰域結構。現有方法試圖將噪音點刪除,但困難的是噪音難以準確識別,有些看起來是噪音的數據對數據分析來說是不可少的,如孤立點挖掘,而對數據稀疏性的處理則更缺少有效的方法。這些困難來源於認知科學和心理學中的很多成果在機器學習中並沒有用到,例如人類比較容易處理噪音和小樣本問題,現在的流形學習方法卻很難處理。本項目利用數學架起認知科學與機器學習之間的橋樑,建立認知規律的幾何模型,進而用於流形學習及數據挖掘,解決目前流形學習方法及數據挖掘所面臨的困難。 項目主要研究了認知科學和心理學中的典型認知規律,如格式塔(Gestalt)心理學中的若干格式塔規律。第2研究了認知相對性規律及其幾何模型, 以及演繹出的新機器學習方法。第3研究了認知不變性規律及其幾何模型,包括幾何模型, 具體的拓撲變換方法及變換條件等。第4研究了格式塔規律如對稱性規律的幾何化問題, 並套用於分類算法。第5研究了認知規律可能的套用領域, 包括機器學習/流形學習,數據挖掘,生物信息學,認知信息學,這些領域可以檢驗認知規律幾何化方法的有效性。 項目的研究成果包括提出了幾種認知規律的幾何模型及其套用,提出了新的半監督流形學習算法,新的半監督分類算法,基於規則的最近鄰分類算法,新的證據推理分類框架及其分類算法,新的聚類算法等, 這些成果共發表了論文28篇, 其中有2篇論文發表在計算機學會確定的A類頂級國際會議, 另有1篇發表在計算機學會確定的B類權威國際會議, 發表國際期刊論文9篇,另有1篇已被錄用。整體上SCI收錄9篇論文,EI收錄17篇論文。項目結題後將繼續在理論上採用微分拓撲、模糊拓撲等數學方法研究更多認知規律的幾何化問題,並套用於機器學習與數據挖掘。