《帶類噪聲的大規模張量分類算法研究》是依託華南理工大學,由楊曉偉擔任項目負責人的面上項目。
基本介紹
- 中文名:帶類噪聲的大規模張量分類算法研究
- 項目類別:面上項目
- 項目負責人:楊曉偉
- 依託單位:華南理工大學
項目摘要,結題摘要,
項目摘要
帶類噪聲的大規模分類問題廣泛存在於網頁分類、文本分類、基於內容的視頻檢索、脫機手寫體字元識別和生物信息處理等領域,是當前數據挖掘和機器學習領域中的重要研究課題,已引起了國內外計算機、自動化、電信和數學領域研究人員的廣泛關注。在本項目中,為了解決帶類噪聲的大規模張量分類問題,在支持向量機的理論框架下,我們擬開展四個方面的研究工作:(1)針對二分類問題,建立支持張量機模型;(2)針對帶類噪聲的中小規模二分類問題,建立魯棒支持張量機模型;(3)針對多分類問題,設計縮減的一對多支持張量機算法;(4)針對帶類噪聲的大規模分類問題,設計基於CF樹聚類和局部學習的支持張量機算法,並分析局部學習的誤差界。通過本課題的研究,不僅可以建立相關的支持張量機模型,設計適用性更好的算法,解決實際的帶類噪聲大規模分類問題,而且可以豐富數據挖掘和機器學習的研究內容,同時還可以推動機器學習和數學理論的發展。
結題摘要
帶類噪聲的大規模分類問題廣泛存在於網頁分類、文本分類、圖像分類、基於內容的視頻檢索、人臉識別和脫機手寫體字元識別等領域,是當前機器學習、數據挖掘和模式識別領域中的重要研究課題,已引起了國內外計算機、自動化、電信和數學領域研究人員的廣泛關注。基於數據的多源、異構和相互關聯特性,張量分析技術引起了機器學習、數據挖掘和模式識別領域研究人員的極大興趣。在本項目中,針對支持向量機,課題組對與分解算法、最小二乘支持向量機、多分類、模糊支持向量機、線上學習和大規模分類相關的優秀成果進行了歸納和整理,從數學上對相關算法的原理進行了詳細分析,在科學出版社出版了學術專著《支持向量機的算法設計與分析》。該專著納入到了信息與計算科學叢書中,得到了國家出版基金的資助。為了解決帶類噪聲的大規模張量分類問題,在支持向量機的理論框架下,我們主要研究了有監督張量學習、半監督張量學習、帶類噪聲的張量學習、大規模張量分類、張量的核函式構造、張量的特徵選擇、張量完全和多分類,提出了基於CP分解的線性支持高階張量機模型、基於張量低秩近似的半監督張量分類模型、魯棒支持張量機模型、線上支持張量機、基於樹分解的大規模半監督學習算法、結構保持的張量核函式、基於遺傳算法的張量特徵選擇算法、基於張量分解的缺失數據補全算法和縮減的一對多分類算法,在IEEE Transactions on Image Processing、Neurocomputing、Applied Mathematics and Computation、Soft Computing、ICDM、SDM、PAKDD、 ECML/PKDD、Lecture Notes on Computer Science、Journal of the Operations Research Society of China、《模式識別與人工智慧》、《計算機科學與探索》等國內外的主流雜誌和國際學術會議上發表了19篇學術論文,其中SCI和EI收錄14篇,被國內外同行引用12篇,共120餘次。對於課題組所建立的支持張量機模型,當輸入模式為向量時,它們均可以退化到支持向量機模型,因此具有更好的適用性。我們的研究成果獲得了2013年廣東省自然科學二等獎和2015年廣東省科技進步一等獎。課題組的研究不僅豐富了數據挖掘和機器學習的研究內容,同時還為數學提出了一些新的問題。