《判別性正則化技術及其在半監督學習中的拓展研究》是依託東南大學,由薛暉擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:判別性正則化技術及其在半監督學習中的拓展研究
- 項目類別:青年科學基金項目
- 項目負責人:薛暉
- 依託單位:東南大學
中文摘要,結題摘要,
中文摘要
正則化技術是模式識別領域中提高分類器推廣性能的主要技術之一,其藉助於正則化項的形式,將問題的先驗知識引入至分類器設計之中,使得分類器光滑穩定,從而有效地改進了分類性能。但是由於傳統正則化技術來源於多元函式擬合問題,因此現有正則化項的構造更強調分類器數據獨立的光滑性懲罰,而忽視了判別信息的充分利用,限制了推廣性能的進一步提高。本項目旨在提出一種新穎的判別性正則化設計理念,為改進正則化技術提供開拓性的新思路。其具有以下特點:1、更充分地融合分類問題的數據信息和先驗知識;2、有效地解決常見正則化分類器設計算法中存在的主要問題,進一步提高分類器的推廣性能;3、可套用於增量學習中,以處理大規模的分類(包括動態環境等)問題;4、可進一步拓展到半監督學習領域。研究內容涉及:1、新方法的理論分析與實驗驗證;2、判別性正則化技術套用領域的推廣;3、判別性正則化框架的構建等。
結題摘要
正則化技術是機器學習與模式識別領域的核心研究內容之一,其藉助於正則化項的形式,將問題的先驗知識引入至分類器的設計之中,保證了分類器具有好的泛化性能。本項目圍繞正則化技術開展了一系列深入與廣泛的研究。在深度上,從著重於數據判別信息和結構信息的判別性正則化半監督分類器模型出發,逐步發展出綜合利用數據多層次先驗信息為正則化的一般型分類器設計框架,該框架不僅統一刻畫了現有眾多有力的正則化(包括大間隔)分類器,而且從中設計出的多種正則化分類器具有良好的泛化性能。受此框架引導,我們分別在單視圖數據和特徵層面、多視圖數據和特徵層面的先驗信息利用上開展了一系列研究,其中:1、在單視圖數據層面的成果有:提出了基於成對約束的半監督判別性正則化分類器、基於成對約束和無標號數據的判別性不定核分類器、不定核分類器的判別性正則化框架、結構正則化支持向量機、同時保持數據整體和局部結構的支持向量機、結構嵌入AUC支持向量機、利用數據結構信息提升基於ECOC的多類支持向量機、去相關性的基於ECOC多類學習框架、基於正交性的多類分類編碼校正等;2、在單視圖數據特徵層面的成果有:發展了融合特徵判別性的正則化支持向量機、基於局部性正則化推廣誤差界的特徵選擇算法、融合非目標類數據信息的線性判別分析等;3、在多視圖數據層面的成果有:提出了多視圖判別性正則化分類器、基於跨視圖約束的半監督判別性正則化分類器等;4、在多視圖數據特徵層面的成果有:發展了半監督半配對多視圖數據的降維框架、基於判別信息的大相關性分析等。