數據理解的若干基本問題研究

《數據理解的若干基本問題研究》是依託清華大學,由張長水擔任項目負責人的重點項目。

基本介紹

  • 中文名:數據理解的若干基本問題研究
  • 依託單位:清華大學
  • 項目負責人:張長水
  • 項目類別:重點項目
項目摘要,結題摘要,

項目摘要

數據理解是機器學習和數據挖掘中的基本需求。本項目研究數據理解方面從理論到套用的三個部分:理論部分研究參數空間和函式空間的最佳化問題,以及對統計學習算法做性能分析。結構化數據的建模和分析部分研究半參數的學習問題和結構化輸出中的半監督學習、遷移學習、結構化輸出的分類等問題。在套用部分研究圖像中目標的檢測和分類問題。這三個部分緊密聯繫。理論部分對於套用部分的研究提供了指導,套用部分為理論部分提供研究背景。

結題摘要

數據理解是機器學習和數據挖掘中的基本需求。本項目從理論、方法和套用三個方面出發,研究數據理解若干基本問題。理論部分開展了統計學習算法的性能分析的研究工作:研究基於間隔和損失函式的機器學習問題、無約束最佳化的核學習問題、多核學習尺度敏感問題和稀疏多任務學習問題等四方面理論問題。方法部分在數據理解的多個領域取得成果:提出了半監督統一框架、半監督支持向量機快速算法和正則化約束下的多示例半監督學習框架等方法;提出了基於最大間隔的非監督降維與特徵選擇算法、最大間隔聚類快速算法、非監督大間隔判別式投影和非平衡數據學習的加權間隔方法等多種最大間隔方法;提出了子空間降維和特徵選擇的跡比值方法以及核子空間、張量子空間和拓撲子空間等方法;提出了弱監督學習、多示例學習、主動學習和多標籤學習等方法;提出了演化聚類和演化分類學習方法以及演化學習的線上方法;提出了基於稀疏最佳化的一系列方法,如分段線性模型、正則化boosting、稀疏排序算法、求解正則最小二乘問題的對偶投影牛頓法、求解信任區域步長的有效多階段共軛梯度法以及求解非負矩陣分解的有效投影牛頓法等最佳化方法。套用部分開展了五方面工作:研究了三種不同的圖像與目標分割模型;提出了四種不同準則進行圖像分類的特徵選擇與相似性度量;以圖像標註和圖像檢索為目標,設計完成圖像與目標分類系統;運動目標識別領域提出了一個新穎的基於語義場景模型學習的事件分析框架;提出了基於層次碼本模型的光碟檢索系統,使得在浩瀚的數據集下,能夠快速查找到用戶輸入圖片或者視頻中出現光碟的信息。

相關詞條

熱門詞條

聯絡我們