《多標記數據的粒計算理論與算法研究》是依託山西大學,由李德玉擔任項目負責人的面上項目。
基本介紹
- 中文名:多標記數據的粒計算理論與算法研究
- 項目類別:面上項目
- 項目負責人:李德玉
- 依託單位:山西大學
項目摘要,結題摘要,
項目摘要
多標記數據是密切關聯與Web信息處理、文本分類、生物信息學、視頻語義標註、信息檢索等眾多套用領域的一類重要數據類型。粒計算是當前人工智慧,特別是智慧型信息處理領域最為活躍的研究方向,對大規模複雜數據的建模、分析與計算任務具有重要意義。本課題旨在研究多標記數據粒計算理論與算法。主要內容包括:(1)數據的極小表示拓撲結構學習;(2)不確定性度量與屬性約簡算法;(3)數據的覆蓋聚類粒化;(4)多標記數據分類優先性;(5)數據的概念結構及其可視化。系統地發展多標記數據建模、分析與計算的粒計算理論與方法,開發一個可用於多標記數據建模與分析的實驗系統。本項目研究成果將豐富粒計算理論,拓展粒計算的數據適用範圍,探索複雜信息處理的新途徑,對數據挖掘和知識發現的研究有重要的理論意義和套用價值。
結題摘要
多標記數據是密切關聯於文本分析、多媒體分析、生物信息學、社會網路、智慧型商務等眾多領域的重要數據類型。按照項目契約書的要求,項目組圍繞構建多標記數據的粒計算模型與高效算法進行了系統而深入的研究工作,取得了一系列重要研究進展。在多標記數據分類方面,提出了一種基於粗糙集理論的屬性約簡方法,給出了一種可以計算所有互補決策約簡的區分矩陣方法和互補決策約簡的啟發式算法,建立了一種新的多標記穩健模糊粗糙分類模型。在多標記數據特徵選擇方面,給出了一種針對多標記數據的變精度屬性約簡方法,建立了新約簡的判定定理和區分矩陣方法,構造了基於鄰域粗糙集的多標記分類任務的特徵選擇算法,提出一個基於粗糙集的多標記專屬特徵學習算法,探索了兩種基於標記間相關性度量的核函式構造方法。在模糊粗糙集理論方面,定義了二型模糊粗糙集和粒二型模糊集,討論了二型模糊粗糙集的粒結構,建立了勾股模糊多粒度粗糙集模型,定義了對偶猶豫模糊多粒度粗糙集的模型,並證明了常見性質,建立了雙論域區間猶豫模糊多粒度粗糙集的概念。在數據推理的邏輯基礎方面,首先研究了決策蘊涵的語義和語構特徵;接著引入了決策前提的概念,並據此生成了一個決策蘊涵規範基,證明了該決策蘊涵集的完備性、無冗餘性和最優性;還研究了基於決策背景的決策蘊涵規範基;提出了基於最小生成子和真前提的決策蘊涵規範基的生成方法;另外,還研究了模糊決策蘊涵的語義和語構特徵。在理論成果的套用方面,基於模糊粗糙集,研究了文本情感的多標籤分類、汽車產品評價的多方面情感挖掘。另外,基於條件機率的空間相關性判別,提出了一種歸一化的空間相關性度量指標,能夠挖掘出更多有價值的空間相關性信息。