《復共線性數據環境下的馬田分類理論研究及套用》是依託南京理工大學,由程龍生擔任項目負責人的面上項目。
基本介紹
- 中文名:復共線性數據環境下的馬田分類理論研究及套用
- 項目類別:面上項目
- 項目負責人:程龍生
- 依託單位:南京理工大學
項目摘要,結題摘要,
項目摘要
馬田系統(MTS)是一種結合馬氏距離、正交表和信噪比進行分類和診斷的方法。現實問題高維的變數特性導致復共線性數據環境,而這會使得馬氏距離失真,進而降低MTS分類正確率。本項目研究復共線性數據環境下MTS分類理論,具體有:構建結合馬氏距離、核函式、偽逆矩陣或嶺參數的新測量尺度以克服復共線性影響並提高區分度,研究新測量尺度有效性;研究MTS的基準空間生成、更新機制及判穩準則;在正交表、信噪比基礎上研究採用最佳化模型處理特徵篩選問題;研究閾值確定辦法,建立MTS平衡數據/不平衡數據二類分類和多類分類規則;研究多MTS分類器集成技術;開展MTS分類方法套用研究。項目面向復共線性數據環境,以MTS改進為主線,旨在發展MTS使之成為在復共線性數據環境下先進實用的分類技術。預期在測量尺度改進、基準空間構建與最佳化方面會取得創新性成果,豐富分類理論及方法,更好地指導分類實踐。
結題摘要
針對很多實際分類決策問題中特徵變數具有復共線性的特點,提出了一種新的結合馬氏距離的測量尺度——嶺馬氏距離(RMD),考慮到某些實際問題中個體形狀相似性也是分類重要因素,又提出了一種既能度量貼近度又能度量形狀相似性的測量尺度——灰馬氏距離(GMD)。兩種新的測量尺度均有較廣泛的套用前景。項目組提出了基於控制圖的基準空間生成機理,即先用專家選取的正常樣本構建初始基準空間,再以每個正常樣品在初始基準空間和對應的縮減基準空間上的馬氏距離增量建立單值控制圖,利用控制圖穩定性判定規則剔除異常數據,從而得到穩定狀態的基準空間,較好解決了MTS基準空間生成機制與穩態判定問題。 圍繞復共線性數據環境,結合分類效率、降維和信噪比等因素,構建多目標最佳化模型,提出了多個改進的MTS分類方法。對二類別分類問題,研究了一種基於全方位最佳化算法的MTS分類方法——MTSO,也研究了基於粗糙集理論的特徵變數篩選方法和結合ROC曲線分析法的閾值確定新方法。提出了一種基於切比雪夫定理的機率閾值模型的二類別不平衡數據分類方法MTSOP。對多類別分類問題,研究了兩種分類方法,分別為二叉樹MTS(BT-MTS)和多馬氏空間特徵變數篩選MTS(MF-MTS)。項目組創造性地將MTS分類思想運用到多屬性決策問題中,研究新的決策方案排序方法。針對區間數據、模糊信息等不同決策信息背景,提出了運用2可加Choquet模糊積分運算元的多屬性決策方法和引入非線性集成運算元Choquet模糊積分的灰模糊積分關聯度決策模型。此外,還提出了結合TOPSIS法、相對熵、相對灰關聯度的基於廣義馬田系統的區間數多屬性決策方法。 項目組也結合不同實際問題進行了MTS分類方法的改進和實證研究,成功套用到故障診斷與健康狀態評估、政府融資平颱風險預警、上市公司財務困境識別及環境管理等問題研究中。本項目的研究成果豐富和發展了MTS理論和決策評價理論。