稀疏表達下的非負矩陣分解在入侵檢測中的研究

稀疏表達下的非負矩陣分解在入侵檢測中的研究

《稀疏表達下的非負矩陣分解在入侵檢測中的研究》是依託西南大學,由陳善雄擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:稀疏表達下的非負矩陣分解在入侵檢測中的研究
  • 項目類別:青年科學基金項目
  • 項目負責人:陳善雄
  • 依託單位:西南大學
項目摘要,結題摘要,

項目摘要

非負矩陣分解能夠從大規模數據中提取關鍵特徵,從顯式變數中找出隱藏變數,將高維數據降維,適合處理大規模數據。目前這些分解算法大都存在兩方面問題:一是不能避免收斂於局部最優;二是單一度量標準疊代次數隨數據量的增長呈指數上升,增加了收斂時間。本項目擬採用多散度聯合度量的方法從理論上證明非負矩陣分解的全局最優解的存在,求解多散度的分解的疊代規則,降低分解過程收斂時間。同時引入稀疏化約束條件-等距約束性,對數據進行壓縮採樣,並套用於入侵信號的檢測。本項目首先分析入侵數據的特點,建立網路非線性信號與非負矩陣的映射模型,其次證明多散度在非負矩陣分解中作為誤差度量標準的可行性,推導出基於多散度非負矩陣分解的乘性疊代規則,尋找滿足RIP條件的變換基和投影矩陣,建立基於稀疏約束下多散度非負矩陣分解的乘性疊代規則對入侵信號的檢測模型。

結題摘要

大規模數據處理必然帶來處理機時間和空間的增加,而維度約減一直是數據挖掘、機器學習等領域研究的一個重要方向。非負矩陣分解能夠從大規模數據中提取關鍵特徵, 從顯式變數中找出隱藏變數,將高維數據降維,適合處理大規模數據。本項目從對網路數據的結構分析出發,研究利用非負矩陣分解提取網路訪問行為的特徵,從而對網路中的異常訪問進行檢測。項目小組研究發現誤差度量標準決定了基矩陣和係數矩陣對原矩陣的信息表示能力,且影響對入侵行為的檢測的精度。我們引入了Hellinger 距離、Pearson 距離、χ2散度 、Bregman散度、Alpha散度以及Itakura-Saito散度作為分解過程中的誤差度量標準,並給出這些度量標準的轉換條件,建立多散度聯合度量的非負矩陣分解方法。完成了基於該方法的網路入侵檢測流程構建,並完成系統設計。針對矩陣分解中稀疏約束問題,通過構建參數設計字典,建立分解過程中的稀疏基,從而確保矩陣分解收斂於全局最優。本項目還提出一種採用遺傳規劃方法來求解基於Alpha散度的非負矩陣分解全局最優解,並將其用於網路數據的異常檢測。採用了乘性疊代方式逐步逼近待分解的數據矩陣的Alpha散度最小值。非負矩陣分解的乘性疊代方法對於入侵檢測有著較高的精度,然而存在學習過程較慢的問題。引入遺傳算法能減少Alpha散度作為度量標準時分解收斂的時間,從而加快檢測速度。 本項目在Lasso問題的變數線性回歸求解的基礎上,提出了一種基於Lasso的異常檢測方法。我們把異常檢測過程,轉化為線性回歸模型。利用Lasso的參數估計具有穩定的回歸係數,同時可以壓縮模型參數,縮小參數數量特點,實現異常檢測的穩定、快速、簡潔的模型建立和準確的檢測能力。實驗表明在選擇恰當閾值的約束條件下,該方法具有較高檢測精度和快速的收斂能力。

相關詞條

熱門詞條

聯絡我們