關聯處理

關聯處理

在計算機圖論中,圖G的一條邊的兩個頂點稱與該邊關聯,反之,也稱該邊與兩個頂點關聯。在計算機科學中,幾乎所有的問題都存在關聯關係。例如在數據分析中,對象之間以及對象屬性之間都存在關聯關係。關聯處理是指採用某種方法對問題關聯關係進行處理,從而得到問題的內在聯繫。

基本介紹

  • 中文名:關聯處理
  • 外文名:associative processing
  • 學科:計算機
  • 定義:採用某種方法對問題關係進行處理
  • 目的:發現問題內在關係
  • 領域:大數據、信息安全
簡介,處理器關聯,系統調用,數據關聯處理,入侵檢測警報關聯處理技術,基於相似性的關聯算法,基於聚類分析的關聯算法,

簡介

在計算機科學中,可以把關聯處理分為三個層次,硬體關聯處理、軟體關聯處理和數據關聯處理。這三個層次關聯處理既是獨立的又是相互依賴的。硬體關聯處理是指計算機設備工作之間存在相互依賴關係。軟體關聯處理是指軟體之間需要相互調用才能實現某種功能。數據關聯處理是指採用某種方法分析數據之間關係。硬體關聯處理和軟體關聯處理通過處理數據關聯處理來發現的,而數據關聯處理需要硬體關聯處理和軟體關聯處理來實現。

處理器關聯

處理器親和性又稱處理器關聯。通過處理器關聯可以將虛擬機或虛擬處理器映射到一個或多個物理處理器上。該技術基於對稱多處理機作業系統中的native central queue調度算法。佇列(queue)中的每一個任務(進程執行緒)都有一個標籤(tag)來指定它們傾向的處理器。在分配處理器的階段,每個任務就會分配到它們所傾向的處理器上。
處理器親和性利用了這樣一個事實,就是進程上一次運行後的殘餘信息會保留在處理器的狀態中(也就是指處理器的快取)。如果下一次仍然將該進程調度到同一個處理器上,就能避免一些不好的情況(比如快取未命中),使得進程的運行更加高效。
調度算法對於處理器親和性的支持各不相同。有些調度算法在它認為合適的情況下會允許把一個任務調度到不同的處理器上。比如當兩個計算密集型的任務(A和B)同時對一個處理器具有親和性時,另外一個處理器可能就被閒置了。這種情況下許多調度算法會把任務B調度到第二個處理器上,使得多處理器的利用更加充分。
處理器親和性能夠有效地解決一些高速快取的問題,但卻不能緩解負載均衡的問題。而且,在異構系統中,處理器親和性問題會變得更加複雜。

系統調用

系統調用(system call),指運行在使用者空間的程式向作業系統核心請求需要更高許可權運行的服務。系統調用提供用戶程式與作業系統之間的接口。大多數系統互動式操作需求在核心態執行。如設備IO操作或者進程間通信。

數據關聯處理

數據關聯處理,也可以稱做數據分析或數據關聯分析。關聯分析是一種簡單、實用的分析技術,就是發現存在於大量數據集中的關聯性或相關性,從而描述了一個事物中某些屬性同時出現的規律和模式。一般採用關聯規則分析。關 聯規則發現是尋找事物之間的關聯。如,它可從一 組(假設是商品採購)事務包含的一組數據項中發現規則如下:如果採購事務包含項X和項Y,則在全部採購事務的N%中包含採購事務的項Z。序列規則發現類似於關聯規則發現,是尋找事物之間的序列關係。如,同樣可從消費者購物的一組事務所包含的一組數據項中,進一步對這些事務的每個消費者給以標識。關聯規則一般有以下度量:
興趣度度量(interest measure):幫助用戶評估得 到的關聯規則。與關聯規則評估相關的興趣度包括簡潔性、正確性、實用性、新穎性。
簡潔性度量是衡量一個規則結構的複雜程度, 複雜結構的規則難以解釋與理解,造成其興趣度降低;正確性度量用以判斷規則令人信服的程度有多 高,在關聯規則中用置信度表示;實用性度量用以判斷該規則再次出現的可能性有多大,在關聯規則中用支持度表示;新穎性度量判斷規則是否已被導 出的規則集中的另一規則所蘊涵,用以去除冗餘規則。
頻繁項集(frequent itemset): 項集出現的頻率表 示包含項集的交易數,如果項集的出現頻率大於或等於最小支持度閾值與交易數據集D中交易總數的 乘積,即項集滿足最小支持度閾值要求,則該項集 是頻繁項集;其餘稱為非頻繁項集。
強關聯規則: 強關聯規則是指同時滿足用戶定義的最小支持度閾值和最小置信度閾值的關聯規則。相反,不滿足用戶定義的最小支持度閾值和最小置信度閾值的規則,是弱關聯規則。

入侵檢測警報關聯處理技術

警報關聯技術是根據 IDS 警報信息之間往往並非獨立的特性,採用一定的算法或分析策略,對警報的某些屬性進行分析,以發現警報信息之間的重複、並發、因果、時序等關係,進而根據這些關係重構攻擊序列,發現完整入侵事件的技術。

基於相似性的關聯算法

該類算法主要通過定義相似度函式來計算警報之間的關聯特性。算法描述如下:
(1) 對報警信息的共有屬性分別定義相似函式。
(2) 定義屬性相似期望。相似期望表示對屬性相似的先驗期望,大小依賴於特定上下文。由於不同的屬性對報警信息整體相似度的貢獻不同,設定不同屬性權值來計算整體相似度。
(3) 定義屬性最小相似度。如果某屬性的相似度小於最小相似度,則兩條報警信息的該屬性不具有相似性。
(4) 定義報警相似度閾值域。如果兩條報警信息的相似度不在相似度閾值域內,則兩條報警不相似。
(5) 計算報警相似度。
該方法的優點: 能夠發現利用假冒源 IP 地址和潛伏期很長的攻擊場景;關聯速度快,在不到兩秒內,可對 16000 個報警分配攻擊場景。缺點:由於場景的分配基於原子模型,一旦一個攻擊場景出錯,就會影響到後續報警信息的關聯,因此該方法需要在減少錯誤場景的創建方面進行改進。

基於聚類分析的關聯算法

聚類分析是根據對象屬性對對象進行分類的一種多元分析技術,把屬性相近的個體歸為一類,使得同一類中的個體具有高度的相似性,不同類之間的個體具有高度的相異性。基於攻擊場景的啟發式聚類方法。報警信息中的屬性都可作為聚合屬性,通常採用三個聚合屬性:攻擊源、攻擊目標、攻擊類型.場景定義為: < 攻擊源,攻擊目標,報警類型,嚴重級別 > 。根據攻擊者採取的攻擊方法定義了七種攻擊場景:(1) 具有相同攻擊源、攻擊目標、攻擊類型,如攻擊者對 Web 伺服器發動一系列的 Web 攻擊;(2) 具有相同攻擊源、攻擊目標,如攻擊者對同一目標提供的不同服務發動攻擊;(3) 具有相同攻擊目標、攻擊類型,如多個攻擊者協作對同一目標實行分散式攻擊,使之拒絕服務;(4) 具有相同攻擊源、 攻擊類型, 如攻擊者對不同的域名伺服器發動攻擊;(5) 具有相同攻擊源,如攻擊者對不同目標發動不同攻擊;(6)具有相同攻擊目標,如分散式攻擊中不同攻擊者針對同一目標不同的系統漏洞發動攻擊;(7) 具有相同攻擊類型,如不同攻擊者針對同一漏洞發動攻擊。該方法優點:方法簡單,容易實現,開銷小。缺點:需要事先知道相應的攻擊場景,不能發現新的攻擊場景。

相關詞條

熱門詞條

聯絡我們