關聯知識挖掘

關聯知識是指反映了一個事件和其他事件的依賴或關聯。

資料庫中的數據關聯是現實世界中事物聯繫的表現。資料庫作為一種結構化得數據組織形式,利用其依附的數據模型可能刻畫了數據間的關聯。但是,數據之間的關聯式複雜的,不僅是上面所說的依附在數據模型中的關聯,大部分是蘊藏的。關聯知識挖掘的目的就是找出資料庫中隱藏的關聯信息。關聯可以分為簡單關聯,時序關聯,因果關聯,數量關聯等。這些關聯並不總是事先知道的,而是通過資料庫中關聯分析得到的,因而對商業決策具有新的價值。
從廣義上講,關聯分析是數據、挖掘的本質。既然數據挖掘的目的是發現潛藏在數據背後的知識,那么這種知識一定是反映不同對象之間的關聯。關聯規則挖掘是關聯規則挖掘最常用的方法。最著名的是Agrawal提出的Apriori及其改進算法。為了發現有意義的關聯規則,需要給定兩個閾值:最小支持度和最小可信度,他表示了一組項目關聯在一起需要滿足的最低聯繫程度。在這個意義上,數據挖掘系統的目的就是從源資料庫匯總挖掘出和比較深入的分支,許多關聯規則挖掘的理論和算法已經被提出。

相關詞條

熱門詞條

聯絡我們