正規概念分析是個非監督式機器學習技巧和資料分析方法。透過正規概念分析建立一個概念點陣,可以將所有的正規概念組織起來。這個點陣是由一群"自然"物件和"自然"屬性所組成。
基本介紹
- 中文名:正規概念分析法
- 外文名:Formal concept analysis
- 性質:分析方法
- 領域:計算機
簡介,歷史,本體,格物論,
簡介
正規概念分析是一種將物件概念和其屬性自動依造本體論進行分析的方法。這個辭彙最早是由Wille於1984所提出。它套用了格理論將物件和其所對應的屬性互相關聯。所套用到的格理論則是由Birkhoff等人於1930年代所發展的。
歷史
正規概念分析的最初動機是尋找數學秩序理論的現實意義。一般性的一種可能性是數據表可以轉換為稱為完全格子的代數結構,並且這些可以用於數據可視化和解釋。表示對象和屬性之間的二元關係的數據表,因此將“對象g具有屬性m”形式的表格列表,被認為是基本數據類型,並且被稱為正式上下文。在這個理論中,形式概念被定義為一對(A,B),其中A是一組對象(稱為範圍),B是一組屬性(意圖),這樣
- 範圍A由在B和dually中共享屬性的所有對象組成
- 意圖B由A中對象共享的所有屬性組成。
任何形式背景的形式概念可以-作為解釋如下-be下令在一個名為更加正式的上下文的層次結構“概念格”。概念格可以圖形方式顯示為“線圖”,這可能有助於理解數據。然而,這些晶格通常太大而無法實現可視化。然後,形式概念分析的數學理論可能是有幫助的,例如,用於將晶格分解成沒有信息損失的較小塊,或者用於將其嵌入到更容易解釋的另一結構中。
目前形式的理論可以追溯到20世紀80年代早期,由達姆施塔特工業大學的Rudolf Wille,Bernhard Ganter和Peter Burmeister領導的研究小組。然而,它的基本數學定義在20世紀30年代由Garrett Birkhoff作為一般晶格理論的一部分引入。其他以前採用同一理念的方法來自法國的各種研究小組,但達姆施塔特小組對該領域進行了規範化,並系統地計算出其數學理論及其哲學基礎。後者特別提到了Charles S. Peirce,但也提到了Port-Royal的邏輯。
本體
在計算機科學與信息科學領域,理論上,本體是指一種“形式化的,對於共享概念體系的明確而又詳細的說明”。本體提供的是一種共享詞表,也就是特定領域之中那些存在著的對象類型或概念及其屬性和相互關係;或者說,本體就是一種特殊類型的術語集,具有結構化的特點,且更加適合於在計算機系統之中使用;或者說,本體實際上就是對特定領域之中某套概念及其相互之間關係的形式化表達(formal representation)。本體是人們以自己興趣領域的知識為素材,運用信息科學的本體論原理而編寫出來的作品。本體一般可以用來針對該領域的屬性進行推理,亦可用於定義該領域(也就是對該領域進行建模)。此外,有時人們也會將“本體”稱為“本體論”。