正規概念分析法

正規概念分析是個非監督式機器學習技巧和資料分析方法。透過正規概念分析建立一個概念點陣,可以將所有的正規概念組織起來。這個點陣是由一群"自然"物件和"自然"屬性所組成。

基本介紹

  • 中文名:正規概念分析法
  • 外文名:Formal concept analysis
  • 性質:分析方法
  • 領域:計算機
簡介,歷史,本體,格物論,

簡介

正規概念分析是一種將物件概念和其屬性自動依造本體論進行分析的方法。這個辭彙最早是由Wille於1984所提出。它套用了格理論將物件和其所對應的屬性互相關聯。所套用到的格理論則是由Birkhoff等人於1930年代所發展的。

歷史

正規概念分析的最初動機是尋找數學秩序理論的現實意義。一般性的一種可能性是數據表可以轉換為稱為完全格子的代數結構,並且這些可以用於數據可視化和解釋。表示對象和屬性之間的二元關係的數據表,因此將“對象g具有屬性m”形式的表格列表,被認為是基本數據類型,並且被稱為正式上下文。在這個理論中,形式概念被定義為一對(A,B),其中A是一組對象(稱為範圍),B是一組屬性(意圖),這樣
  • 範圍A由在B和dually中共享屬性的所有對象組成
  • 意圖B由A中對象共享的所有屬性組成。
通過這種方式,形式概念分析形式化了擴展內涵語義概念。
任何形式背景的形式概念可以-作為解釋如下-be下令在一個名為更加正式的上下文的層次結構“概念格”。概念格可以圖形方式顯示為“線圖”,這可能有助於理解數據。然而,這些晶格通常太大而無法實現可視化。然後,形式概念分析的數學理論可能是有幫助的,例如,用於將晶格分解成沒有信息損失的較小塊,或者用於將其嵌入到更容易解釋的另一結構中。
目前形式的理論可以追溯到20世紀80年代早期,由達姆施塔特工業大學的Rudolf Wille,Bernhard Ganter和Peter Burmeister領導的研究小組。然而,它的基本數學定義在20世紀30年代由Garrett Birkhoff作為一般晶格理論的一部分引入。其他以前採用同一理念的方法來自法國的各種研究小組,但達姆施塔特小組對該領域進行了規範化,並系統地計算出其數學理論及其哲學基礎。後者特別提到了Charles S. Peirce,但也提到了Port-Royal的邏輯

本體

計算機科學信息科學領域,理論上,本體是指一種“形式化的,對於共享概念體系的明確而又詳細的說明”。本體提供的是一種共享詞表,也就是特定領域之中那些存在著的對象類型或概念及其屬性和相互關係;或者說,本體就是一種特殊類型的術語集,具有結構化的特點,且更加適合於在計算機系統之中使用;或者說,本體實際上就是對特定領域之中某套概念及其相互之間關係的形式化表達(formal representation)。本體是人們以自己興趣領域知識為素材,運用信息科學的本體論原理而編寫出來的作品。本體一般可以用來針對該領域的屬性進行推理,亦可用於定義該領域(也就是對該領域進行建模)。此外,有時人們也會將“本體”稱為“本體論”。
作為一種關於現實世界或其中某個組成部分的知識表達形式,本體目前的套用領域包括(但不僅限於):人工智慧語義網軟體工程生物醫學信息學圖書館學以及信息架構

格物論

數學中,是其非空有限子集都有一個上確界(叫)和一個下確界(叫)的偏序集合(poset)。格也可以特徵化為滿足特定公理恆等式代數結構。因為兩個定義是等價的,格理論從序理論泛代數二者提取內容。半格包括了格,依次包括海廷代數布爾代數。這些"格樣式"的結構都允許序理論和抽象代數的描述。
考慮任意一個偏序集合L,≤),如果對集合L中的任意元素a,b,使得a,b在L中存在一個最大下界,和最小上界,則(L,≤)是一個格。
這裡對於取a,b的最大下界的操作用
表示;
對於取a,b的最小上界操作用
表示。
有界格有一個最大元素和一個最小元素,按慣例分別指示為1和0(也叫做)。任何格都可以通過增加一個最大元素和最小元素而轉換成有界格。
使用容易的歸納論證,你可以演繹出任何格的所有非空有限子集的上確界(並)和下確界(交)的存在。一個很重要的格的種類是完全格。一個格是完全的,如果它的所有子集都有一個交和一個並,這對比於上述格的定義,這裡只要求所有非空有限子集的交和並的存在。

相關詞條

熱門詞條

聯絡我們