在計算機科學與信息科學領域,理論上,本體是指一種“形式化的,對於共享概念體系的明確而又詳細的說明”。本體提供的是一種共享詞表,也就是特定領域之中那些存在著的對象類型或概念及其屬性和相互關係;或者說,本體就是一種特殊類型的術語集,具有結構化的特點,且更加適合於在計算機系統之中使用;或者說,本體實際上就是對特定領域之中某套概念及其相互之間關係的形式化表達(formal representation)。本體是人們以自己興趣領域的知識為素材,運用信息科學的本體論原理而編寫出來的作品。本體一般可以用來針對該領域的屬性進行推理,亦可用於定義該領域(也就是對該領域進行建模)。此外,有時人們也會將“本體”稱為“本體論”。
作為一種關於現實世界或其中某個組成部分的知識表達形式,本體目前的套用領域包括(但不僅限於):人工智慧、語義網、軟體工程、 生物醫學信息學、圖書館學以及信息架構。
基本介紹
- 中文名:本體
- 外文名:Ontology (information science)
- 領域:電子工程
基本信息
歷史
本體構成要素
- 個體(實例):基礎的或者說“底層的”對象。
- 類:集合(sets)、概念、對象類型或者說事物的種類。
- 屬性:對象(和類)所可能具有的屬性、特徵、特性、特點和參數。
- 關係:類與個體之間的彼此關聯所可能具有的方式。
- 函式術語:在聲明語句當中,可用來代替具體術語的特定關係所構成的複雜結構。
- 約束(限制):採取形式化方式所聲明的,關於接受某項斷言作為輸入而必須成立的情況的描述。。
- 規則:用於描述可以依據特定形式的某項斷言所能夠得出的邏輯推論的,if-then(前因-後果)式語句形式的聲明。
- 公理:採取特定邏輯形式的斷言(包括規則在內)所共同構成的就是其本體在相應套用領域當中所描述的整個理論。這種定義有別於產生式語法和形式邏輯當中所說的“公理”。在這些學科當中,公理之中僅僅包括那些被斷言為先驗知識的聲明。就這裡的用法而言,“公理”之中還包括依據公理型聲明所推導得出的理論。
- 事件(哲學):屬性或關係的變化。
領域本體
本體工程
本體語言
- Cyc項目有其自己的,基於一階謂詞演算,且具有某些高階擴展的本體語言(即CycL)。
- Gellish語言之中包括了關於自身擴展的規則,因而集成了一部本體和一種本體語言。
- 規則交換格式(Rule Interchange Format,RIF)與F-邏輯(F-Logic)可將各種本體和規則結合起來。
本體的例子
- 胺基酸本體:關於胺基酸及其性質的小型本體(其中,概念、屬性和關係均備有中英文名稱、同義詞及縮寫)。
- 基本形式化本體(Basic Formal Ontology):一部設計旨在為科學技術研究工作提供支持的形式化上層本體。
- BioPAX:一部旨在促進生物學途徑(細胞過程)數據之交換和互操作性的本體。
- 細胞周期本體(Cell-Cycle Ontology,CCO):一部用於表達細胞周期的套用本體。
- CIDOC概念參考模型(CIDOC Conceptual Reference Model):一部關於文化遺產的本體。
- Cyc:一部關於論域之形式化表達的基礎本體。
- 疾病本體(Disease Ontology):在設計上旨在促進各種疾病及相關健康狀況向特定醫學代碼的映射。
- DOLCE:即語言學與認知工程描述型本體(Descriptive Ontology for Linguistic and Cognitive Engineering)。
- 基礎性核心語言學本體(Foundational, Core and Linguistic Ontologies)
- 人類解剖學方面的解剖學基礎模型(Foundational Model of Anatomy,FMA)
- 基因組學領域的基因本體(Gene Ontology,GO)
- 通用上層模型(Generalized Upper Model):一部用於在客戶系統與自然語言技術之間發揮中介作用的,帶有語言學動機的本體。
- Gellish英語詞典:是一部包括有詞典和分類法的本體;其中,收錄有一部上層本體和一部下層本體(lower ontology),側重於工程、技術以及採購方面的工業及商業套用。參見SourceForge的開源項目。
- GOLD:即語言描述通用本體(General Ontology for Linguistic Description)。
- Linkbase:在基本形式化本體(Basic Formal Ontology)的基礎之上,對於生物醫學領域的一種形式化表達。
- 勞森模式語言(Lawson Pattern Language,LPL)
- 開放生物醫學本體鑄造廠(OBO Foundry):生物醫學領域的一套具有互操作性的參考本體。
- 植物本體(Plant Ontology):關於植物結構以及生長/發育階段等方面的本體。
- 程式抽象分類法(Program abstraction taxonomy)
- 蛋白質組學領域的蛋白質本體(Protein Ontology)
- 系統生物學本體(Systems Biology Ontology):描述的是生物學領域的計算機模型
- 推薦上層合併本體:一部形式化上層本體
- SWEET(Semantic Web for Earth and Environmental Terminology,地球與環境術語集語義網)
- 思想財富本體
- 醫學教育標引主題(Topics for Indexing Medical Education)
- WordNet:一個辭彙參考系統(Lexical reference system)。
本體庫
- CO-ODE項目本體庫:提供的是一些與CO-ODE項目相關的本體示例和本體資源連結。
- DAML本體庫(DAML Ontology Library)之中保存的是那些採用DAML格式的歷史遺留本體。
- Protege本體庫(Protege Ontology Library)之中收錄的是一套採用OWL格式、基於框架的格式以及其他格式的本體。
- SchemaWeb則是一個由採用RDFS、OWL以及DAML+OIL格式所表達的RDF模式(RDF schemata)而構成的目錄。
- OntoSelect Ontology Library(OntoSelect本體庫)提供的是多種類似的,適用於RDF/S、DAML以及OWL本體的服務。
- Ontaria是“一個可以搜尋和瀏覽的語義網數據目錄,且側重於RDF詞表以及OWL本體”。
- Swoogle是一個目錄和搜尋引擎,適用於網際網路上現成可用的所有RDF資源,包括各種本體。
常用本體工具
本體伺服器
- CO-ODE本體瀏覽器:又稱為“OWLDoc Server”,即OWL本體文檔伺服器,用於動態生成HTMLOWLDoc文檔,功能類似於Protégé本體編輯器之中的OWLDoc外掛程式。
本體編輯器
- Protégé
- Neon工具箱
參見
- 形式化概念分析
- 本體對齊
- 本體圖表
- 開放生物醫學本體
- 軟本體
- 術語集提取
- 弱本體
- 分體法
- 知識表達
- 術語集
- 臨床術語伺服器