計算機科學,信息科學和系統工程中的本體工程是研究構建本體的方法和方法的領域:域內一組概念的形式表示以及這些概念之間的關係。 抽象概念的大規模表示,如行動,時間,物理對象和信仰,將成為本體工程的一個例子。本體工程是套用本體的領域之一,可以看作是哲學本體論的套用。 本體工程的核心思想和目標也是概念建模的核心。
基本介紹
- 中文名:本體工程
- 外文名:Ontology engineering
概觀,本體語言,生命科學中的本體工程,本體工程的方法和工具,
概觀
“本體工程旨在明確軟體應用程式中包含的知識,以及特定領域的企業和業務流程中的知識。本體工程為解決語義障礙帶來的互操作性問題提供了方向,即與業務術語和軟體類的定義相關的障礙。本體工程是一組與特定領域的本體開發相關的任務。 ”
可以通過向相應的資源(例如視頻檔案)添加豐富的語義來自動處理軟體代理無法解釋的信息。表示知識域的正式概念化的方法之一是使用機器可解釋的本體,其在RDF,RDFS和OWL中提供或基於RDF,RDFS和OWL提供結構化數據。本體工程是這種本體的設計和創造,它不僅包含術語列表(受控辭彙表);它們包含術語,斷言和關係公理,用於定義概念(類),個體和角色(屬性)(分別為TBox,ABox和RBox)。本體工程是一個相對較新的研究領域,涉及本體開發過程,本體生命周期,構建本體的方法和方法,以及支持它們的工具套件和語言。提供本體邏輯基礎的一種常用方法是將描述邏輯的公理形式化,然後可以將其轉換為RDF的任何序列化,例如RDF / XML或Turtle。除了描述邏輯公理之外,本體還可能包含SWRL規則。概念定義可以映射到RDF中的任何類型的資源或資源段,例如圖像,視頻和感興趣的區域,以注釋對象,人等,並將它們與跨知識庫,本體和相關資源相互連結。 LOD數據集。這些信息基於人類的經驗和知識,對於自動解釋複雜和模糊內容(例如多媒體資源的可視內容)的推動者而言是有價值的。基於本體的推理的套用領域包括但不限於信息檢索,自動場景解釋和知識發現。
本體語言
本體語言是用於編碼本體的形式語言。本體有許多這樣的語言,包括專有語言和基於標準的語言:
通用邏輯是ISO標準24707,這是一系列本體語言的規範,可以準確地相互轉換。
Cyc項目有自己的本體語言CycL,基於一階謂詞演算和一些高階擴展。
Gellish語言包括其自身擴展的規則,因此將本體與本體語言集成在一起。
IDEF5是一種開發和維護可用,準確的域本體的軟體工程方法。
KIF是基於S表達式的一階邏輯的語法。
規則交換格式(RIF),F-Logic及其後繼者ObjectLogic結合了本體和規則。
OWL是一種用於製作本體語句的語言,作為RDF和RDFS的後續開發,以及早期的本體語言項目,包括OIL,DAML和DAML + OIL。 OWL旨在通過全球資訊網使用,其所有元素(類,屬性和個體)都被定義為RDF資源,並由URI標識。
OntoUML是用於指定參考本體的有根據的語言。
SHACL(RDF SHapes Constraints Language)是一種描述RDF數據結構的語言。它可以與RDFS和OWL一起使用,也可以獨立使用。
XBRL(可擴展商業報告語言)是一種表達業務語義的語法。
生命科學中的本體工程
生命科學正在蓬勃發展,生物學家用它來理解他們的實驗。為了從實驗中推斷出正確的結論,本體必須針對它們所代表的知識庫進行最佳結構化。需要不斷更改本體的結構,以便它是底層域的準確表示。
最近,一種自動化方法被引入生命科學中的工程本體,例如Gene Ontology(GO)。是最成功和最廣泛使用的生物醫學本體之一。基於信息理論,它重構本體,使得級別代表概念的期望特異性。類似的信息理論方法也被用於基因本體的最佳劃分。鑒於此類工程算法的數學特性,這些最佳化可以自動化,以生成原則和可擴展的架構,以重構GO等本體。
開放式生物醫學本體論(OBO)是美國國家生物醫學本體中心2006年的一項倡議,為各種本體倡議提供了一個共同的“代工廠”,其中包括:
通用模型生物項目(GMOD)
基因本體聯盟
序列本體
本體查找服務
植物本體聯盟
功能基因組學的標準和本體
本體工程的方法和工具
- DogmaModeler
- KAON
- OntoClean
- Protégé (software)
- TopBraid Composer
- TopBraid EDG
- HCOME: Human-centered collaborative ontology engineering methodology (http://semanticweb.org/wiki/SharedHCONE.html and HCOME-3O)