概觀
“本體工程旨在明確軟體應用程式中包含的知識,以及特定領域的企業和業務流程中的知識。本體工程為解決語義障礙帶來的互操作性問題提供了方向,即與業務術語和軟體類的定義相關的障礙。本體工程是一組與特定領域的本體開發相關的任務。 ”
可以通過向相應的資源(例如視頻檔案)添加豐富的語義來自動處理軟體代理無法解釋的信息。表示知識域的正式概念化的方法之一是使用機器可解釋的本體,其在RDF,RDFS和OWL中提供或基於RDF,RDFS和OWL提供結構化數據。本體工程是這種本體的設計和創造,它不僅包含術語列表(受控辭彙表);它們包含術語,斷言和關係公理,用於定義概念(類),個體和角色(屬性)(分別為TBox,ABox和RBox)。本體工程是一個相對較新的研究領域,涉及本體開發過程,本體生命周期,構建本體的方法和方法,以及支持它們的工具套件和語言。提供本體邏輯基礎的一種常用方法是將描述邏輯的公理形式化,然後可以將其轉換為RDF的任何序列化,例如RDF / XML或Turtle。除了描述邏輯公理之外,本體還可能包含SWRL規則。概念定義可以映射到RDF中的任何類型的資源或資源段,例如圖像,視頻和感興趣的區域,以注釋對象,人等,並將它們與跨知識庫,本體和相關資源相互連結。 LOD數據集。這些信息基於人類的經驗和知識,對於自動解釋複雜和模糊內容(例如多媒體資源的可視內容)的推動者而言是有價值的。基於本體的推理的套用領域包括但不限於信息檢索,自動場景解釋和知識發現。
本體語言
本體語言是用於編碼本體的形式語言。本體有許多這樣的語言,包括專有語言和基於標準的語言:
通用邏輯是ISO標準24707,這是一系列本體語言的規範,可以準確地相互轉換。
Cyc項目有自己的本體語言CycL,基於一階謂詞演算和一些高階擴展。
Gellish語言包括其自身擴展的規則,因此將本體與本體語言集成在一起。
IDEF5是一種開發和維護可用,準確的域本體的軟體工程方法。
KIF是基於S表達式的一階邏輯的語法。
規則交換格式(RIF),F-Logic及其後繼者ObjectLogic結合了本體和規則。
OWL是一種用於製作本體語句的語言,作為RDF和RDFS的後續開發,以及早期的本體語言項目,包括OIL,DAML和DAML + OIL。 OWL旨在通過全球資訊網使用,其所有元素(類,屬性和個體)都被定義為RDF資源,並由URI標識。
OntoUML是用於指定參考本體的有根據的語言。
SHACL(RDF SHapes Constraints Language)是一種描述RDF數據結構的語言。它可以與RDFS和OWL一起使用,也可以獨立使用。
XBRL(可擴展商業報告語言)是一種表達業務語義的語法。
生命科學中的本體工程
生命科學正在蓬勃發展,生物學家用它來理解他們的實驗。為了從實驗中推斷出正確的結論,本體必須針對它們所代表的知識庫進行最佳結構化。需要不斷更改本體的結構,以便它是底層域的準確表示。
最近,一種自動化方法被引入生命科學中的工程本體,例如Gene Ontology(GO)。是最成功和最廣泛使用的生物醫學本體之一。基於信息理論,它重構本體,使得級別代表概念的期望特異性。類似的信息理論方法也被用於基因本體的最佳劃分。鑒於此類工程算法的數學特性,這些最佳化可以自動化,以生成原則和可擴展的架構,以重構GO等本體。
開放式生物醫學本體論(OBO)是美國國家生物醫學本體中心2006年的一項倡議,為各種本體倡議提供了一個共同的“代工廠”,其中包括:
通用模型生物項目(GMOD)
基因本體聯盟
序列本體
本體查找服務
植物本體聯盟
功能基因組學的標準和本體
本體工程的方法和工具