知識庫簡介
知識庫,又稱為智慧型資料庫或人工智慧資料庫。知識庫的概念來自兩個不同的領域,一個是人工智慧及其分支-知識工程領域,另一個是傳統的資料庫領域。由人工智慧(AI)和資料庫(DB)兩項計算機技術的有機結合,促成了知識庫系統的產生和發展。
知識庫使基於知識的系統(或專家系統)具有智慧型性。並不是所有具有智慧型的程式都擁有知識庫,只有基於知識的系統才擁有知識庫。現在許多應用程式都利用知識,其中有的還達到了很高的水平,但是,這些應用程式可能並不是基於知識的系統,它們也不擁有知識庫。
與程式的區別
一般的應用程式與基於知識的系統之間的區別在於:一般的應用程式是把問題求解的知識隱含地編碼在程式中,而基於知識的系統則將套用領域的問題求解知識顯式地表達,並單獨地組成一個相對獨立的程式實體。
隨著信息化進程,知識庫管理越來越受到企業的重視,但是企業在進行文檔管理的過程中,經常會碰到以下的問題:海量知識存儲,管理困難;查找緩慢,效率低下;知識庫版本管理混亂;知識庫安全缺乏保障;知識庫無法有效協作共享;知識庫管理舉步維艱等。所以知識庫管理逐漸成為國內外業界研究的熱點
歷史
在20世紀80年代開始,許多廠商開始開發的知識庫管理系統,以管理紙質檔案為主要功能。這些系統管理記錄紙張檔案,其中包括印刷、出版的檔案、照片和版畫等。
後來開發商研發第二類知識庫管理系統,即電子檔案管理,這些檔案存儲在用戶的本地計算機中。最早的電子知識庫管理系統的管理,由於技術限制,對檔案類型和檔案數量都做了限制。主要功能集中捕獲、存儲、索引和檢索的檔案格式。
發展到現在,基於B/S架構的知識庫管理系統出現,通過上傳到
伺服器中進行集中存儲,管理起來更加方便,查找更快,而且只要有網際網路的地方,就可以通過瀏覽器直接訪問系統。也增加了更多功能,包括文檔的許可權管理、全文搜尋、存儲加密、審批流程、文檔審計、版本管理、規則套用、線上編輯和統計報表等。
系統結構
知識庫管理系統由如下四部分就組成。
知識庫使用關係型資料庫來存放知識,包括事實與規則。
搜尋模組實現知識庫和推理機之間的知識搜尋和與傳遞。
查詢模組實現推理機對知識庫的知識查詢。
一致性、完整性檢查模組在知識庫中的知識發生變動時對知識庫中的知識進行一致性、完整性檢查。
具備條件
管理知識庫中知識的程式稱為知識庫管理系統,知識庫管理系統可簡稱為KBMS。它應具有以下的功能。
知識的操縱
知識的操縱包括對知識庫中知識的插入、刪除及修改,其中知識的刪除是刪除知識庫中的某些知識,知識的插入是在知識庫中添加一些知識,知識的插入涉及到添加的知識與資料庫中的知識的相容性、冗餘性等。所謂相容性即是添加的知識與知識庫中的知識是否相矛盾。所謂冗餘性即是指所添加的知識是多餘的,它可以從原有知識庫中經演繹而推出,而沒有添加這些知識的必要。知識的修改涉及到刪除與插入兩個部分,因此也存在與知識庫的相容性與冗餘性等問題。
知識的查詢
知識的查詢在這裡有兩層含義。一是從知識庫中提取知識。二是由知識庫中的知識可以推算出一些新的知識。
知識的控制
知識的控制包括知識的一致性和完整性控制、知識共享、知識安全、並發控制、故障恢復等。這都類似於資料庫管理系統。根據KBMS的功能可以看出,從功能範圍看,KBMS實際上是DBMS的一個擴充,即KBMS包括了DBMS的一切,因此在構制KBMS時就可以儘可能的利用現有的DBMS的功能來實現KBMS,這也為本文將KBMS集成到DBMS中提供了依據。
知識庫中知識表示模型
知識庫中的知識通常用一種或幾種方法來表示。知識表示的方法決定了知識庫的結構,因此,建立知識庫的關鍵在於如何表達知識。當前知識的表示方去有以下幾種:產生式規則(Productionrules)、語義網路(Semanticnets)、謂詞演算(PredicateCalculus)、框架(Frames)等等[4]。
基於邏輯的知識表示
亦即用數理邏輯(命題邏輯和謂詞邏輯〉來表示知識,這種知識表示方法是最早的一種知識表示模式,它簡單、自然、靈活、模組化程度高、理論嚴謹、表達能力強,同關係資料庫一樣它有堅實的數學理論基礎。為了克服上述邏輯語言表示能力有限的問題,近年來,在所謂的非經典邏輯研究方面取得了重要進展,如模態邏輯、時序邏輯和非單調邏輯等。
語義網路知識表示
一種用帶標記的有向圖來表示知識的形式。語義網作為人類聯想記憶的顯示心理學模型,它用結點和有向弧組成的網路描述知識。結點表示各種事物、概念、對象、實體、事件等,帶標記的有向弧表示所連線的結點之間的特定關係。通常,一種關係對應一種推理模式。語義網是一種很強的顯式知識表示方法,它直觀清晰,但不適用於不確定性推理。
框架知識表示
可以把對象的所有知識存儲在一起構成的複雜數據結構。它反映了人類通過一般性知識去認識個別事物的特點。一個框架由若干個槽組成,每個槽描述框架所描述的對象的某一方面的特性。槽由槽名和槽值組成,同一個槽可能有多種類型的槽值,每種類型的槽筐稱為榕的一個側面。其中,槽值為附加的過程性知識,稱為附加過程。槽值還可以預設,取預設值。當框架具有時間性質,就構成時序框架。框架知識表示對實現知識庫系統的非精確推理具有重要作用。
面向對象的知識表示
指採用基於信息隱蔽和抽象數據類型概念的面向對象的方法來表示知識,它把所有的實體都描述成對象。每個對象都包括其靜態結構和一組操作。對象按“類”、“子類”、“超類”構成偏序關係。上一層對象的屬性可以有條件地被下一層對象所繼承,對象之間除了互遞訊息之外沒有其它的聯繫。用戶要完成的任務也是通過傳送訊息來實現的。面向對象知識表示方法封裝好、層次性強、模組化程度高,有很強的表達能力,更能用於解決不確定問題。
基於本體的知識表示
基於本體的知識表示方法是近年來的研究熱點之一。這種觀點認為:任何複雜的知識都由最基本的概念構成,這些最基本的概念稱為本題;本體是基本概念的詳細說明。本體的重要性體現在它在知識的可重用和共享性上的重要作用。
基於規則知識表示
基於產生式規則時是由E.Post於1943年提出的。他運用這種規則對符號串作替換運算:運算中的每一條規則就稱為一個產生式。但產生式方法用於專家系統中,無論在理論上或套用方面都有了較大改進。美國史丹福大學早在1965年就採用這種方法開發了世界上第一個專家系統DENDRAL,用於幫助有機化學家確定化合物的內部結構。由於DENDRAL的成功開發,使得用規則來表示專家知識的方法廣為採用。基於規則的知識表示使用IFCondition,THENaction形成的產生式規則表示知識,它具有良好的模組性,是目前套用最廣泛的知識表示方法之一。
知識的搜尋
建立知識庫的重要目的之一是有效地運用知識求解複雜的問題,問題求解的過程本質上即為知識的匹配和搜尋過程。在搜尋過程中,知識庫中的知識通常可看成具有層次關係的樹狀式、網狀式結構。即從某一結點出發的有向圖。搜尋就是從該點出發對有向圖的遍歷,即沿著有向弧按特定次序訪問有向圖中的每一個結點:搜尋的目地是尋找某些滿足一定條件的結點的集合,搜尋方法基本上可分為“盲目搜尋”和“啟發式搜尋”兩大類。
盲目搜尋
盲目搜尋是一種“窮盡”搜尋方法,它不需要有關求解問題的先驗信息,但效率較低,不適合套用於具有複雜搜尋空間的場合。盲目搜尋法包括深度優先搜尋和寬度優先搜尋法。
啟發式搜尋
啟發式搜尋利用以往的經驗指導搜尋過程,這些經驗包括事實,簡化的評價推理和規則等。常用的方法有爬山算法和最佳優先搜尋法。爬山法直接源於我們的爬山的經驗,在爬山中,我們總是選擇坡度最大的方向作為前進的方向,但是採用爬山法我們有可能到達的只是局部最高點,而不是全局最高點,也就是不是最優解。最佳優先搜尋法是爬山法的改進,以解決爬山法的缺陷。構想有一群登山者,從同一點出發,沿著不同的方向爬山,登山者通過通信工具相互聯繫直至最後到達全局的最高點。由於知識庫的容量通常非常大,所以當涉及較大空間時可採用一些技術來縮小搜尋空間,如消去法。消去法是儘可能早地剪去搜尋樹中非解〈或可能性很小〉的分校。通過這種剪枝的方法來縮小搜尋空間。
知識推理方法
所謂推理,是指從已有的知識推導出某種蘊涵的未知知識或發現新的知識。知識推理技術是如何從給定的前提或假設推導出某種理論,或在要求達到某種結論的情況下,去尋找什麼樣的前提才能導致給定的結論。知識推理是專家系統的核心任務之一,是設計實用專家系統的關鍵技術。知識推理技術多種多樣,有演繹和歸納、單調和非單調、確定的和不確定的等。其中,對於確定的知識處理和演繹推理是基於知識推理的核心內容。推理的方向有正向和逆向兩種,對於不同的推理方向,往往有不同的控制策略。而在專家系統中,我們要尋求的是那些功能強,且能描述和解決一大類有用問題的通用方法。目前,有關確定的、以演繹推理為基礎的有效推理技術主要包括:歸結反演技術、規則演繹技術、啟發式技術和黑板技術等。對於不確定的知識處理,目前已經提出了許多新方法,這些方法大致可分為兩大類:一類是採用基於機率論和模糊集合論的數值方法:另一類是採用非數值的符號方法。
功能
集中存儲:為企事業單位搭建海量文檔集中存儲的平台,實現統一的文檔共享。
目錄結構:支持樹形目錄結構,可無限創建資料夾和子資料夾結構。可自定義目錄排序。組織內部所有成員可輕鬆的實現檔案的安全共享與查看。
文檔排序:支持根據文檔的標題、大小、日期、上傳人等屬性進行排序。
顯示模式:支持目錄以列表模式或縮略圖模式顯示。
全文搜尋:全文搜尋及高級搜尋引擎幫您快速從海量資料中精準查找所需檔案。
文檔編輯器:可直接在系統瀏覽器中創建、閱讀和編輯Office檔案,無須改變現有的任何操作習慣,無需下載或安裝軟體。
多檔案上傳:支持檔案的批量上傳及壓縮檔導入,實現文檔資料的快速輕鬆存儲管理,支持Office文檔、PDF、圖像、音視頻和圖紙等各類型檔案。
版本管理:強大的版本管理功能,文檔關聯多版本,避免錯誤版本的使用,同時支持歷史版本的查看、回退與下載。
自動編號:系統提供25種變數,可自由組合設計編號規則。配合規則進行條件匹配可實現靈活的編號效果。
文檔審計:文檔審計信息描述了文檔生命周期全過程中的每一個動作,包括操作人、動作、日期時間等信息,通過審計跟蹤您可以全局掌握系統內部所有檔案的操作情況。
Office集成:E6與Office無縫集成,可直接在系統中新建、閱讀、編輯各類Office檔案,包括Word、Excel、PowerPoint、WPS、Visio等格式。
摘要及縮略圖:系統會自動為上傳的Office文檔、txt、pdf等類型檔案生成摘要;系統支持為圖片、音頻、視頻類檔案增加摘要及縮略圖,便於預覽查看。摘要及縮略圖功能簡化了操作,用戶無需逐個打開文檔即可快速預覽文檔內容。
鎖定保護:E6除了提供許可權控制保護外,還提供鎖定保護機制,文檔作者和管理權用戶可將文檔鎖定,確保文檔不被隨意修改。當文檔需要修改或刪除時,可以解鎖,保證文檔的正常操作。
文檔連結:支持將文檔傳送至常用文檔,用戶無需每次在打開各個目錄中查找; 支持將文檔傳送至目錄,方便其他部門查閱;支持將文檔傳送至指定用戶從而協同完成工作; E6與電子郵件集成,支持直接將文檔傳送至Email,無需登錄信箱及手動上傳附屬檔案,操作簡便、非常實用。
關聯文檔:文檔新建或上傳後,系統會自動或手動為檔案生成唯一編號,支持文檔的批量關聯。E6支持通過檔案唯一編號,實現文檔與相關文檔、圖紙、圖片及其它格式附屬檔案進行關聯,點擊連結即可一鍵快速查看。系統支持為圖片、音、視頻類檔案增加摘要及縮略圖。
規則套用:系統支持為目錄設定規則,指定動作、條件和操作,當動作觸發符合設定的條件,系統則自動執行規則的操作。規則兩個主要功能:一是將文檔自動歸檔到規則指定的目錄下,實現規範化管理;二是:文檔自動發起審批進入流程,實現文檔審批自動化。
許可權管理:提供許可權控制機制,可針對用戶、部門及崗位進行細粒度的許可權控制,控制用戶的管理、瀏覽、閱讀、編輯、下載、刪除、列印、訂閱等操作,實現文檔安全共享。
存儲加密:檔案採用加密存儲,防止檔案擴散,全面保證企業級數據的安全性和可靠性。
模板管理:支持在系統中創建大量Office模板檔案,授權給用戶使用。用戶在新建文檔時,可調用授權的模板。系統自動統一規則命名文檔,實現檔案名稱標準化管理。
文檔借閱:支持將公共文檔和個人文檔進行借閱管理,借出過程中可控制用戶訪問許可權。被借閱用戶會收到系統傳送的即時訊息通知。系統支持根據時間對借出的文檔自動進行收回處理。
多媒體查看器:E6除了管理文檔外,還支持多媒體數字資產的存儲及管理。您可以直接在系統中預覽圖片、播放視頻、音頻。支持的格式包含:gif、jpg、png、 bmp、psd 、ai 、tif 、mp3、wav、wma、flv、mpg、 avi 、wmv、mp4等。
CAD圖紙管理:E6為了滿足工程建築、房地產等行業的需求,支持AutoCAD、SolidWorks、Pro/E、STL等300多種檔案格式的線上預覽及管理,減少等待預覽及審核圖紙的時間。
紙質文檔電子化管理:E6除了可以管理電子文檔、多媒體檔案、CAD圖紙外,還支持紙質文檔電子化管理。通過掃瞄器將紙質文檔轉化為電子的圖片或者PDF存儲至系統。
Office無縫集成:E6與Office無縫集成,系統操作與本地操作無異,無需改變任何習慣,即可快速上手熟練使用系統,可多人協同編輯文檔,多版本進行管理,提高工作效率。
掃瞄器集成:與掃瞄器緊密集成,通過掃瞄器將紙質資料轉化為電子的圖片或PDF檔案存儲。減少通過檔案櫃或抽屜查找紙質文檔所花費的時間,降低紙質文檔可能被損壞、丟失的風險或正在被另一用戶使用而重複複印造成大量紙質成本的浪費。