知識組織系統互操作的含義
如前所述,互操作是指兩個或多個系統相互使用已被交換的數據/信息的能力,而知識組織系統的互操作就是指不同知識組織系統之間的兼容互換。
當前,各種數字圖書館、主題網關(學科信息門戶)以及搜尋引擎等成為業界研究的熱點和建設的重點,而如何通過異質知識組織系統間的互操作,為用戶提供跨庫、跨系統、跨語言的瀏覽與檢索是圖書館界和信息界正在重點關注的一個熱點課題。即多類型、多語言的知識組織系統之間的互操作,是實現分散式信息資源系統交叉瀏覽和集成檢索的有效方法,也是目前知識組織系統建設的主要內容。
資源組織要實現知識組織系統間的互操作,就是要找到某種方法,使具有不同標識、結構、載體的分類表或主題詞表或形式化本體等的成分建立聯繫,用戶只用一種檢索語言或直接使用自然語言就可實現聯網環境下的跨資料庫或信息系統檢索。
而要實現這一目標就必須在信息描述、檢索、對象交換與檢索協定等方面取得突破性進展。需要解決的問題另還包括元數據的定義和通過文本或多媒體數字對象等抽取元數據,數字對象的特徵描述計算,具有不同語義的異構資源庫的整合,信息的聚類和自動分類、自動排序、分級算法等。
知識組織系統互操作的層面
國內外學術界一直比較重視知識組織系統問的互操作研究,實施了許多積極而有成效的研究計畫,而且一些研究成果也已在實踐中得到套用。據司莉所做的調查,國內外已開展的數十項知識組織系統的互操作研究計畫大致可以歸為以下三類:
一類是相同結構間的互操作研究,包括標題法之間、敘詞表之間以及分類法之間的互操作研究。其中,敘詞表之間和分類法之間的互操作研究占這類互操作研究的八成以上。
第二類是不同結構間的互操作研究,包括兩種知識組織系統(比如敘詞表與分類法、分類法與標題表)以及三種以上知識組織系統問的互操作研究。對多種知識組織系統間的互操作研究已成為今後研究的重點,也是互操作領域研究的發展趨勢。
第三類是涉及兩種語言以上的互操作研究,約有十多項。這一方面是各國文化的發展、不同文化之間的交流和融合發展的結果,另一方面也說明知識組織系統的互操作研究國際化和全球化的程度在不斷加深。語言障礙和異構系統是用戶利用知識信息的最大阻礙,因此互操作也成為網路知識組織系統(NKOS)重點討論的一項關鍵技術。其中,跨語言的互操作在美國和歐洲尤其受到重視,美國數字圖書館先導計畫(DigitalLibrary Initiative)中有許多項目就是解決語義互操作問題的。
例如Illinois大學主持的項目中關於概念空間與分類地圖的研究,伯克利(Berkeley)大學主持的項目中對於消除文字歧義的研究,卡內基梅隆(CarnegieMellon)大學主持的項目中對於語音識別的研究以及加州大學聖塔巴巴拉分校關於圖像的分割與聚類的研究,主要集中於人工智慧、統計規律識別技術等,這些都屬於語義研究或語義互操作研究範疇。歐洲的相關研究項目有Renardus、MACS、Merimee等,甚至嘗試自動建立中、英文詞表之間的映射。我國也有一些關於雙語數字圖書館知識組織系統互操作的研究,例如《漢語主題詞表》與LCSH、本體之間的轉換研究、《中圖法》與DDC類目設定的比較、與DDC對照系統的研製等。
異構系統間的互操作的目標是實現不同系統間的知識交換、共享和重用。這方面需要解決的問題除了跨語言、跨文化互操作(未來的數字圖書館系統將是聯邦數字圖書館。即建立全球範圍的數字圖書館系統,需要解決跨語言、跨文化的互操作問題,其中包括比較複雜的語言翻譯問題)問題外,還有不同本體間的互操作(本體作為語義全球資訊網建設的核心,為數字圖書館系統的語義互操作提供了解決方案,但其本身也存在著異構性,因此不同本體間的互操作也是數字圖書館系統互操作的一個方面),以及各類知識組織系統安全性問題。
開展多語種知識組織系統互操作的研究,將有助於世界範圍內信息資源的整合與共享,具有很大的現實意義。與國外互操作研究相比,我國這方面的研究一是起步較晚,二是研究的項目數量比較少,因此相應的實踐成果也較少。目前已經開展的研究項目主要包括中醫藥一體化語言系統、AGROVOC詞表的中文翻譯、《中圖法》與DDC映射系統、教育集成詞庫構建系統、醫學分類主題一體化系統建設、漢語科技詞系統等。而涉及分類法與主題法之間的互操作的技術方式較為單一,主要為對照索引式的分類主題一體化詞表。
綜合國內外知識組織系統的研究,我們將各種類型的知識組織系統粗略劃分為兩類,一類是傳統知識組織系統,包括術語表、分類表、類目表、標題表、敘詞表及其他情報檢索語言與標引語言等;另一類是以形式化本體為代表的新型知識組織系統。與此相應同時也是為了論述的方便,本節將知識組織系統互操作也大致分為兩類,一類是傳統知識組織系統間的互操作,另一類本體間的互操作。