國內外研究現狀
數字資源整合是在各種
數字資源自主性、分布性、異構性的基礎上,運用各種集成技術和手段將各類數字資源集成在統一的利用環境下,實現“
一步到位”的檢索,讓用戶極其方便地利用各種數字資源,為其節省寶貴的時間和精力。數字資源的整合是圖書情報界一個較新的研究課題,它的研究起始於20世紀90年代後期,是隨著數字資源的劇增和在用戶對數字資源的利用提出新要求的環境下提出來的,近年來逐步成為研究的熱點。
國外研究現狀
國外對數字資源整合研究早在20世紀90年代中後期就開始了,並相繼出現了一系列的研究論文。如早在1998年,S.Pinfield等人在“D-Lib Magzine”上發表了“Realizing the Hybrid Library”一文,提出了
複合圖書館中的整合問題:複合圖書館應該要達到“無縫整合”(searnless Integration),即通過統一的用戶界面來為用戶提供服務,並且應該只有唯一的認證網關。同時也指出複合圖書館互操作性問題,提出了圖書館眾多格式和媒體的資源要實現互操作的關鍵是要解決元數據互操作的問題。但由於當時的技術條件所限制,該文並沒有提出具體的解決途徑與方法。20世紀90年代後期,比利時Ghent大學的H.Sompel等開始立項研究參考連結問題,於1999年在“D-Lib Magzine”雜誌上發表其研究成果“Reference Linking in a Hybrid Library Environment”系列報告,提出了在OpenURL框架下的數字資源參考連結解決方案,並開發出名為SFX的連結伺服器軟體。可以說H.Sompel是SFX參考連結的始創人。
他與其合作人以後還發表了一批相當重要的相關學術論文。2000年2月,美國Ex Libris公司從比利時Ghent大學取得了對SFX參考連結軟體的獨占權。目前ISI、CSA、Gale Group、UMI、EBSC0、OCLC等公司的資料庫已經採用了SFX技術。全球17個國家近200個機構選擇了SFx和Meta Lib的解決方案。GALE集團產品管理部副總裁J.Barnes先生讚譽“SFX是電子資源發展史上的里程碑,因為它解決了曾耗費大量精力去進行各種資料庫使用方面研究的問題,但是如果他們不能將這些資料庫進行有效的整合,那么資料庫的使用價值將大打折扣,SFX正是全面考慮了各種數字資源的集成方案。”差不多也在20世紀90年代後期,出版界也試圖推出另一種引文連結規範。1999年底,大型國際出版商同意在建立索引連結的基礎上相互合作。於2000年1月,12個世界頂尖的SIM學術出版商為促進電子期刊領域中跨出版商的索引連線的合作而成立了CrossRef。成員有ACM、The Academic Press、American Institute of Physics、IEEE、kluwer、Blackwell science、Springer、Wiley、Elsevier Science等國際知名出版商。他們組成了一個稱為出版商國際連結協會(Publishers Intenational Linking Association,PILA)的非營利組織,負責CrossRef的運作及提供服務。
J.Pearce提出整合檢索是複合圖書館未來的發展趨勢,並分出三個層次:信息地圖是最低水平的整合;代理結構(Broke Architectures)屬第二層次,如利用z39.50代理伺服器檢索其他館的OPAC系統;整合資源提供商系統是最高層次,有兩種實現方法:一是通過標準協定用代理服務來整合圖書館書目系統和數字館藏,如Z39.50,二是建立一個中央索引集來支持資源發現。
J.walker指出開放連結框架讓圖書館決定內部連結研究環境的範圍及可以提供給用戶的服務範疇。創造這樣一種開放連結環境需要全部信息產業中的信息提供商的合作;並且其成功實現的前提是要有一種類似於openURL的標準。
A.A.Terry提出參考連結使含有引文的著作增加了新的價值,它也減輕了研究者重新檢索參考資料的負擔。並指出要實現參考連結的全部價值,還有很多問題要解決,如:決定要鏈向什麼;適當複本問題;檢索許可權、智慧財產權管理和對象標識符的持續性問題等。A.A.Terry介紹了很多正在解決或已經解決了這些問題的項目或軟體工具,如UIUC的數字圖書館倡導項目試圖利用文獻結構實現不同出版商的出版物之間的“聯邦檢索”;連帶管理的知識環境工具(Jointly Administered Knowledge Environment)是GNu普通公共許可軟體中的一個組件,它可查找、管理連結出版物。另外,A.A.Terry也對CrossRef、SIX、DOI等作了介紹和評價。
2004年2月在墨爾本召開兩年一次的第12屆維多利亞圖書館自動化協會會議,會議的主題就是“打破邊界:整合和可互操作性”。會上Curtin技術大學圖書館的書目服務館員A.sutherland介紹了SFX在其圖書館套用的情況,並對SFX的優點和缺點提出了自己的觀點。我國上海圖書館的吳建中發表了“發展無邊界複合圖書館:上海經驗”,提出2003年是圖書館整合年,提出了上海圖書館2003年的目標是將所有的電子資源及其服務放到一個界面中(0ne Interface),而將來的目標是一次性搜尋(0ne Search)。
國內研究現狀
我國圖書情報界提出以“整合檢索”為研究內容始於2000年,台灣省的陳昭珍教授著有《電子圖書館整合檢索之理論與實踐》一書,該書在當時技術水平基礎上分析了數字資源的整合檢索需求與模式。但由於當時技術發展水平的限制,它主要介紹了Z39.50協定在圖書館數字資源整合中的套用,並對電子資訊的整合檢索發展趨勢作一些巨觀上的展望。黃學軍和唐泰可也於2000年在《現代圖書情報技術》上發表了《書目整合檢索web網關的設計》一文,提出基於Z39.50協定基礎上的書目整合檢索的必要性及其實現方法。之後,我國圖書情報界對“資源整合”的研究越來越關注,其成果也逐漸豐富起來。從數量上看,2001年只有2篇相關文章,趙俊玲、王文娜在《圖書情報工作》雜誌上刊登了《科研信息資源的整合與組織》一文。范愛紅等在《現代圖書情報技術》雜誌上刊載了《基於知識管理的學術信息資源整合體系——對ISI Web of knowledge的評價》一文;2002年在圖書情報類雜誌上刊登的相關論文大約有10餘篇;而2003年已經達到30篇以上。可見圖書館數字資源的整合研究已經越來越受到圖書情報界的重視。從研究內容看,這些文獻的研究也越來越深入。從介紹性文字到研究論文;從理論研究到系統、技術實現的實踐等。
立足點
數字資源整合應立足於數字資源系統結構性最佳化整合。系統的結構性是指系統中各要素之間所形成的某種關係,是系統有機聯繫的反映。相同的要素具有不同的結構形式時,系統就會產生不同的功能和效果。數字資源體系的結構性是一種組織性的表現,是指數字資源體系中不同資料庫之間所形成的某種關聯性,是數字資源系統有機聯繫的反映。數字資源系統的結構整合包括橫向縱向結構整合。 橫向結構指的是數字資源學科專業上的相互關聯性,橫向整合即對不同的資料庫中相同學科專業的數字對象進行最佳化整合。 縱向結構指數字資源在空間上的相互關聯性,縱向整合則是將不同學科專業的數字資源整合為具有多維立體網狀結構的有機知識整體。結構是功能的基礎,結構決定功能。要發揮數字資源系統的整體功能,必須合理地整合結構,構建有效發揮功能的數字資源體系結構。
基本整合方式
它包括多種類型 、多種層次 、多種方式的整合 ,目前主要有以下四個層次上整合方式 。
(1) 匯合整合方式 。
主要是基於
OPAC資源系統的一種整合方式 。OPAC是圖書館重要館藏數字資源系統 ,對OPAC 資源系統的整合是圖書館數字資源最基本的整合方式 。它的實現主要是通過執行 Z39. 50 協定 ,聚合不同平台上的異構 OPAC 資料庫,建立書目整合檢索系統 。用戶只要通過一個 OPAC 系統界面即可檢索相關圖書館的 OPAC。 如上海交通大學圖書館的“Webpac 檢索系統”的“多節點資料庫檢索”,可在統一檢索界面上通過著者 、題名 、主題 、關鍵字 、標準書號等途徑檢索上海交通大學圖書館 、華東師範大學圖書館 、復旦大學圖書館 、上海圖書館的 OPAC 書目信息,不需要在各個圖書館不同的 OPAC 界面間來回切換 。 韓國“國立圖書館整合信息統”可以一次性檢索到圖書 、期刊 、CD-ROM、錄像 、音響等所有資料。匯合整合方式實際上是不同 OPAC 系統中數字信息量的綜合與合併 ,是多個館藏的簡單相加 ,只是通過統一的查詢界面 ,顯示各館 OPAC 系統符合檢索條件的命中記錄 ,用戶還須逐一點擊各館藏記錄 ,自己進行查重處理,進行二次選擇 。
(2) 組合整合方式 。
即對相關資料庫內的數據對象去除重複信息的整合方式 ,提供給用戶的不單是統一的查詢界面,而且是不重複和高質量的信息。組合方式是多個資料庫系統的有機最佳化整合,既是不同數字資源系統中信息量的綜合,也體現了數字信息質的最佳化。 如“Web of Knowledge 學術資源體系”不僅提供跨資料庫交叉檢索功能,而且對命中記錄做了查重處理,節省了用戶對各資料庫重複內容進行去重的時間和精力 。
(3) 重組整合方式 。
重組整合方式主要是基於數字圖書館套用系統的一種資源整合方式。其主要功能是通過對數字資源的分解重組 ,按數字資源的邏輯關係組織成立體網狀、相互聯繫的知識資源系統。 這是當前數字資源整合的一種新模式。數字圖書館套用系統是進行數位化建設及整合各類數字資源的基礎平台,支持對知識和數位化資源的採集、加工、處理、存儲、歸檔 、組織 、發布和利用等全過程,一般由數字資源建設體系 、數字資源存儲與管理體系和用戶服務體系三大模組組成。 如 IBM公司和中國文津信息技術研究中心開發的數字圖書館套用系統 。該整合方式的主要優勢有:其一,能夠整合多種媒體多種渠道的數字信息,不僅包括文字信息,還包括圖像 、音頻 、視頻等不同載體 、不同介質的數字信息;不僅包括數位化的紙質資源,還包括網路各類學術資源 。 其二,能夠實現不同類型 、不同級次 (一次和二次) 資源間的連結,建立起圖書 、期刊 、會議 、機構 、人物等科學研究所需核心資源和相關資源間的整合與連結關係 。 其三 ,能夠保持知識體系的整體性和關聯性,通過知識因子的有序化和知識關聯的網狀化,溝通相互隔絕的學科領域,使之成為相互滲透 、相互作用的有機體,發揮科學知識的整體功能 。其四,能夠形成具有新的組織結構和功能的資源系統 。 這種整合不是簡單的“庫集合”和“庫連結”,而是剔除冗餘、重複和劣質信息,對數字資源內容與結構進行新的類聚和重組,形成一個獲取便捷 、利用率高的新數字資源體系 。 例如 ,“中國試驗型數字式圖書館”,實現了資源的深層標引和分散式資源庫的跨庫連線,對分布在不同地點、不同單位製作的不同資源庫之間,與書目資源、規範資源、百科全書資源和網上讀書之間的連線與查詢。
(4) 一體化綜合整合方式。
以 MARC 格式描述資源對象的 OPAC 是目前圖書館館藏主體資源系統,是用戶利用數字館藏的切入點。MARC 注重形式 、結構複雜 、製作成本高的局限,使其難以承擔對大量多媒體數字資源進行編目的重任,也無法完全實現知識資源的立體化和網狀化整合。數字圖書館套用系統是以 DC 格式描述資源對象,DC 雖有基於內容、簡單明晰、可修飾可擴展等優點,通過 DC 可以對知識資源進行縱向和橫向整合,但不可能解決所有資源的元數據描述問題,還不是十分穩定成熟的元數據標準,也不可能完全代替 MARC。這種情況下,數字圖書館的資源整合既要考慮圖書館原有的 OPAC 資源基礎,又要考慮多種數字資源的建設,一體化綜合整合方式便成了圖書館數字資源整合的不二選擇。一體化綜合整合是指在OPAC 資源整合系統和數字圖書館資源整合系統之間再建立多維度關聯,以形成更為最佳化的數字圖書館資源整合系統 。 其中之關鍵是要實現 OPAC 系統和數字圖書館套用系統之間的技術兼容,實現各種元數據之間以及與其他資源對象之間的互操作 。 在這方面有許多問題需要探索。 上海數字圖書館的以DC 為核心元素集,多種元數據方法並存,並以基於XML 結構的 RDF 資源描述體系封裝整合多種元數據的構想,為實現綜合整合方式提供了一種思路和途徑。