基於文獻的知識發現,更確切的術語是基於非相關文獻的知識發現,它是1986年由Swanson教授首先提出,該術語目前尚無完整的定義,根據Swanson歷次發表的論文,可將基於文獻的知識發現含義歸納為:“從公開發表的非相關文獻中發現某些知識片段間的隱含聯繫,並在此基礎上提出科學假設或猜想,一道科研人員進行攻關或實驗,從而發現新知識。
基本介紹
- 中文名:基於文獻的知識發現
- 簡介:基於文獻的知識發現
- 產生背景:第一,記錄性知識
- 基本原理:Swanson提出的基於文獻
簡介,產生背景,基本原理,
簡介
基於文獻的知識發現
基於文獻的知識發現含義
”這裡,發表的非相關文獻是指兩篇或多篇公開發表的文獻不彼此引用或不共引其他文獻。所謂知識片段是指知識單元或知識單元集合。最後提出的科學假設只是一種推測,尚需實驗佐證,方能生成新知識,為科學界所認可。
Swanson提出的知識發現方法首先在生物醫學中得到套用。1986年,他發現,雷諾氏病是一種病因和治療方法均未知的血液循環紊亂疾病。有的文獻記載了部分雷諾氏病患者血液中有些異常(如血液黏度偏高),又有一些文獻記載了食用魚油能糾正這些異常(如它可降低血液黏度)。Swanson將34篇論述血液變化可導致雷諾氏病的生物醫學文獻分為一組(A),而將25篇論述食用魚油可引起血液某種變化的生物醫學文獻分為另一組(C),通過雷諾氏病主題詞(B)將兩組文獻類型在一起。在此基礎上,Swanson提出科學假設:“食用魚油會對雷諾氏病患者有益。”當時,這一假設並未以任何形式公開發表過,學術界尚未發現食用魚油與雷諾氏病之間的聯繫。兩年後,這個科學假設被臨床實驗所證實。後來,Swanson通過文獻研究又發現了偏頭痛與鎂的11條被忽略掉的聯繫。他在1998年發表的文章中提出了“鎂的缺乏可能引起偏頭痛”的假設,後來也被臨床實驗和腦中鎂含量的檢測報告所證實。
美國為嗯州立大學Cort教授講Swanson方法成功套用於發現Wilson人文資料庫中文獻間的隱含關係。他發現以前未被人們發覺的詩人Robert Forst(1874-1963)和希臘哲學家Carneades(公元前214~公元前129年)間的聯繫。為此證實在人文科學文獻中同樣存在著許多未被挖掘的隱含聯繫。
2001年F.Morrissery博士在美國第九屆圖書館、保健圖書館和法律圖書館會議上發表了題為“科學技術與醫學資料庫中知識發現的理論與實踐”一文。他以工程索引資料庫Compendex為基礎,採用Swanson的方法發現兩人以前未被熱發覺的聚合物中產生帶狀扭結的原因,從而證實了工程技術文獻中也存在著大量未被發覺得隱含聯繫。
產生背景
第一,記錄性知識(文獻)總量與人類吸收知識能力之間的鴻溝不僅是巨大的,而且是不斷擴展和加深的,人的智力水平和有限的生命嚴重地影響新知識的產生,極大地延緩知識的演化過程。
第二,知識分裂現象日趨嚴重。知識分裂又稱知識分化。由於跨學科、跨專業的知識交流,各個學科不斷產生新的分支和專業。知識裂化的加劇導致文獻中隱含的關係不易被發覺,人們識別文獻之間意義联系及其關聯網越感困難。
第三,文獻之間意義联系呈“大爆炸”之勢。一個專業領域的信息可能對另一個專業領域是有價值的,而這一事實卻無人知曉。跨學科之間存在著許許多多未被人發現的聯繫,而這種聯繫未能通過文獻之間的相互引用或其他交流方式進行溝通。另人驚訝的是,意想不到的這種隱性意義联系的數量遠遠超過顯性(相互引用和交流)聯繫的數量,各種信息或知識單元在意義上的結合(潛在聯繫)數量要比信息或知識單元本身多的多。文獻意義關聯的數量爆炸令人擔憂,後果更為嚴重。
基本原理
Swanson提出的基於文獻的知識發現方法最初是根據亞里士多德的三段論。三段論一般由兩個前提和一個結論構成,即是說,從兩個因果關係中可以推導出第三個因果關係。例如,A→B(A引起B),B→C(B引起C),則A→C(A引起C)。知識的發現是以因果的演繹推理為基礎的。然而,這種三段論有其局限性,必須遵循一定的規則。
美國密西根大學商學院Gordon教授發展了Swanson的邏輯遞推的理念,提出了中介文獻概念。其基本原理為:“若某一篇文獻中的A與另一篇文獻中的Bi有關,而每一個Bi又與其他文獻中的Cj有關,將這種遞推關係一直進行下去,直至發現預定目標的內容T。而A與T沒有在文獻中共引或相互引用,也沒有一篇文獻同時論述A與T。” Gordon教授邏輯遞推知識發現的原理,增加了中介文獻,而這比Swanson教授簡單演繹推理更進一步。
美國布拉斯加大學數學與計算機系的Chen創建了“文獻相互交談”的計算機模型,其基本原理可描述為:“若在文獻dj中實體或對象Ok同Ol有關,而另一文獻dj中實體或對象Oi與Om有關,則Ok與Om通過Ol被聯繫起來。” Chen的模型也是建立在三段論基礎之上的。
計算機實現方法——Arrowsmith系統
Swanson教授根據其思想開發的Arrowsmith系統目前已經推出了3.0版本。由過去的資料庫記錄的標題檢索模式過渡到主題詞和文摘檢索模式。該系統的網址為http//:kiwi.Uchicago.edu或http//:Arrowsmit.Psych.Uic.edu。