產生和特徵
1.1 網路計量學的提出
1997年T.C.阿曼德首次提出了“網路計量學”(Webometrics或Cybermetrics)的概念。阿曼德認為,網路計量學包括了所有使用情報計量和其他計量方法對網路通信有關問題的研究。“情報計量方法所使用的手段完全可以套用到全球資訊網上,只不過是將全球資訊網看作引文網路,傳統的引文由Web頁面所取代”。將傳統文獻計量方法使用在Web分析上,通常可統計諸如語言、單詞、辭彙、頻次、作者特徵、作者合作的能力和程度,還有對作者的引文分析,學科或資料庫增長的測量,新概念、新定義的增長、信息的測量、信息措施的形式與特徵。
1.2 網路計量學的特徵
網路計量學是指在電子網路環境中,運用文獻計量學、科學計量學、信息計量學的方法,對網上各種信息的組織、存儲、分布、傳遞、相互引證及其功能和開發利用等做出定量描述並進行統計分析和研究,以揭示其數量特徵和內在規律的一門新興分支學科。通過對網上信息的計量研究,為網上信息的有序化組織和合理分布、為網路信息資源的最佳化配置和有效利用、為網路管理的規範化和科學化提供必要的定量依據,以改善網路的組織管理和信息管理,提高其管理水平。
因此,網路計量學作為一門新興學科,順應了網路資訊時代的需求,對某一方向的發展趨勢可進行全面統計,具有廣闊的前景;它在對網路的信息數據進行科學統計、分析的過程中大量使用了機率論與統計學,計量方便、操作簡單、結果準確,從而揭示了網路文獻及信息資源的新規律;與傳統手工檢索工具相比較,網路檢索系統有著不可比擬的優越性,為其方便快捷的檢索途徑和情報服務提供了更為廣泛的實際套用。
理論研究
2.1 網路計量學研究的內容
作為全球信息網路,網際網路提供站點、主頁、電子郵件、討論新聞組等媒介和內容,都將成為網路計量學的主要研究對象。它適用於網路文獻檢索研究、文獻著者研究、引文分析、站點評價、搜尋引擎研究、信息資源建設以及網路信息最佳化處理等,歸納起來主要涉及到三個層次:
⑴網路信息的直接計量
網際網路的不斷發展使人們一改傳統的通過人工對文字、聲音、圖像等文本的註解,然後再進行的檢索,人們不斷發展的對情報需求的心理特點要求對網上各種信息進行直接準確的檢索。這就要求我們:首先,建立容量足夠大的多媒體信息資料庫以完整保存信息;其次,以圖像為例,構建各種特徵索引資料庫,將顏色、紋理、形狀等視覺特徵內容通過繪製直方圖、共生矩陣及輪廓線等數據模型進行量化;對聲音的各種屬性特徵進行賦值,在檢索時通過賦值檢索或示例匹配方式,將其特徵值限制在一定的相似範圍內或通過選擇示例聲音進行匹配,從而得到精確結果;另外,也可選擇具有聲音服務的E—mail等網站進行單項統計,利用層次分析法將用戶對聲音的主觀評價轉化為對聲音服務的要求的客觀反映,以指導網站建設。
⑵網路文獻、文獻信息及相關特徵信息的計量
網路計算學雖然包括了許多的計量內容,但其理論是在文獻計量學的基礎上發展起來的,因此網路文獻既保留了傳統文獻的特徵研究,又具有其獨特的新概念、新指標和新規律,例如:①對作者分布規律的研究;②對文獻分散規律的研究;③對文獻增長規律的研究;④對文獻老化規律的研究;⑤對文獻引文分析的研究。諸如此類對這些規律的理論解釋和數學模型的研究。
⑶網路結構單元(站點)的信息計量
網站作為網路時代的“知識地圖”成為網路計量學家所關注的問題,不僅網路文獻保持著聚類關係,網站之間也有著獨特的引用關係。網路文獻之間不僅是參考文獻的標註方式;更多的是使用了超級連結的方式;不僅是參考文獻的條目,有可能是通過點擊得到引用文獻的全文。網路計量學研究的正是全球資訊網(引文網)中的Web網頁(引文)之間的引用關係,同被引與引文耦仍然可以用於揭示站點之間的相關性。而網路的動態性、高時效性也可成為我們研究的更有效的計量指標。
2.2 網路計量學研究的方法
網路計量學是網路技術、信息技術和文獻計量學的有機結合,隨著這十年來網際網路的迅猛發展,對網路計量學的研究大致可分為四種類型:
⑴運用統計方法對數據進行統計分析
網路計量學使用機率論與統計學對網路中的數據進行科學分析,得出網路本身所適用的數學模型,從而揭示網路文獻及信息資源的新規律。通過對網站和伺服器的數量、網路用戶特徵以及網路發展的增長率指標進行統計分析。
⑵運用圖論的方法對數據進行可視化研究
就是運用網路繪圖和信息技術來研究網頁超級連結的拓撲結構,直觀反映網頁間的連結關係。人們將圖論方法和傳統及新的研究方法綜合套用,並擴充和確認了這種方法的研究和套用。
⑶運用提示數據聚簇和分散的工具進行數據挖掘研究
與統計方法相比,數據挖掘可用於對一個站點上的各種特徵進行深度研究,包括站點的交通測度以及各個國家的IP位址的分配。數據挖掘在文獻和引文資料庫中所套用的方法之一聚類分析技術,在網路環境下也同樣適用。
⑷運用解釋和模擬網路結構和增長理論工具進行模擬研究
這種方法就是通過構建網路結構的模型來研究網路,諸如網路的相互連結及拓撲結構。主要用於研究各個國家的域的等級——頻次分布、網頁之間和網頁內部、外部的超級連結。
套用分析
3.1在數字圖書館和情報科學中的套用
網路計量學對網路信息資源的研究成果將能有效地套用於數字圖書館,如在數字圖書館館藏資源建設中的套用可以提高數字圖書館的管理水平,通過連結分析研究,及時掌握、判斷網路信息資源情況,從而有效地指導數字圖書館的業務開展。一方面可以合理分配館藏空間,另一方面可進行動態館藏的維護,將網路計量學套用於網路信息資源的建設。
而對於情報科學的研究探索,要取得突破性的進展,需要解決兩個問題:知識信息的表達與組織必須從物理層次的文獻單元認識層次向知識單元或情報單元轉換;知識信息的計量必須從語法層次向語義和語用層次發展。這兩方面的突破有賴於網路計量學的深入研究和發展,從而使情報科學的社會功能得以實現,情報科學的地位與作用得以提高。
3.2 在網路搜尋引擎、網站建設和管理中的套用
在網路環境下,信息用戶一般是利用搜尋引擎進行檢索的,然而龐大的用戶群所產生的信息需求是複雜多樣的,且缺乏明確的信息檢索所需的背景知識,因此要求網路信息的揭示方式以用戶需求為出發點,通過用戶對已有網站的點擊率來統計分析用戶的需求特點及傾向,從各個層次、角度完善網路全新的檢索途徑,建立容量龐大、語種多樣的大型資料庫檢索系統,使搜尋引擎從單一的查詢工具向網路全功能服務發展。目前搜尋引擎數據組織機制較好的有Google採用的方式和IBM的算法。
同時,網路計量學可套用於網站信息資源評價及網站評價,就像引文分析可以用於確定網路信息資源的權威性和可靠性。由於缺乏規範的表達方式和組織管理,造成了網路信息檢索和管理上的混亂無序,這給網路信息的分析計量工作設定了一定的障礙。因此,如果每個信息發布者都依照一定的標準表達和組織網路信息資源,即網路信息資源能以某種規範的形式存在,其規律就會比較容易發現,掌握用戶的信息需求和上網習慣就會更準確,信息用戶利用網路就會更便捷,而網路信息的價值也更能夠得到體現。
具體的套用之一在於處理日誌檔案,這樣可揭示一段時間區域網路站所接受的訪問次數,對其分析類似於圖書館利用登到記錄、流通統計等業務統計數據進行資源利用情況分析評價。日誌檔案的分析需要相應的軟體收集數據,需專業人員從各種數據中分析出相關數據,這些數據主要包括:①伺服器在一段時間內受到的訪問量;②網站內每個頁面受到的訪問量;③用戶瀏覽網站的整個過程的記錄,如從何處進入網站,從哪個頁面退出,用戶在一個頁面上停留的時間、下載一條數據的時間和位元組數等。
3.3 在社會科學研究、科技發展和決策中的套用
在同一時期內,科學體系中的各個學科和其下面的各個研究主題並非均衡發展的,在某個時期總有一個或多個學科容易取得成果,科學上將這種易出成果且成果纍纍的學科叫做當采學科;同樣,一個學科中易出成果纍纍的主題叫做當采主題。由於成果的多少可用文獻的數量來表示,我們可藉助搜尋引擎或網路在線上資料庫,通過計量統計研究,分析出當采學科和當采主題在網路中的受關注程度,並得出科學的評價。
網路計量學的發展,科技活動中的信息和信息技術的日益普及,對科技發展和成效的科學計量學及網路計量學的分析變得越來越重要;同樣,網路計量學對科研機構科技政策的實施也會產生影響,通過對網際網路上有關學科的各類信息進行計量分析,從而對科技研究機構之間的合作、信息流動,以及科技政策的實施等作出了探索性的研究。
3.4 在社會生活中的套用
網際網路及網路化趨勢的出現和擴展,既是一種信息技術的創新形式與過程,也表現為一種特殊的社會現象和社會過程,導致了人類行為的領域開始向網路和網路化方向延伸。人類特有的信息、知識和情感之間的互動關係,在現實社會空間表現出來的社會問題,在網路空間也會如實體現出來。例如2003年10月15日中國自行研製的“神舟五號”載人飛船的成功發射,此事引起世界的驚嘆和關注。在此段時間,我們可以每天甚至每小時都可用搜尋引擎搜尋有關“神五”的關鍵字,記錄下命中的記錄,進行內容單元分析,跟蹤分析發射前後的變化、輿論導向作用、海內外華人的歡欣鼓舞和各國政府、媒體的評論,以及中國在國際上的地位及影響力等等。
3.5 在指導核心期刊評定中的套用
基於《中國知識資源總庫》的總體規劃和建設方案,“中國學術期刊(光碟版)”電子雜誌提出了基於知識元和知識網路的知識評價方法,即藉助資料庫和知識抽取技術、用知識點含量及知識點創新性比較,對期刊和期刊文獻進行分析評價。同時主張引入網路影響因子,建立包括網上全文下載量等新的計量指標在內的科學評價體系,在新近出版的《中國學術期刊綜合引證報告(2004)》中,上網期刊全文下載總頻次作為一項新的計量指標公布,成為“期刊綜合評價梯度”測定的一項網路計量評價指數,初步確立了網路環境下期刊評價的新指標體系,並將成為核心期刊評定中最可靠的科學依據。例如:根據《中國學術期刊綜合引證年度報告(2003)》,在“中國期刊網”中心網站2002年全文下載記錄的統計,並經綜合評價分析,《遺傳》2002年載文量168,總被引頻次797,他引率0.8645,影響因子0.8456,Web下載量9980。總被引頻次比上年(619)增加28.76%;影響因子比上年(0.6221)增加35.93%。在全國生物學期刊中排名第10位,已經躋身一級期刊之列,是《中文核心期刊要目總覽》(第四版)綜合性生物類核心期刊。
發展趨勢
網路計量學的產生和發展,給信息用戶提供了多方面的決策點,這些將有助於提高查全率和查準率,對於改進網站質量、有針對性的提供信息資源具有重要作用。
4.1 有取代文獻計量學和信息計量學的趨勢
網路計量學的發展使得文獻計量學也很有必要對新媒體的出現作些思考。正如1990年Paisley提出了將情報計量方法套用到電子通信領域,他說:“現在的書、刊、報紙中的大部分文本信息將來都會被包含在電子資料庫中,收藏的大量電子信息將來會成為文獻計量學研究的主流。”21世紀的文獻計量學也許真的會成為“網路計量學”,不論它的名稱是否會有變化,我們都必須看到這樣一種趨勢:下個世紀的文獻計量學必將實現向新的計量媒體的拓展,從而開始一個嶄新的發展階段。
4.2 有研究日漸成熟和規範化的趨勢
搜尋引擎的不斷發展、完善以及查準率的提高將對網路計量學的發展產生積極的影響,特別是查準率的研究有可能使網路計量學最終經受起科學的檢驗並逐步完善。網路計量學的研究成果可以指導網路信息檢索,幫助用戶選取高質量的站點和搜尋引擎。網路信息檢索是一種多維檢索,它有著更大的自由度,也更適合人類的聯想思維方式,新出現的搜尋引擎更具親和力和人性化,更加貼近用戶的心理,更能滿足人們查找信息的需求,成為搜尋引擎的又一個發展趨勢。
4.3 有加強網路信息的控制和管理的趨勢
在網路環境下,信息用戶群是利用搜尋引擎進行檢索的,網路計量學研究成果可以指導網路信息檢索,幫助用戶迅速選取高質量的站點和搜尋引擎,通過用戶對已有網站的點擊率來統計分析用戶的需求特點及傾向,幫助網站人員建立最佳網站。對於網路用戶的詳細分析,根據用戶特徵調整網站風格、最最佳化地選取網路視點、焦點和賣點,科學配置網路資源,掌握其特有的規律形式,將使網路計量學更緊密地聯繫網站和用戶多樣化的實際,成為構建用戶與網站良好關係的中介。
4.4 有促進各學科交流和發展的趨勢
知識經濟的核心是知識的創新、組織、利用和傳遞,網路計量學研究的突破帶來信息計量的可操作性與有效性,必將為知識組織與管理提供有效的工具和方法,進而消除和緩解網路時代信息污染帶來的知識積累與利用間的矛盾激化,使各學科的社會功能得以實現。隨著網路的迅速發展,網路計量學研究不受國界限制,任何一名圖書館員都可以利用網際網路進行資料蒐集分析,隨時將獲得的網路計量學研究成果發表在全球資訊網上,圖書館還可以通過BBS進行討論,通過網際網路視訊系統進行網上會談與商榷。網路計量學的發展及其在圖書館的套用,縮小了學者國家間的差別,使網路計量學真正成為一門國際性合作的現代計量科學。網路計量學的產生和發展,也使得人們通過對HTML語言和都柏林核心元數據集(Dublin Core)的研究以進一步探討網路計量學研究的新方法和新規則,網路計量學研究成果和分析結果給信息用戶提供了多方面的決策點,有助於提高查全率和查準率。
在不斷發展和變化的網路環境中,不斷開拓新方向,發現新問題,採用新手段,開發新的網路計量工具與方法,是網路計量學的根本任務。探討網路計量學研究規律、選取適當的搜尋引擎對數據進行正確分析和量化處理也是網路計量學研究取得新進展的必然要求。由於網路文獻的特殊性,以及所具有的傳統文獻的普遍性,網路計量學的發展還必須借鑑、移植傳統文獻計量學、信息計量學方法。通過網上信息計量研究,為信息的有序化組織和合理分布,為網路管理的規範化和科學化提供必要的定量依據,從而改善網路的組織管理和信息管理,提高其管理水平,促進其充分發揮經濟效益和社會效益。
參考文獻
1 徐久齡,許蓮蓮.網路計量學.情報科學,2002⑴
2 李長忠,李東洋,齊源.網路計量學的研究對象與方法.情報科學,2002⑴
3 龔立群,朱慶華.網路計量學的研究方法及套用.新世紀圖書館,2003⑹
4 吳華香,鐘少丹.網路計量學的套用分析.圖書情報工作,2003⑻
5 夏旭,李健康,葛馳.網路計量學研究:現狀、問題與發展.圖書館論壇,2001⑹
6 趙啟民.網路計量學研究的構建和發展方向.吉林師範大學學報(自然版),2003⑵
7 張曉雁.網路計量學初探.情報雜誌,2003⑶
8
邱均平.信息計量學(一),情報理論與實踐,2000⑴
(本文為福建省教育廳課題,編號:jb03101)