網路連結分析法

Mc Kiernan於1996年首先提出了sitation這一新術語,用以研究網頁之間的引用關係。Roussea認為對網頁連結關係的研究與對發表文章的引文研究相似,但又不盡相同。他對網址的分布模式和進入網頁的連結作了分析,發現在他所研究的343個網址中最高層域名服從洛特卡分布,而且對這些網址的引用也符合洛特卡分布,自引比例約為30 % 。

基本介紹

  • 中文名:網路連結分析法
  • 外文名:sitation
  • 提出者:Mc Kiernan
  • 提出時間:1996年
解釋,網路影響因子,Ingwersen結論,相關名詞,WIF,存在的問題,本質,

解釋

目前網路連結分析法的開展,都或多或少跟網路影響因子的測定聯繫著。如邱均平教授在《中國大學網站連結分析及網路影響因子探討》這篇文章中所得出的關於現階段中國大學影響力這方面的結論,就是在收集了相應指標數據的基礎上,運用網路影響因子對國內各主要大學(廣東管理科學研究院2002年最新排名前100名的大學)網站的網路影響因子和各大學排名之間的關係進行了研究。楊濤在《網路信息計量學實證研究:對國內20個大學網站的分析》這篇文章中也套用了相類似的方法進行網路連結分析,並得出了一些結論。除這兩位學者之外,還有其他一些學者就此領域作了大量的研究,如段宇鋒博士在其博士論文中提及的網站連結數量特徵(網站連結總數、指向內部的連結數、指向外部的連結數、被連結網站數)、網站連結分布特徵(連結密度、網頁平均連結數)和網站影響力指標(網站被連結次數、網站影響因子、擴散係數),這些均可以從不同的側面來說明網路連結分析法。

網路影響因子

(Web impact factor)是Ingwersen受了期刊影響因子的概念影響後於1998年提出的用於評價網站在網路上影響力的一個指標。網路影響因子是Ingwersen在1998年所發表的一篇題為《關於網路影響因子的計算》(The calculation of web impact factors)的文章中提出的,在文章中,Ingwersen對計算網路影響因子的可行性和可靠性作了研究,同時他還給出了網路影響因子的定義:假設某一時刻連結到網路上某一特定網站或區域的網頁數為a,而這一網站或區域本身所包含的網頁數為b,那么其網路影響因子的數值可以表示為WIF= a/b。
這裡需要引起注意的是,在定義中所提到的網頁數目之和並不是指連結次數的和,而是所連結的頁數目之和。
通過對7個國家(挪威、英國、法國、丹麥瑞典、芬蘭和日本)網址和4個主要域名(gov,org,co m,edu)的研究,

Ingwersen結論

1、由於用作搜尋引擎的Alta Vista只能統計連結到某個網頁的網頁數目而不是連結的次數,因此自連結不會影響網路影響因子的結果。4個主要域名的自連結Web-IF值平均為0.55,“com”的自連結Web-IF值為0.59,平均來自外部的連結頁的Web-IF為0.39
2、對於非主要域名的個人網址,其Web-IF的可信度要小得多。在作Web-IF計算時可以利用計算結果發生的變化作為評價網路引擎性能的一個測度。
對於第2個結論,Smith和Thelwall也分別作了研究,但遺憾的是他們幾人的研究使用的均是不穩定版的Alta Vista,因而,他們均對引擎的覆蓋範圍和檢索性能產生了懷疑。Thelwall認為,現存的網路影響因子的概念在實際套用中還只是一個相對粗淺的提法,因而所得出的結論也存在很多問題。由於Thelwall對網路影響因子也頗有研究,故他也有自己的定義。他認為,網路影響因子的大小是連結到某網站或特定區域的網頁數與該網站或區域的大小之比。該網站或區域的大小並不一定局限於該網站的網頁數,也可以用其它指標來衡量,如對學術機構的網站進行研究時也可以是該機構的研究人員數、該機構的研究經費或全日制學生數等等。
比較這兩位學者的觀點,在這兩種提法中,Ingwersen的提法要容易理解一些,但Thelwall的提法則嚴謹一些,它還考慮到了網路連結的特殊性。為了研究易於進行,我們可提倡Ingwersen使用的研究方法,他使用了Alta Vista搜尋引擎中的指令來測量連結網頁的數目。

相關名詞

Link:指連結到一個Web空間的網頁。例如“Link :*.nz ”指到紐西蘭域的連結,星號 “*”確指一帶有到nz域的連結的網頁被找到,而不是帶有nz檔案名稱的網頁連結。在Alta Vista幫助頁面里沒有註明星號的使用,但是搜尋到的文獻樣本表明“Link :*.nz”這種格式給連結到頂級域名的網頁數做了最好的估計。
Domain:指在頂級域名里的網頁。例如“Domain:au”指那些在澳大利亞範圍內的網頁。
Host:指在子域的網頁,例如“ 我們可使用Alta Vista去計算網路影響因子(WIF),Alta Vista提供布爾邏輯操作,這些操作使複雜的搜尋被執行。以New Zealand (紐西蘭)Web空間為例,我們可進行如下操作:
D Domain : * .nz 這是對此空間裡整個網頁數的估計。
L Link :* .nz 這是到空間裡網頁的所有連結。
L1 Link : *.nz/ and Domain : nz或Domain : nz and link : *.nz/ 這是自我連結數目。
L2 Link : *.nz /and not Link : nz and或Link:*.nz and not( domain: nz and link:.nz)或Link: .nz and not (link : .nz/ and domain:nz)這是指外部連結數目。

WIF

這樣我們可以計算出Web空間三個WIF:
 自我連結Web影響因子,測量所測Web空間自身頁面之間的連結,其值為L1/D。
 外部Web影響因子,測量外部連結到所測Web空間的連結,其值為L2/D。
 整體Web影響因子,測量到Web空間的所有連結,其值為L/D。
外部WIF是Web空間以外站點連結到Web空間內站點的程度,外部WIF是Web空間的影響的最好反映,整個WIF的趨勢似乎緊隨外部WIF的趨勢。事實上,域裡網頁數與它的外部影響因子一般成反比關係。
由於WIF是測量每個頁面平均連結數,它們既受連結程度的影響,又受Web空間頁面數目的影響。在研究的某一個域裡,頁面數越多,外部WIF越小,有很少頁面的域有很大的外部WIF。因此應該謹慎對待某一個域外部WIF,外部WIF僅僅用於比較具有相似特徵的域。

存在的問題

但是連結分析法仍然存在很多問題。隨著研究的深入,人們越來越發現文獻之間的引用與網路信息之間的連結存在著顯著的差異。譬如,Stephen P.Harter和Charlotte E.Ford的研究發現,在指向電子期刊的網路連結中,有近半數是結構性自我連結,對於評價文獻的學術價值和研究學術交流行為沒有意義;具有指向電子期刊的連結的網頁,只有不到8%的網頁是學術性的;Thelwall通過對英國大學網站中被連結次數最多的100個網頁進行分析,其結果也表明網頁被連結次數並不能反映其學術價值。這使得研究者們開始重新反思網路連結分析研究領域最基本的問題

本質

目前已經達成的共識是網路連結與引文在本質上完全不同,雖然引文分析對我們開展網路連結研究具有一定的啟發作用,但在借鑑時應當充分考慮到兩者之間所存在的差異,對運用該方法取得的結果應進行相應的處理。
有些學者指出,通過區分不同類型的連結,給予不同的權值,嚴格限定其使用範圍和改進搜尋引擎的性能或研製專業連結分析的工具等方法,可以改進連結分析法的效果和排名。

相關詞條

熱門詞條

聯絡我們