查準率(Precision)(精度)是衡量某一檢索系統的信號噪聲比的一種指標,即檢出的相關文獻與檢出的全部文獻的百分比。普遍表示為:查準率=(檢索出的相關信息量/檢索出的信息總量)x100%。
基本介紹
- 中文名:查準率
- 外文名:Precision
- 釋義:衡量某一檢索系統的信號噪聲比
- 關係:召回率
- 集合:正確答案
- 召回率:檢出的相關文獻與相關文獻百分比
定義,查全率,兩者關係,
定義
查準率的數學表達:Precision=#(Retrieved∩Relevant)╱#Retrieved.
Retrieved:待評測檢索系統處理查詢樣例返回結果集合。
Relevant:正確答案集合。
查全率
查全率(召回率),是衡量某一檢索系統從文獻集合中檢出相關文獻成功度的一項指標,即檢出的相關文獻與全部相關文獻的百分比。普遍表示為:查全率=(檢索出的相關信息量/系統中的相關信息總量)x100%
兩者關係
衡量某一類文獻檢索系統的信號噪聲比的一種指標。它的數值等於w/m,式中w是用戶鑑別檢出的m篇文獻時,認為實際對口徑的文獻篇數。這一指標最初是1956年由J.W.佩里、A.肯特等人提出的。F.W.蘭開斯特1979年在《情報檢索系統──特性、試驗與評價》(第二版)一書中將某一系統所擁有的文獻總篇數表述為a+b+c+d之和,並列出2×2表格。 上述的w篇文獻即為a ,m篇文獻即為a+b,這樣查準率即為a/(a+b),a值是經過一次檢索後,即可由用戶判定的,a+b即經過一次檢索所檢出的全部文獻。例如在某一次檢索過程中共檢出了50篇文獻,用戶判定其中有 10 篇文獻是相關的,則查準率即為10/50=20%。查準率主要取決於檢索語言的專指性和所擬定的檢索策略能否準確表達用戶真正的情報需求。若檢索策略擬訂得較寬泛,參與組配的檢索詞較少,主題詞的概念比用戶的情報需求寬泛,則查準率將降低,而查全率將增加,因為二者一般呈互逆相關關係。查準率標誌某一檢索系統運行過程中拒絕無關文獻、選出有關文獻的能力,同時也是用戶從檢出文獻中進一步篩選出相關文獻所需時間的一種間接測度。為達到相同查全率,高的查準率意味著用戶鑑別檢索結果時只需用較少時間,不過這種測度主要適用於評價情報工作人員代替用戶檢索的情況。