查全率

浏览

衡量某一情报检索系统从特定文献集合中检出相关文献成功度的一项指标。它的数值等于 w/x,式中 w为用户鉴别检出的 m篇文献时,认为实际对口径的文献篇数,x 为特定检索系统中所包括的全部 n篇文献中实际与某一课题相关的文献篇数。这一指标最初是由J.W.佩里与A.肯特等人于1956年提出的。F.W.兰开斯特于1979年在《情报检索系统──特性、试验与评价》一书(第二版)中将上述n篇文献表达为a+b+c+d之和,并采用下列2×2表。

图

上述m篇文献应为a+b,w篇文献应为a,x 篇文献应为a+c。查全率可表述为a/(a+c),式中a 值经过一次检索即可判定,c值一般可用下述4种方法确定:

(1)若n 值不大,逐篇鉴别各篇文献,即可确定c值。

(2)若n值很大,可对未检出文献随机抽样,如抽样为1/100,其中有r篇文献是相关的,则估计c=100r。

(3)由有经验的用户去鉴别检出的文献,若他认为这次检出了2/3 的全部相关文献,则c=1-2/3=1/3。

(4)通过不同途径去检索同一课题的文献,把各次检出的文献加在一起,剔除重复,形成一份较完整的相关文献清单,以此对比每次检出的相关文献,即可知道相应的c值。有了a值与c 值,代入公式a/ (a+c),即可求出查全率。一般来说,检索工具的标引深度越大,查全率也就越高。标引过程的网罗性越好,查全率也就越高。C.W.克莱弗登1963年通过试验揭示查全率与查准率一般呈互逆相关关系,即提高查全率往往要降低查准率,反之亦然。1982、1983年中国已有人用概率论与微积分证明了这一经验定律,并对查全率、查准率相关矩阵边线与隅角的物理意义作出了进一步的科学解释。