信息检索复习全

发布 2022-08-25 05:23:28 阅读 4287

科学信息检索与应用。

第一章绪论。

1.情报检索与科学研究关系。

2.个体研究阶段,世界上最早出现的手工检索工具:

答:2024年瑞士出版的《物理科学进展年报》

2024年德国创办的文摘杂志《药学总览》

3.社会化阶段,研制大型检索工具:

答:美国2024年创办了《工程索引》(ei)

美国2024年创办了《化学文摘》(ca)

美国2024年创办了《生物学文摘》(ba)

英国2024年创办了《科学文摘》(sa)

4.自动化阶段,产生新的检索理论:

答:2024年 taube,m 提出:单元词组配法。

2024年 citron,j 提出:轮排索引。

2024年 luhn,h 提出:定题服务(sdi)

二战期间…案例: 曼哈顿工程 - 阿波罗计划。

5.科技文献概念。

答:记录在载体上的科技知识,包括科技事实、数据、理论方法、构思和假设等。 (文献/科技文献)

6.文献信息源,按文献载体形式划分:

答:印刷型文献:指印刷术发明之后,以纸张为存储载体,通过油印、铅印、胶印、静电复印等手段,将文字固化在纸张上所形成的文献。

缩微型文献:又称为缩微复制品文献,它是以感光材料为载体,以印刷型文献为母本,采用光学摄影技术,将文献的体积浓缩而固化到载体上。

机读型文献:机读型文献的全称为计算机阅读型,是以磁性材料为存储载体,以穿孔、打字或光学字符识别装置为记录手段而形成的文献。

声像型文献:又称为视听型文献,它是以磁性材料或感光材料为载体,借助特定的机械设备直接记录声音信息和图像信息所形成的文献。

7.文献信息源,按文献的出版形式划分:

答:科技图书(science and technical book)

科学期刊(science and technical journal)

科技报告(science and technical report)

专利文献(patent document)

会议文献(conference *****)

学位**(degree thesis)

标准文献(standard literature)

**出版物(government document)

产品样本(product stylebook )

技术档案(technical files)

8. 文献信息源,按文献的产生、加工、用途划分为:

答:一次文献,又称原始文献。以本人的研究成果为基本素材创作而成的文献。

二次文献,将分散的一次文献进行选择、加工、整理之后所得到的产物,是为了便于管理和利用一次文献而编制的检索工具。

三次文献,利用二次文献查阅大量一次文献,并将其进行综合、分析、研究而编写出来的文献。

9.文献寿命缩短

半衰期:贝纳尔(bernal,提出半衰期:某学科现时尚在利用的全部文献中较新的一半,是在多长一段时间内(x年)发表的。经过x年,某学科领域其一半文献的利用价值已逐渐衰减。

例如:生物科学文献的半衰期是3年,也就是说,现时仍在利用的生物科学文献的50%,其出版年龄不超过3年。换句话说,上述生物学文献的半衰期(一半老化的时间)是3年。

表1. 各类科技文献使用寿命

平均使用寿命为5-6年

表2. 不同学科文献半衰期。

10.情报检索(information retrieval)是指将信息按一定的方式组织存储起来,并根据信息用户的需要找出相关信息的过程。

11.主题检索语言:

答:主题词:能表达文献的实质内容,经过规范化处理的名词术语。

如,中国《汉语主题词表》、《医学主题词表》、《农业、生物科学主题词表》…

关键词:能表达文献主要内容的词汇或术语,未经过规范化处理。

12.评价指标。

答:英国情报学家克莱弗登(cranfield)在分析用户基本要求的基础上,提出了6项系统性能的指标,它们是:收录范围、查全率、查准率、响应时间、用户负担和输出形式,其中查全率和查准率是两个最常用的重要指标。

查全率(recall ratio) :指检出的相关文献量(a)与检索系统中相关文献总量(a+c)的比率。

例如:某课题检出相关文献49篇,而该检索工具中与课题相关的文献总量有70篇,那么,此次检索的查全率为70%。

查准率(precision ratio):指检出的相关文献量(a)与检出的文献总量(a+b)的比率。

例如:某课题检出文献总量为60篇,经筛选只有30篇与课题相关,那么此次检索的查准率为50%。

13.效果评价。

答:表3. 各种因素对查全和查准率的影响:

本章思考题。

1. 试述情报检索与科学研究二者间的关系。(材料第一题)

2. 在个体研究阶段,最早出现的手工检索工具有哪些?(材料第二题)

3. 19世纪末-20世纪初,研制并产生了哪些大型检索工具?(材料第三题)

4. 二战以后,产生了哪些新的检索理论?(材料第四题)

第二章计算机检索方法与制定检索策略。

1.布尔逻辑算符检索法。

答:是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。

逻辑运算符有三种:与、或、非

逻辑与(and 或 *)是一种用于交叉概念和限定关系的组配。它可以缩小减缩范围,有利于提高查准率。

例如:insulin and diabetes

凡是用and的检索式,and两侧的检索词必须同时出现在同一条记录中,该记录才算命中。

逻辑或(or 或 +)是一种用于并列关系的组配。它可以扩大检索范围,防止漏检,有利于提高查全率。

例如:cancer or tumor

凡是用or的检索式,or两侧的检索词只要有一个在一条记录**现,该记录就算命中。

逻辑非(not 或 -)是一种排斥关系的组配。用来从原来的检索范围中排除不需要的概念,有利于提高查准率。

例如:solar energy not nuclear

凡是用not的检索式,not前面的检索词必须在记录**现而后面的检索词一定不能出现,该记录才算命中。

2.三个提示。

提示1:在使用“逻辑非”进行组配时特别注意,否则会出现漏检。如上例是查找有关太阳能并排除核能方面的文献,结果查到一篇有关一种替代核能燃料方面的文献。

提示 2:在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。复合逻辑检索式中,运算优先级别从高至低依次是not、and、with、or,可以使用括号改变运算次序。

如(a or b)and c ,先运算(a or b),再运算 and c 。

提示 3:在检索过程中,应根据课题的具体要求,选用不同的逻辑算符进行组配,通过改变检索项的逻辑组配关系,可扩大或缩小检索范围。

如,检索有关“汽轮机叶片制造”方面的文献。

a-汽轮机 b-叶片 c-制造。

检索式:a and b and c;a and b;b and c

3.位置算符检索法。

又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。跟and运算符类似,但比and运算符功能更具体。

例如:查找“细菌对染料破坏”方面的文献。

常用位置运算符有(w)(n)(s)(f)(1)(w)(词间位置算符,含义为with)

词序不能颠倒,两词之间不允许插入其它词,但允许有空格。

例如:economy(w)mathematics

4.截词(truncation)检索法。

截词有多种用途:

1)词尾截断可得到该单词所提及的所有词语(单数和复数)

(2)词间切断或通配符:可找到该单词的所有变化形式或不同拼法。

= 一个字符。

一个或多个字符。

例如: 检索单复数和不同拼法等词语。

注意:截词检索时,不可截的太短,否则会检出无关概念。如,com*

5.检索限定。

字段限定包括ti、ab、de、 au;时间范围限定py; 分类限定cc;语种限定la;文献类型dt…… 等。

字段限定也是调整检索策略的一种重要手段。多数检索系统对不指定字段的检索词通常在所有字段(all field)中进行检索。

如果想指定在文献的题目等特定字段中检索,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索的查准率。

例如:tea and breeding /ti

au = zhou,g z

6.布尔逻辑检索式编写。

(1)逻辑运算符使用方法。

布尔逻辑检索式是检索策略的逻辑表达式,其表达形式实际上是上述各步骤结果的综合体现,即使用合适的逻辑算符和位置算符,将各检索词进行组配,使之确切地表达课题的主题概念,符合检索的需求。

例1:查找分别单独论述微型汽车发动机和摩托车发动机的文献,并要求排除那些同时论述这二个主题的文献”。a-微型汽车 b-摩托车 c-发动机

检索式:(a and c or b and c)not(a and b and c)

a and c or b and c)not(a and b )

信息检索复习全

科学信息检索与应用。第一章绪论。1.情报检索与科学研究关系。2.个体研究阶段,世界上最早出现的手工检索工具 答 1821年瑞士出版的 物理科学进展年报 1830年德国创办的文摘杂志 药学总览 3.社会化阶段,研制大型检索工具 答 美国1884年创办了 工程索引 ei 美国1907年创办了 化学文摘 ...

信息检索复习

2009 10 18 10 39 33 分类 文献检索 字号订阅。上学期 信息检索与利用 试题。一 选择题。字段 jn de ti分别代表。a 50页103页104页。刊名字段 主题字段 标题字段。文摘号 文献类型 文摘字段。分类号 机构 公司。在信息检索技术中,算符and or not指的是哪一中...

信息检索复习

信息检索资料。填空题。1 文献的级次分为零次文献 一次文献 二次文献 三次文献。2 中图法 有五个基本部类,分别是马克思主义 列宁主义 思想 哲学 社会科学 自然科学和综合性图书,在此基础上又划分为 22 个大类。3 按内容可将计算机检索系统的数据库类型分为 文献书目型数据库 事实型数据库 数值型数...