信息检索2019真题

发布 2022-08-25 02:14:28 阅读 9587

2023年“信息检索”考试真题及答案。

一、ir与数据库检索的区别;

1、数据源不同。

数据库:结构化数据:包含了各种可以命名的部分,并按一定的结构对内容进行组织

i r:结构化

半结构化:html,xml标记

非结构化:自然语言表达

2、描述模型不同。

数据库:层次模型:双亲子女关系(pcr)

网状模型:系的概念,用系表示数据间的联系

关系模型:以集合论中的关系概念发展起来

i r:布尔模型,向量模型,概率模型,模糊模型

3、检索匹配不同

数据库:精确匹配,sql查询

i r:非精确匹配

准确率(precision)= 返回的与查询相关的文档数 / 返回的文档总数

召回率(recall)= 返回的与查询相关的文档数 / 所有与查询相关。

二、十大信息源;

信息源定义:是指人们在进行科研及技术工作时使用频率比较高的十种情报**的总称。

1. 科技图书:是对某专门知识或某学科进行系统的论述或概括的一种情报**。其主要特征是内容比较成熟,但相对比较陈旧。合法出版的图书均有版权页。

2. 科技期刊:又称连续性出版物(serials),是一种定期或不定期连续出版的文献载体,它一般有同样的名称,按一定时间编定卷号,每一卷又分若干期。

1)期刊是人们获取信息的最重要**,在科学家和专家们所利用的全科技信息中,由期刊提供的占70%左右。

2)电子期刊在目前网络时代中正在崛起,其形式也有多种,包括印刷期刊的数字化、印刷期刊的网络版、网络期刊(开放访问期刊)

3. 科技报告:报道(记录)研究和开发调查工作的成果或进展情况的一种文献类型,一般都编有号码,供识别报告本身及其发行机构 ,报告是一种典型的机关团体出版物。

1) 科技报告的流通范围有绝密、秘密、保密、非密限制发行、非密、解密等。

2)由于科技报告是非正式出版的,获取比较困难。

3)我国每年发表科技报告5万余篇,中国科技信息研究所是我国科技报告的收藏单位。

4. 会议文献:是指学术会议文献,它往往反映出科学技术的发展趋势,其特点是与最新成果的间隔时间短,但其内容与期刊相比可能不太成熟。

会议类型大致可分为国际会议、全国性会议及地区会议等。会议和会议文献常用的主要名称有conference(大会)、meeting(小型会议)、symposium(讨论会)、proceeding(会议录)、*****(单篇**)、transaction(汇报)等。

5. 专利文献:在实行专利制度的国家,凡是本国或外国的个人和企业有了创造发明,都可以根据专利法的规定,向本国或外国专利局提出申请,经审查合格,批准授予在一定年限内享有创造发明成果的权利,并在法律上受到保护,这样一种受到法律保护的技术专有权利叫做专利。

1) 广义的专利文献是指所有与专利制度有关的文件, 包括专利申请书、专利说明书、专利分类、专利公报、专利文摘、专利证书等; 狭义的专利文献仅指专利说明书。

2)根据专利的技术水平和应用情况,专利类型有invention(发明)、utility patent(实用新型)和design patent(外观设计)等。

6. 标准文献:经过公认权威当局批准的标准化工作成果,可以采用文件形式或规定基本单位(物理常数)这两种形式固定下来、以文件形式出现的标准化工作成果,就是标准文献。

1)标准按使用范围可分为国际标准、区域标准、国家标准、地方标准、行业标准和专业标准等

2)标准一般过若干时间就要进行修订, 新的标准不断地替代旧的标准。因此,查阅时应以最新标准为准。

7. 学位**:是高校研究生、毕业生为获得学位进行科学研究而写出的学术性**。按学位不同可分为学士**、硕士**和博士**。

硕士和博士**具有一定的学术性、独创性、系统性和完整性, 具有重要的参考价值。学位**一般不公开发行, 多数收藏在授予学位的大学图书馆、档案馆或研究机构的文献信息中心。

8. 产品资料:一般是指产品样本说明书,是厂商或**机构为宣传和推销其产品而印发的免费赠给消费者的资料。

如产品目录、产品样本、产品说明书、产品总览、产品手册等。如今,许多厂商已经开始利用互联网发布产品信息,网上可以找到不少产品资料。

9. 技术档案:技术档案是在生产或科研活动中形成的,有具体工程和研究对象的技术文件的总称, 包括任务书、协议书、技术经济指标、研究计划、方案、试验设计实验记录调查材料、总结报告等所有应入档的资料。

技术档案有一定的保密性, 一般在内部控制使用。

10. 报纸:报纸以及广播、电视等大众传媒传递信息快, 信息量大, 现实感强, 传播面广, 具有群众性和通俗性, 是重要的社会**工具和信息源。

一些专门刊登科技类文献的报纸对了解当前的学科前沿和水平以及科学新闻很有益处。

三、科技文献等级结构和信息检索的类型;

科技文献等级结构:

1、 零次文献:是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。零次文献在原始文献的保存、原始数据的核对、原始构思的核定 (权利人)等方面有着重要的作用,其特点是信息**直接真实, 内容新颖。

2、一次文献:是指作者以本人的研究成果为基本素材而创作或撰写的文献,如阅读性图书、期刊**、科技报告、专利文献、会议文献、学位**、技术档案等都是一次文献。

3、二次文献:是指文献工作者对分散的无组织的一次文献进行搜集、提炼、浓缩、加工、整理,并按一定的科学方法组织编排、编辑出版的文献,是为了更有效地管理和利用一次文献而编辑的工具性文献。如各种目录、题录、文摘及机读型书目数据库、网上检索引擎等都属于二次文献。

4、 三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析、研究、对比、综合、评述、概括而撰写的文献,如综述、述评、年度进展报告、百科全书、手册、年鉴、辞典等。其特点是文字精炼、叙述简明扼要,具有系统性、综合性、知识性和工具性等特点。

信息检索的类型:

1、按检索对象划分6类:

文献检索(document retrieval),数据检索(data retrieval),事实检索(fact retrieval),全文检索(full text retrieval),图像检索(image retrieval),超文本检索(hyper text retrieval)

2、按信息检索手段划分2类:手工信息检索,计算机信息检索

3、按检索系统的工作方式划分4类:

脱机检索(off-line retrieval),联机检索(on-line retrieval),光盘检索(cd-rom retrieval),

特网检索(internet retrieval)

4、按检索工具类型划分6类:

目录检索(catalog searching),题录检索(title searching),文摘检索(abstract searching),

索引检索(index searching),全文检索(full text searching), 参考工具检索(fact and data searching)

四、信息检索的方法和检索效果的评价指标;信息检索的方法:

1、工具法

概念:利用各类检索工具直接查找信息的方法

类型:顺查法、倒查法、抽查法

2、引文法

概念:利用文献后面的参考文献查找信息的方法

特点:所检文献专指度较高、信息越来越旧、容易误导;在检索工具短缺时采用此法

3、循环法

概念:工具法和引文法交替使用的检索方法

特点:优势互补

检索效果的评价指标:

查全率(recall factor), 查准率(precision factor), 漏检率(omission factor) 误检率(noise factor)

查全率 r= a/(a+c) x 100% 查准率 p= a/(a+b) x 100%

漏检率 o= c/(a+c) x 100% 误检率 n= b/(a+b) x 100%

其中:a=检出的相关信息量, b=检出的非相关信息量, c=未检出的相关信息量, a+b=检出的信息总量, a+c=系统相关信息总量。

五、我校常用的数字图书馆电子资源检索。ei,sci,istp,图书,中国期刊网,万方,博硕**库等,1、ei数据库介绍

1)engineering index 简称ei,创刊于2023年,由美国工程信息公司编辑出版。

2)是目前世界上反映工程技术领域文献最权威、最主要的数据库,包含选自5,000多种工程类期刊、会议**集和技术报告的超过7,000,000篇**的参考文献和摘要被誉为国际著名四大检索系统之一。

2、sci

1) sci(《科学引文索引》,英文全称为science citation index)是美国科学情报研究所(institute for scientific information,简称isi.

2) **:出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上web版数据库。

3)sci收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种。isi通过它严格的选刊标准和评估程序挑选刊源,而且每年略有增减,从而做到sci收录的文献能全面覆盖全世界最重要和最有影响力的研究成果。

3、istp

美国thomson scientific公司基于isi web of knowledge检索平台将istp(科学技术会议录索引)和isshp(社会科学及人文科学会议录索引)两大会议录索引集成为isi proceedings,提供会议**的文摘索引信息,index to scientific & technical proceedings (1998-).

4、中国期刊网

1)中国知识资源总库是中国知识基础设施(china national knowledge infrastructure,简称cnki)工程的重点项目。

信息检索题

15.d 属于文献的外表特征。错误正确答案 a a.题名。b.主题词。c.关键词。d.分类号。数据库检索结果的输出包括 a 错误正确答案 c a.部分数据输出和全文数据输出。b.文档输出和全文数据输出。c.全文数据输出和题录导出。d.详细数据输出和简单数据输出。22.揭示节点文献研究工作的继续 应用...

2019信息检索上机题

姓名 雷波学号 109202010211系 机械系班级 09机本班。1 在中国知识基础设施工程 cnki 系列资源库的中国期刊全文数据库中检索篇名为 聚合硫酸铁的制备 发表在 四川师范大学学报 上的 6 1 给出检索策略。检索词 篇名 聚合硫酸铁的制备,刊名 四川师范大学学报,时间 1997 201...

2019“信息检索”实践题

信息检索 上机实践题。一 利用搜索引擎的高级搜索 在福大 内查找有关硕士学位 的相关规定。记下你认为最有用的两条。操作提示 高级搜索中的站内搜索功能 检索策略 检索结果 其中两条的网页标题与url 二 查找有关介绍 endnote文献管理软件 使用的课件,查看其中一条结果,简要说明endnote的主...