信息检索复习

发布 2022-08-25 05:21:28 阅读 7043

信息检索第一讲。

一、基本概念。

1、信息:生物以及具有自动控制系统的机器,通过感觉器官和相应的设备与外界进行交换的一切内容。信息具有五个基本特种:普遍性、依附性、传递性、信息价值的不定、共享性。

2、知识:是人们对客观事物的认识和经验总和。

3、文献:是用文字、图形、符号、音频、**等技术手段记录人类知识的一种载体。

4、情报:是指运用一定的形式,传递给用户,并产生效益的知识或消息。具有:知识性、传递性、效益性。

5、信息资源。

广义上是指信息活动中各种要素的总称,既包含信息本身,也包括信息相关的人员、设备、技术和资金等因素;

狭义上是指各种载体和形式的信息的集合,包括文字、音像、印刷品、电子信息、数据库等。

文献是最主要的信息资源。

一、信息类型。

1、按照加工程度:

零次信息:草稿、笔记、会议记录等。

一次信息:期刊**、专利说明、会议**、科技报告、学位**。

二次信息:目录、索引、文摘、新书通报等。

三次信息:词典、名录、手册、年鉴、书目、评论、专著、教科书、**丛集、百科全书等。

2、按照出版形式以及载体:

图书。连续出版物:期刊、报纸、年度出版物等。

特种文献:科技报告、会议文献、**出版物、专利文献、标准文献、公司产品资料、学位**、档案资料等。

1)图书:isbn 国际标准书号。

例如:isbn978-7-302-20062-8

在参考文献列表里,图书著录格式如下。

著者。书名[m]. 版本。 出版地:出版者,出版时间。

多作者用逗号分开,超过3个者用“等”)

叶继元。信息检索导论。北京:高等教育出版社,1995.

2)期刊:是最重要的信息源。

国际标准刊号( issn )

期刊著录格式:

作者。 题名[j].刊物名称,年代,卷数(期数):页数

刘志强。我国农业生态环境可持续发展评价及对策[j].农业系统科学与综合研究,2001,17(3):24~26.

核心期刊:少数刊载某一学科大量高质量专业**的期刊。

三、我国信息系统体系结构。

图书馆系统(高校图书馆、公共图书馆、科学研究系统图书馆)、科技信息服务系统、档案系统、专利系统、标准系统。

图书馆系统主要服务方式有:

文献外借服务(如个人外借、预约借书、馆际互借等)、

文献阅览服务、

文献复**务、

信息咨询与检索服务、

用户教育与辅导、

信息研究服务、

网上信息服务(如网上公共目录查询、网上预约服务、网上咨询服务、利用电子邮件提供信息服务、文献传递服务)

信息检索第二讲。

1、信息检索的概念。

狭义的信息检索是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。

广义的检索包括信息的存储和检索两个过程。

2、信息检索的作用。

信息检索是获取知识的捷径

信息检索是科学研究的向导

信息检索是终身教育的基础。

3、信息检索的类型:文献检索、全文检索、数据检索、事实检索、多**检索、图像检索、超文本检索。

4、检索语言的作用。

组织文献信息的著手点。

检索文献信息的入口。

检索语言主要由文献特征构成。

1)描述文献的外表特征:题名、责任者、标准编号(isbn、issn、专利号等)、出版社、出版时间、参考文献、分类号。

2)描述文献内容特征:学科分类、主题、观点、见解、结论。

5、检索方法。

常规法和引文法。

常规法包括:顺查法、倒查法、时间抽样法。

引文法包括:追溯法和检索引文法。

6、检索途径:

一般来讲分为:主题途径、分类途径、著者途径和其他途径。

1)主题途径:

是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。

主题词就是表达主题概念的词汇。广义主题词包括关键词、主题词、标题词、叙词。

2)分类途径:

分类途径就是人们常说的分类号检索。这种检索是根据信息内容的学科分类来进行的。一般说来,可以提高查全率。

3)著者途径:

著者途径是指根据已知文献著者来查找文献的途径,它根据的是著者索引,包括个人著者索引和机关团体索引,排列规则是“姓+名”次序。

7、信息检索的程序。

是指根据课题要求,选择相应的信息检索工具及系统,采用适当的途径及技术,查找所需文献信息的过程。信息检索的程序一般可以分为:

1)分析研究课题

2)选择检索工具或数据库。

3)确定检索途径。

4)编制检索式。

5)实施检索。

6)原始文献的获取

8、计算机检索技术。

布尔逻辑算符组配检索。

逻辑“或”(和)

→扩大查找范围。

用符号“or”或“+”表示,其逻辑表达式为:

a or b 或 a+b

其意义为检索记录中凡含有检索词a或检索词b,或同时含有检索词a和b的,均为命中文献。

逻辑“与”→缩小查找范围。

用符号“and”或“*”表示,其逻辑表达式为:

a * b 或 a and b

其意义为检索记录中必须同时含有检索词a和b的文献,才算命中文献。

逻辑“非”

用符号“not”或“-”其逻辑表达式为:

a not b 或 a-b

其意义为:检索记录中含有检索词a,但不能。

含有检索词b的文献,才算命中文献。

注:a检出的相关文献量。

b检出的不相关文献量。

c未检出的相关文献量。

1. 查全率。

查全率(r )=100%

查全率是对所需信息被检出程度的信息量指标。

2. 查准率。

查准率(p )=100%

查准率是衡量拒绝非相关信息的指标。

9、影响检索效率的因素。

数据库质量(客观因素)

1)数据库搜集信息的数量与质量

2)对每条信息揭示的深度与广度,著录标引的质量(字段的数量,主题词的信息标引网罗度)

3)检索途径及检索字段的数量

检索策略(主观因素)

分析课题的准确度、检索工具或数据库选取是否恰当、检索词拟定是否合理、检索词逻辑关系表达是否准确。

信息检索第三讲。

1、定义。数据和事实检索是对数值、事实检索,提供原始信息,给出直接、确定性的答案。

数据检索:以特定的数值为检索对象。

事实检索:以特定的事实为检索对象。

2、百科全书。

是概要记述人类一切门类知识或某一门类全部知识的完备的工具书。它收集专门术语、重要名词、分列条目、加以详细的叙述和说明,提供定义、原理、方法、历史及现状、统计、书目等方面的资料。

常被誉为“没有围墙的大学”、“工具书之王” 。又称大全。

世界著名的百科全书是所谓abc百科全书。

a《美国百科全书》

b《不列颠百科全书》

c《科里尔百科全书》

网络百科全书:百科维基百科(人民的百科全书)

3、中国统计年鉴:是一部全面反映我国国民经济和社会发展的大型统计资料。

4、知识产权:工业产权、版权。

5、专利的三层含义:专利权、具有专利权的发明创造、专利文献。

专利权的三个属性:独占性、时间性、地域性。

专利的三种类型:发明、实用新型、外观设计。

我国专利法规定几种情况不授予专利:

1)科学发现,例如对自然现象、社会现象及其规律的发现等。

2)智力活动的规则和方法。

3)疾病的诊断和**方法。

4)动物和植物的品种。

5)用原子核变换方法获得的物质。

6)对于违反国家法律、公德和妨害公众利益的发明创造。

专利文献:常用的就是专利说明书。

专利检索系统:cnki专利文献数据库、国家知识产权局、专利信息网等。

6、标准文献的概念。

标准文献主要是指与技术标准、生产组织标准和管理标准相关的文献,也包括国家颁布的环境保**、森林法、消费品安全保障法、药典、**标准化管理机构的有关文件以及与标准化工作相关的其他文献。

标准检索工具:cnki标准全文数据库、中国质量网、中国标准服务网等。

7、科技报告检索工具:国家科技成果库(cnki)

美国**的四大科技报告:

pb报告:内容涉及自然科学和工程技术,近年来侧重于土木建筑、城市规划、环境污染等领域。

ad报告:内容涉及国防军事科学技术等领域

nasa报告:内容涉及航空、宇航相关学科等领域

doe报告:内容涉及能源等学科领域

8、会议文献:

常用工具:中国会议网、cnki中国重要会议**数据库。

信息检索第四讲。

1、internet含义:物理概念、人文环境、流通内容。

域名 com商业机构、edu教育机构、gov**机构。

url 统一资源定位器(**)

2、web2.0常见技术应用。

blog博客、wiki维基、sns社交网络、rss聚合(订阅)、tag标签。

3、网络信息资源特点:

4、搜索引擎。

搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

一个搜索引擎由搜索器、索引器、检索器和用户接口4个部分组成。

搜索引擎的工作原理,简单地说主要包括以下几个步骤:

1)网页信息搜索。

2)索引库的建立。

3)用户检索式的处理。

4)检索结果输出。

搜索引擎的分类。

按组织信息的方式划分。

目录式分类搜索引擎、全文搜索引擎、智能搜索引擎。

按搜索范围划分。

独立搜索引擎、元搜索引擎。

5、、谷歌常见产品谷歌的“手气不错”、“网页快照”

6、免费学术资源搜索。

定义:专门用于检索因特网上学术信息的搜索引擎,可以检索图书、期刊**、专利文献、标准文献、文档等方面的学术资源和学术站点。

常用的中文学术资源搜索引擎。

a、google中文学术搜索。

b、cnki知识搜索。

c、读秀学术搜索。

信息检索第五讲。

1、图书检索的两种方式。

1)文献线索的检索。

主要从著录外部特征入手,检索图书的详细信息或获取方式。

1)各类馆藏目录,如本馆馆藏目录、calis公共查询;

2)搜索引擎,如图书、谷歌图书;

3)网上书店,如卓越网、当当网、京东网。

2)获取原文的检索。

1)网上免费电子图书,如起点、盛大;

2)商业数据库,如超星、书生之家。

2、超星数字图书馆。

1)简介:它是目前世界最大的中文**数字图书馆,提供大量的电子图书资源提供阅读。

2)超星阅读器,特色功能。

1)书签、标注。

2)文字识别。

3)异地阅读。

4)资源的采集。

3、超星读秀。

读秀学术搜索是超星数字图书馆研发的新产品,由海量中文图书资源组成的庞大知识库系统,其以270万种中文图书资源为基础,为用户提供深入图书内容的书目和全文检索,部分文献的全文试读,以及通过email获取文献资源,是一个真正意义上的知识搜索及文献服务平台。

信息检索复习

2009 10 18 10 39 33 分类 文献检索 字号订阅。上学期 信息检索与利用 试题。一 选择题。字段 jn de ti分别代表。a 50页103页104页。刊名字段 主题字段 标题字段。文摘号 文献类型 文摘字段。分类号 机构 公司。在信息检索技术中,算符and or not指的是哪一中...

信息检索复习

信息检索资料。填空题。1 文献的级次分为零次文献 一次文献 二次文献 三次文献。2 中图法 有五个基本部类,分别是马克思主义 列宁主义 思想 哲学 社会科学 自然科学和综合性图书,在此基础上又划分为 22 个大类。3 按内容可将计算机检索系统的数据库类型分为 文献书目型数据库 事实型数据库 数值型数...

信息检索复习

1.请说明一次文献 二次文献和三次文献的特点和功用。2.请说明题录目录文摘的特点以及区别。3.布拉德伏特文献文献分散定律和期刊影响因子的概念。4.请阐述信息 知识 情报的概念,并分析它们三者之间的关系。5.请对搜索引擎的分类及检索结果排序方法举例说明。6.选择一个你比较熟悉的网络搜索引擎,以为题,根...