modern information retrieval technology
2015级应用电子技术专业。
柳州铁道职业技术学院。
应用电子技术教研室编制。
2024年2月。
目录。第一讲信息检索绪论 1
第二讲信息检索的基础知识 2
第三讲常用中英文数据库检索 5
第四讲重庆维普中文科技期刊数据库 6
第五讲英文数据库 7
第六讲搜索引擎 9
第七讲**参考工具 13
第八讲多**信息检索 16
第九讲图书馆信息资源利用 19
第十讲专利检索方法与信息分析利用 21
现代信息检索技术》简明讲义。
现代信息检索技术》是培养学生的情报意识,掌握用手工方式和计算机方式从相关的文献中获取知识和情报的一门科学方法课,是提高学生自学能力和独立研究问题能力的工具课。本课程使学生了解各自专业及相关专业文献的基本知识,学会常用手工检索工具、计算机检索工具的使用方法,懂得如何获得与利用文献情报,增强自学能力和研究能力。
第一讲信息检索绪论。
一、掌握信息检索有什么好处?
专业知识**、让生活更方便、防止上当、提高个人素质……等等……
二、开设课程的目的。
1、查找信息资源 2、利用信息资源 3、提升信息素质。
三、意义和作用。
1、掌握有效信息,避免重复劳动,有助科研工作。
2、提高信息素质,培养创新能力,促进创新人才的培养。
3、提供科学方法 ,协助管理决策者做出正确的决策
四、信息资源概述。
1、信息概论。
1)信息是所有事物的存在方式和运动状态的反映,是频率变化的一种感知。(或者说信息是指消息接受者来说预先不知道的报道)
信息是事物的存在方式和运动状态的反映
信息借助于一定的物质载体传输和存储
2)信息的特性。
传递性。所谓信息的传递过程,是指客观存在的信息通过人的智慧被感知以后将其转换成语言、文字、图形、**等可接受的形式进行传输。
信息的获取必须依赖于信息的传递。
时效性。信息的时效性是指如果信息不能及时反映事物存在的方式和运动状态,那么这一信息就会失去效用。
共享性。信息的共享性是指同一内容的信息可以在同一时间被两个或两个以上的用户使用。
3)信息的分类:可以从不同的角度来进行分类。
分类目的:使信息在分类后呈现出各自的特征,从而有利于人们有针对性地研究和利用信息。
按信息**:自然信息、社会信息和知识信息。
按信息的应用分:工业信息、农业信息、科技信息、文化信息等。
2、信息资源概述。
1)信息资源的概念。
信息通过文字、符号、声音或图像等形式存储在各种载体上集合在一起就成了信息资源。
信息资源是可利用信息的集合。
2)信息资源的类型。
体载信息资源:体载信息资源指以人体为载体并能为他人识别的信息资源。
实物信息资源:是指以实物为载体的信息资源。
文献信息资源:文献信息资源是以文献为载体的信息资源。
按文献信息资源载体形式划分。
1) 印刷型(printed form):以纸张为载体。
2) 缩微型(microform):以感光材料为载体。
3) 声像型(audio-visual form):以声像记录材料为载体。
4) 电子型(machine readable form):以计算机信息存储设备为载体
按信息资源出版类型划分。
**出版物、科技报告、学位**、报纸、期刊和图书等。
按信息资源内容加工层次划分。
一次文献、二次文献、三次文献 、零次文献。
网络信息资源:网络信息资源是指通过计算机,通信技术,多**技术相互融合而形成的网络上可查找到的资源。
信息表现形式:电子出版物信息资源和非电子出版物信息资源。
信息的**形式:文本信息资源、超文本信息资源、多**信息资源和超**信息资源。
网络信息资源加工层次:网络资源指南和搜索引擎、联机馆藏目录、数据库信息资源、电子出版物、网上参考工具和其他动态信息。
用户采用的不同的网络协议。
基于超文本传输协议(http)的信息资源、基于文本传输协议(ftp)的信息资源、
基于远程登录(telnet)的信息资源、新闻组(usenet/newsgroups)资源。
电子邮件(e-mail)信息资源、 此外,还有gopher资源、wais资源等。
五、信息素质。
信息有各种**和形式,如打印文本、电视、**、图书馆数据库、**等等。一个具备 “信息素养” 的人,能够知道自己为什么、什么时间和如何使用这些信息**,并且对信息源提供的信息质量有敏锐的洞察力。你不可能一夜之间就具备信息素养。
象培养阅读,写作能力一样,你需要不断地从课题检索过程中获得经验,在寻找,选择,评价你遇到的信息和思想中,你的信息素养逐渐提高了。
1)概念。具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。信息素质既是一种能力素质,更是一种基础素质,主要包括信息意识、信息能力、信息道德三方面素养。
2)评价标准。
确定所需信息的范围。
有效地获取所需的信息。
鉴别信息及其**。
将检出的信息融入自己的知识基础。
有效地利用信息去完成一个具体的任务。
了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息。
第二讲信息检索的基础知识。
信息资源检索:找什么?怎么找?怎么**?
一、信息资源检索的概念与类型
1、信息资源检索的概念
从信息资源集合中找出所需信息内容的过程。
要求:高效、快速、准确、正确、全面、新颖。
2、信息资源检索的类型
1) 按检索内容划分:文献信息检索、数据信息检索和事实信息检索。
2)按信息资源检索技术划分:全文文本检索、超文本检索、多**检索和网络信息检索 。
3、信息资源检索系统的概念。
用于报道、存贮与查找信息的工具。
4、信息资源检索系统的类型。
按著录方式划分:目录、题录、文摘、参考工具、全文数据库和搜索引擎
按存储介质划分:手工检索系统、计算机检索系统、穿孔卡片系统、缩微品检索系统。
按检索手段划分:脱机检索系统、联机检索系统、光盘检索系统、网络检索系统。
二、信息资源检索语言。
1、概念。检索语言是信息资源存储和检索的共同语言。其实质是从自然语言中精选出来并加以规范化的一套词汇符号,是概括信息资源内容特征或外在特征及相互关系的概念标识体系。
2、检索语言的种类。
按规范化程度划分:人工语言、自然语言。
按文献信息资源的特征划分
表述文献外表特征的语言:题名(书名、刊名、篇名)、责任者(个人、机构名称)、号码(如专利号、标准号、报告号、isbn号、issn号等)引文。
表述文献内容特征的语言:分类法和主题法。
分类语言:分类语言也称分类法,它是用分类号表达主题概念,依据知识分类将各主题概念按学科性质进行分类和系统排列成类目体系的标引语言。
体系分类法:直接体现知识分类的等级概念。分成5个基本部类,基本部类是对人类全部知识作最概括的划分。
由基本部类划分出22个基本大类,基本大类是较为概括的大学科领域的划分,用由a到z的22个字母表示(其中l、m、w、y四个字母未使用)。
主题语言:主题语言是采用表达某一事物或概念的名词术语来标引、存储、检索的一种检索语言。
关键词语言:以关键词作为文献内容标识和检索入口的一种主题语言。关键词是直接从文献中抽取的,未经规范化处理的自由词。
三、信息资源检索技术。
1、检索策略与检索步骤
1)检索策略。
广义:为实现检索目标而制定的全盘计划或方案。
狭义:检索式
2)检索步骤。
课题分析。
选择检索系统(数据库)
选择检索点和检索词。
制定检索式。
由检索点、检索词、检索算符组成)例:ab=金融网络 and au=张杰。
调整检索策略。
获取原文。
2、检索方式。
1)浏览方式。
分类浏览:按学科类别浏览。可点击“分类导航”或“分类表”中的任何一个类别,接着显示所点击类别的下属子类,如此类推。
字顺浏览:按检索词首字母为序,提供相应检索字段的浏览。如按出版物名称字顺、著者姓名字顺等。
2)查询方式
初级检索:也称快速检索、基本检索。利用初级检索系统能进行快速方便的查询,适用于不熟悉多条件组合查询或sql语句查询的用户。
高级检索:也称扩展检索。高级检索可进行多个条件的组合检索,即多个字段之间有一定逻辑关系(and,or, not)的检索。
专家检索:也称专业检索。检索式中可同时使用检索词、逻辑算符(如and,or,not,and not)、字段标识符、邻近算符(如near,adj等)、截词符等多种算符,创建更复杂的检索式。
二次检索:在结果中检索又称为二次检索,当检索结果太多,想从中精选出一部分时,可使用二次检索。
3)检索点与检索词。
1) 检索点: 检索点 = 检索途径 ≈ 关键词。
检索点(access point)是检索的出发点,以前常用“检索途径”(approach)这一术语。在计算机检索中,所有类型的检索点形式上都表现为“关键词”,但在数据库检索中,检索点和关键词的含义还是有所区别的。
文献信息特征是多方面的,用于文献检索的检索点很多,反映文献信息内容特征的有:分类检索和主题检索;反映文献外部特征的有:作者检索、名称检索和号码检索等。
文献内容特征的检索点: 分类检索和主题检索。
文献外部特征的检索点:作者检索、名称检索和号码检索。
2)检索词
检索词是表达信息需求的基本单元,也是与系统中有关数据库进行匹配运算的基本单元。检索词选择得当与否,会直接影响检索效果。
检索词可分为两类,一类是表示主题概念的名词术语(如叙词和关键词),或者是个人或机构的名称(如作者姓名),另一类是某些特殊的符号(如分类号、**等)。
4)检索算符
检索算符也称组配符,用于连接检索点和检索词,表达检索词之间的关系,与检索点、检索词共同构成检索式,表达用户的检索需求。
现代信息检索技术
现代信息检索技术 模拟题 一 填空。1.信息按出版类型分为 科技图书 科技期刊 科技报告 会议文献 专利文献 学位 标准文献 出版物 产品样本 技术档案 报纸 新闻稿 统计资料等。也可以直接回答 普通文献和特种文献 2.定期 多于一天 或不定期出版的有固定名称的连续出版物是 科技期刊 3.按文献的相...
现代信息检索技术
一 填空。1.信息按出版类型分为 2.定期 多于一天 或不定期出版的有固定名称的连续出版物是。3.按文献的相对利用率来划分,可以把文献分为。4.检索语言可分为两大类。5.检索国外科技会议 的主要检索工具为。6.在万方数据资源中,检索期刊文献时主要使用。7.文件的后缀名是文件类型是。8.我国专利法保护...
现代信息检索技术
现代信息检索技术 模拟题 一 填空。1.信息按出版类型分为 2.试举三个中文期刊全文数据库。3.按文献的相对利用率来划分,可以把文献分为。4.检索语言可分为两大类。5.请在英文数据库后面写上中文数据库的名称。eisciistp6.当检索关键词具有多个同义词和近义词时,容易造成使得较低。7.文件的后缀...