第一章。
信息检索是一门关于如何查询,获取文献资料和信息的工具性课程。是培养我们独立学习能力的一门科学方法课程。
信息检索由两部分组成: ①加工整理,使之能够被利用; ②利用。
信息:是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性。
信息分为自然信息和社会信息。
知识:知识是人类的主观世界对客观世界的概括和如实的反映,是被人们理解和认识并经过大脑重新组织的信息。知识**于信息,是信息的一部分。
情报:为了解决一个特定问题所要的知识,是被激活、被活化的知识,具有及时性和针对性。情报**于知识,是一种活化的信息和知识。
文献:是记录有知识的一切载体。
包含3个要素:
(1)记录的具体内容;
(2)记录的表现形式,如文字、图像、声频、**等;
(3)记录的物质载体,如纸张、光盘、磁盘等。
按载体形式分为:p4
印刷型缩微型视听型电子型
按文献出版的类型分为:p5
图书期刊会议文献学位**专利文献科技报告。
按信息加工的程度分为:
一次文献二次文献三次文献。
信息系统的构成 1.硬件2.软件 3.数据。
数据库:存储在一起的相关数据的集合。
信息检索系统:为满足用户的信息需求,运用特定的信息收集技术,将经过加工的信息存储起来,并提供检索服务功能的一种相对独立的服务实体。
信息检索系统一般按照它的发展历史和决策问题也可分为:数据处理系统,管理信息系统,决策支持系统。
一个完整的信息检索系统,通常由信息源、信息组织管理、用户接口和提问处理等几个有机部分组成。
计算机检索是建立在信息收集和信息存储的基础之上的。信息的存储标识与检索标识相匹配是检索成功的前提。
数据库由文档构成,文档由记录构成,记录由字段构成。
题名、著者、文献**三个字段构成题录。题录是检索结果显示和文献后面所列参考文献的常用格式,也是获取原文所需要的基本信息。
检索语言是描述信息内容及外表特征和表达信息检索提问的一种专用语言,是信息存储与信息检索时共同使用的约定语言,又称索引语言、标引语言等。
检索语言的基本功能就是有效组织文献信息,使杂乱无章的信息有序化,使相同学科门类或相同主题内容、同一著者的信息聚集在一起,并将信息按不同的特征排列成适合检索的信息系统,以保证检索能够高效、准确的顺利实施。
信息检索语言一般按其所表达的信息特征进行划分,可分为外表特征检索语言和内容特征检索语言两大类。
将信息的外部特征(文章的题名、著者、刊名、序号等)作为文献信息标引和检索途径的检索语言。
1)题名语言(2)著者语言(3)序号语言:以文献特有的顺序号为标识的检索语言,如专利号、技术标准号、化学文摘号等。
将信息的内部特征作为文献信息标引和检索途径的检索语言。主要指信息所属学科或专业、信息的主要内容、研究方法等,分为分类语言、主题语言、**语言等。
分类语言:用分类号和类目名称来表达概念,并按学科性质和逻辑层次结构进行分类和系统排列,是一种直接体现知识分类的检索语言。
分类法是一种直接体现知识分类的等级制概念标识系统。其主要特点是按学科、专业集中文献 ,从知识分类的角度揭示不同文献在内容上的区别和联系。
分类法的类目用一种自然顺序的标记符号来代表,这就是分类号。分类号代表一个类目,也在一定程度上表达各类之间隶属、并列关系。
分类法的种类:国外著名的分类法有杜威十进分类法、国际十进分类法等,国内使用最普遍的是中国图书馆分类法。
分类语言的标识是分类号及类目名称。
例如:用分类途径查找有关《支气管肺炎》方面的文献资料,以《中国图书馆分类法》为依据,取分类号为“r563.12”, 类目名称是“支气管肺炎”。
主题语言是用表达文献主题内容的词语作为标识的信息检索语言。应用较多的是主题词和关键词。
主题词:对表达信息主题内容特征的主题词汇经过规范化处理所形成的检索语言。
主题词是从自然语言中优选出来能代表文献实质内容的专业名词或词组。
其特点是表达概念准确,具有唯一性,多个相同概念、术语、同义词等在索引中只用唯一一个词语表达,使内容相同或相近的文献更加集中、更具有专指性。
主题词表:将主题词按字顺排列就成了主题词表,通过参照系统做规范化处理,使同义词、近义词、同族词、相关词等在主题词表中都一目了然。
主题词表是标引和检索人员的共同依据。
通过参照系统指引读者,扩大检索范围。常用的主题词表有《汉语主题词表》、《医学主题词表》等。
主题词有单级主题和多级主题两种。单级主题在主题词下就可以找到所需文献。而多级主题则包含一级主题、二级主题、**主题。
一级主题就是主题词。
二级主题也叫做副主题词。它是对主题词起限定作用的。
**主题也可以说是说明语,它对上面的主题词或副主题词做一文字性补充说明。
主题检索的原则:主题词必须和副主题词匹配使用。
关键词:将文献中的一些具有实质意义的词语抽出作为检索标识的检索语言。
关键词出现在文献的题名、摘要或正文中,能表达文献的主题内容。关键词是未经规范化的名词术语,它属于自然语言范畴,又称作自由词。
**语言指用代表事物的**作为标识系统的检索语言。在表述时按特殊的逻辑规则对**进行运算和推理,以抽象的形式表达科学内容的意思。
自由词途径:利用能表达文献主题内容的有实际意义的自然语词作为检索入口查找文献。主要包括题名词、关键词、文摘词、全文词。虚词不可作为自由词。
1. 布尔逻辑算符:
是计算机检索中最基本、最重要的运算方法,表达检索词之间的逻辑运算关系,对若干个检索词进行组合来表达检索要求。主要有三种,逻辑与(and或*)、逻辑或(or或+)和逻辑非(not或-)。
2. 运算次序及优先运算符:
3个布尔算符中,not 优先运算,and其次,or最后运算。如果要改变运算次序,用括号来表示括号内的运算符先运算。
not > and > or
字段限定检索
字段限定检索是在指定字段中进行检索,使检索趋向于查准。
字段限定检索的表达形式有:“字段标识符=检索词”,“字段标识符(检索词)”,最常见的形式是“检索词 in 字段标识符”。
截词算符。(1)无限截词符 * 就是把检索词取词根,再加上截词符输入检索,可以检索到词根相同但词尾不同的检索词。
2)有限截词符?又称通配符,常用于一个词中间,代表一个字符有或无,可以检索单复数、英美不同拼写方式等检索词。
默认检索。默认检索又称缺省检索,是指在检索系统预先设定的多个字段中同时进行检索。
cbm中的“缺省”检索是在中文标题、文摘、主题词、关键词、作者、刊名6个字段中检索。
限定检索。对检索出结果进行范围以及数量的限定。主要是对文献的年限、类型、研究的对象、年龄、语种等设定限定条件。
检索式又称检索提问式,是用户向检索系统表达文献需求的句式。分为简单提问式和复合提问式。简单提问式只含一个检索词,表达一个简单的概念。
复合提问式含有2个或2个以上的检索词,用布尔逻辑算符或位置算符连接。
信息检索的类型。
1. 数目型数据库:1题目型 2文摘型。
2. 事实数据库。
3. 数值型数据库
4. 全文数据库。
5. 图像数据库。
检索语言的功能。
1. 对文献信息内容加以标引
2. 系统组织相关文献信息。
3. 识别和比较标引结果与检索提问标识。
4. 桥梁和纽带。
主题词的特点。
①采用的词语有较严格的“规范”,保证词语与概念的准确性和唯一性。
②进行概念组配检索,提高了查准率。主题词与副主题词组配,用副主题词对主题词进行限定。
采用参照系统将某些非主题词指向采用的主题词,并显示相关主题词之间的相互关系。
采用类似分类的方法编制主题词分类索引和等级索引。树状结构表显示了词与词之间的等级关系,便利了检索。
⑤主题词表每年都进行修改。保证了用词的准确性。
采用主题倒置,便利在同一主题下进行检索。
查全率较高。
⑧由于它的“规范”,所以缺乏灵活性。
关键词的特点。
①使用方便灵活,易被人们接受;
②大大节省了检索系统的存储时间,缩短了检索工具出版的时差;
③随着现代科技发展,新概念、新名词的不断出现,关键词能很好地适应这种变化;
④不显示词与词之间的等级关系和相关关系,增加了检索文献的难度;
⑤查全率不高,容易漏检。
信息检索途径。
1. 分类途径2.主题途径3.自由词途径4.著者途径5.题名途径6.引文途径7.序号途径8.其他途径。
扩展检索 :
删除某个用and连接的不重要的检索词;
增加用or连接的检索词;
位置算符放宽;
检索词后用截词符;
多用副主题词;
用下位类主题词扩检;
同时用主题词和关键词检索,用or连接;
用著者检索、分类检索进行补充;
多选几个数据库检索。
缩小检索:
增加用and连接的检索词,或使用二次检索;
用特定的副主题词进行限定;
增加字段限定检索;
增加文献类型、语种、核心期刊、年份等限定检索;
使用主题词加权检索。
信息检索步骤。
1.分析检索课题,明确检索要求 2.选择数据库 3.选择检索途径 4.确定检索词。
5.构筑检索提问式并上机检索操作 6.调整检索策略 7.输出检索结果8.获取原始文献。
9.创建文献跟踪服务。
检索策略流程:
课题环境。
信息医学检索
目的 检索医学信息管理专业开设的院校及课程设置。工具 cnki 检索方式 为标准检索,文献内容主题为医学信息管理并含院校检索文献共有220条记录。有包头医学院,于2006年开始招生医学信息管理与信息系统本科生,既需学习医学基础课程,又要学习计算机相关课程。广东医学院是一门综合性学科是关于计算机科管理...
医学信息检索
1 以下属中文数据库的有 b d.以上都不是。2 中国生物医学文献数据库的英文缩写是 b 3 构建临床问题的国际通用pico原则,p是 a a.病人或疾病 b.干预 c.比较干预或暴露 d.临床结局。4 cbmdisc中的 二次检索 表示 a 运算 5 下面哪个数据库是引文数据库 d library...
医学信息检索
1.信息的特性 普遍性 传递性 依存性 相对性 可加工性 时效性 可共享性。3.产生次序和加工程度 重要 零次 一次 二次 三次信息。1 零次信息 指未经正式发表或不宜公开和大范围内交流的比较原始的素材 底稿 手稿 书信 工作文稿 工作图纸 考察记录 实验记录 调查稿 原始统计数字 以及各种口头交流...