笔记1 《信息检索》

发布 2022-08-25 03:42:28 阅读 8641

《信息检索》总结笔记。

复习纲要:一、信息、知识、信息源、信息资源。

]:经济学家认为信息、物质和能量是世界三大要素;心理学家认为信息存在于自然界、印刷品及空气中;哲学家认为信息是能被其他事物感知、反映事物本质和特征的信号内容;申农认为信息是用来减少不确定性的东西;维纳认为信息是人们同外部世界相互联系、相互作用的一种内容;信息管理者认为信息是事物或记录。

原因:(1)信息本身的复杂性,是多元化、多功能的综合物;(2)信息科学分支众多,其内涵和外延还不明确;(3)研究者研究信息的目的、角度等不同。

]:(1)本体论层次:不受任何约束条件;(2)认识论层次:受主体约束,即信息是主体所感知的事物本质和特征。

认识能力:获取信息的能力,包括信息意识、信息组织和检索能力、信息分析评价能力等。

信息的共享性:信息提供者在将信息传播给使用者时并不失去原信息的内容和信息量。

1)按信息**分:可分为自然信息、生物信息、机器信息、社会信息;社会信息是指人与人之间交流的信息,如政治、经济、文化信息等。

2)按信息载体分:口头信息、文献信息、电子信息。

口头信息:是存于人脑记忆中的,通过交谈、讨论等方式传播的信息。具有出现早、传递快、偶发性强等特点,但缺乏完整性和系统性,不易保存;

文献信息:是指文献记载的知识,通过一定的记录方式转化为符号系统,附着在一定的载体上。具有易保存、易识别、跨时空传播等特点,但一经固定便难以改变;

电子信息:以数字化形式存储的信息,通过网络、计算机等技术加以再现。具有共享方便、容易复制和传播、信息量大、形式多样等特点,但有时过于庞杂,质量参差。

信息是使人原有的知识结构发生变化的那一小部分知识:

1)信息和知识密不可分:信息是知识的表现形式,知识通过信息来传递和被感知;

2)信息不等于知识:将信息加工、升华后的再生信息才是知识。

获取知识的途径:(1)产生信息的客观事物,这是直接**;(2)通过信息载体或媒介。

人们的信息需求在一定的内在和外在条件下将激发获取信息的动机,并最终将信息转化为知识。信息能否转化为知识取决于主体的认知能力。

内在条件:人们对信息价值的评估和认识程度,它决定了信息获取动机的强度;

外在条件:人们获取信息的外部环境、人们对这种环境的认识等。

]:信息的**,是人们生产活动产生的成果和原始记录,以及对这些成果和原始记录加工整理得到的成品。

]:根据对信息源加工的层次和集约程度划分—

一次信息源:也称本体论信息源,所有的物质;

二次信息源:主要储存于人脑中,经传播、咨询等活动能被感知的信息;

三次信息源:又称再生信息源,包括文献信息、电子信息等加工过的信息;

四次信息源:也称集约信息源,是三次信息源的集约化,如图书馆、数据库等。

信息与信息资源:

12、是一种附加了人类劳动的信息,它包括人、信息、符号、载体四个基本要素,是人通过一系列认知和创造过程之后以符号形式存储在一定载体上的全部信息。它是一个动态的概念,其范围和数量由生产力和研究水平决定。

文献信息资源(见文献学)

]:以数字化形式存储的信息,通过网络、计算机等技术加以再现的资源。包括:网络信息资源、非网络信息资源。前者通过联机检索和**检索实现信息资源的利用;

后者是在单机模式下对信息资源进行利用,如光盘数据库。

网络信息特点:数量庞大,质量参差、瞬息万变、**复杂。

优点:检索系统配置简单,检索成本低;操作比较简单;数据资源共享方便,部分数据可进行个性化处理;缺点:信息容量有限;数据需定期更新,实时性和动态性差。

电子/数字信息资源的特点:

1)具有通用性、开放性和标准化的数据结构,在网络环境下可供多用户使用、共享;

2)以机读数据的形式存在,可单机高速处理,也可借助网络远距传播,不受时空限制;

3)存储信息密度高,容量大,占用空间少,检索速度快,检索途径多,功能齐全;

4)类型多样,可包含从一次文献到三次文献等多种文献类型,输出方式灵活;

5)内容丰富,形式多样,并且各种类型的数据可任意组合编辑。

7、是由检索中心和与之相连的无数终端组成的。

检索中心:系统的中枢,由**计算机、联机数据库、检索与管理软件及相应的检索服务体制组成。

联机数据库:联机系统自建或数据库生产者提供,构成数据库的主文档。如dialog。

8、联机检索系统是一个相对封闭的系统,信息资源来自主机;网络检索系统是一个开放的系统,信息资源**于互联网。

9、联机系统一些概念:

1)主文档的索引文档——指明每条记录在磁盘上的存储起始地址,便于随机存取。

索引文档分为:基本索引和辅助索引。

基本索引:主要揭示文献的内容特征,是一种主题性质的索引,包括叙词字段(de)、标题字段(ti)、文摘字段(ab)、注释字段(nt)等。

辅助索引:主要揭示文献的外在特征,属于非主题性索引,包括作者(au)、分类号(cc)、机构**(cs)、期刊名称(jn)、语言(la)、文献类型(dt)、文摘号(an)、出版时间(pt)等。

2)倒排文档——从主文档中抽取可检字段(如作者、题名、主题词、分类号、自由词等)加以排序和归并,组成倒排文档,便于用户从不同途径查询数据库。

3)文档(file),由记录及其索引组成。

记录(record)——文档中作为一个单位来处理的有关数据的集合,是对一条完整信息(一篇文档、一个公司、一种产品)的各种属性进行描述的结果。其描述文字构成记录的内容。一个记录通常由若干个字段(fields)组成。

字段,记录的下级数据单位,用来描述一条完整信息的某一属性,又称数据项目、数据元(data elements)。如一篇文献由标题、作者、出版者等若干属性组成,该文献也就由标题字段、作者字段等表示。字段是数据库最小的存取单位。

一个字段可以由多个子字段、甚至子子字段组成,信息便形成层次关系。

字段分为:可检字段和不可检字段(只用来显示和打印)——按检索匹配运算的要求。

字段分为:主题字段和非主题字段——按揭示文献内容特征。

索引:数据库中可检词的字顺表,即全部记录的标识及其在记录中地址的对照表。

索引文档分为:基本索引、辅助索引。基本索引主要揭示文献的内容特征,是一种主题性质的索引,包括叙词字段(de)、标题字段(ti)、文摘字段(ab)、注释字段(nt)、公司名称(co)等。

辅助索引主要揭示文献的外在特征,属于非主题性质索引,包括作者(au)、分类号(cc)、机构**(cs)、期刊名称(jn)、语言(la)、文献类型(dt)、文摘号(an)、出版时间(py)等。

]:(1)集中管理,专人负责,定期更新;(2)系统成熟,信息质量高,安全性高;(3)检索途径多,检索效率和准确率较高。

缺点:(1)扩展性和灵活性较差;(2)多以线性方式组织信息,相关信息的关联性差;(3)系统相对独立,数据共享性受到限制;(4)用户往往要经过训练才会使用。

]:广义是指网络信息活动中所有要素的总和;狭义是指以数字化形式记录的、存储在网络计算机各类介质上、并通过网络通信方式进行传递的信息内容的集合。

缺点:1)信息庞杂,加大了有用信息的获取难度;

2)规范化问题:数据库的标准化进程滞后于使用需求,数据库的跨库应用严重受限;

3)网络通路不畅:通信网络建设受到各种主客观因素限制;

4)信息污染:存在大量垃圾信息,影响正常的信息利用。

13、利用网络信息资源的注意事项:

1)发布网络信息的主体及其权威性,通过正规的网络渠道获取高质量信息;

2)站点式信息资源与网页式信息资源。不同类型的**提供服务的重点不同。

3)网络信息资源的组织方式:

文件方式——辅助方式;简单方便,但不利管控;

数据库方式——当前网络信息资源普遍的组织方式;

主题目录方式——可通过浏览方式层层遍历,结构清晰;

超**方式——超文本与多**技术结合,高度链接。

4)信息存取方式,有电子邮件型、即时交互型、揭示板型和文献提供型。

电子邮件:使用最多的获取信息的方式;

即时交互:即时信息传播,如会话、讨论、聊天、虚拟咨询;

揭示板:非即时信息传播,如bbs、网络新闻;

文献提供:提供网络图书、网络报刊、专利、标准等文献的全文**或推销服务。

5)网络信息资源类型:按传统信息加工层次标准,:

网络零次信息:未经加工处理的信息,如聊天记录、邮件等;

网络一次信息:初步加工处理并存放于网络的信息,如一次文献的数字版;

网络二次信息:对零次、一次信息加工整理,揭示其特征,形成有组织的信息系统。如网络版书目、文摘、搜索引擎、**目录等;

网络三次信息:利用。

一、二次信息资源,通过加工和组织形成的信息产品,如网上词典、百科全书、数字图书馆、数据库等,是一种高度集约化的信息集合体。

信息服务业定义:以开发、利用信息资源为基础,利用现代科学技术对信息进行生产、处理、使用并提供信息产品和服务的总称,例如信息经纪业、咨询业、调查业等,用以满足社会和个人的信息需求。

信息服务业分类:

1)信息提供业,如数据库信息检索服务、联机信息检索服务;

2)信息处理业,如数据录入、处理、信息输出、电子数据交换等;

3)软件开发与服务业;

4)系统集成服务业;

5)咨询业及其他相关服务业。

信息服务机构分为:

1)公益性,多为事业性质,如图书馆、档案馆等;

2)经营性,多为各类信息服务机构,如信息公司、咨询公司等;

seis:state economic information systems of china,国家经济信息系统,典型的**信息系统,由包括**、省、市、县四个层次的信息中心所构成的经济信息纵向系统(主系统)和由***各部委信息机构所构成的经济信息横向系统两部分组成。

医学信息检索笔记

1 什么是综述?是三次文献的加工。2 文献综述是作者对某一方面问题的历史问题 前人工作 争论焦点研究现状和发展前景多内容进行评论科学性 3 综述的作用 是 的压缩。培养科院人员的情报意识,思维方式的重要手段。是科研立项 成果答辩的准备。4综述的特点。篇幅大。引文较多。内容比较丰富。涉及面比较广。揭示...

信息检索作业 1

课题名称 工程陶瓷材料加工技术现状。由于工程陶瓷具有极高的硬度 良好的耐磨性和耐腐蚀性以及脆性高等特点,成为难加工材料,特别是加工高精度 形状复杂的构件非常困难,因此,陶瓷材料作为工程结构材料的大规模推广使用,在很大程度上取决于陶瓷零件加工技术的发展。本文综述了国内外陶瓷材料加工技术的研究现状更多还...

实验1信息检索

信息检索1.1实验目的1 掌握利用网络进行。市场信息检索的基本思路 2 掌握利用网络进行市场信息检索的主要方法。1.2预习要求掌握数据 消息 信息 的概念 清楚信息与消息的区别 掌握信息的特性 熟练掌握信息的生命周期 掌握信息系统的组成 了解互联网的基本应用。1.3实验内容与步骤1.明确检索目标要完...