信息存储与检索实验作业

发布 2022-08-24 19:24:28 阅读 3633

信息存储与检索。

一、实验目的。

1、了解信息存储的背景。

信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。随着2024年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统。

2、熟练掌握信息存储与检索的相关方法,比如中文检索系统、外文检索系统、专业检索系统等;

3、了解信息存储与检索的额含义、分类及相关理论;

4、具有编写信息分析报告的能力。

二、实验意义。

1、能较全面地掌握有关的必要信息。

信息检索可以有目的、较系统地获得某一主题的必要信息。

2、能提高信息利用的效率,节省时间与费用。

一般公信度高的,较准确的信息才会被收集、组织或存储在检索工具或数据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数十倍。

3、能提高信息素质,加速成才。

信息素质是指具有获取信息的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。中国的高等教育法明确要求大学生要具备信息素质。

三、实验内容。

3.1信息检索的含义。

信息检索有广义和狭义的之分。广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。

狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。

所以综上所述,信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。

3.2信息检索的可行性分析。

计算机技术可行性分析。从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。

从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。

适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。

社会环境可行性分析。首先,信息检索是获取知识的捷径;其次,信息检索是科学研究的向导;美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。在科研开发领域里,重复劳动在世界各国都不同程度地存在。

据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;中国的重复率则更高。最后,信息检索是终身教育的基础;学校培养学生的目标是学生的智能:

包括自学能力、研究能力、思维能力、表达能力和组织管理能力。教育已扩大到一个人的整个一生,认为唯有全面的终身教育才能够培养完善的人,可以防止知识老化,不断更新知识,适应当代信息社会发展的需求。

综合以上各个方面的分析,我们可以得出结论,信息检索技术的快速发展与应用更加广泛化。

3.3网络检索技术的应用。

3.3.1谷歌学术。

google学术搜索是一个可以免费搜索学术文章的google网络应用。2024年11月,google第一次发布了google学术搜索的试用版。该项索引包括了世界上绝大部分出版的学术期刊, 可广泛搜索学术文献的简便方法。

您可以从一个位置搜索众多学科和资料**:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、**、图书、摘要和文章。google 学术搜索可帮助您在整个学术领域中确定相关性最强的研究。

3.3.2学术搜索。

学术搜索是旗下的提供海量中英文文献检索的学术资源搜索平台,涵盖了各类学术期刊、会议**,旨在为国内外学者提供最好的科研体验。学术搜索可检索到收费和免费的学术**,并通过时间筛选、标题、关键字、摘要、作者、出版物、文献类型、被引用次数等细化指标提高检索的精准性。学术搜索频道还是一个无广告的频道,页面简洁大方保持了搜索一贯的简单风格。

在搜索页面下,会针对用户搜索的学术内容,呈现出学术搜索提供的合适结果。用户可以选择查看学术**的详细信息,也可以选择跳转至学术搜索页面查看更多相关**。在学术搜索中,用户还可以选择将搜索结果按照“相关性”、“被引频次”、“发表时间”三个维度分别排序,以满足不同的需求。

我们所举的例子均是以“信息分析”为主题来进行查询,以题目《企业经济信息分析的内容及作用探析》作为查询篇目,作者:吴智勇。

其具体操作如下所示:首先,在网上选择“学术”栏目,进而进入学术搜索界面,输入“信息分析”主题词,得出如图(1)所示界面,然后点击【高级筛选】按钮,进入如图(2)所示画面。

图(1)为“信息分析”查询结果界面。

图(2)为进入高级筛选界面。

图(3)为高级检索界面。

进入“高级检索”界面后,点击【搜索】按钮,进入如图(4)所示的查询结果。

图(4)为高级检索结果。

有业内观察人士指出,随着我国科学技术的不断发展和教育水平的逐步提高,对专业性文献资料的需求也呈现出**式的增长速度。任何一家文献**都无法覆盖所有的文献资料,这就使得用户在搜索过程中投入的时间、精力成本不断增加。学术搜索功能的推出,就像在各文献**中架设起了错落有致的桥梁,使得用户可以随意穿梭,最快找到自己需要的文献资料,极大的降低了搜索的成本;而对于专业学术**,丰富的内容也找到了最大化的输出渠道。

学术搜索全面融合了互联网最优质的数据与应用内容,极大地提升了用户学术搜索体验,同样也促进了互联网大生态圈的良性发展。通过这一互联网第一入口对近5亿中国网民的全面覆盖,为学术型**铺设服务普通大众的全新通道,在带给用户更卓越的服务体验的同时,也扩大了自身影响、促进了自身发展,同时学术搜索也为最终形成开放共赢、绿色健康、持续发展的学术分享新生态而努力。

3.3.3中国知网学术搜索。

中国知网是国家知识基础设施(national knowledge infrastructure,nki)的概念,由世界银行于2024年提出。cnki工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于2024年6月。cnki工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,此项目对应实体公司为同方知网(北京)技术****。

我们之前就已经知道,所需查找的**资料,所以在图(5)所示界面中输入**名“企业经济信息分析的内容及作用探索”,点击【检索】按钮后,出现如图(6)所示界面,关联度有6个,但是这篇文章实质上未收入该数据库,则查准率为0/6=0%,所以这种查询方式存在缺陷。

图(5)为中国知网简单查询界面。

图(6)为中国知网相关度查询界面。

图(7)为点击“高级检索”按钮。

在如图(7)所示界面中,点击【高级检索】后出现如图(8)所示界面,然后输入作者及**相关信息后,点击【查询】图框按钮即可,出现图(9)所示提示信息,其查准率提高,但是查全率降低。

图(8)为“高级检索”界面中输入所需信息。

图(9)为“高级检索”查询结果图。

cnki的作用有以下4点,一是大规模集成整合知识信息资源,整体提高资源的综合和增值利用价值;二是建设知识资源互联网传播扩散与增值服务平台,为全社会提供资源共享、数字化学习、知识创新信息化条件;三是建设知识资源的深度开发利用平台,为社会各方面提供知识管理与知识服务的信息化手段;四是为知识资源生产出版部门创造互联网出版发行的市场环境与商业机制,大力促进文化出版事业、产业的现代化建设与跨越式发展。

3.3.4万方数据库学术搜索。

万方数据股份****是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。《中国企业、公司及产品数据库》始建于2024年,由万方数据联合国内近百家信息机构共同开发。十几年来,cecdb历经不断的更新和扩充,现已收录96个行业的近20万家企业详尽信息,是国内外工商界了解中国市场的一条捷径。

目前,cecdb的用户已经遍及北美、西欧、东南亚等50多个国家与地区,主要客户类型包括:公司企业、信息机构、驻华商社、大学图书馆等。国际著名的美国dialog联机系统更将cecdb定为中国首选的经济信息数据库,而收进其系统向全球数百万用户提供联机检索服务。

图(10)在万方数据库平台上实现信息查询。

在图(10)的登录界面中输入“信息分析”主题词,得到7132个相关个查询结果,然后在查询结果中再进行筛选,作者为吴志勇,发表时间为2014—2024年之间,如图(12)所示。

图(11)在简单查询结果中再进行筛选。

图(12)为万方数据库的高级查询界面。

在如图(12)所示界面总输入所需信息,然后点击【检索】按钮后进入图(13)界面,没有任何相应结果,查准率为100%,即万方数据库根本都还没有录入该篇**,则查全率为0。

图(13)检索信息不存在。

在为用户提供信息内容服务的同时,作为国内第一批开展互联网服务的企业之一,万方数据坚持以信息资源建设为核心,努力发展成为中国第一的信息服务提供商,开发独具特色的信息处理方案和信息增值产品,为用户提供从数据、信息到知识的全面解决方案,服务于国民经济信息化建设,推动中国全民信息素质的成长。万方数据提供中国大陆科技期刊检索,是万方数据股份****建立的专业学术知识服务**。隶属于万方数据资源系统,对外服务数据由万方数据资源系统统一部署提供。

3.3.5中国学术搜索网。

sciinfo中国学术搜索网提供中外文学术文献(包括期刊、学位、会议、专利、成果、标准、法规、图书等)的统一检索、二次文献揭示以及全文内容指向与调度;同时对各类学术文献资源的整合与海量数据的挖掘分析,帮助用户开展更高质量和高效率的科研工作。

图(14)为中国学术搜索网简单查询界面。

图(15)为简单查询接果。

在图(14)所示界面中直接输入所需查找的**名,然后点击【检索】后,得到图(15)所示界面,到符合条件的文章一篇,输入格式即可。查准率为1/1,即100%。最后,信息录入“中国学术搜索网”的格式如图(16)所示。

图(16)为该**录入格式。

sciinfo中国学术搜索网的服务功能有以下几种:第一,一站式的知识发现。针对期刊、学位、会议、专利等各种学术资源,系统提供快速搜索入口和多种易用的辅助功能和资源获取的快捷方式;第二,精细化的知识组织输出按照不同文献类型的需求组织内容,更精确引导用户访问过程,提供更快捷的信息访问通道;第三,主动的检索词识别。

信息访问通道智能检索词识别算法,根据不同输入,主动输出用户关注的核心内容;第四,精准的知识聚类和筛选机制。检索结果将根据用户选择自动聚类,实现从收录分布分析、遴选作者与机构、期刊排名等多个维度的进一步筛选机制;第五,深层次知识分析机制。从学科、主题、人物、机构等多个要素对元数据仓储进行深度挖掘分析,如主题趋势分析、人物科研合作关系分析、学科发展成熟度分析、机构科研能力变化趋势等,用数据和图形说话;第六,多元的资源定位方式。

通过多途径全文资源调度,实现尽可能多的原文获取途径的揭示,打通资源厂商、官方传递和地方共享平台的通道,方便用户获取知识的同时保护知识产权。

信息存储与检索实验

班级 信管111 学号 111406070137 姓名张红燕。指导教师蔡羽。实验一 搜索引擎的工作原理及资源获取方法与技巧。实验学时 2学时。一 实验目的和要求。1 实验目的 理解搜索引擎的工作原理,熟练使用google lycos等搜索引擎,灵活掌握资源获取方法与技巧。2 实验对象 interne...

信息存储与检索实验二

上机二 专利信息资源和事项检索。目的 掌握专利信息资源的检索 常用网上事项检索工具的检索。内容 专利信息资源的检索,字典词典 手册 名录的检索。实验步骤 一 专利信息资源。1 中国专利信息资源的检索。中国知识产权局。步骤一 专利申请人途径 登录 点击 进入 打开该站点主页 选择上方 发明专利 专利 ...

信息存储与检索试题

信息存储与检索试题 试题。姓名 学号 班级 时间 120分钟。一 填空题 每空 分,共 分 计算机检索系统是由计算机技术 和 等构成的存储和检索信息系统。计算机检索用词可分为 反映文献外部特征的有作者 和 等。gopher搜索的是 archie查寻的是 而 则是寻找在独立文档全文中包含的信息。联机检...