一、 名词解释。
1、 源数据库。
答:源数据库是指能直接提供原始资料或具体数据的自足性数据库,用户不必再查阅其他信息源。可包括数值数据库,文本数值数据库,全文数据库,术语数据库,图像数据库,音频数据库等。
2、 索引款目。
答:单个索引包括索引款目,参照系统和索引款目导引标志,索引款目由索引标目和索引地址两部分组成。索引标目又可以分为主标目和副标目。
主标目揭示被索引概念或项目的核心部分,并决定索引款目的排列位置和检索入口。副标目从属于主标目,其作用是使索引标目含义更为具体、专指。
3、 书目信息检索。
答:书目信息检索是指读者可以通过互联网实现图书的查找和借阅。一般来说,大中型图书馆的馆藏目录,都可以通过互联网实现查询。
4、 跨语言检索。
答:跨语言信息检索是指用户以自己所掌握的某一种语言构造检索提问式,计算机根据用户的检索要求在其他不同语种的信息中进行自动搜索,得到的检索结果甚至可以翻译成用户指定的语种。
5、 查询扩展。
答:信息都是以字、词或者词组的形式来表示的。 只有查询词出现在文档中时, 才有可能被检索到。
但是在自然语言里同一个概念经常会有多种不同的表达方式, 因而很有可能出现与用户查询含义相关的文档由于用词不同而无法被检索出来的情况。查询扩展就是用意思相近的词来查询同一概念。
二、 判断题(,图书馆专业1~5题,情报学专业6~10题,档案管理6~10题)
6、 从成果来看,信息分析最终是为不同层次的科学决策服务的。
答:错,从成果来看,信息分析形成了新的增值了的信息产品,即知识和情报。
7、 信息分析人员将完成的信息分析产品或报告递交给用户,信息分析工作就结束了。
答:错,信息分析除了把信息分析产品交给用户外,还要协助实施、收集反馈。
8、 类比推理只能发生在有相同或相似属性的事物之间。
答:对。9、 市场信息分析就是对产品销售情况的分析。
答:错,市场信息分析是在市场调查的基础上,运用科学的方法,对影响市场供需的各种因素进行调查和综合,由此**出市场的变化和未来趋势,为企业决策提供服务。
10、科学知识图谱以知识为对象,其本质与知识管理中的知识地图相同。
答:对。三、简述题。
1、简述词表子系统的作用。
答:一、词表子系统在标引过程中的使用。
二、检索过程中词表的使用。指定和提示作用。
2、简述传统布尔检索模型的优缺点。
答:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。
优点:一、逻辑运算符较少,便于用户学习。
二、模式较易构造,可以通过简单的关系来体现检索项的联系。
三、布尔检索模型可以将复杂的检索过程以简单的检索式表达出来。
四、检索提问式较灵活,方便修改。
缺点:一、布尔检索中关键词没有权重区别。
二、检索结果的输出没有重要性排序。
三、查全率很难控制。
四、布尔检索要求用户具备很高的素质和语义提取能力。
3、试比较顺排文档检索与倒排文档检索。
答:顺排文档主要按照某一属性的字符顺序存入了数据库的全部记录,故又称为主文档。
顺排文档组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护。但在查询的时候需要对所有的文档进行扫描以确保没有遗漏,这样就使得检索时间大大延长,检索效率低下。
倒排文档是将主文档的可检字段抽出,按某种顺序重新排列起来所形成的一种索引文档。这个文档归并相同词汇,并把在顺排文档中相关记录的记录号集合赋予在索引关键字之后,以保证通过某一特征词能够快速、方便的获取相关记录。
倒排文档是建立在顺排文档的基础之上的,它的检索速度比顺排文档快,且比较准确。
4、试析查全率和查准率的影响因素。
答:查全率和查准率的影响因素有如下几个方面:1)相对值的影响;2)检索方式的影响。
3)时限的影响;4)检索过程中的影响。(分别对每一点展开论述)
5、以dialog系统为例,简述联机检索系统的最新发展。
答:先说dialog系统的优势,优势如下:1)信息量大;2)数据库的质量比较高;3)检索迅速方便;4)具有较强的回溯检索功能。注:每一点后面可以用一两句话解释。
然后引申出联机检索系统的新发展,新发展是:1)系统模式客户机/服务器化;2)完善的网络通讯平台;3)智能化人机接口;4)具有多**采集、存储、加工、检索、传递能力;5)具有较强的网络互联能力;6)提供多种信息服务功能。
6、以google为例,简述搜索引擎的工作原理。
答:搜索引擎是网上二次信息进行组织的主要形式,其实质是一种报道、存储网上一次信息的检索工具。
工作原理:第一步:爬行,搜索引擎是通过一种特定规律的软件跟踪网页的连接;
第二步:抓取存储,搜索引擎是通过蜘蛛跟踪连接爬行到网页,并将爬行的数据存入原始页面数据库;
第三步:预处理,搜索引擎将蜘蛛抓起回来的页面,进行各种步骤的预处理。
第四步:排名,用户在搜索框输入关键词后,排名程序调用索引数据库,计算排名显示给用户,排名过程与用户直接互动。
如在google中查找中医药信息素养的文章,先输入关键词,搜索引擎会跟踪到相关的页面,再将相关页面的信息或数据存入原始页面数据库;然后对数据或信息进行各种处理;最后按重要性进行排序输出。
四、论述题(图书馆专业1~2题,情报学专业3~4 题,档案管理专业5~6题)
3、试根据引文分析的基本假设分析引文分析方法应用的局限性。:
答:引文分析的基本假设是:一、文献的引用表示作者确实使用过该文献;二、文献的引用是文献价值、重要性及影响力的指标;三、好的文献才会被引用;四、原始文献和引用文献之间必然有相关性;五、所有的引用都是同等重要的;六、期刊引用报告收录的期刊能正确代表整个学科领域,并支持其研究目标;七、引用次数是衡量引用文献是否有意义的有效指标。
局限性:一、引文关系存在假联系;二、文献被引用并不完全等于重要;三、著者选用引文受到可获得性的影响。四、马太效应的影响。(对各点进行展开论述)
4、有人说:信息分析体现了情报学专业的核心竞争力与应用型专业的特点,试阐述你的观点。
答:先表明自己的态度:我同意这种观点。
理由:先写信息分析的概念:信息分析是分析人员根据用户的特定信息需求,利用各种分析方法和工具,对搜集到的零散的原始信息进行识别、鉴定和筛选,挖掘出其中的知识和规律,并通过系统的额分析和研究得到有针对性、时效性、**性、科学性、综合性及可用性的结论,以便用户决策使用。
简而言之,就是通过针对性的信息搜集,经过深入的分析研究,挖掘隐藏于信息分析中的情报,从而为决策服务。
信息分析是产生情报的关键步骤。
情报是对决策有用的信息,而信息只有通过有效的信息分析才能转变为情报,从而为决策服务。所以信息分析体现了情报学专业的核心竞争力。
进行信息分析的目的是为了合理有用的应用信息分析的结果。信息分析广泛的应用于社会的各个方面。所以信息分析也体现了情报学专业应用型的特点。
所以信息分析体现了情报学专业的核心竞争力与应用型专业的特点。
信息检索2019真题
2010年 信息检索 考试真题及答案。一 ir与数据库检索的区别 1 数据源不同。数据库 结构化数据 包含了各种可以命名的部分,并按一定的结构对内容进行组织 i r 结构化 半结构化 html,xml标记 非结构化 自然语言表达 2 描述模型不同。数据库 层次模型 双亲子女关系 pcr 网状模型 系...
2023年真题分析
具体题型。第一个大题 单选题第二个大题 多选题。第三个大题 简答题 5个,每题10分 第四个大题 综合题 3个,每题30分 单项选择题涵盖面比较广,出题比较细,很细微的知识点都有可能成为出题点,如关于主观估计时间 能力研究的著作等等。但这些知识点都较少有深度,注重考查的是。考生对基本知识 基本理论的...
2023年真题 案例分析
2011年安全工程师 安全生产事故案例分析 真题及答案。一 a焦化厂为民营企业,从业人员1000人,2009年发生生产安全事故2起 造成2人轻伤。该厂因精苯工业废水兑水稀释后外排,被环保部门责令整改。该厂采取的措施是将废水向煤堆喷洒,这样既仰制了扬尘,又避免了废水外排。为防止相关事故发生,该厂于20...