第一讲网页采集。
1. 网页采集器的基本原理[简答题]
2. 网页采集器的设计[综合设计题]
第二讲分析处理。
1. 网页分析处理的必要性[简答题]
2. 分词歧义的处理方法[简答题]
3. 分词程序的设计[综合设计题]
4. 计算准确率、召回率和f值[计算题]
第三讲信息检索模型。
1. 信息检索系统的基本模式[简答题]
2. 各种信息检索模型的原理[简答题]
3. 利用布尔模型的搜索引擎的设计[综合设计题]4. 计算用向量表示的网页的相似度[计算题]5. 计算特征项权重(tf*idf方法)[计算题]第四讲跨语言信息检索。
1. 跨语言信息检索的原理[简答题]
2. 各种机器翻译方法的原理[简答题]
第五讲文本分类。
1. 文本分类的一般过程[简答题]
2. 文本分类技术的应用[简答题或综合设计题]第六讲自动文摘。
1. 自动文摘的分类[简答题]
2. 各种自动文摘技术的原理[简答题]
3. 自动文摘技术的应用[简答题或综合设计题]附:题型。一、简答题(4小题,共40分)
二、计算题(2小题,共30分)
三、综合设计题(1小题,共30分)
注:综合设计题要求,运用所学信息检索知识并结合软件工程要求,从3个题目中任选一个,分析用户需求、进行系统设计(以上为基本要求,20分);分析开发和应用过程中可能遇到的问题,给出相应的改良方案,并对该系统的实际应用做出展望(以上为拔高要求,10分)。
信息检索考试要点
基本属性 知识性,传递性,效用性。13.知识创新的定义。知识创新是指通过科学研究,包括基础研究和应用研究,获得新的基础科学和技术科学知识的过程。其目的就是为了追求新的发展,创立新的方法,积累新的知识。14.信息资源的定义。信息资源是指以文字 图形 图像 声音 动画和 等形式储存在一定的载体上,并可供...
扬州大学广陵学院信息检索作业复习要点
32 期刊数据库记录中的 文献出处 字段是指什么?33 pqdt是用于检索什么文献的数据库?34 如何通过专利号识别发明专利 实用新型专利 外观设计专利?35 检索工具有哪几种类型?36 如何查找中国专利说明书全文信息?37 了解并辨别我国各种标准的编码。38 可利用查找国家标准的相关信息数据库有哪...
信息检索复习
2009 10 18 10 39 33 分类 文献检索 字号订阅。上学期 信息检索与利用 试题。一 选择题。字段 jn de ti分别代表。a 50页103页104页。刊名字段 主题字段 标题字段。文摘号 文献类型 文摘字段。分类号 机构 公司。在信息检索技术中,算符and or not指的是哪一中...