《计算机信息检索》上机作业

发布 2022-08-24 19:38:28 阅读 3051

《计算机信息检索》上机作业。

一、库结构。

access 2000数据库1、停用词表1)表名。

stopword2)表结构。

字段名字段类型字段含义id长整型(自动编号)词序号stopword字符型(文本,最大长度50)停用词。

3)记录数。

64个停用词2、关键词表1)表名term2)表结构。

字段名字段类型字段含义id长整型(自动编号)词序号term字符型(文本,最大长度50)关键词。

3)记录数。

104关键词3、篇名表1)表名title2)表结构。

字段名字段类型字段含义recid长整型(自动编号)篇名序号title字符型(文本,最大长度100)篇名。

3)记录数20条。

二、编程要求。

1、合并使用停用词表和关键词表作为分词词表,应用逆向最长匹配法对所有篇名分词,给出每条篇名对应的分词结果。在屏幕上显示篇名序号、篇名、分词结果。2、去除停用词(显示在屏幕上)。

3、利用tfx词频加权公式,计算各词的权重,在屏幕上显示每条篇名中各词的权重。4、根据输入的阈值,确定标引词,并在屏幕上显示标引词。5、根据输入的标引深度,确定标引词,并在屏幕上显示标引词。

计算机信息检索课作业

一 特定作者成果的检索和分析评价。1 检索过程。此次检索以我的导师 郭新宝老师的科研成果为对象,选择cnki 中国知网 为检索工具。选择cnki,不仅是因为其收录了人文社科类的期刊 会议 以及报纸等在内的数据库,与检索专业范围吻合,还可以生成检索结果报告,而且检索结果分析功能较万方数据库来说也更为完...

计算机信息检索

课程编号 99000212 学时 32 学分 2 课程性质 公共选修课。选课对象 全校各专业。内容提要 介绍计算机检索概念,检索的基础知识,检索语言,检索原理,计算机检索策略,检索技术,联机检索中基本指令和搜索引擎的使用技法。建议选用教材 计算机信息检索 机械工业出版社李莹 2002版。主要参考书 ...

计算机信息检索

8 检索语言 是应文献信息的加工 存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言 体系分类语言 主题词语言 和非规范化语言 自然语言 两类。9.自然语言 索引词汇...