数据挖掘上机作业

发布 2022-09-05 10:02:28 阅读 5505

《数据挖掘》实验。

实验要求:一、 所有选课的学生都必须提交上机实验报告;

二、 实验报告应包括如下内容:

1) 算法基本思想的描述。

2) 编程实现算法。

3) 输出运算结果。

三、 分类技术和凝聚技术的两个问题中,可以各选择一个题目,关联规则挖掘的题目必选,即每个人至少选三个题目。

实习一分类技术及其应用。

实习题1 基于决策树的分类算法,属性的选择采用id3 或c4.5策略,采用如下的数据建立分类决策树。

实习题2 基于线性回归模型拟合一个班学生的学习成绩,建立**模型。数据可由自己建立100个学生的学习成绩。

实习二聚类技术及其应用。

实习题1 编程验证单连接凝聚聚类算法,实验数据可使用第五章表5.2 的数据进行。要求输出层次聚类过程中每一步的聚类结果。

实习题2 利用k-均值聚类算法对如下数据进行聚类,其中输入k=3,数据集为。

要求输出每个类及其中的元素。

实习三关联规则挖掘及其应用。

实习题:apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。它将关联规则挖掘算法的设计分解为两个子问题:

(1) 找到所有支持度大于最小支持度的项集,这些项集称被为频繁项集(frequent itemset)。(2) 使用第一步产生的频繁集产生期望的规则。

在图书馆管理系统中积累了大量的读者借还书的历史记录,基于apriori算法挖掘最大频繁项目集,由此产生关联规则。数据格式可参阅文献。

数据挖掘技术平时作业

第一次 1 什么是数据挖掘?当把数据挖掘看作知识发现过程时,描述数据挖掘所涉及的步骤。参 数据挖掘是指从大量数据中提取有趣的 有价值的 隐含的 先前未知的 潜在有用的 关系 模式或趋势,并用这些知识与规则建立用于决策支持的模型,提供 性决策支持的方法。很多学者把数据挖掘当作另一术语kdd的同义词,而...

数据挖掘第二讲作业

第二讲大数据分析处理概述。1 hadoop是一个 c a.进行大数据分析处理的操作系统。b.专门存储大数据的数据库。c.大数据计算框架。d.收费的商业数据分析服务提供商。2 hadoop集群可以运行的3个模式是 abc 多选。a.本地模式。b.伪分布模式。c.全分布模式。d.离线模式。3 在hado...

数据挖掘部分作业答案

一 概述。数据挖掘概念 数据挖掘是对大量数据进行探索和分析 以便发现有意义的模式和规。则的过程。数据仓库 数据仓库就是面向主题的 集成的 非易失的 稳定性 随时间变化 不。同时间 的数据集合,用以支持经营管理中的决策制定过程。数据立方体 允许以多维对数据建模和观察。由维和事实组成。其中事实是数值的度...