数据挖掘和基于数据的决策是目前非常重要的研究领域,是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的特殊过程。在商业上,数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析技术,可用于分析企业数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
本次作业要求完成一个相亲配对程序,让相亲者更容易找到自己的意中人。查阅相关文献,以python为工具实现k-近邻算法,从而完成一个基本版的相亲配对系统,在此基础上深入研究聚类算法(k-近邻算法为其中一种),讨论各种聚类思路及算法优劣,完成相应的研究**。
基本的设计思路提示如下:利用附件文档中提供的三种属性(前三列,其中第1列为对方每年出差/旅行的公里数,第2列为对方玩游戏消耗时间的百分比,第3列为对方每周消费的冷饮公升数)作为测度是否和对方匹配的标准。附件文件第4列表示了你遇到此类人产生的好恶情感,其中largedoses表示对你极有吸引力,smalldoses表示对你吸引力一般,didntlike表示是你不喜欢的类型。
利用此文件提供的数据,以k-近邻算法为工具,进行数据挖掘,发现你的喜好标准,对新的未标定的待匹配方(即只有前三行数据)给出第4行的好恶情感标签(即largedoses、smalldoses或didntlike)。
具体要求如下:
查找文献,理解完整的k-近邻算法;
使用python语言编程实现k-近邻算法,解决相亲配对这一明确的应用问题;
撰写的研究**要有关于聚类算法的详细叙述,**中的算法应该与程序实现的算法相印证。
大作业要求:
自己设计解决方案,简易的解决方案得分较低,完整的解决方案,即使部分完成,得分也会较高;
作业上交形式为电子版文件。所有文件打包为一个文件,以“学号+姓名”的方式命名;
算法的python源程序(py文件);
对此问题进行研究得到的研究性**,**包括前言(简介),算法部分(算法流程图为核心),程序设计部分(程序流程图为核心),实验结果和分析,小结等内容(doc文件);
**必须有规范的发表**格式,包括题目、作者、单位、摘要、关键字、正文及参考文献;
字数:**部分字数限于2000±300,太多太少均扣分。
上交期限:19周周日,由学习委员收齐统一上交。
抄袭0分!
期末大作业
1 功能 这是一款简单的经典小游戏,游戏主体是一蛇,可以根据游戏的进程而逐渐变长。玩家通过方向键控制蛇的走向,每经过一个实心点便会加长一节。游戏开始时玩家可以控制游戏的难度 即蛇的运行快慢 运行时界面右侧会显示得分和等级,左侧为游戏界面。在蛇碰到自身或边界时会显示你输了并给出得分。2 背景与意义 贪...
期末大作业
20 20 学年第学期 课号课程名称 实用软件技术 photoshop改卷教师。学号 116050021姓名 陈雅倩得分。主题 电视剧步步惊情宣传海报。领衔主演 刘诗诗吴奇隆。主演 林更新刘心悠等。制作流程如下 1打开ps软件,新建一个1000 1500的海报模板。打开图一和图二,将图中的景物拖入模...
期末大作业
主线任务 任务1 我的环游世界。任务要求 选择10个世界上你最想去的地方,使用所学的ps方法 6.2 将将自己的全身照放入 要求人物与背景要和谐,保存文件的文件名以 地名标明。任务2 我的家谱。任务要求 讲自己的家庭成员用所学内容4.2制成勋章,并将家庭成员使用family tree形式合成自己的f...