聚类分析:p230.6.9
1)用快速聚类法分为3类:(年份)
上表展示了3个类的初始中心情况,3个初始类中心点的数据分别为(50.5,20.9,28.
6),(37.6,38.0,24.
4),(18.6,49.3,32.
1)对应的年份分别是2023年,2023年,2023年。(每次分类得到的初始聚类中心和最终聚类中心不一样,是因为快速聚类法采用的选取初始聚点的方法不同。)
分三类的聚类结果为:
第一类:1952,1953,1954,1955,1956,1957,1961,1962,196,1964,1965,1967,1968,1969
第二类:1959,1960,1985,1986,1987,1988,1989,1990,1991,1992,1993,1994,1995,1996,1997,1998
第三类:1958,1966,1970,1971,1972,1973,1974,1975,1976,1977,1978,1979,1980,1981,1982,1983,1984
从聚类的情况分析,第一类是第一产业(农业)所占百分比大的年份,第二类是第一产业和第二产业(工业建筑)所占百分比较大年份,第三类是第二产业所占百分比较大年份,从2023年到2023年,时间大致分类的顺序为第一类、第三类、第二类,表明我国第一产业农业所占比例的逐步降低,第二类产业工业建筑等行业和第三产业所占比例的升高,也表明了我国从一个农业大国向工业性大国的转变,工业性等产业的的快速发展。
上表是2个类的最终类中心,类中心数据分别是(41.8,29.8,28.
4,),32.7,44.0,23.
3),(23.5,45.4,31.
2)与初始据点的数据有差异,但总的不是很大,仍然是表明农业所占比例的减少和工业建筑类的高速发展。
画出(x1,date)图。
由图可知,除了个别点,第一产业随着年份的增长逐步减少,与上面分析的一致。
画出(x2,x1)图
由图可知,除了个别点,第二产业随着第一产业的减少增加,也就是随着年份的增加逐步减少,与上面分析的一致。
2)用快速聚类法分为4类。
上表展示了4个类的初始中心情况,4个初始类中心点的数据分别为(50.5,20.9,28.
6),(19.1,50.0,30.
9),(42.2,31.2,26.
7),(33.3,45.0,21.
7)。对应的年份分别是2023年,2023年,2023年,2023年。
分4类的聚类结果为:(年份)
第一类:1952,1953,1954,1955,1956
第二类:1959,1960,1985,1986,1987,1988,1989,1990,1991,1992,1993,1994,1995,1996,1997,1998
第三类:1957,1961,1962,1963,1964,1965,1967,1968,1969,1958,1966
第四类:1970,1971,1972,1973,1974,1975,1976,1977,1978,1979,1980,1981,1982,1983,1984
从聚类的情况分析,第一类是第一产业(农业)所占百分比大的年份,第二类是第二产业(工业建筑)所占百分比较大年份,第三类是第一产业所占百分比较大年份,第四类是第二产业所占百分比较大年份,若从2023年到2023年来看,时间分类的顺序是第一类、第三类、第四类、第二类,表明我国第一产业农业所占比例的逐步降低,第二类产业工业建筑等行业和第三产业所占比例的逐步升高。同分三类的结果差不多。
上表是2个类的最终类中心,类中心数据分别是(46.3,21.4,29.
6),(23.5,45.4,31.
2,),38.6,33.8,27.
6),(32.2,44.9,22.
9)与初始据点的数据有差异,但总的不是很大,仍然是表明第一产业农业所占比例的减少和第二产业工业建筑类和第三类产业的增高发展。
画出(x1,date)图
由图可知,除了个别点,第一产业随着年份的增长逐步减少,与上面分析的一致。
画出(x2,x1)图
由图可知,除了个别点,第二产业随着第一产业的减少增加,也就是随着年份的增加逐步减少,与上面分析的一致。
1)用快速聚类法分为3类(质心聚类)
结果如下:上表是初始聚点。
用快速聚类法分3类的聚类结果为:(id)
第一类:9,10,12
第二类:1,2
第三类:3,4,5,6,7,8,11
上表是3个类的距离矩阵。
2)用法快速聚类法并采用绝对距离分为4类(即用lm距离进行快速聚类的方法,距离为minkowshi距离,m=1)
在操作过程中,选取。
分类结果如下:
第一类:1,2
第二类:3第三类:4,5,6,7,8,11
第四类:9,10,12
和快速聚类法相比只是将其第二类分割成了两类。
3)用类平均聚法聚类,并写出分3类结果(在操作过程中选取系统聚类的组内分析,平均euclidean距离)
分类结果如下:
第一类:1,2
第二类:3,4,5,6,7,8,11
第三类:9,10,12
树状图如上,和快速聚类法分成的三类一样,和采用据对距离分为4类相比,只是其第二类和第三类合并形成了用类平均法聚类的第二类(由图看出,3和4,5,6,7,8,11这一组的距离最近,所以将他们合并),其他基本不变。
聚类分析作业
已知每个农业小区域的气候取决于四个指标 热量 水分 霜冻 霜雹。假设现有五个农业小区域,其相应的指标数据如下表,运用模糊聚类的方法对其进行合理分类 解 由题目条件知变量指标均大于0,且没有量纲,数据之间具有一定的可比性,故不需进行预处理变换 直接用绝对值减数法建立模糊相似矩阵。公式为 c取适当值,使...
聚类分析参考作业
注意 1 作业可以交手写稿也可打印稿。2 下面的内容比较多,大家可以有选择性的复制粘贴,不要太雷同了,但是 第五步 的内容一定要有。3 手写的同学也可以参照聚类图2.4 这是我参照几个同学的作业整理而成的,有什么错误的地方请大家反应。第一步 将原始数据进行自然对数变换后 第二步 将自然对数数据标准差...
北航2019聚类分析大作业
应用数理统计。第二次课程 学号 姓名。2012年11月。目录。我国各省市城镇居民消费水平的聚类分析和判别分析 1 摘要 11.引言 2 1.1 研究背景 2 1.2 内容 方法和结论 2 2 解决问题的方法和计算结果 3 2.1 数据说明 3 2.2 聚类分析 3 2.3 判别分析 9 3讨论与总结...