多元统计课程设计

发布 2022-10-01 14:01:28 阅读 2737

目录。摘要 21.利用主成分分析对我国某省物流产业发展的综合评价 3

1.1 理论依据: 3

1.1.1 主成分分析基本概念 3

1.1.2 主成分分析的使用方法 3

1.1.3系数决定原则 4

1.1.4主成分分析的原理 4

1.2 问题描述: 4

1.3 问题分析: 5

1.3.1数据选取 5

1.3.2指标** 5

1.4求解计算: 6

1.4.1数据处理 6

1.4.2结果分析 7

1.5 结论 8

1.5.1结果论述 8

1.5.2感悟与心得 8

参考文献】 8

本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,对我国某省沿江地区20个地市的物流发展现状进行了综合评价。首先提出主成分分析的相关理论依据,根据该理论基础提出本次课程设计的问题,利用提出的理论对问题进行分析;其次利用问题的分析所得出的结果,对该问题进行求解计算,利用spss软件编写程序,得出结果;最后写出相关结论并总结本次课程设计的感悟和心得。

关键词】主成分分析物流产业综合评价。

主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵:

如何从这么多变量的数据中抓住主要的变量指标呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。

那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。

如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为x1,x2,…,zm(m≤p)。则。

在(2)式中,系数lij由下列原则来决定:

1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;

2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。

这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。

从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。

主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。

基本步骤为:确定分析变量,收集数据;原始数据的标准化处理;由标准数据求协方差矩阵;求r的特征值、特征向量和主成分的方差贡献率;提取主成分;求主成分分值,计算综合分值。

针对我国某省物流产业发展的状况,利用主成分分析的方法和该省沿江地区主要指标的一些数据,对该省物流发展进行综合评价。

根据上文主成分分析的基本原理,本文以我国某省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第。

一、第二、第三产业的产值”作为产业结构的影响因素。具体选择的指标为:地区生产总值x1、第一产业产值x2、第二产业产值x3、第三产业产值x4、公路里程x5以及车辆拥有量x6等。

其中,三大产业不仅考虑了区域经济总量,还考虑了该省经济结构对物流需求规模影响。(具体的原始数据见表1所示,其中20个区分别用1区、2区、3区…19区、20区表示)

表1 2023年该省沿江地区主要指标。

数据**:该省统计年鉴2010

对原始数据进行标准化处理。计算特征值、方差贡献率以及各指标的相关系数矩阵。利用spss软件对标准处理的数据进行处理。

特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合得分如表4所示。

表2 方差分析表。

提取方法:主成分分析法。

表3各指标相关系数矩阵的特征量。

表4综合排序。

提取主成分。如表2所示,提取前2个特征值的主成分,这两个主成分的累计方差贡献率达到98.26%,表明提取的前2个主成分可以基本反映全部6个指标所具有的信息,能在一定程度上说明区域物流产业发展的综合因素。

笔者利用sas9.1.3统计软件进行数据的处理,得出相关系数矩阵的特征值(见表3),进而得到主成分的表达式可以表述为:

prin1=0.419061x1+0.381547x2+0.399822x3+0.423129x4+0.400101x5+0.424067x6

prin2=-0.312072x1+0.631509x2-0.489653x3-0.176339x4+ 0.477188x5 -0.072414x6

对原始数据进行标准化处理计算出各地区的综合得分(见表4),负分值不表示物流产业发展的能力差,评价分值只是反映了物流产业发展能力的相对强弱。

从表4的综合排名可以看出,得分为正值的地区只有5个,得分为负值的市有15个,这信息说明该省的物流产业发展目前不容乐观,并且地区之间的发展不平衡,易形成两极分化的局势。

实践证明,经济越发达地区对物流的需求规模越大,经济增长对物流需求有很大促进作用,这点从模型结果也得到验证。因此,要想加快该省物流产业的发展必须加快经济的发展,并且要制定相应的刺激消费的政策,提高最终消费支出加快产业结构的转换,构建合理的产业结构加快物流产业基础设施建设,完善物流发展平台加强**对物流业发展的规划,制定人才开发战略,采取这些措施可以促进该省物流产业发展。

统计课程设计材料

工程管理0903班。调查人 刘红 59 肖亚 60 王荪凯 82 李欣荣 80 宋宇鹏 71 杨玉清 73 徐亮 72 辛东儒 70 王亚辛 78 二 一一年十二月。目录 2一 前言 3 二 调查方案设计 4 一 调查目的 4 二 调查范围和对象 4 三 调查时间 4 四 调查内容 4 五 调查人员...

统计计算课程设计作业

班级 数学121班。姓名 林孝涛。学号 1920125079 2015年1月13日星期二。作业一。必做题一。步骤 1.打开word文件和 准备填入数据。2.首先填序号列,这时候要注意单元格的格式,所以设置单元格,要设置成文本格式如图。3.填入001,然后下拉自动填充序列 4.紧接着填第二列 书名。4...

统计计算课程设计作业

报告书。实验一 统计学中有关概念。1 基本要求 了解统计学中常用的一些基本概念,重点掌握几个集中指标和变异指标。2 完成时间 2012 06 11 3 实验内容 2 根据下表求平均数 区域 四分位数 平均绝对离差 标准差 方差。操作过程 1 建立excel,把问题中的数据输入,下面计算所求值。2 在...