spss小组作业

发布 2022-06-27 15:14:28 阅读 2304

我国各省、市、自治区城镇居民月平均消费性支出的主成分分析。

我国地域广阔,各省份的经济发展很不平衡,城镇间居民的月平均消费性支出(由表1 中的x1,……x8这八个指标来描述)存在着较大的差异, 而且由于多种因素的影响, 这种差异呈现加速扩大的态势。如何客观、 准确、 有效地分析这些差异,具有重要的理论和实践意义。消费性支出的衡量指标有许多,如果直接用这些指标来分析各省份的差异,那么分析的结果很可能是繁杂或片面的,很难给出直观、准确而有效的结论。

如果仅用消费性总支出这个指标, 则显得太笼统,会丢失许多有用的信息,不能充分地反映各省份之间的消费差异。那么, 寻求一个既能使得所作的分析研究不繁杂,又不会损失太多有用信息的方法,正是本文所要解决的问题。

本文运用多元统计分析中的主成分分析方法,将描述各省份城镇居民月平均消费性支出的八个指标压缩成两个综合指标( 称为主成分) ,这两个主成分保留了原始八个指标的绝大部分信息,在指标压缩的同时能够最大限度地反映出各省份城镇居民月平均消费性支出的差异。本文给出了这两个主成分的符合实际意义的解释, 并用它们来描述分析各地区城镇居民消费性支出的主要差异。

(一) 样本数据选择。

本文选择的样本数据来自于中国统计年鉴( 2005) 提供的全国 31 个省、 直辖市和自治区(港、 澳、 台不在其中)的城镇居民每人月平均消费性支出的9 项主要指标(单位:元) ,指标**和指标名称列于表1,原始数据列于表2。

表一。表二原始数据。

二) 方法研究。

为了达到对x1, …x8 这八个指标的降维目的, 我们可以使用多元统计分析中的主成分分析法。主成分分析是一种通过降维技术把多个指标约化为少数几个综合指标的统计分析方法,这些称为主成分的综合指标能够反映出原始指标的绝大部分信息。利用它们可进行简洁、 有效的分析研究,甚至还可借助于图形作直观的分析。

表三 表三是8个原始变量之间的相关系数矩阵,可见许多变量之间直接的相关性比较强,在信息上存在重叠。

表四。表四给出的是各成分的方差贡献率和累计贡献率,由表四可知,只有前2个特征根大于1,因此只取前面两个主成分。第一主成分的方差占所有主成分方差的52.

58%,已超过一半,前两个主成分的累计贡献已达69.95%, 因此选前两个主成分,它们能很好概括x1 ,…x8 这八个指标。

表五。由bartlett检验可以看出,变量间具有较强的相关性,但是kmo统计量为0.644,小于0.

7.说明各变量间信息的重叠程度可能不是特别的高,有可能做出的因子分析模型不是很完善,但还是值得尝试的。

表六。变量共同度communalities是表示各变量中所含原始信息能被提取的公因子所表示的程度,由此表所表示的变量共同度可知:所有的变量共同度都在100%,因此提取的这几个公因子对各变量的解释能力很强。

图一。碎石图用于显示各因子的重要程度,其横轴为因子序号,纵轴表示特征根大小。它将因子特征根从大到小依次排列,从中可以非常直观的了解到哪些是最主要的因子。

前面陡峭的对应较大的特征根,作用明显;后面的平台对应较小的特征根,其影响不明显。图一中可见前两个因子的散点位于陡坡上,而后六个因子散点形成了平台,且特征根均小于1,因此至多考虑前两个公因子即可。

表七。前两个主成分可分别表述为:

y1=0.013zx1-0.125zx2-0.130zx3+1.188zx4-0.379zx5-0.163zx6-0.042zx7+0.416zx8

y2=-0.403zx1-0.336zx2+0.459zx3-0.108zx4-0.541zx5+1.827zx6+0.285zx7-0.579zx8

表八。表八把31个省份分别按第一主成分和第二主成分得分从小到大重新排序后的结果。从此表可以看出,东部地区的第一主成分得分普遍较高,中部地区一般,而西部地区则普遍较低。

表九。从此表可见,南方地区第二主成分得分普遍较高,而北方地区则普遍较低,这是由于南方地区人口分布密集,用于日杂用品的消费比重相对较高,而北方地区则相反。

图二。从散点图可以看出,上海、天津和北京在最右边,城镇居民月平均消费性支出是最高的,其次是浙江和广东,湖北在散点图的最左边,表明城镇居民月平均消费性支出是最低的;

当前我国国民经济运行的主要问题之一是需求不足,消费需求是整个总需求的一个重要方面。上述分析表明, 我国的消费需求呈现出极大的地区不平衡性。这说明,我国当前消费需求不足,就区域而言,是一种地区性需求不足,沪、津、京和浙已经具有较高的消费需求,赣、 豫、 黑、 蒙、 黔等省、 区是我国消费需求不足的地区,这些地区消费还有很大的提升空间。

如何扩大这些地区的消费需求,刺激这些地区的消费增长,应是当前宏观调控的重要内容。

SPSS作业

p.117第10题。把数据列入spss中为。得出两因素完全随机有重复观察值资料。glm 单变量方差分析 lgda为因变量,a b为固定变量 效应模型设定 a主效应 b主效应 a b互作效应 两两比较。方差分析得出 a因素各水平间 b因素各水平间及a b互作的sig均小于0.01,所以认为均存在极显著...

SPSS作业

常用统计软件spss实验报告。学院 动物科技学院。班级 水产1401班姓名 学号 实验一 t检验 非配对样本的检验。一 实验目的 1 学会应用spss软件进行数据整理和分析。2 能够应用spss软件对相关数据做出方差分析。3 掌握spss软件功能及正确分析实验结果的能力。二 实验内容 实验二 t检验...

spss作业

成都体育学院。2010年攻读硕士学位研究生考试试卷。学号 2010100019 专业体育人文社会学 考试科目体育统计与spss软件应用 任课教师郭新艳 考生姓名沈雨婷 考试时间2010.12.2 一 答 1 统计资料分为三类 计量资料 计数资料 等级资料。2 统计处理方法 计量资料。对这类资料通常先...