衡阳师范学院数学与计算科学系。
学生实验报告。
实验课程名称数学建模(2
系别: 数计系年级: 2012 专业和班级:数学 2 班。
学生姓名。学号。
开课时间: 2014 年下学期。
2014-10-23 星期四。
1、 请利用互联网获取2024年我国某省及直辖市各地区的城市居民家庭人均收入和支出数据。收入和支出支出数据要包含下面指标:
收入指标:工薪,经营,财产,转移。
支出指标:食品,衣着,居住,家庭设备用品,交通和通信,文教娱乐用品及服务,医疗和保健,杂项和服务,社会保障,其他。
2、 对上述指标作典型相关分析:(包括计算相关系数,求典型变量,典型相关系数的显著性检验,典型变量的信息解释能力,典型变量得分,典型冗余分析等)。
表一和表二分别是来自《2012中国统计年鉴》我国各省及直辖市各地区的城市居民家庭人均收入及支出数据,其中人均收入指标包括工薪性收入,经营性收入,财产性收入,转移性收入。人均支出指标包括人均食品消费支出、人均衣着消费支出、人均居住消费支出、人均家庭设备用品消费支出、人均交通和通信消费支出、人均文教娱乐消费支出、人均医疗保健消费支出、人均杂项和服务消费支出。
表一我国各省及直辖市各地区的城市居民家庭人均收入。
表二我国各省及直辖市各地区的城市居民家庭人均支出。
典型相关分析是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。为了用比较少的变量来反映两组变量之间的相关关系,考虑两组变量的线性组合,从这两个线性组合中找出最相关的综合变量,通过少数几个综合变量来反映两组变量的相关性质,这样便引出了典型相关分析。它的基本思想是首先在每组变量中找出变量的线性组合,使其分别与第一对线性组合不相关,而第二对本身具有最大的相关性,如此继续下去,直到两组变量之间的相关性被提取完毕为止。
有了这样线性组合的最大相关,则讨论两组变量之间的相关,就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数。
设有两组随机变量,,分别为维和维随机变量,根据典型相关分析的思想,我们用和的线性组合和之间的相关性来研究两组随机变量和之间的相关性。我们希望找到和,使得最大。由相关系数的定义。
易得出对任意常数,,,均有。
这说明使得相关系数最大的,并不唯一。因此,为避免不必要的结果重复,我们在求综合变量是常常限定。
于是,我们就有了下面的定义:设有两组随机变量:,维随机向量的均值向量为零,协方差阵(不妨设)。
如果存在和,使得在约束条件。
下: 则称是,的典型相关变量,它们之间的相关系数称为典型相关系数;
其他典型相关系数定义如下:定义了前对典型相关变量之后,第对典型相关变量定义为:如果存在和,使得。
1)和前面的对典型相关变量都不相关;
3)和的相关系数最大。
则称和是,的第对典型相关变量,它们之间的相关系数称为第个典型相关系数。
下面对上述指标作典型相关分析:
分别将工薪性收入,经营性收入,财产性收入,转移性收入设为。分别将人均食品消费支出、人均衣着消费支出、人均居住消费支出、人均家庭设备用品消费支出、人均交通和通信消费支出、人均文教娱乐消费支出、人均医疗保健消费支出、人均杂项和服务消费支出设为。首先计算上述指标的相关系数矩阵。
计算相关系数矩阵的matlab程序**为:
x=xlsread('shumo4')
a=zscore(x)%将原始数据标准化。
r=corr(a)%输出相关系数矩阵。
得出相关系数矩阵r为:
其中,第一组变量的相关系数矩阵为:
第二组变量的相关系数矩阵为:
两组变量的相关系数矩阵为:
第对典型相关变量为:
其中;称和为(第对)典型变量系数或典型权重。
记第一对典型相关变量间的典型相关系数为:
使u1与v1间最大相关);
第二对典型相关变量间的典型相关系数为:
与u1、v1无关;使u2与v2间最大相关)…
第对典型相关变量间的典型相关系数为:
与u1,v1,…,um–1,vm–1无关;um与vm间最大相关)
下面求解典型相关系数:
首先求矩阵。
且a、b有相同的非零特征值;
求a或b的特征值与,a或b的特征值即为典型相关系数的平方:
4) 求a、b关于的特征向量。设为a关于的特征向量,为b关于的特征向量,则和为(第i对)典型变量系数。即第i对典型相关变量:
其中,,为原变量组的标准化。
求解相关系数的matlab程序为:
r=xlsread('shumo4');
a=zscore(r);
r=cov(a)
p=4;q=8;n=12;%p,q为x,y的列数,n为行数。
r11=r(1:p,1:p);r12=r(1:p,p+1:p+q);r22=r(p+1:p+q,p+1:p+q);r21=r(p+1:p+q,1:p);
v1,d1]=eig(r11),v2,d2]=eig(r22)
p1=inv(v1*sqrt(d1)*v1');
p2=inv(v2*sqrt(d2)*v2');
t1=p1*r12*inv(r22)*r21*p1;
t2=p2*r21*inv(r11)*r12*p2;
va,da]=eig(t1),[vb,db]=eig(t2),a1=p1*va,b1=p2*vb,r=sqrt(sum(da))
得出相关系数为:0.9815,0.4438,0.6891,0.8218。
典型相关系数的显著性检验的步骤为:
设总体x,y的各对典型相关系数为首先提出检验原假设与备择假设。
若不能拒绝原假设,则= =0,此时不能做典型相关分析;若拒绝,继续如下检验。
若不能拒绝,表明只有第一对典型变量显著相关外,其余变量均不显著,实际应用只需考虑第一对典型变量;若拒绝,则需检验是否为零,以此类推,若假设k-1=0被拒绝,则检验。
若不能拒绝,则只需考虑前k-1对典型相关变量,否则继续检验,直至检验是否为零。
在总体服从维正态分布条件下,可用如下的似然比统计量进行检验。
对于给定的,计算概率。
若,即认为第k对典型变量显著相关。上述检验依次对k=1,2,…,p进行,若对某个k检验概率首次大于 ,则检验停止,即认为只有前k-1对典型变量显著相关。
典型变量得分步骤:
由第一组典型相关方程可知,收入的主要因素是,说明收入中影响支出的主要因素是经营,财产,转移;居民支出的第一典型变量与呈高度相关,说明在支出指标中,食品,交通和通信,文教娱乐用品及服务占主导地位。根据第二组典型变量的相关方程,转移是收入指标的主要因素,而医疗和保健是反映居民支出的一个重要指标。
典型冗余分析与解释能力:
典型相关系数的平方的实际意义是一对典型变量之间的共享方差在两个典型变量各自方差中的比例。典型冗余分析用来表示各典型变量对原始变量组整体的变差解释程度,分为组内变差解释和组间变差解释,典型冗余分析的结果为:表三
建模二作业二
衡阳师范学院数学与计算科学系。学生实验报告。实验课程名称数学建模 2 系别 数计系年级 2012 专业和班级 数学 2 班。学生姓名。学号。开课时间 2014 年下学期。2014 09 25 星期四。1 下面 是某高校15个学院09级同一生源地新生的数学成绩抽样数据。1 将各个学院新生的数学成绩合并...
数学建模作业 四
2013年4月16日。调查包装类似但多少不同的三种同一商品各两组,组建模型描述包装与 的关系。假设 10.不考虑利润及其他因素对商品 的影响。20.包装只计装包工时和包装材料。30.不同规格的商品装包时工作效率相同。40.不同规格的商品包装外观相似,包装材料相似,至少在 上没有太大的差异。参量与变量...
数学建模作业 二
一头重量是100kg的猪,在上一周每天增重约2kg。五天前售价为7.5元 kg,但现在猪价下降到7.2元 kg,饲料每天需花费7.1元。前期投入约500元。现在改变饲养方式,每天的饲养花费为9元,会使猪按3.5kg 日增重。那么是否值得改变饲养方式?求出使饲养方式值得改变的最小的增重率。1.前,猪每...