数学建模作业

发布 2020-04-15 13:30:28 阅读 7363

一、摘要。

本文根据所给出的数据,运用excel软件并采用数据分析法,制定了一个具体可行的调整方案(其可靠性为95%)。首先,本文对题中的12组数据,进行相关性分析,求出各观测站所测的年平均降雨量间的相关系数,找出满足的观测站组合。其次,对这些组合进行一元线性回归,得到一元回归模型,并作f检验。

经过检验进行优化选择,可先去掉5,9,11三个观测站。通过对一元线性回归模型分析知,观测站8的年平均降雨量可由观测站6**得到。因此在满足足够大的信息量下,本模型可减少5,8,9,11四个观测站,而他们的信息均可由6观测站来**,可靠性为95%。

由于降雨量具有随机性,为更精确**该地区未来十年的年平均降雨量,本文利用精简后的数据建立时间序列模型。对原数据列进行一阶差分处理,得到稳定的新时间序列。分析新时间序列的自相关函数与偏自相关函数图像,然后采用自相关函数和偏相关函数检验法对模型进行识别,确定使用arma(1,1)模型。

借助于spss软件对数据进行处理,并对理论结果进行白噪声检验,结果表明arma(1,1)具有可靠性与实用性。

关键字:相关性分析数据分析一元线性回归时间序列自相关函数 arma(1,1)模型白噪声检验。

二、问题重述。

问题一:某地区内有12个气象观测站,根据27年来各观测站测得的年降雨量(见附表1),由于经费问题, 有关单位拟减少气象站数目以节约开支, 但又希望还能够尽量多地获取该地区的降水量信息。现要求设计一个方案:

尽量减少观测站,而所得到的年降水量的信息量仍足够大。

问题二:为研究该地区的降雨量特点,需要对该地区未来十年的降雨量进行**分析。

三、模型假设。

1.该地区的地理特征具有一定的均匀性,而不是表现为复杂多变的地理特征。

2.不考虑其它区域及天气对本地区降雨量的影响。

3.该市的气候特征较稳定,不出现较大的自然灾害,27年的统计数据能够全面地反映该市的气候特征;

4.该市的气候不会因环境的变化而发生较大的变化;

四、符号说明。

为任意两个观测站间的相关系数。

为自由度n-p-1的t分布双侧临界值。

为欲**值。

为元回归数。

为剩余标准差。

)为平稳时间序列。

x表示原始序列。

y表示一阶差分序列。

白噪声序列方差。

五、问题分析。

5.1 问题一的分析。

本案例实质上是个典型的**问题,即用较少的测站来**12个站的年降水量,本模型的基本思想是:如果某一观测站的年降水量可用其它观测站的年降水量来线性回归的话,就可删去这一观测站。

在删除的过程中必须遵循两个原则:①**性相关的组合中,尽可能地留下可利用度大的观测站;②留下的观测站可用线性回归模型来**减掉的观测站的年降水量。

5.2 问题二的分析

自然现象受自然界各种因素如气候、环境以及人为活动影响,其变化规律极其复杂,如水文现象中的雨量,对其用物理的方法加以分析,往往因其影响因素未全面了解而导致分析模型的复杂和效果不理想。在实际中,常用统计模型来模拟,本文即讨论了用时间序列方法。

某地区观测站年平均降雨量序列加以分析,并对精简后的观测站未来十年的年平均降雨量进行**。

六、模型的建立与求解。

6.1 精简模型的建立与求解。

6.1.1相关性分析[1]

为研究这12个观测站之间是否存在明显的相关性,现利用附表1中的27组数据进行分析。利用软件spss 17.0对这12个观测站测得的数据进行相关性分析,结果如下表所示:

表1: 12个观测站之间的相关系数表。

根据95%的可信度,查“检验相关系数ρ=0的临界()表[1]”,可得, 从表1可查得,的观测站组合:, 说明了这四个组合的线性相关性是显著的。

6.1.2 一元线性回归模型。

由表一知,观测站5与6,5与8,6与9,6与11之间分别具有显著的线性关系,接下来本文利用excel软件对其进行线性回归分析并进行f检验。经回归分析,结果如下:

观测站5与6的线性回归模型为:

或1)方差分析[2]

由上表知,所以这个线性回归模型可用。

利用上述方法可得:

观测站5与8的线性回归模型为:

观测站6与9的线性回归模型为:

观测站6与11的线性回归模型为:

上述四个线性回归模型均可用,所以可删除三个观测站的方法有2种方法。

由(1)(2)联立可得:

到观测站8的年平均降雨量,故观测站8可去掉。

从表(2)的数据可知,一些较接近于0.381,如: ,这时可利用上述一元回归方法,来确定是否可再减少一些站点。方差分析的结果由下表所示:

表2:观测站3与7的方差分析结果。

表3:观测站9与11的方差分析结果。

由表2和表3可知,观测站3与7,9与11这两组不能进行一元线性回归**,故不能再进行减少站点。

所以综上所得,可采用减少5,8,9,11四个观测站的方案,但年降水量的信息量仍足够大,而减少的观测站的信息由以下线性方程测知:

6.1.3误差分析。

因本案例是在95%的可靠性下进行的数据分析,对**结果必然存在误差。接着对误差进行分析,被预值y0的95%置信区间为。

其中,为自由度n-p-1的t分布双侧临界值(由表可查)。为欲**值,n=10,为元回归数。为剩余标准差。,

可得误差示意图如下:yx

从上式易知,当离愈远,则估计的误差愈大。形成以为中心的喇叭口形。

由于影响降水量的因素很多,如地形,地理位置等,因而在这些因数未知下,误差较大。若增加调查数据,可提高**的精确度。

6.1.4模型的评价。

1.本模型完全运用统计的数据分析法,采用线性回归,利用一元线性回归分析的方法,制定一个较具体适用的调整方案,本模型简单易懂,层次清晰,且可用于其它领域的数据处理,如实验、调查数据整理。具有灵活性和适用性。

2.在没有计算机运算的情况下,人工运算量较大,故还有待于改进。在实际运用中,可根据需要的精确度,来改进模型,从而达到要求。

3. 实际上, 任何一个气象观测站的建立与否, 除了能单独地提供降水量的信息外, 还应考虑各观测站的合理布设、各观测站的控制作用、各观测站的代表性以及周围环境的优劣性等因素。因以上因素在此问题中皆没有明确给出,故该模型仅能单独进行数据处理。

4. 在本文系列中, 作为一个样本27年数据略嫌不足, 理应提供更充足的数据, 才能在节约经费开支的同时也保证信息的精度。

6.2 **模型的建立。

6.2.1 时间序列的概念[3]

某个随另一个变量的变化而变化的量,在处的实测值组成的离散有序集合,称为一个时间序列,记作。一般情况下,时间序列可以分解为反映趋势变化的趋势项,反映周期变化的周期项和随机项三部分组成,根据趋势项、周期项的不同情况,可将序列分为平稳的和非平稳的:当和为常数时,则称()为平稳时间序列;当及不全为常数时,则称其取样值为非平稳时间序列。

6.2.2时间序列模型分类及识别。

对于平稳的的时间序列,其观测值可描述为一个线性差分模型:

其中,和为参数,是白噪声序列。

对公式(3)根据,及,不同取值,可分为三类随机模型:自回归模型、滑动平均模型、自回归—滑动平均模型。对时间序列的模型识别,可采用自相关函数与偏相关函数检验法。

对于平稳序列采样值,对其作零均值化处理,即取离差:

的协方差公式:

自相关函数的计算公式:

其中4)将(4)求出的带入以下递推公式计算偏相关函数:

计算出的自相关函数与偏相关函数,根据其拖尾性和截尾性可初步判断属于哪一类模型,当、均小于的频率大于等于95%,称其为截尾性,否则,随增大,或趋于0,则称其具有拖尾性。对于模型和模型,可以依据有截尾性的函数中有与值接近的序号,确定阶数的或,对于模型,可依据与签署接近的显著值的个数初步确定其阶数。在实际应用中,模型的阶数一般比较低。

时间序列阶数的识别,有较大的灵活性,但要接受住实际的验证。时间数列的三类随机模型,其自相关函数与偏自相关函数的特性如下表所示:

表4:三类随机模型的自相关函数与偏相关函数特性表。

6.2.3 arma模型的说明与参数估计。

6.2.3.1 arma模型的说明[4]

armr模型由三个过程组成:自回归过程(ar(p)),单整(i(d)),移动平均过程(ma(q))。ar(p)即自回归过程,是指一个过程的一个当前值与过去值的线性函数。

如:如果当前观测值仅与上期(滞后一期)的观测值有显著的线性函数关系,则我们就说这是一阶自回归过程,记作ar(1)。推广之,如果当前值与滞后p期的都有线性关系则称p阶自回归过程,记作ar(p)。

ma(q),即移动平均过程,是指模型值可以表示为过去残差项(即过去的模型拟合值与过去观测值的差)的线性函数。如:ma(1)过程,说明时间序列受到滞后一期残差项的影响。

推广之,ma(q)是指时间序列受到滞后q期的残差项的影响。单整,是指将一个非平稳时间序列转化为平稳序列所要进行差分的次数。意义在于使非平稳序列转化为平稳序列,实现短期的均衡。

数学建模作业

1992年全国数学建模a题数据分析。对土豆和生菜,分别建立施肥量和产量之间的多元关系,运用excel和matlab软件依次采用散点法和拟合关系进行绘图显示。在确认模型具有完美的基础上,进行线性相关 交互作用 最佳响应水平 强影响变量等的分析。同时,将两种作物进行比较,得出一系列颇有实用价值的结论。分...

数学建模作业

数学建模作业 第二章。微分方程稳定性分析。1 由解得平衡点,特征值,是不稳定点。matlab作图程序 x 5 0.1 5 fora 5 0.1 5 y a x plot x,y hold on endxlabel x ylabel y 得到图形 2 由解得平衡点,特征值,是不稳定点。matlab作图...

数学建模作业

1.试说明下面的数学规划 mp 是一个凸规划。解 1 目标函数。一阶顺序主子式为,行列式为 二阶顺序主子式为,行列式为 三阶顺序主子式为,行列式为。hessian矩阵正定,目标函数是凸函数。2 约束条件。一阶顺序主子式为,行列式为 二阶顺序主子式为,行列式为 三阶顺序主子式为,行列式为。hessia...