数学建模之统计回归模型

发布 2023-05-18 06:03:28 阅读 4269

数学建模大作业。

统计回归模型。

摘要。某公司想用全行业的销售额作为自变量来**公司的销售额,题目给出了1977—1981此公司的销售额和行业销售额的分季度数据**。通过对所给数据的简单分析,我们可以看出:

此公司的销售额有随着行业销售额的增加而增加的趋势,为了更加精确的分析题目所给的数据,得出科学的结论,从而达到合理**的目的。我们使用时间序列分析法,参照课本统计回归模型例4,做出了如下的统计回归模型。

在问题一中,我们使用matlb数学软件,画出了数据的散点图,通过观察散点图,发现公司的销售额和行业销售额之间有很强的线性关系,于是我们用线性回归模型去拟合,发现有很好的拟合性。但是这种情况下,并没有考虑到数据的自相关性,所以我们做了下面几个问题的分析来对这个数学模型进行优化。

在问题二中,通过建立了公司销售额对全行业销售额的回归模型,并使用dw检测诊断随机误差项的自相关性。通过计算和查dw表比较后发现随即误差存在正自相关,也就是说前面的模型有一定的局限性,**结果存在一定的偏差,还有需要改进的地方。

在问题三中,因为在问题二中得出随即误差存在正自相关,为了消除随机误差的自相关性,我们建立了一个加入自相关后的回归模型。并对其作出了分析和验证,我们发现加入自相关后的回归模型更加合理。通过使用我们建立的模型对公司的销售额进行**,发现和实际的销售额很接近,也就是说模型效果还不错。

关键词:销售额、回归模型、自相关性。

一、问题提出。

某公司想用全行业的销售额作为自变量来**公司的销售额,下表给出了1977-2023年公司销售额和行业销售额的分季度数据(单位:百万元).

1) 画出数据的散点图,观察用线性回归模型拟合是否合适。

2) 监理公司销售额对全行业销售额的回归模型,并用dw检验诊断随机误差项的自相关性。

3) 建立消除了随机误差项自相关性后的回归模型。

二、基本假设。

假设一:模型中ε(对时间t)相互独立。

三、符号说明。

公司销售额:(百万)

行业销售额:(百万)

概念介绍:1.自相关:

自相关(auto correlation),又称序列相关(serial correlation)是指总体回归模型的随机误差项之间存在的相关关系。即不同观测点上的误差项彼此相关。

2.置信区间:如果p()=1-α,0.1或0.05,则称区间[a,b]为的置信度为1-α的置信区间。

3.时间序列:时间序列法是一种定量**方法,亦称简单外延方法。时间序列即按时间的推移或排布会对规律的变化有所影响。

四、问题分析。

问题一:表中的数据是以时间为顺序的。由于前期的销售额对后期的投资一般有明显的影响,从而对后期的后期的销售额造成影响。

因此在此模型中应考虑到存在自相关,我们可以先建立基本的回归模型,然后再进行自相关性诊断,并建立新的回归模型。

问题二:在问题一之后,就可以接着求出问题二,然后利用dw检验诊断随机误差项的自相关性。

问题三:进行了自相关诊断后,将自相关加入模型中,建立消除了随机误差项自相关性的回归模型。

五、模型的建立与求解。

5.1 问题一。

5.1.1 问题一的分析。

表中数据是以时间为序的,建立基本的回归模型。

5.1.2 问题一模型的建立。

基本回归模型:

设该公司第时间的公司销售额为,行业销售额为。为了大致分析和的关系,首先利用表中的数据作出对关系作出散点图,如下(见图中的“+”做散点图:

可以看出,随着行业销售额的增加,公司销售额增大,而且两者有很强的线性关系,图中的直线说明两者呈线性模型,因此本题用线性回归模型拟合非常合适。

5.2 问题二。

5.2.1 问题二的分析。

从问题一中的图形可以看出,随着行业销售额的增加,公司销售额增大,而且两者有很强的线性关系,图中的直线说明两者呈线性模型,因此可建立一元线性回归模型。

5.2.2 问题二模型的建立。

由题意建立一元线性回归模型。

模型(1)中除了行业销售额和公司销售额的影响外,影响的其他因素都包含在随机误差内,这里假设(对t相互独立)且服从均值为零的正态分布n(0, )

5.2.3 问题二模型的求解。

根据表中的数据。对模型(1)直接利用matlab统计工具箱求解(具体算法见附录),得到的回归系数估计值及置信区间(置信水平α=0.05)、检验统计量, ,的结果见下表:

将参数估计值代入(1)得到:

用matlab中rstool命令得到的交互式画面见图 (1) ,由此可以得出不同水平下的**值及其置信区间。通过左下方的export下拉式菜单。可以输出模型的统计结果。

图1自相关性诊断与处理方法从表面上来看得到的基本模型(2)拟合度(r)非常之高,接近你100%,应该很满意了,但是,这个模型并没有考虑到我们的数据是一个时间序列(将原表中的数据打乱不影响模型(2)的结果)。实际上对于时间序列数据做回归分析时,模型的随机误差有可能存在相关性,违背模型关于(对时间t)相互独立的基本假设,其他相关因素对公司销售额的影响肯能也有时间上的延续,包含在随机误差中,即随机误差会出现自相关性。

残差可以作为随机误差的估计值,画出的散点图,能够从直观上判断的自相关性。模型(2)的残差可在计算过程中得到表1,以及数据的图见图 2

表 1图 2

为了对ε的字相关性做定量的诊断,并在确诊后得到新的结果,我们考虑如下模型。

其中是自相关系数,||1,相互独立且服从均值为0的正态分布。

若=0,则退化为普通的回归模型;若》0,则随机误差存在正的自相关;若<0,则随机误差存在负的自相关。

利用d-w检验诊断自相关现象如下:

利用matlab算出:

dw=0.7388 =0.6306

具体程序见附录)

因为dw≈2(1-),所以 0≤dw≤4,若的估计值在0附近,则dw的值在2附近,的自相关行很弱,若在正负1附近,则dw接近0或4,的自相关性很强。

5.2.4 问题二结果的分析及验证。

要根据dw的具体数值确定是否存在自相关,查d-w分布表,可以得到检验的临界值和,然后根据区间来确定。

利用表1给出的残差,根据以上式子可得出dw=0.7388,对于显著性水平α=0.05,n=20,k=2,查d-w分布表,得到检验的临界值=1.

2和=1.4 .现在dw<,因此可以认为随即误差存在正自相关,而且可得出=0.

6306。

5.3 问题三。

5.3.1 问题三的分析。

数学建模之统计回归模型

数学建模大作业。统计回归模型。摘要。某公司想用全行业的销售额作为自变量来 公司的销售额,题目给出了1977 1981此公司的销售额和行业销售额的分季度数据 通过对所给数据的简单分析,我们可以看出 此公司的销售额有随着行业销售额的增加而增加的趋势,为了更加精确的分析题目所给的数据,得出科学的结论,从而...

数学建模统计回归模型

第6组 潘光松,刘博,杜晶。习题10 6 问题 某公司想用全行业的销售额作为自变量来 公司的销售量,表中给出了1977 1981年公司的销售额和行业销售额的分季度数据 单位 百万元 1 画出数据的散点图,观察用线性回归模型拟合是否合适。2 建立公司销售额对全行业的回归模型,并用dw检验诊断随机误差项...

数学建模2统计模型

数学建模。题目 一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物试验,给患有同种疾病的病人使用这种新止痛剂的以下4个剂量中的某一个 2 g,5 g,7 g和10 g,并记录每个病人病痛明显减轻的时间 以分钟计 为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按...