1 1 回归分析的基本思想及其初步应用 学案

发布 2022-10-27 03:16:28 阅读 5737

1.1 回归分析的基本思想及其初步应用。

自学导引。1.回归分析。

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

2.线性回归模型。

1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数y=bx+a描述它们之间的关系,因此用线性回归模型y=bx+a+e来表示,其中a、b为未知参数,e为随机误差.

2)对参数a和b的估计,由《数学必修3》可知:最小二乘法估计和就是未知参数a、b的最好估计,其计算公式为。

其中(,)称为样本点的中心.

例1 从某大学中随机选取8名女大学生,其身高/cm和体重/kg数据如下表所示:

问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。

解:由于问题中要求根据身高预报体重,因此选为自变量x, 为因变量。

1)做散点图:

从散点图可以看出和有比较好的相关关系。

所以。于是得到回归直线的方程为。

3)身高为172cm的女大学生,由回归方程可以预报其体重为 kg。

问题:1、身高为172cm的女大学生,体重一定是上述预报值吗?

2、随机误差的概念是什么和产生随机误差的主要原因是什么?

线性回归模型与一次函数模型的不同之处是增加了随机误差项e,因变量y由自变量x和随机误差e共同确定,即自变量x只解释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量。

试一试:下表是x和y之间的一组数据,则y关于x的线性回归方程必过( )

a.点(2,3b.点(1.5,4)

c.点(2.5,4d.点(2.5,5)

3.刻画回归效果的方式。

想一想:回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?

提示不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.

4.非线性回归分析。

1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近.我们就称这两个变量之间不具有线性相关关系而是非线性相关关系.

2)非线性回归方程线性化。

名师点睛】1.线性回归方程。

1)在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.

2)求线性回归方程=x+的关键是求未知参数和,其中可借助于计算器求出,因为=-,即=+,所以点(,)一定满足线性回归方程,即回归直线一定过点(,)

3)求线性回归方程的步骤:

计算出,,x+x+…+x,x1y1+x2y2+…+xnyn的值;

计算未知参数,;

写出线性回归方程=x+.

2.线性回归分析。

1)由线性回归方程给出的是一个预报值而非精确值。

2)随机误差的主要**:

线性回归模型与真实情况引起的误差;

省略了一些因素的影响产生的误差;

观测与计算产生的误差.

3)残差分析是回归分析的一种方法。

4)用相关指数r2来刻画回归效果。

r2越大,意味着残差平方和越小,即模型的拟合效果越好;r2越小,残差平方和越大,即模型的拟合效果越差.

3.建立回归模型的基本步骤。

1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.

2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存**性关系等)。

3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)。

4)按一定规则(如最小二乘法)估计回归方程中的参数。

5)得出结果后分析残差图是否有异常(如个别数据对应残差过大或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等。

题型一线性回归分析。

例1】 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:

1)作出散点图并求线性回归方程;

2)求出r2;

3)进行残差分析。

答案】(1)散点图如图

(5+10+15+20+25+30)=17.5,=(7.25+8.

12+8.95+9.90+10.

9+11.8)≈9.487,2 275, 1 076.

2,计算得,≈0.183,≈6.285,所求回归直线方程为=0.

183x+6.285.

2)列表如下:

所以(yi-i)2≈0.013 18, (yi-)2=14.678 4.

所以,r2=1-≈0.999 1,回归模型的拟合效果较好。

3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.

规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面.

变式1】 已知某种商品的**x(元)与需求量y(件)之间的关系有如下一组数据:

求y对x的回归直线方程,并说明回归模型拟合效果的好坏。

答案】=(14+16+18+20+22)=18,=(12+10+7+5+3)=7.4,142+162+182+202+222=1 660, 14×12+16×10+18×7+20×5+22×

620,所以==-1.15,=7.4+1.15×18=28.1,所以所求回归直线方程是:=-1.15x+28.1.

列出残差表:

所以, (yi-i)2=0.3, (yi-)2=53.2,r2=1-≈0.994,所以回归模型的拟合效果很好。

题型二非线性回归分析。

例2】 下表为收集到的一组数据:

1)作出x与y的散点图,并猜测x与y之间的关系;

2)建立x与y的关系,预报回归模型并计算残差;

3)利用所得模型,预报x=40时y的值。

审题指导 (1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关.由散点图得x、y之间的回归模型.

2) 进行拟合,预报回归模型,求回归方程。

答案】 (1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1、c2为待定的参数.

2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:

求得回归直线方程为=0.272x-3.849,∴=e0.272x-3.849

残差。3) 当x=40时,y=e0.272x-3.849≈1 131

题后反思】 解决非线性回归问题的方法及步骤。

1)确定变量:确定解释变量为x,预报变量为y;

2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;

3)变量置换:通过变量置换把非线性问题转化为线性回归问题;

4)分析拟合效果:通过计算相关指数等来判断拟合效果;

5)写出非线性回归方程.

误区警示对相关指数r2理解不当致误。

示例】 关于x与y有如下数据:

为了对x、y两个变量进行统计分析,现有以下两种线性模型:甲模型=6.5x+17.5,乙模型=7x+17,试比较哪一个模型拟合的效果更好?

错解] ∵r=1-=1-=

又∵84.5%>82%,∴乙选用的模型拟合的效果更好。

用相关指数r2来比较模型的拟合效果,r2越大,模型的拟合效果越好,并不是r2越小拟合效果更好.

11回归分析的基本思想及其初步应用作业 2

1.1回归分析的基本思想及其初步应用作业 2 姓名班级学号 一 选择题 1 在回归直线方程。a 当,的平均值b 当变动一个单位时,的实际变动量。c 当变动一个单位时,的平均变动量 d 当变动一个单位时,的平均变动量。2 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是。a 总偏差平方和 ...

1回归分析的基本思想及其初步应用

新课标数学选修1 2 1 1回归分析的基本思想及其初步应用。教师用书独具 三维目标。1 知识与技能。通过典型案例的 了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题 了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的...

1 1回归分析的基本思想及其初步应用

1.1.1回归分析的基本思想及其初步应用。主备 霍海伟主审 王伟。重点 1 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤 了解线性回归模型与函数模型的区别 2 尝试做散点图,求回归直线方程 一 基础知识梳理。回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个...