课时作业1回归分析的基本思想及其初步应用

发布 2022-10-27 03:13:28 阅读 8110

课时作业1 回归分析的基本思想及其初步应用。

a组基础巩固。

一、选择题。

1.在对两个变量x,y进行线性回归分析时,有下列步骤:

对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图。

如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )

ab.③②cd.②⑤

解析对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图。观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④故选d。

答案 d2.有下列说法:

在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②r2来刻画回归的效果,r2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好。

其中正确命题的个数是( )

a.0 b.1

c.2 d.3

解析 ①选用的模型是否合适与残差点的分布有关;对于②③,r2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好。

答案 d3.下图是根据变量x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )

a.①②b.①④

c.②③d.③④

解析根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系。

答案 d4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:

则y对x的线性回归方程为( )

a.y=x-1 b.y=x+1

c.y=88+x d.y=176

解析法一:由线性回归直线方程过样本中心(176,176),排除a、b答案,结合选项可得c为正确答案。

法二:将表中的五组数值分别代入选项验证,可知y=88+x最适合。

答案 c5.在一组样本数据(x1,y1),(x2,y2),…xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )

a.-1 b.0

c. d.1

解析样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1。

答案 d6.若某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.

5。如果今年该地区财政收入10亿元,年支出预计不会超过( )

a.10亿元 b.9亿元。

c.10.5亿元 d.9.5亿元。

解析代入数据y=10+e,因为|e|≤0.5,所以|y|≤10.5,故不会超过10.5亿元。

答案 c二、填空题。

7.对于数据:

通过画散点图,写出一个便于运算的较为合适的回归曲线方程是___

解析散点图如下图。

由数据及散点图知较为合适的曲线方程是y=x2+1。

答案 y=x2+1

8.若一组观测值( x1,y1),(x2,y2),…xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n)且ei恒为0,则r2为___

解析由ei恒为0,知yi=i,即yi-i=0,故r2=1-=1-0=1。

答案 19.下列说法正确的命题是___填序号)。

回归直线过样本点的中心(,)

线性回归方程对应的直线=x+至少经过其样本数据点(x1,y1),(x2,y2),…xn,yn)中的一个点;

在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;

在回归分析中,r2为0.98的模型比r2为0.80的模型拟合的效果好。

解析由回归分析的概念知①④正确,②③错误。

答案 ①④10.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y之间的关系:

小李这5天的平均投篮命中率为___用线性回归分析法的方法,**小李该月6号打6小时篮球的投篮命中率为___

解析这5天的平均投篮命中率为。

xi-)(yi-)=1-3)×(0.4-0.5)+(2-3)×(0.

5-0.5)+(3-3)×(0.6-0.

5)+(4-3)×(0.6-0.5)+(5-3)×(0.

4-0.5)=0.1。

xi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10。

所以回归直线方程为=0.01x+0.47。

当x=6时,=0.01×6+0.47=0.53。

答案 0.5 0.53

三、解答题。

11.下图是我国2023年至2023年生活垃圾无害化处理量(单位:亿吨)的折线图。

注:年份**1—7分别对应年份2008—2014。

1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;

2)建立y关于t的回归方程(系数精确到0.01),**2023年我国生活垃圾无害化处理量。

附注:参考数据: i=9.32, iyi=40.17,0.55,≈2.646。

参考公式:相关系数r=,回归方程=+t中斜率和截距最小二乘估计公式分别为:,=

解 (1)由折线图中数据和附注中参考数据得。

4, (ti-)2=28,=0.55,ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,r≈≈0.99。

因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系。

2)由=≈1.33及(1)得。

所以y关于t的回归方程为=0.93+0.10t。

将2023年对应的t=9代入回归方程得。

所以**2023年我国生活垃圾无害化处理量约为1.83亿吨。

b组能力提升。

1.甲、乙、丙、丁4位同学各自对a,b两变量进行回归分析,分别得到散点图与残差平方和(yi-i)2如下表:

哪位同学的试验结果体现拟合a,b两变量关系的模型拟合精度高( )

a.甲 b.乙。

c.丙 d.丁。

解析根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,r2的表达式中(yi-)2为确定的数,则残差平方和越小,r2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些。故选d。

答案 d2.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令=ln y,求得回归直线方程为=0.25x-2.58,则该模型的回归方程为___

解析因为=0.25x-2.58,=ln y,所以y=e0.25x-2.58。

答案 y=e0.25x-2.58

3.关于x与y有以下数据:

已知x与y线性相关,由最小二乘法得=6.5。

1)求y关于x的线性回归方程。

2)现有第二个线性模型:=7x+17,且r2=0.82。若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由。

解 (1)依题意设y关于x的线性回归方程为。

6.5x+,(2+4+5+6+8)=5,(30+40+60+50+70)=50。

=6.5x+经过样本点的中心(,)50=6.5×5+,=17.5,y与x的线性回归方程为=6.5x+17.5。

2)由(1)的线性模型得yi-i与yi-的关系如下表:

(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,yi-)2=(-20)2+(-10)2+102+02+202=1 000。

r=1-=1-=0.845。

由r=0.845,r2=0.82,知r>r2,(1)的线性模型拟合效果比较好。

1回归分析的基本思想及其初步应用

新课标数学选修1 2 1 1回归分析的基本思想及其初步应用。教师用书独具 三维目标。1 知识与技能。通过典型案例的 了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题 了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的...

1 1回归分析的基本思想及其初步应用

1.1.1回归分析的基本思想及其初步应用。主备 霍海伟主审 王伟。重点 1 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤 了解线性回归模型与函数模型的区别 2 尝试做散点图,求回归直线方程 一 基础知识梳理。回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个...

1 1回归分析的基本思想及其初步应用

1.1 回归分析的基本思想及其初步应用。一 知识清单。1.总偏差平方和 在数学上,把每个效应 观测值减去总的平均值 的平方和加起来,即用表示总的效应,成为总偏差平方和,它代表了解释变量和随机误差的组合效应。2.残差与残差平方和 数据点和它在回归直线上相应位置的差异是随机误差的效应,称为将所有数据对应...