课时作业1 回归分析的基本思想及其初步应用。
a组基础巩固。
一、选择题。
1.在对两个变量x,y进行线性回归分析时,有下列步骤:
对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图。
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )
ab.③②cd.②⑤
解析对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图。观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④故选d。
答案 d2.有下列说法:
在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②r2来刻画回归的效果,r2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好。
其中正确命题的个数是( )
a.0 b.1
c.2 d.3
解析 ①选用的模型是否合适与残差点的分布有关;对于②③,r2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好。
答案 d3.下图是根据变量x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )
a.①②b.①④
c.②③d.③④
解析根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系。
答案 d4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
则y对x的线性回归方程为( )
a.y=x-1 b.y=x+1
c.y=88+x d.y=176
解析法一:由线性回归直线方程过样本中心(176,176),排除a、b答案,结合选项可得c为正确答案。
法二:将表中的五组数值分别代入选项验证,可知y=88+x最适合。
答案 c5.在一组样本数据(x1,y1),(x2,y2),…xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
a.-1 b.0
c. d.1
解析样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1。
答案 d6.若某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.
5。如果今年该地区财政收入10亿元,年支出预计不会超过( )
a.10亿元 b.9亿元。
c.10.5亿元 d.9.5亿元。
解析代入数据y=10+e,因为|e|≤0.5,所以|y|≤10.5,故不会超过10.5亿元。
答案 c二、填空题。
7.对于数据:
通过画散点图,写出一个便于运算的较为合适的回归曲线方程是___
解析散点图如下图。
由数据及散点图知较为合适的曲线方程是y=x2+1。
答案 y=x2+1
8.若一组观测值( x1,y1),(x2,y2),…xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n)且ei恒为0,则r2为___
解析由ei恒为0,知yi=i,即yi-i=0,故r2=1-=1-0=1。
答案 19.下列说法正确的命题是___填序号)。
回归直线过样本点的中心(,)
线性回归方程对应的直线=x+至少经过其样本数据点(x1,y1),(x2,y2),…xn,yn)中的一个点;
在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;
在回归分析中,r2为0.98的模型比r2为0.80的模型拟合的效果好。
解析由回归分析的概念知①④正确,②③错误。
答案 ①④10.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y之间的关系:
小李这5天的平均投篮命中率为___用线性回归分析法的方法,**小李该月6号打6小时篮球的投篮命中率为___
解析这5天的平均投篮命中率为。
xi-)(yi-)=1-3)×(0.4-0.5)+(2-3)×(0.
5-0.5)+(3-3)×(0.6-0.
5)+(4-3)×(0.6-0.5)+(5-3)×(0.
4-0.5)=0.1。
xi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10。
所以回归直线方程为=0.01x+0.47。
当x=6时,=0.01×6+0.47=0.53。
答案 0.5 0.53
三、解答题。
11.下图是我国2023年至2023年生活垃圾无害化处理量(单位:亿吨)的折线图。
注:年份**1—7分别对应年份2008—2014。
1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
2)建立y关于t的回归方程(系数精确到0.01),**2023年我国生活垃圾无害化处理量。
附注:参考数据: i=9.32, iyi=40.17,0.55,≈2.646。
参考公式:相关系数r=,回归方程=+t中斜率和截距最小二乘估计公式分别为:,=
解 (1)由折线图中数据和附注中参考数据得。
4, (ti-)2=28,=0.55,ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,r≈≈0.99。
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系。
2)由=≈1.33及(1)得。
所以y关于t的回归方程为=0.93+0.10t。
将2023年对应的t=9代入回归方程得。
所以**2023年我国生活垃圾无害化处理量约为1.83亿吨。
b组能力提升。
1.甲、乙、丙、丁4位同学各自对a,b两变量进行回归分析,分别得到散点图与残差平方和(yi-i)2如下表:
哪位同学的试验结果体现拟合a,b两变量关系的模型拟合精度高( )
a.甲 b.乙。
c.丙 d.丁。
解析根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,r2的表达式中(yi-)2为确定的数,则残差平方和越小,r2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些。故选d。
答案 d2.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令=ln y,求得回归直线方程为=0.25x-2.58,则该模型的回归方程为___
解析因为=0.25x-2.58,=ln y,所以y=e0.25x-2.58。
答案 y=e0.25x-2.58
3.关于x与y有以下数据:
已知x与y线性相关,由最小二乘法得=6.5。
1)求y关于x的线性回归方程。
2)现有第二个线性模型:=7x+17,且r2=0.82。若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由。
解 (1)依题意设y关于x的线性回归方程为。
6.5x+,(2+4+5+6+8)=5,(30+40+60+50+70)=50。
=6.5x+经过样本点的中心(,)50=6.5×5+,=17.5,y与x的线性回归方程为=6.5x+17.5。
2)由(1)的线性模型得yi-i与yi-的关系如下表:
(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,yi-)2=(-20)2+(-10)2+102+02+202=1 000。
r=1-=1-=0.845。
由r=0.845,r2=0.82,知r>r2,(1)的线性模型拟合效果比较好。
1回归分析的基本思想及其初步应用
新课标数学选修1 2 1 1回归分析的基本思想及其初步应用。教师用书独具 三维目标。1 知识与技能。通过典型案例的 了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题 了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的...
1 1回归分析的基本思想及其初步应用
1.1.1回归分析的基本思想及其初步应用。主备 霍海伟主审 王伟。重点 1 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤 了解线性回归模型与函数模型的区别 2 尝试做散点图,求回归直线方程 一 基础知识梳理。回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个...
1 1回归分析的基本思想及其初步应用
1.1 回归分析的基本思想及其初步应用。一 知识清单。1.总偏差平方和 在数学上,把每个效应 观测值减去总的平均值 的平方和加起来,即用表示总的效应,成为总偏差平方和,它代表了解释变量和随机误差的组合效应。2.残差与残差平方和 数据点和它在回归直线上相应位置的差异是随机误差的效应,称为将所有数据对应...