—《统计案例》
知识点》一、知识结构图:
二、要点回顾:
1.2×2列联表.
2.独立性检验与相关性检验(见下表).
三、关键信息强化:
1.独立性检验的两个重要工具是:统计量和临界值,只有准确计算(熟记计算公式),熟记各临界值及统计决断的原则,才能正确地处理独立性检验的问题.
2.线性回归方程中回归系数和回归截距的意义:
的意义:x每增加(或减少)一个单位,y平均改变个单位.
的意义:y不受x变化影响的部分.
3.由线性回归方程中的计算公式知:回归直线必过点.
4.做回归分析要有实际意义,而如何才能知道有无实际意义呢?——相关性检验.
5.相关系数和临界值是正确进行相关性检验的两大重要因素.
要明确相关系数的大小与相关程度的关系(即的性质),并要会根据公式计算或利用计算器计算.另外的查法要熟练掌握.
6.相关性检验就是检验与的大小关系.
四、特别警示:
1.分析两个变量相关关系的常用方法:
(1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线的附近,那么就说这两个变量之间具有线性相关关系.
(2)利用相关系数r进行判断:而且越接近于1,相关程度越强;越接近于0,相关程度越弱.
2.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求线性回归方程.
3.在实际问题中,经常会面临需要推断的问题,在作推断时,我们不能仅凭主观意愿作出结论,而是需要通过试验来收集数据,并根据独立性检验的原理做出合理的推断.
4.统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误.好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据,整理分析数据得出的结论是“吸烟与患肺癌有关”,而且这个结论犯错误的概率在0.01以下,实际上,这是统计思维与确定性思维差异的反应,这是数学问题,不一定在实际中得到验证.
练习题》一.选择题。
1.对于变量x和y,当x值一定时,y的取值带有一定的随机性,x,y间这种非确定性关系叫( )
.函数关系线性关系。
.相关关系回归关系。
2.变量y与x之间的回归方程( )
.表示y与x之间的函数关系。
.表示y与x之间的不确定性关系。
.反映y与x之间真实关系的形式。
.反映y与x之间的真实关系达到最大限度的吻合。
3.下面4个散点图中,适合用线性回归模型拟合其中两个变量的是( )
4.已知对一组观测值作出散点图后,确定具有线性相关关系,若对于,求得,,,则线性回归方程为( )
5.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( )
.ecda6.为了表示n个点与相应直线在整体上的接近程度,我们表示它常用( )
7.利用独立性检验来考察两个变量x和y是否有关系时,通过查阅下表来确定断言“x与y有关系”的可信程度.如果,那么就有把握认为“x与y有关系”的百分比为( )
a. b. c. d.
8.为加强素质教育,使学生全面发展,某校对学生文化课与体育课的成绩进行了调查统计,结果如下:
在**体育课成绩和文化课成绩是否有关时,根据以上数据可得到等于( )
9.为了对新产品进行合理定价,对这类产品进行了试销试验,以观察需求量y(单位:千件)相应于**x(单位:千元)的变化关系,得到数据如下:
根据以上数据可求得变量y与x之间的相关系数等于( )
b10.有22组观测值,则与显著性水平0.05相应的相关系数临界值为( )
.0.404 b.0.515 c.0.4230.537
11.下列说法:①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的值是变量y的精确值.其中正确的是( )
12.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:
利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于( )
二.填空题。
13.如果两个变量之间的线性相关程度很高,则其相关系数r的绝对值应接近于。
14.回归分析是对具有相关关系的两个变量进行统计分析的方法.两个变量具有是回归分析的前提.
15.独立性检验的基本思想类似于数学上的。
16.某五星级大饭店的入住率x()与每天每间客房的成本y(元)如下:
则y关于x的线性回归方程是。
三.解答题。
17.为考察性别与是否喜欢饮酒之间的关系,在某地区随机抽取290人,得到如下2×2列联表:
性别与喜欢饮酒列联表。
利用2×2列联表的独立性检验判断性别与饮酒之间是否有关系?
18.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子的成长记录:
1) 作出这些数据的散点图;(2)求出这些数据的回归方程.
19.已知在某实验中获得一组数据如下:
其中不慎将数据丢失,但知道这四组数据符合线性关系,且,求与的近似值.
20.为调查饮酒是否对患胃癌有影响,某科研机构随机地抽查了10138人,得到如下结果(单位:人):
饮酒与患胃癌列联表。
那么饮酒是否对患胃癌有影响?
参***。一.选择题。
二.填空题。
13.1; 14.相关关系; 15.反证法; 16. :
三.解答题。
17. 解:由2×2列联表中的数据可得:
所以我们说有的把握认为“性别与饮酒有关”.
18. 解:(1)数据的散点图如下:
2)用表示身高,表示年龄,则数据的回归方程为.
19. 解:由已知得,代入,得,.
所以,.20. 解:由列联表中的数据可得:
所以我们说有的把握认为“饮酒与患胃癌”有关.
高二数学复习讲义
推理与证明 知识点 一 推理 合情推理 归纳推理和类比推理都是根据已有事实,经过观察 分析 比较 联想,在进行归纳 类比,然后提出猜想的推理,我们把它们称为合情推理。归纳推理 由某类食物的部分对象具有某些特征,推出该类事物的全部对象都具有这些特征的推理,或者有个别事实概括出一般结论的推理,称为归纳推...
高二数学复习讲义
统计案例 知识点 1 独立性检验。假设有两个分类变量x和y,它们的值域分另为和,其样本频数列联表为 若要推断的论述为h1 x与y有关系 可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体的做法是,由表中的数据算出随机变量k 2的值 即k的平方 k2 n ad bc...
高二数学竞赛讲义
轨迹。一 知识点。求轨迹方程的一般步骤是 建系 设点 列式 化简 检验 其中检验就是指检验点轨迹的纯粹性和完备性 常用的求轨迹方程的方法有定义法 直接法 代入法 参数法等 二 应用。例1 半径为1的圆c过原点o,q为圆c与x轴的另一个交点,oqrp为平行四边形,其中rp为圆c的切线,p为切点,且点p...