高考数学总复习:统计。
知识网络。目标认知。
考试大纲要求:
1. 理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统。
抽样方法。2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们深圳家教 )
各自的特点。
3. 理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如。
平均数、标准差),并作出合理的解释。
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样。
本估计总体的思想。
5.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。
6.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思。
想,能根据给出的线性回归方程系数公式建立线性回归方程。
7.利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义。
8.了解下列一些常见的统计方法(独立性检验(只要求2×2列联表)、假设检验、聚类分析、回归)
的基本思想、方法,并能应用这些方法解决一些实际问题;
重点:1.会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本。
2.会用样本频率分布去估计总体分布。
3.频率分布表和频率分布直方图的绘制。
4.了解正态分布的意义及主要性质。
5.了解线性回归的方法和简单应用。
难点:用样本频率分布去估计总体分布,频率分布表和频率分布直方图的绘制。正态分布的意义及主要性质,线性回归的方法和简单应用。
知识要点梳理。
知识点一:抽样方法。
从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本。
1.简单的随机抽样。
简单随机抽样的概念:
设一个总体的个体数为n.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
①用简单随机抽样从含有n个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个。
体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;
③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.
简单抽样常用方法:
①抽签法:先将总体中的所有个体(共有n个)编号(号码可从1到n),并把号码写在形状、大小相同的号。
签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽。
签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.
适用范围:总体的个体数不多.
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数。
字;第三步,获取样本号码.
2.系统抽样:
当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样的步骤:
①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的。
准考证号、街道上各户的门牌号等等.
②为将整个的编号分段 (即分成几个部分),要确定分段的间隔.当是整数时(n为总体中的个体。
的个数,n为样本容量),;当不是整数时,通过从总体中剔除一些个体使剩下的总体中。
个体的个数能被n整除,这时。
③在第一段用简单随机抽样确定起始的个体编号.
④按照事先确定的规则抽取样本(通常是将加上间隔,得到第2个编号,第3个编号,这。
样继续下去,直到获取整个样本).
注意:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一。
部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的。
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体。
数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本。
容量整除再进行系统抽样.
3.分层抽样:
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.
4.常用的三种抽样方法的比较:
注意:(1)各种抽样的个体被抽到的概率相等;
(2)抽样过程中个体被抽到的概率相等。
5.不放回抽样和放回抽样:
在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.
随机抽样、系统抽样、分层抽样都是不放回抽样.
知识点二:统计。
1. 统计图表包括条形图、折线图、饼图、茎叶图.
2. 刻画一组数据集中趋势的统计量有平均数、中位数、众数.
平均数:刻画一组数据离散程度的统计量有极差、方差、标准差.
方差:.3.总体分布。
(1)总体:在数理统计中,通常把被研究的对象的全体叫做总体.
(2)频率分布;用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数。
和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率。
分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.
(3)频率分布直方图中每个小矩形的宽度为(分组的宽度),小矩形的面积为相应的频率,高为。
(4)频率折线图:在频率分布直方图中,按照分组原则,再在左、右两边各加一个区间,从所加的左边。
区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,所得到的折线。
称为频率折线图.
(5)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是。
进行了n次试验,试验所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.
(6)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概。
率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑。
曲线,这条曲线叫做总体密度曲线.
它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间内取值的概率等。
于总体密度曲线,直线、及轴所围图形的面积.
(7)总体分布密度曲线函数的两条基本性质:
①,;由曲线与轴围成的总面积为1.
知识点三:正态分布。
1.正态分布密度函数:,(0,-∞
其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差。正态分布一般记为,它的密度曲线简称正态曲线。
2.正态曲线:
函数的图象为正态分布密度函数曲线,简称正态曲线。
3.正态曲线的性质:
正态分布由参数μ、σ唯一确定,如果随机变量~n(μ,2),根据定义有:μ=e,σ=d.
正态曲线具有以下性质:
(1)曲线在x轴上方,与x轴不相交。
(2)曲线关于直线对称。
(3)曲线在时位于最高点。
(4)当时,曲线上升;当时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为。
渐近线,向它无限靠近。
(5)当一定时,曲线的形状由确定。越大,曲线越“矮胖”,表示总体的分布越分散;越。
小,曲线越“瘦高”,表示总体的分布越集中。
4.标准正态曲线:
当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是,其相应的曲线称为标准正态曲线
标准正态总体n(0,1)在正态总体的研究中占有重要的地位。任何正态分布的概率问题均可转化成标准正态分布的概率问题。
5. 标准正态总体的概率问题:
对于标准正态总体n(0,1),是总体取值小于的概率,即,其中,图中阴影部分的面积表示为概率。只要有标准正态分布表即可查表解决。从图中不难发现:当时,;而当时,φ(0)=0.5;
标准正态总体在任意区间内取值的概率,即直线,与正态曲线、x轴所围成的曲边梯形的面积.
6.非标准正态总体在某区间内取值的概率:可以通过转化成标准正态总体,然后查标准正态分布表即可。在这里重点掌握如何转化,首先要掌握正态总体的均值和标准差,然后进行相应的转化。
知识点四:回归分析和独立性检验。
1.散点图:将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度。粗略地看,散点分布具有一定的规律。
如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合。
2.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.
3.线性相关:若两个变量的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.若所有点看上去都在某条曲线(不是直线)附近波动,则称此相关为非线性相关的;如果所有的点在散点图中没有任何关系,则称变量间是不相关的.
4.相关关系与函数关系的异同点如下:
相同点:均是指两个变量的关系.
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
5.回归分析一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.
对于线性回归分析,我们要注意以下几个方面:
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法.两个变量具有相关关系是回归分析的。
前提.(2)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.
(3)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意。
义,否则,求出的回归直线方程毫无意义.
6.回归直线。
设所求的直线方程为,其中a、b是待定系数., 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。
7. 相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把。
叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度。
8. 相关系数的性质: ≤1,且越接近1,相关程度越大;且越接近0,相关程度越小。
9. 显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值,它必须在每一次统计检验之前确定。
10. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.
01和0.05,自由度为n-2其中n是数据的个数。在“相关系数检验的临界值表”查出与显著性水平0.
05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0.05或r0.
01;例如n=7时,r0.05=0.754,r0.
01=0.874.求得的相关系数r和临界值r0.
05比较,若r>r0.05,上面y与x是线性相关的,当≤r0. 05或r0.
01,认为线性关系不显著。
11.小概率事件的含义:发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生。
假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析。
假设检验方法的操作程序,即“三步曲”
一是提出统计假设,教科书中的统计假设总体是正态总体;
二是确定一次试验中的a值是否落入(μ-3σ,μ3σ);
三是作出判断。
规律方法指导。
解答正态分布问题,从考纲要求来看,只要掌握有关对称区间概率的计算。
2023年高考数学总复习系列
2011年高考数学总复习系列 高中数学选修2 2 第一章导数及其应用。无论哪个省市的考题中可以看出,一定会重视对导数的考察,所以同学一定将导数学细学精!基础知识 理解去记 1 极限定义 1 若数列满足,对任意给定的正数 总存在正数m,当n m且n n时,恒有 un a 成立 a为常数 则称a为数列u...
2023年高考数学总复习方略
函数。一。函数与映射的定义。题型1.如图,可表示函数y f x 的图象的只可能是 题型2.下列各组函数是同一函数的是 a.y 与y 1 b.y x 1 与y c.y 与y d.y 与y x 题型3.已知集合a b 满足条件f 3 f 1 f 2 的映射f a b的个数是 a 2b 4 c 7 d 6...
2023年高考数学总复习计划
第二轮专题过关。组成整个知识体系的重点章节,重点知识点,高考试题中会对这些反复进行考查,不会有意对这些内容进行回避。因此我们要对整个书本进行梳理,对特别重要的章节中所考查的知识点要全部列举出来,再看看近几年的高考题,看已经考了哪些知识点,那么剩下的那些点就应更加注意,高考题一般会在一定的周期内对这些...