高级统计学复习题

发布 2021-04-19 02:26:28 阅读 9189

4.某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.

5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问:

1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑?

2)计算(1)的p-值。

3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?

4)计算(3)的p-值。

5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2)。

解:(1)(2)假设检验为。采用正态分布的检验统计量。

查出=0.05水平下的临界值为1.96。

计算统计量值。因为z=4.6875>1.

96,所以拒绝原假设。对应p值=2(1-f(z)) 查表得到f(z)在0.999 994和0.

999 999之间,所以p值在0.000 006和0.000 001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-f(|z|),直接查表即得f(|z|))p值<0.

05,拒绝原假设。都说明平均加油量并非12加仑。

3)(4)假设检验为。采用成数检验统计量。查出=0.

05水平下的临界值为1.64和1.65之间。

计算统计量值,因此z=-2.5<-1.65(<-1.

64),所以拒绝原假设。p值为0.00062(因为本题为单侧检验,p值=(1-f(|z|))2 )。

显然p值<0.05,所以拒绝原假设。

5) 假设检验为。采用正态分布的检验统计量。查出=0.

05水平下的临界值为1.96。计算统计量值。

因为z=2.344>1.96,所以拒绝原假设。

对应p值=2(1-f(z)) 查表得到f(z)在0.9807和0.9817之间,所以p值在0.

0193和0.0183之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-f(|z|),直接查表即得f(|z|))显然p值<0.05,拒绝原假设。

1.某湖水在不同季节氯化物含量测定值如表5-3所示。问不同季节氯化物含量有无差别?若有差别,进行32个水平的两两比较。

表5-3 某湖水不同季节氯化物含量(mg/l)

1.完全随机设计单因素芳差分析。

解:h0:4个季节湖水中氯化物含量相等,即μ1=μ2=μ3=μ4

h1:4个季节湖水中氯化物含量不等或不全相等。

表5-8 方差分析表。

查f界值表,。因f>所以p<0.05。按α=0.05水准,拒绝h0,接受h1,认为不同季节湖水中氯化物含量不同或不全相同。

用snk-q检验进行各组均数间两两比较。

h0:任意两对比组的总体均数相等,μa=μb

h1:μa≠μb

表5-9 四个样本均数顺序排序。

表5-10 四组均数两两比较q检验。

春与夏、秋与冬湖水中氯化物含量p>0.05,按α=0.05水准,不拒绝h0,即不能认为春与夏、秋与冬季湖水中氯化物含量有差别。

而其它4组均有p<0.01,按α=0.05水准,拒绝h0,接受h1,即认为春夏两季湖水中氯化物含量高于秋冬两季。

例对夫妇的一个随机样本给出了如下的结婚年龄数据。

1) 计算样本相关系数r;

2) 求总体相关系数的95%置信区间;

3) 以5%的水平,检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。

解:(1) =

由于=22,=23;=≈0.3426

(2)由于se()=n=10,df=8=2.306,所以:

se()=0.332

得1.062072

(3):夫妻的结婚年龄之间没有线性相关,夫妻的结婚年龄之间不完全没有线性相关,≠0

根据第(2)题的计算结果,1.062072

由于的原假设落入了该置信区间,所以接受原假设,认为夫妻的结婚年龄之间没有线性相关关系。

1.设销售收入x为自变量,销售成本y为因变量。现根据某百货公司12个月的有关资料计算出以下数据:(单位:万元)

(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释。

(2) 计算决定系数和回归估计的标准误差。

(3) 对β2进行显著水平为5%的显著性检验。

4)假定明年1月销售收入为800万元,利用拟合的回归方程**相应的销售成本,并给出置信度为95%的**区间。 解:

t值远大于临界值2.228,故拒绝零假设,说明在5%的显著性水平下通过了显著性检验。

4)(万元)

所以,yf的置信度为95%的**区间为:

所以,区间**为:

1.直接月季平均法。

第一步,计算历年相同月(季)的简单算术平均数。

第二步计算历年所有月(季)的总平均数。

第三步,用各月(季)的平均数除以总的月(季)平均数,即为各月(季)的季节指数。

在**中,假定**年份各对应月(季)的季节指数与之相同。

按月(季)平均法计算季节比率,简便易行,但这种方法没有考虑长期趋势的影响,因为计算过程中是将各年同月(季)的数值所起的作用同等看待了。实际上,在存在长期趋势的序列中,后期各月(季)的数值所起的作用要比前期同月(季)的作用大。因此,如果时间序列中存在明显的长期趋势影响,则按月(季)平均法计算的季节比率是不准确的,应先剔除长期趋势的影响后,再计算季节比率。

同期平均法来测定其季节变动。步骤如下:

第一,计算各年同季(月)的平均数,目的是要消除非季节因素的影响。道理很简单,因为同样是旺季或者淡季,有些年份的旺季更旺或更淡,这就是非季节因素的影响。因为我们假设没有长期趋势,因此,这些因素通过平均的方法就可以相互抵消。

第二,计算各年同季(或同月)平均数的平均数,也即时间数列的序时平均数,目的是计算季节比率。因为就从测定季节变动的目的讲,只计算“异年同季的平均数”已经可以反映现象的季节变动趋势了:平均数大,表明是旺季,越大越旺;平均数小,表明是淡季,越小越淡。

但是,这种大与小、淡与旺的程度只能和其它季节相比才能有个准确的认识,因此,就需要将“各年同季的平均数”进行相对化变换,即计算季节比率,对比的标准就应该是时间数列的序时平均数。

第三,计算季节比率。方法是将各年同季的平均数分别和时间数列的序时平均数进行对比。一般用百分数表示,用公式表示为:

季节指数(s)=同月(或季)平均数/总月(或季)平均数×100%

画法:上升趋势-两个低点相连;下降趋势:两个高点相连。

由两条平行的上升轨道线组成,反映上升趋势。它反映的是一种以买方力量为主导的市场,尽管卖方力量也不断反击,造成**不时**,但买方力量占有优势的情况下,卖方力量反复被消化,**持续上升,处于上升趋势。

由两条平行的下降轨道线组成,反映下降趋势。它反映的是一种以卖方力量为主导的市场,尽管买方力量也不断反击,造成**不时**,但卖方力量占有优势的情况下,买方力量反复被消化,**持续**,处于下降趋势。

由两条水平的平行线组成,反映市场卖方和买方的力量相持,市场进入一个短暂均衡状态,这样的市场往往缺乏明确方向,**被限定在水平区间中反复波动。**突破通道的时候,往往代表新的趋势即将展开。它一般持续的时间较短而且并不多见,因为这种均衡状态并不多见。

2023年统计学复习题

一 名词解释。1.总体 指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体。2.总体单位 是构成统计总体的个别事物或基本单位。3.标志 说明总体单位特征的名称,分为品质标志和数量标志。4.统计设计 根据统计研究的任务和研究对象的特点,对统计工作的各个方面和各个环节所作的通盘考虑和安排,是...

高级生物统计学基础习题

计算题。1 某小麦品种的常年平均亩产量为 210公斤,现从外地引种一新品种,在6 个试验点试种,得平均亩产是 x 224公斤,其标准差为 s 4.63公斤,试问该新品种的产量是否与原来的品种有显著差异?0.05 2.有一水稻品种的比较试验,参试品种有4个,对照品种一个 ck 随机区组设计,设置三次重...

统计学复习

统计学。第1章统计与数据。1.统计学 是收集 处理 分析 解释数据并从数据中得结论出的科学。2.统计分析数据的方法分为两大类 描述统计 是研究数据收集 处理和描述的统计学方法。描述统计的内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合 概括与分析,得出所关心...