生物统计和试验设计 (a)卷2001—2002学年第 1 学期。
一、 名词(术语、符号)解释(每小题2分,共16分)。
1.样本:从总体中抽出的一部分。
2. :样本平均数的标准误 。
3.plsd0.05:显著水平达到0.05的最小显著差数。
4.相关系数:描述两个变数线性相关密切程度及性质的统计数。
5.无偏估计: 在统计上,如果所有可能样本的某一个统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。
6.处理:水平和水平的组合。
7.统计控制:利用统计方法对试验因素进行控制。
8.偏回归系数:,当其他自变数都固定时,每增加一个单位,平均增加或减少的单位数。
二、是非题:(以√表示正确,以×表示错误,每小题1分,共12分)。
1.增加样本容量可以减小试验误差方差。(
2.二项分布在n>30,np、nq皆大于5时,可用正态分布近似求其概率。(
3.分布是一组随自由度变化的曲线系统,此曲线是间断性的,用于间断性资料的假设测验。(
4.t分布是以平均数=0为中心的对称分布。(
5.当u=1.96时,统计假设测验的右尾概率为0.01。(
6.一个试验资料的方差分析数学模型,必须在获取试验结果后才能确定。(
7.出现频率最多的观察值,称为中位数。(
8.组成二项总体的两种事件为对立事件。(
9.一个二因素试验不能使用拉丁方设计。(
10.试验资料不符合方差分析三个基本假定时,可采取剔除特殊值;分解为若干个同质误差部分分析;进行数据转换等方法补救。(
11.增大样本容量和自变数区间范围,即和越小,有利于提高的估计可靠度。(
12.多元回归显著,即说明每个自变数都与依变数间有显著回归关系,不必再对各偏回归系数作显著性测验。(
三、选择题(每小题2分,共16分)。
1.算术平均数的重要特性之一是离均差的总和( c )
a. 最小 b. 最大 c. 等于零 d. 接近零。
2.正态分布曲线与横轴之间的总面积等于( d )
a. 次数总和n b. 次数总和n+1 c. 0.95 d. 1.00
3.回归系数b的标准误等于( a )
4.统计推断某参数在区间[l1,l2]内的信度为p,则最常用的p值是( d )
a. 0.01b. 0.05c. 0.90d. 0.95
5.如测验k(k3)个样本方差是否**于方差相等的总体,这种测验在统计上称为( a )。
a. 方差的同质性测验 b. 独立性测验 c. f测验 d. 适合性测验。
6.用标记字母法表示多重比较结果时,如果两个平均数间差异显著,则它们后面一定要标上( d )
a. 相同拉丁字母 b. 小写拉丁字母 c. 大写拉丁字母 d. 不同小写拉丁字母。
7.在多元线性回归和相关分析中,计算下列( c )和( d )时,需用到信息阵的逆矩阵(元素)。
a. 复相关系数b. 总回归平方和c. 偏回归平方和。
d. 偏相关系数e. 离回归标准差f. 多元决定系数。
四、填空题(每空1分,共20分)。
1.变异数的种类主要有__极差___方差_ _标准差___变异系数。
2.为了解学生的身高状况,测量某班学生体高所得的数据集合,构成一个__样本;被测体高的学生数之和,称为___样本容量。
3.在参数区间估计中,保证参数在某一区间内的概率称为__置信度___
4.有一样本方差250, 11,如测验100,对100,则实得测验值值为 25 ,如此值,则在0.05水平上接受,如此值,则在0.05水平上否定。
5.无效假设是指实得差异由误差造成的假设 ;备择假设是指和无效假设相对立的假设 。
6.测验两样本平均数差异是否显著时用两尾测验,即否定的区域有两个。
7.在成对数据资料用t测验比较时,若对数n=13,则查t表的自由度为___12___
8.在研究玉米种植密度和产量的关系中,其中种植密度是自变数,_产量是依变数。
9.方差分析的基本假定是可加性、 同质性、 正态性 。
五、简答题(每小题5分,共15分)。
1.简述田间试验设计的三大原则及其作用。
答:1.重复——每一个处理有一个以上的试验单元。
作用:降低和估计误差。
2.随机——每种处理获得某一试验条件的概率相等。
作用:无偏地估计误差。
3.局部控制——将试验环境分成若干个相对比较均匀的小环境。
作用:最大限度的降低误差。
2.对于k(k≥3)个样本平均数,能否仍套用u或t测验进行两两独立比较?为什么?
答:不能,(1)程序繁琐。(2)误差估计的精度受损。(3)增大犯错误的概率。
3.简述单相关与偏相关的异同。
答:偏相关系数和单相关系数虽然都是线性相关系数,但是得出这些系数的前提条件迥然不同,例如,研究和的线性相关,偏相关系数乃是将对以及通过对的线性影响统统消去之后的和的线性相关系数;而单相关系数乃是将对以及通过对的线性影响都统统地包括在内的和的线性相关系数。因此,除非和,偏相关系数决不会和单相关系数相同,而单相关系数总是或多或少地包含着虚假的成分。
六、综合题1(共4小题,总计32分)。
1.已知某一二因素试验,a因素有a1、a2、a3三个水平,b因素有b1、b2两个水平。每处理重复3次。试(1)分别按随机区组和裂区(a为主区因素)设计画出田间试验设计图;(2)给出上述两种设计下各变异**的自由度。
随机区组:裂区:
2.对13个样点的水稻茎杆产量(x,克)和籽粒产量(y,克)进行测定,作成散点图如下。现有a、b、c、d四人对该资料进行回归分析,结果为:
a:(r=-0.9902)
b: (r= 0.9902 )
c: (r=0.9902)
d: (r=0.9902)
试根据图象,判断四种结果的正、误;并对回归统计数和方程的生物学意义作进一步分析。
解:由图象可知:b为正确回归方程。
当时,(克)为产量阈。
当时,为有效分蘖,当时为无效分蘖。
3.有一n=10的双变数资料,已算得12, 2.0, 3.24。请测验:β=0(t0.01,8=3.355);并计算回归方程的估计标准误sy/x。
解:(1)假设。
否定即极显著。
4.一农场对4块田调查某地下害虫头数(头数/米),每田块随机调查6个样点的初步计算见下表。(1)写出试验观察值的线性模型;(2)用方差分析说明田块间差异显著性(=3.1; =4.
9);(3)对平均数作多重比较(=2.1; =2.8)。
解:(1)
方差分析表。
平均数的多重比较。
七、综合题2(限农区9901班做,计12分)
称量两个玉米的百粒重(克),基本数据如下表,请测验其差异显著性。
t0.05,16=2.12, t0.05,17=2.11, t0.05,8=2.3)。
解:假设。取。
否定,即差异显著。
一、名词解释(2×10)
1、随机样本:用随机抽样的方法,从总体中抽出一个部分。
2、标准误:统计数变异度的度量
3、β错误:接受一个错误时所犯的错误。
4、参数:描述总体的特征数,如。
5、次数资料的独立性测验:这是测验两个因素的列联次数彼此独立还是相关的一种测验。
6、无偏估计:在统计上,如果所有可能样本的某一个统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。
7、:矫正处理平均数,
8、相关系数:描述两个变数线性相关密切程度及性质的统计数
9、偏回归系数:,当其他自变数都固定时,每增加一个单位,平均增加或减少的单位数。
10、均积:两个变数的互变异数,
二、选择(2×10)
1、如果事件a1和a2不能同时发生,则a1和a2应称为[ d ]
a、和事件 b、积事件 c、对立事件 d、互斥事件。
2、下列描述中不正确的说法是[ d ]
a、间断性变数在分组时组距通常为整数。
b、次数分布图中折线与横轴围成的面积与方柱图的总面积相等。
c、总体平均数不受抽样误差的影响。
d、二项分布的概率均可用正态分布小区间的概率求取。
3、当y~n(100,100)时, 以样本容量n=4抽得样本平均数大于110的概率[ c ]
a、≈0.05 b、≈0.10 c、≈0.025 d、≈0.01
4、当r<0时,的关系是[ b ]。
ab. cd.不好确定。
5、同一组资料,简单相关系数与偏相关系数假设测验的结论[ a ]。
a、不一致 b、完全一致 c、不一定一致 d、基本一致。
6、回归系数b的标准误等于[ a ]。
ab、 c、 d、
7、在一元线性回归分析中, [a ]
a、0 b、sp c、ud、q
8、可估计和减少试验误差的手段是:[ c ]。
高级生物统计试卷
江西农业大学 高级生物统计 课程考试试卷。院系专业班级学号姓名分数 一 简答题 每题5分,共15分 1 请简述什么是系统聚类法。2 请简述因子分析的步骤。3 请说明什么是多元相关分析。二 某地市场上销售的mp4有多种牌号,有些畅销,有些滞销。现从该地市场的畅销 滞销品牌中各随机抽取10台,按照11级...
生物统计学试卷
1 变量之间的相关关系主要有两大类。2 在统计学中,常见平均数主要有。3 样本标准差的计算公式。4 小概率事件原理是指。5 在标准正态分布中,p 1 u 1 已知随机变量1的临界值为0 1587 6 在分析变量之间的关系时,一个变量x确定,y是随着x变化而变化,两变量呈因果关系,则x称为 y称为。二...
生物统计学试卷
1 变量之间的相关关系主要有两大类。2 在统计学中,常见平均数主要有。3 样本标准差的计算公式。4 小概率事件原理是指。5 在标准正态分布中,p 1 u 1 已知随机变量1的临界值为0 1587 6 在分析变量之间的关系时,一个变量x确定,y是随着x变化而变化,两变量呈因果关系,则x称为 y称为。二...