①求全距。
所谓全距乃是一批数据中最大值与最小值之间的差距。观察全部数据,找出其中的最大值(xmax)和最小值(xmin),以符号r表示全距,则全距的计算公式为:
r= xmax-xmin1-1)
故,全距在有的书中也称为两极差。
定组数。定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号k表示,它的大小要看数据的多少而定。
一般来说,当一批数据的个数在200个以内时,组数可取8~18组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:
上述公式中的n为数据个数。
定组距i =r/k
在知道全距r和组数k之后,就可以来确定分组的组距。用符号i 表示,其一般原则是取奇数或5的倍数,如1,3,5,7,9,10等。具体的取值办法,可通过全距r与组数k的比值来取整确定。
写出组限。组限是每个组的起止点界限,有表述组限和实际组限之区别。在教育与心理统计学文献中,组限的表述方法主要有两种。两种组限表述方法意义不尽相同。
第一种方法以连续的形态表述组限,每一组实际组限是“左闭右开”的区间范围。如“10~15”和“15~20”这两组,其实际组限是指[10,15)和[15,20)的区间范围。
第二种方法以跳跃的形态表述组限,在相邻组别中形成“缺口”,例如,“10~14”和“15~19”这两组在相邻处不连续,从14跳跃到15时留下的“1”个单位缺口。对于这种表述组限,其实际组限分别是指[9.5,14.
5]和[14.5,19.5]的区间范围 。
求组中值。组中值是各组的组中点在量尺上的数值,其计算公式为:
组中值=(组实上限+组实下限)÷21-3)
不同的组距以及不同的组限,必然会产生不同的组中值。如果希望每组的组中值恰好为整数便于后继运算,那么,组距选择为奇数是最好的。
归类划记。完成上述各个步骤后,我们就可以设计一个表的格式来记录上述有关结果并对数据进行归类划记。
登记次数。根据划记结果,点计各组的次数,记入次数栏。
当我们把组别、组中值和次数值拼在一起时,就构成简单次数分布表。
2) 相对次数分布表。
相对次数就是各组的次数与总次数n之间的比值,若以表示相对次数,则相对次数的计算公式为:
把组别、组中值和次数值拼在一起时,就构成次数分布表。
相对次数分布表与简单次数发布表各有不同的用途,它们既可单独使用,又可联合使用。当我们主要对各组的绝对次数感兴趣时,则可编制简单次数分布表。
相对次数分布表主要能反映各组数据的百分比结构,当我们侧重关心各组次数的相对比例结构时,通常要编制相对次数分布表。
3) 累计次数分布表。
假如我们希望通过一个统计表,就能较方便地了解到处于某个数值以下的数据个数有多少时,就可编制一个累积次数分布表。
把组别、组中值和累积次数值拼在一起时,就构成累积次数分布表。
4) 累积相对次数分布表和累积百分数分布表。
前面介绍的累积次数分布是对简单次数进行累积的结果。与此相对应的是,还可对相对次数进行累积。
累积相对次数分布和累积百分数分布在心理与教育测量研究中有广泛而又重要的应用。
值得一提的是,累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种,在应用时,应根据具体情况决定选用其中的一种。
三、请举例说明实际组限和表述组限的区别是什么?
组限是每个组的起止点界限,有表述组限和实际组限之区别。在教育与心理统计学文献中,组限的表述方法主要有两种。两种组限表述方法意义不尽相同。
第一种方法以连续的形态表述组限,每一组实际组限是“左闭右开”的区间范围。如“10~15”和“15~20”这两组,其实际组限是指[10,15)和[15,20)的区间范围。
第二种方法以跳跃的形态表述组限,在相邻组别中形成“缺口”,例如,“10~14”和“15~19”这两组在相邻处不连续,从14跳跃到15时留下的“1”个单位缺口。对于这种表述组限,其实际组限分别是指[9.5,14.
5]和[14.5,19.5]的区间范围 。
四、已知某次高考模拟试卷高一的5名学生做所用时间分别为分钟;高三的5名学生做所用时间分别为分钟;问高一和高三哪一组离散程度大?(请写出计算过程)
高一用时平均值:x1=(170+120+110+160+130)/5=138
高一用时方差:s1= ^2 =[170-x1)^ 2+(120-x1)^ 2+(110-x1)^ 2+(160-x1)^ 2+(130-x1)^ 2] /5=536
高一用时标准差:δ1=23.15
高三用时平均值:x2=(50+70+90+55+45)/5=62
高三用时方差:s2= ^2=[(50-x2)^ 2+(70-x2)^ 2+(90-x2)^ 2+(55-x2)^ 2+(45-x2)^ 2] /5=266
高三用时标准差:δ2=16.3
因此高一的离散程度大。
第二次作业。
1. 教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示,下表是一次测验的有关数据:
求该题目区分度。(请写出计算过程)
解:(1)求答对第二题的比率p和答错的比率q:
p=6/10=0.6
q=1-p=0.4
2)求x1和x2,分别为答对和答错第二题学生成绩的平均数:
x1=(75+57+73+65+63+67)/6=66.67
x2=(67+56+61+65)/4=62.25
3) 求σx,所有考生的总分的标准差:
平均分x=(75+57+73+65+63+67+67+56+61+65)/10=64.9
x^ 2=[(75-x)^ 2+(57-x)^ 2+(73-x)^ 2+(65-x)^ 2+(67-x)^ 2+
56-x)^ 2+(63-x)^ 2+(61-x)^ 2+(65-x)^ 2+(67-x)^ 2] /10=33.69
x=5.8(4) 求点二列相关系数r:
即该试卷第二题的区分度为0.373。
2.某班学生的数学、语文、外语的平均成绩分别为,标准差分别为。某个同学的三科成绩分别为,问这个同学的哪科成绩更好?(请写出计算过程)
解:数学。语文:
外语:z2>z3>z1
这个同学语文成绩更好。
3.某市的举行选拔考试,共1000人参加,只录取200人,已知此次考试平均分为60分,标准差为10,问。
1) 录取分数线定为多少?
2) 如果面试线定为50分,那么有多少人可以参加面试?(请写出计算过程)
解:(1)由题意得。
查表得z=0.84
即。所以录取分数线定为x=68.4
查表得。所以可以参加面试的人数为:1000*0.8413=841(人)
第三次作业。
1、假设检验的基本原理?
假设检验是除参数估计之外的另一类重要的统计推断问题。它的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。
也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件a在一次试验中是几乎不可能发一的;要是在一次试验中事件a竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。
2、 假设检验的步骤有哪些?
一、根据具体问题要求,建立原假设h0和备择假设h1。
二、 选择一个合适的检验统计量z,它应与原假设有关,能够知道当原假设h0为真时统计量的抽样分布抽样分布应不含未知参数,根据原假设和备择假设确定一个检验规则的形式。
三、 给定显著性水平α,当原假设h0为真时,求出临界值。
四、由样本观测值计算检验统计量z值,按检验规则,对原假设作出拒绝或接受的判断。
3、 随机抽取文、理两科大学生各一组参加一种推理测验,已知测验成绩服从正态分布且总体方差相等。测验数据为:文科生13名,平均得分85分,标准差11分;理科生15名,平均得分82分,标准差9分。
请问文理两科大学生在这个推理测验上的得分有无显著差异?(a=0.05)(请写出具体计算过程)
解:1、提出假设。
2、计算z值。
式中:x1,x2分别表示两个样本的平均数。
分别表示两个样本标准差的平方。
n1,n2分别表示两个样本的容量。
3、检验并统计判决。
由于z=0.782<1.96 即p>0.05
所以文理两科大学生的得分无显著差异。
教育统计学作业答案
判断题 总体平均数属于统计量。参 错误。判断题 有5个学生的体育成绩分别为 分,这组成绩的众数是88分。参 错误。判断题 学生的百分制成绩属于度量数据。参 正确。判断题 一般情况下,大样本是指样本容量超过60的样本。参 错误。判断题 统计图的标题要写在图的上方。参 错误。判断题 直条图是用来表示连续...
教育统计学作业答案
判断题 总体平均数属于统计量。参 错误。判断题 有5个学生的体育成绩分别为 分,这组成绩的众数是88分。参 错误。判断题 学生的百分制成绩属于度量数据。参 正确。判断题 一般情况下,大样本是指样本容量超过60的样本。参 错误。判断题 统计图的标题要写在图的上方。参 错误。判断题 直条图是用来表示连续...
教育统计与评价作业答案
1 对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。这种方法称为。a.描述性统计。2 对信度的估计方法采用。c.相关法。3 测量的可靠性是指测量的。b.信度。4 在不易简明扼要地表达答案的意思时,最好选用哪一种类型问卷。b.开放式。5 反映某一事物或现象内部差异情况的指标是。d.标...