教育统计学作业

发布 2022-08-26 06:12:28 阅读 2682

一、简述标准分数的优点和应用。

答:标准分数(standard score),又称基分数或z分数(z-score),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。离平均数有多远,即表示原始分数在平均数以上或者以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。

标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。

计算公式:

z==式中:x代表原始数据,为一组数据的平均数;

s为标准差。

从上式可以明确了z分数的意义。它是一个原始分数与平均数之差除以标准差所得商数,它无实际单位,与原始分数和平均数的距离(x-)成正比,与该组分数的标准差成反比。如果一个数小于平均数,其值就为负数;如果一个数大于平均数,其值为正数;如果一个数的值等于平均数,其值为零。

可见z分数可以表明原分数在该组数据分布中的位置,故称为相对位置量数。当把原始分数转换为z分数后,只需要看z分数的数值和正负号,就立即可以明确每一个原始分数的相对地位。z分数表示其原分数在以平均数为中心时的相对位置,这比使用平均数和原分数表达了更多的信息。

1、标准分数的优点:

1)可比性。标准分数以团体平均分作为比较的基准,以标准差为单位,因此不同性质的成绩,一经转换为标准分数(均值为零,标准差为1),相当于处在不同背景下的分数,放在同一背景下去考虑,具有可比性。

2)可加性。标准分数是一个不受原始分数单位影响的抽象化数值,能使不同性质的原始分数具有相同的参照点,因而可以相加。

3)明确性。知道了某一被试的标准分数,利用标准正态分布函数值表,可以知道该分数在全体分数中的位置,即百分等级,也就知道了该被试分数在全体分数中的地位。所以,标准分数较原始分数意义更为明确。

4)稳定性。原始分数转换为标准分数后,规定标准差为1,保证了不同性质的分数在总分数中的权重一样。在心理测验中,使用标准分数可以弥补由于测试题目难易程度不同,造成不同性质测试之间标准差相距甚远,使得各个测试对总分所起的作用不同,即无形中增大了某一测试的权重的不足,使分数能更稳定、更全面、更真实地反映被试的水平。

这在学科测验和人事选拔中尤其重要,有利于录取的公正性。

2、标准分数的应用:

z分数不仅能表明原始分数在分布中的地位,而且能在不同分布的各个原始分数之间进行比较,同时,还能用代数方法处理,因此,它被教育统计学家称为“多学科表示量数”,有着广泛的用途。

1)用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。

2)计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。

3)表示标准测验分数。

二、简述各相关系数的适用资料。

答:1、积差相关系数的数据资料要满足:

1)要求成堆的数据,即若干个体中每个个体都有两种不同的观测值。

2)两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。

3)两个相关变量是连续变量,也即两列数据都是测量数据。

4)两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。

2、斯皮尔曼等级相关系数即斯皮尔曼ρ系数:适用于只有两列变量,而且是属于等级变量性质的具有线性关系的资料,主要用于解决称名数据和顺序数据的相关问题。对于属于等距或等比变量性质但其分布不是正态分布的资料也能计算等级相关。

缺点是一组能计算积差相关的资料若改用等级相关计算,精确度要差于积差相关。

3、肯德尔w系数即肯德尔和谐系数:原始数据资料的获得一般采用等级评定法,即让k个被试(或称评价者)对n件事物或n种作品进行等级评定,每个评价者都能对n件事物(或作品)的好坏、优劣、喜好、大小、高低等排出一个等级顺序。

4、肯德尔u系数即一致性系数:适用于对k个评价者的一致性进行统计分析。如果有n件事物,有k个评价者对其好坏、优劣、喜好、大小、高低等进行单一纬度的属性评价时,若评价者是采用的是对偶比较的方法,即将n件事物两两配对,可配成n(n-1)/2对,然后对每一对中两事物进行比较,择优选择,优者记1,非优者记0,然后整理所有评价者的评价结果。

5、点二列相关系数:多适用于评价由是非类测验题目组成的测验的内部一致性等问题。

6、二列相关系数:适用的资料是两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量为人为划分的二分变量。

7、多列相关系数:适合处理两列正态变量资料,其中一列为等距或等比的测量数据,另一列被人为划分为多种类别(名义变量),即多用于一列正态连续变量与另一列正态的称名变量之间的一致性分析,在测验中时常用于效度检验。

8、品质相关系数:适用于计算两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型这样的测量数据之间的相关。

9、φ系数:两个相互关联着的变量分布都是真正的二分变量,在两个分布中间都各有一个真正的缺口。适用资料是除四分相关之外的四格表(计数)资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。

10、列联表相关系数即均方相依系数或接触系数,用c表示:由二因素的r×c列联表资料求得。当数据属于r×c表的计数资料预分析所研究的二因素之间的相关程度时就会用到。

另外,当双变量的测量型数据被整理成次数分布表时也能用到。

三、简述抽样原理及抽样方法。

答:1、抽样原理:

随机化是抽样研究的基本原则。所谓随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。

由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能性使样本保持和总体有相同的结构。或者说,具有最大的可能使总体的某些特征在样本中得以表现。所以说随机抽样可以保证样本代表总体。

此外,随机抽样对于抽样误差的范围可以预算或控制。对于抽样误差的预算,意味着对研究结果的精确度来决定样本应该具有多大容量。

如果不按随机原则抽样,则由于总体中个体不能保证以相同的可能性被抽取,所抽的样本也就不能很好地代表总体,而且对于结果的精确度不能进行客观评价。

总之,在推论统计的研究中必须进行随机抽样,或者说随机化是抽样研究的基本原则。

2、抽样方法:

根据总体的不同特点和不同的调查研究目的,在实际调查研究中常常应用不同方式的随机抽样,最主要的抽样方法有简单随机抽样、分层抽样、等距抽样等。

1)简单随机抽样:

是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应由独立的、等概率被抽取的可能。常用的具体抽取方式有抽签法和随机数字法。

抽签法是把总体中的每一个体都编上号码并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。随机数字表是由一些任意的数字毫无规律地排列而成的数字表。使用随机数字表进行抽样时,先给总体编号,然后从表中任意一个数字开始依次往下数,并把最后几位数字小于总体编号数字的选出,按研究要求组成一个样本。

2)分层随机抽样:

简称分层抽样。具体做法是按照总体已有的某些特征,将总体分成几个不同的部分(一个部分叫一个层),再分别在每个部分中随机抽样。它充分利用了总体的已有信息,因而是一种非常实用的抽样方法。

对于一个总体究竟应该如何分层,分几层,要视具体情况而定。总的一个原则是,各层内的变异要小,而层与层之间的变异越大越好,否则将失去了分层的意义。具体实施过程中,有两种方式:

1、按各层人数比例分配,这是在各层内的标准差不知道的情况下常用的分配方式,基本思想是人数多的层多分配,人数少的层少分配。2、最佳分配,这是不但根据各层人数比例,还考虑到了各层标准差。如果各层内的标准差已知,就应该考虑到标准差大的层要多分配,标准差小的层要少分配。

3)两阶段随机抽样:

当总体容量很大时,直接以总体中的所有个体为对象,从中进行抽样,在实际调查或研究中存在很大困难,就采用此方法,一般而言,进行两阶段抽样时,首先将总体分成m个部分,每一部分叫做一“集团”(或“群”),第一步从m个“集团”中随机抽取m个作为第一阶段样本,第二步是分别从所选取的m个“集团”中抽取个体(ni)构成第二阶段样本,可见第一阶段样本中的单位,相对于第二阶段来说又是总体(分总体)。但注意,在将总体分成若干个“集团”后,并不是对每一个“集团”都再进行第二阶段抽样,而是从所有的“集团”中先抽取一部分“集团”,这实际上进行了第一阶段的抽样,构成了第一阶段样本,然后再对所选“集团”作第二阶段抽样。

四、简述假设检验的原理及步骤。

答:1、假设检验的原理:

假设检验的基本思想是概率性质的反证法。为了检验虚无假设,首先假定虚无假设为真,在虚无假设为真的前提下,如果导致违反逻辑或违背人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不能接受虚无假设。若没有导致不合理现象出现,那就认为“虚无假设为真”的假定是正确的,也就是说要接受虚无假设。

这种思想不同于纯数学中的反证法,假设检验中的“不合理现象”是指小概率事件在一次试验中发生了,它是基于人们在实践中广泛采用的小概率事件原理,该原理认为“小概率事件在一次试验中几乎是可能发生的。”

2、假设检验的一般步骤:(包括五个方面)

1)根据具体问题要求,提出虚无假设和备择假设。

2)选择一个合适的检验统计量,直接用样本原始观测值检验假设是困难的,必须借助于根据样本构造出的统计量,而且对不同类型的问题需要选择不同的检验统计量。

3)规定性水平α,在假设检验中有可能会犯错误,如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率就要用α表示,α就是假设检验中的显著性水平。显著性水平确定以后,拒绝与也随之而定,而且对于不同的假设形式,拒绝域是不同的。

4)计算检验统计量的值,根据样本资料计算出检验统计量的具体值。

5)做出决策。根据显著水平α和统计量的分布,查相应的统计表,查找接受域和拒绝域的临界值,用计算出的统计量的具体值与临界值相比较,做出接受虚无假设或拒绝虚无假设的决策。

另外,在假设检验中需要注意的是,在处理调查或实验数据时,经常讨论的相关两个平均数、两个比率、两个方差、两个相关系数这些统计值之间的差异问题,一般分为两种情况:①样本统计量与相应总体参数的差异;②两个样本统计量之间的差异。

五、实验设计:研究遗传与环境在儿童智力发展中的作用。

选取什么对象?如何收集数据?

如何选取对象?为什么这样取?

智商怎么测定?成绩还是智商分数?

教育统计学作业

09教管项丹飞学号 z09080069 一 名词解释。1 全距。答 全距又称两极差,是把一组数据按从小到大的顺序排序,用最大值减去最小值,是说明离散程度的最简单的统计量。2 中位数 答 中位数是指一组数据按从小到大 或从大到小 的顺序依次排列,处在中间位置的一个数 或最中间两个数据的平均数 3 众数...

教育统计学作业

第一部分。数据分析。scl 90的信效度。1.信度分析。信度分析结果所示,内部一致性系数为 0.987 0.8,表明内部一致性佳,该数据是可信可靠的。2 效度分析。效度分析结果所示,kmo 统计量的值为 0.962 0.9,因此适合做因子分析。bartlett 的球形检验概率值小于 0.05,表明效...

教育统计学作业答案

判断题 总体平均数属于统计量。参 错误。判断题 有5个学生的体育成绩分别为 分,这组成绩的众数是88分。参 错误。判断题 学生的百分制成绩属于度量数据。参 正确。判断题 一般情况下,大样本是指样本容量超过60的样本。参 错误。判断题 统计图的标题要写在图的上方。参 错误。判断题 直条图是用来表示连续...