SPSS课件第3章

发布 2023-05-19 18:12:28 阅读 5229

第二篇 spss与基础统计分析。

虽然现在各种各样先进前沿的统计方法和统计模型不断涌现,但是描述统计在整个统计学中的地位仍然是最重要的。其重要性体现在两个方面,一方面是因为在实际工作中,描述统计仍然是使用最广泛的方法,这是由于任何统计方法都有条件,而描述统计对数据的限制条件最少,这就决定了它的使用范围最广泛,而且,对于实际中的一些问题,往往不要求解决得非常精细,用描述统计的方法已经足够,没有必要采用其他方法;另一方面是因为描述统计是其他统计分析的基础,我们对数据的分析都是从描述统计开始的,通过描述统计掌握了数据分布的一些基本特征以后,才能决定接下来采用哪种统计方法,因此描述统计对于后续的统计分析将起到重要的指导和参考作用。

描述统计的范围相当宽泛,方法也很多,归纳起来有四个方面:

单个变量的频数分析,编制频数分布表;

计算单个变量的描述统计量;

比较两个变量,编制交互列联表,并分析变量是否相关;

其他的一些探索性分析。

为实现上述功能,可以有两条途径,一是数值计算,例如统计量的计算,频数的计算,通过精确计算数值来反映统计特征;二是绘制图表,绘制常用的统计图形,利用图形直观的展示数据的分布特点。我们通常将两者结合一来使用,达到相辅相成的效果。

需要注意的是,不同尺度类型的变量,其描述统计的方法是不尽相同的,间隔尺度变量的描述统计方法不一定使用于顺序尺度变量,而顺序尺度变量的统计方法又不一定适合名义尺度变量,这一点非常重要,但是往往容易被分析者所忽略。很多分析者都是不管三七二十一,拿了数据就计算均值、方差,殊不知有时这种计算根本就没有任何意义,结果也不能说明任何问题,因此,在本章中,我们试图针对不同的变量尺度,介绍不同的描述统计方法,并详细介绍每种方法的适用条件,请读者在学习中注意区别。我们先顺序尺度和名义尺度变量的描述分析,然后是间隔尺度变量的描述分析,最后是两个变量的列联表分析。

变量尺度对描述统计分析有着重大的影响,特别是对顺序尺度和名义尺度变量的描述统计,要引起读者足够的重视。在本节开始,我们首先给出一个例子,通过这个例子,我们将能够理解顺序尺度和名义尺度变量的特点,并掌握对这些变量进行分析的要点。

例3-1 现有广告的形式和广告吸引力的数据(见光盘第3章请对此数据进行描述统计分析。

打开数据3-1,我们发现有两个变量,“adtype”表示广告的类型,而“adattrac”表示广告的吸引力,我们虽然在1.1.1就讲过了名义尺度和顺序尺度变量的定义了,但是在这里我们仍然准备再将它们的特点重点阐述一下,加深读者的理解。

广告形式是名义尺度变量,我们注意到它只是取3个值:

1代表广告方式是纯文本方式,2代表广告方式是黑白**广告,3代表广告方式是全彩色**广告。这三个取值仅仅代表三种广告方式,它们不能比较大小,没有顺序。因此,可以归纳出名义尺度变量的特点:

变量只取有限几个值;

变量值仅仅代表不同类别,变量值不能比较大小,即无序。

名义尺度变量最大的特点是无序,接下来我们来看顺序尺度变量的特点,广告吸引力是顺序尺度变量,注意到它取5个值:

1代表非常有吸引力,2代表有吸引力,3代表一般吸引力,4代表不是非常有吸引力,5代表非常没有吸引力。这5个取值代表了不同的程度,它们有顺序,例如1比2好,2比3好,但是不能比较大小差异,例如:非常有吸引力对有吸引力的差异,和有吸引力对一般吸引力的差异,就不能比较了,不能说两者相等,也不能说非常有吸引力对一般吸引力的差异就是后者的两倍。

因此,归纳顺序尺度变量的特点:

变量只取有限几个值;

变量值代表不同程度,变量值有序;

变量值之间的差异无法衡量。

顺序尺度变量最大的特点是有序无量。下面我们将介绍这两类尺度变量的描述统计方法。

在spss中,描述统计分析的菜单集中在【analyze】菜单下的【descriptive statistics】菜单下,如图3-1所示。

图3-1 描述统计分析的主要功能。

对于名义尺度变量,由于其取有限个值,适合做频数分析,同时由于其无序,因此,描述统计量集中趋势的统计量只能计算众数,而关于离散趋势的统计量只能计算异众比率,分布状态的统计量不能计算。同时许多图形不能绘制,只能绘制条形图和饼图。

频数分析的操作。

要进行频数分析,利用以下操作完成:

step1:选择【analyze】菜单→【descriptive statistics】菜单→【frequencies】菜单。

进入如图3-2的对话框,该对话框主要由三部分组成,左边是待选变量框,列出了所有数据集文件中的变量,中间是频数分析变量框,右边三个按钮是频数分析设置按钮。

step2:选择频数分析变量。

将变量“广告类型(adtype)”选入频数分析变量框中。

step3:进行频数分析相关设置。

点击,进入如图3-3对话框,由于只能计算众数,因此选择“mode”,点击回到如图3-2的主对话框。

图3-2 频数分析主对话框。

图3-3 计算统计量对话框。

点击进入如图3-4对话框,选择作图选项,其中“bar charts”表示条形图,“pie charts”表示饼图,“histograms”表示直方图,间隔尺度变量才能做直方图,对于名义尺度和顺序尺度变量,只能做条形图或饼图,本例中做条形图;下面还有一个对话框,问作图数值采用“frequencies”频数,“percentages”频率,效果类似,本例用频数。设置完成以后点击回到图3-2的主对话框。

图3-4 作图对话框图3-5 格式对话框。

点击进入格式对话框,主要设置数据频数表的格式,一般不用修改,使用默认选项即可,说明如下:

1.order by单选按钮组:定义频数表的排列次序,四个选项为:

ascending values:按照变量值的升序做频数分布表;

descending values:按照变量值的降序做频数分布表;

ascending counts:按照频数的升序做频数分布表;

descending counts:按照频数的降序做频数分布表;

2. multiple variables 单选按钮组,如果选择了两个以上的变量做频数表,则compare variables可以将它们的结果在同一频数表中显示,便于比较;organize output by variables则在不同频数表中显示。

选择默认选项,点击回到图3-2的主对话框,点击完成频数分析操作。

对于顺序尺度变量,和名义尺度变量相似,适合做频数分析,同时由于其有序无量,因此,描述统计量集中趋势的统计量可以计算中位数和众数,而关于离散趋势的统计量也只能计算异众比率,分布状态的统计量不能计算,同样只能绘制条形图和饼图。

对于顺序尺度变量“广告吸引力(adattrac)”,其操作与变量“广告类型”操作基本相同,只是在图3-3中除了选众数“mode”外,还可以选择中位数“median”,在图3-4中选择做饼图“pie charts”。

完成描述统计的频数分析和统计量计算分析后,我们来看分析结果:

对于名义尺度变量“广告类型(adtype)”的分析结果如下,我们逐项说明。

标题“frequencies”表明是进行频数分析,下面给出数据**,表3-1广告类型statistics

表3-1显示了统计量的计算结果,其中“n”对应的两行表示样本数,“valid”表示有效样本是11个,“missing”表示有缺失值的样本是0个,下一行的“mode”表示众数为1,最后一行的注释表明众数不止一个,这里只列出最小的一个。

表3-2 广告类型。

表3-2表示根据广告类型计算频数,其中:

frequency”表示频数:即变量值落入该计数区间的次数。

percent”表示百分比频率=频数/样本总数×100%

valid percent”表示有效的百分比频率=频数/有效样本数×100%,其中有效样本数=样本总数-缺失样本数。

cumulative percent”表示累积百分比频率:各百分比频率逐级相加的结果,最终等于100%。

图3-6是广告类型频数条形图,从图中我们可以看到,“纯文本”和“全彩”的频数都是4,所以众数为1和3,这和**3-2显示的内容是一致的,也说明了**3-1的注释众数不止一个。

电子CAD课件第3章

第三章 protel dxp 2004 sp2的原理图设计环境。3.1 电路板设计的一般步骤。3.2 protel dxp 2004 sp2原理图设计系统参数的优先设定。有9个项分别为 常规设置 图形编辑 编译器 自动聚焦 网格 切割线 默认单位 默认图元 端口操作 3.2.1 设置原理图的常规环境...

第2章第3章实验答案

2.1 1 2 a3 end 解答 根据题目要求分别设置命令按钮名称属性为c1和c2,标题caption属性分别为命令按钮1和命令按钮2 设置命令按钮2的visible可视属性为false private sub c1 click 编写命令按钮1的单击事件过程。true false end sub ...

第3章作业

第3章栈和队列作业。1 若用一个大小为6的数组来实现循环队列,且当rear和front的值分别为0和3时,从队列中删除一个元素,再加入两个元素后,rear和front的值分别为多少?复旦大学98年 2和42 设栈s和队列q的初始状态为空,元素e1,e2,e3,e4,e5和e6依次通过栈s,一个元素出...