实验作业一。
2.已知某高速公路采集的车辆速度数据,应用spss软件,输出。
1)平均速度
2)中位速度
3)15%速度。
4)85%速度。
5)最高速度。
6)最低速度。
7)标准差。
8)各速度频率及累计频率。
过程:输出:
9)以起点为80,组距为5,绘制各组频数直方图,并描绘正态曲线。
10)绘制茎叶图。
11)绘制箱型图。
过程:直方图:
茎叶图:箱型图:
实验作业二。
1.分别测得14名事故组驾驶员及11名非事故组驾驶员反应时数据。试比较两组驾驶员平均反应时有无显著差别(取置信水平为0.1)
事故组驾驶员:2.9;5.
41;5.48;4.6;4.
03;5.1;4.97;4.
24;4.36;2.72;2.
37;2.09;7.1;5.
92非事故组驾驶员:5.18;8.79;3.14;6.46;3.72;6.64;5.6;4.57;7.71;4.99;4.01
步骤:(1)、将数据整合为一列,用0表示事故组,1表示非事故组,如图所示:
2)选择分析—比较均值—独立样本t检验,如图所示:
3)在独立样本t检验窗口中将变量导入相关窗口,并定义组,在选项中设置置信区间百分比为90% 。如下:
4)完成之后选择确定从而得到如下图的结果。
结果分析:第一张**给出的是一些统计结果,第二张**是检验结果,样本在“方差方程的 levene 检验”一栏指出,检验类型为f,检验统计量值f=0.440,对应水平值sig.
=0.516,说明在0.1的检验水平下,可以认为方差相等。
因此,进入“均值方程的 t 检验”一栏时,只需要看与“假设方差相等”对齐的一行(第一行),这一行指出:检验类型为t,检验统计量值t=-1.807,自由度df=23,(双侧)水平值sig.
=0.084,所以在0.1的显著性水平下可以认为两者有显著差别。
2.某地区汽车拥有量y和交通事故数x见下表,计算y和x的相关系数,并进行显著性检验。
说明采用哪种相关系数进行计算,原因?
步骤:(1)将数据导入spss,如下:
2)完成之后选择分析—相关性—双变量,如下图所示,之后弹出相关性分析主对话框,导入变量,并设置相关参数。
参数设置时,“相关系数”一栏有三个可以选择,区别如下:
pearson:皮尔逊相关,计算连续变量或是等间距测度的变量间的相关分析;
kendall:肯德尔相关,计算等级变量间的秩相关;
spearman:斯皮尔曼相关,计算斯皮尔曼秩相关。
注意一下几点:
a、对于非等间距测度的连续变量,因为分布不明,可以使用等级相关分析,也可以使用pearson相关分析;
b、对于完全等级的离散变量,必须使用等级相关分析相关性,当数据资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用spearman或kendall相关分析。
本题目所给数据为等间距测度的变量,故选用pearson。
对于显著性检验一栏,由于先不知道相关方向(正相关还是负相关),则可以选择双侧检验。
结果:结果分析:
显著性(双侧)=.000,说明在0.01水平上y与x显著相关。pearson 相关系数为0.948。
实验作业三。
一、 以上为我国2023年-2023年国民收入情况,试依据上表建立国民收入**方程。
1)首先定义变量,将年份定义为变量x1,收入定义为变量x2,然后输入相关数据。
2)建立**方程之前先要进行回归分析,在回归分析之前,有必要绘制散点图,以便于帮助分析**。
步骤:a.将所有数据导入spss,如下图:
b.散点图,过程和结果如下:
结果可以看出,1952-2023年和1978-2023年两个阶段分别有一定的线性关系,所以分别对这两个阶段进行回归分析。
c.回归分析过程:
d.结果:结果分析:
回归方程:
通过参数显著性检验。
同样的方法得出1978-2023年的回归分析结果如下:
结果分析:回归方程:
通过参数显著性检验。
二、以下为我国历年人均生活收入和生活支出情况。建立两变量关系模型。
步骤:1)将数据输入spss,如下:
2)做散点图,步骤见上题,结果如下:
从上面的散点图可以看出,人均生活费支出先是随着人均生活费收入的提高而快速提高,但当收入达到一定水平后。生活费支出的增幅明显趋缓。因此,用线性回归模型表示y和x的关系是不恰当的。
3)对y和x取自然对数和,作出散点图,操作和结果如下(只写出转化变量步骤,作图步骤为给出):
结果:可以看出,和在散点图上近似为线性关系。于是把回归模型确定为幂函数模型:
并进行双对数变换,得:
分别令,得到先行方程;
4)回归分析,操作步骤见上题,结果如下:
结果如下:回归方程:
模型通过参数显著性检验。
三、某种商品的需求量y,**x1和消费者收入x2的统计资料如下,建立y和x1,x2变量之间的模型。
步骤:1)将数据导入spss,如下:
2)按如下操作:
3)结果及分析:
可得回归方程:
sig.<0.05,模型通过参数显著性检验。
实验作业四。
附表为国家统计局获取的2023年全国各省市各行业工资水平统计表。试分析:
1)应用描述统计分析方法,判断哪些行业平均工资水平较高。
2)应用聚类分析方法,判断哪些地区平均工资水平较高。
一、1)首先根据要求定义变量,将2023年的各个行业分别定义为x1、x2…x19,然后输入相应的数据。
2)数据输入完成之后,菜单选择分析—描述统计—描述,如下图所示。
3)弹出描述统计对话框之后将定义的行业变量全部导入变量框中,如下图所示。
4)单击选项,选择需要描述的选项,选择均值,并要求按均值降序排序,如下图所示,单击继续,然后点击确定,开始分析。
SPSS作业
p.117第10题。把数据列入spss中为。得出两因素完全随机有重复观察值资料。glm 单变量方差分析 lgda为因变量,a b为固定变量 效应模型设定 a主效应 b主效应 a b互作效应 两两比较。方差分析得出 a因素各水平间 b因素各水平间及a b互作的sig均小于0.01,所以认为均存在极显著...
SPSS作业
常用统计软件spss实验报告。学院 动物科技学院。班级 水产1401班姓名 学号 实验一 t检验 非配对样本的检验。一 实验目的 1 学会应用spss软件进行数据整理和分析。2 能够应用spss软件对相关数据做出方差分析。3 掌握spss软件功能及正确分析实验结果的能力。二 实验内容 实验二 t检验...
spss作业
成都体育学院。2010年攻读硕士学位研究生考试试卷。学号 2010100019 专业体育人文社会学 考试科目体育统计与spss软件应用 任课教师郭新艳 考生姓名沈雨婷 考试时间2010.12.2 一 答 1 统计资料分为三类 计量资料 计数资料 等级资料。2 统计处理方法 计量资料。对这类资料通常先...