统计软件学期作业。
学院理学院。
专业统计学。
学号1109030133
姓名郑文星。
指导教师马建军。
一。 在中数据为某工厂职工的部分基本信息,其中性别变量中男女分别用1,2表示,按教育程度共分为5类,婚姻状况中用0代表未婚,1代表已婚。
1) 决策者希望了解不同受教育水平已婚职工和未婚职工之间的收入差别,试用一条形图反映有关信息。
2) 绘制一线图,以反映出不同受教育水平的男职工和女职工之间的收入差异。
3) 绘制出反映不同受教育程度员工数量的饼图。
4) 绘制一散点图,反映出不同工作年限类别员工的工作满意程度。
5) 绘制出可以反映不同工作年限类别收入水平的箱图。
二在中给出了2024年某**83个交易日的交易信息。
1) 绘制反映该**每日**最高值和最低值信息的高低图。
2)绘制出该**每个交易日**价的时间序列图,并对每日****进行自相关分析。
自相关分析:
3)创建一双轴线图,使之同时反映出该**每日****和交易量。
三某调查者想考察果汁饮料销售量的影响因素,为此调查者观察了碳酸饮料销售量, 茶饮料销售量, 固体冲泡饮料销售量和咖啡类饮料的销售量,单位均为万升, 全部数据如果文件中。 试利用相关分析或偏相关分析研究果汁饮料与碳酸饮料销售量的相关性。
相关分析:pearson相关系数为0.825,二者之间的不相关的双侧显著值为0.
000<0.01所以,所以在显著性水平为0.01下可拒绝二者不相关的假设。
所以可得结论二者存在显著相关性。
四某实验室培养一种菌群研究其活性,菌群活性和培养天数的部分观测数据见文件。
试利用回归分析研究菌群活性与培养天数之间的关系。
第一步:绘制散点图。
上图由知菌群活性与培养天数之间呈现出显著的线性关系。
第二步:回归分析。
拟合优度检验部分)相关系数r=0.941,判定系数=0.886,调整的判定系数为0.877,回归估计的标准差s=5.891.从中判断该回归方程的拟合优度很高。
回归方程的显著性检验部分)由上表数据得在0.01水平上显著(即f=100.617>f(1,12))。
回归系数的显著性检验)
由上表得知t=16.820>,所以认为该回归系数与零有显著差异,该自变量与因变量之间存在显著地线性关系。
五在文件中是研究脑溢血发病机制的数据文件,包括病人和正常人的六项指标, 其中病人为分组序号为”1”, 正常人为”0”. 希望建立上述指标与脑溢血发病之间的联系,以便可以对脑溢血的发病进行早期诊断。(提示可以利用logistic回归或判别分析)
判别分析:上图给出了样本数量、有效值和剔除值的相关信息。
表5-2上图给出了各组和所有**的均值、标准差和加权与未加权的有效值。
表5-3表5-4
上图给出了wilks的lambda检验的结果,从检验结果可以看出,引入的变量对提高分类精度是有作用的。
表5-5表5-6
上图给出了判别函数的系数与结构矩阵,可以看出,所有变量均在判别分析中使用。
表5-7上图给出了组重心处的判别函数值。
表5-8上图给出了两个组的先验概率。
**的分组结果作为新的变量被保存,从中我们可以看出这60位人员的分组,并可以看出spss对未分类观测进行的分类,分类被保存在“dis_1”变量中,“1”表示病人,“0”表示正常人,与我们在建立变量时的设置有微小的出入,有13个分组不一样。
六根据我国历年钢产量的数据,(可以查《中国工业经济统计年鉴》或其它统计数据资源), 试分析拟合钢铁产量的长期趋势。
曲线拟合:由以上结果得出给出的五种曲线估计中指数模型拟合的曲线与原始观测值拟合得最好,而其他的都有许多观察点没有拟合好。因此,由拟合图的直观观察来看,指数模型最适合本实验的数据建模。
所以我们可以得出钢产量随年份的关系为y=9.783e-97+.
七为了验证某种药物的疗效,对35位患者进行了观察。 首先记录了**前的测试数据,然后记录了**后的测试数据(详见 试分析该药品是否具有显著的疗效。
配对样本t检验:
服药前后的检查值均值,标准差,均值的标准误差。直观上看,服药前后的检查值有显著差别。
成对样本的相关系数,相关系数0.559>0,响应的概率值为0,服药前后相关系数十分显著。
统计学作业
课程 生物统计学。学号 2010114010132 作业次数 p23 第二章试验资料的整理与特征数的计算。习题2.5 某地100例30 40岁健康男子血清总胆固醇 mol l 测定结果如下 试根据所给资料编制次数分布表。解 1.求全距。7.22 2.70 4.52 mol l 2 确定组数和组距 参...
统计学作业
一 调查目的。了解当前大学生的课外活动情况,分析大学生课外活动的现状,指出大学生课外活动的误区,并提出建设性的对策思考。在此基础上,提出相应的改进建议,为今后的大学生的课外活动提供一个可供参考的方案。二 调查内容。本次调查涉及被调查者的性别 年级,课外活动的频率 类别 时长。3 抽样框和样本。1 抽...
统计学作业
spss数据分析报告。表1 3数据 网上搜集一组数据,为2010年四川农户谷子种植意愿影响因素的问卷调查后统计的数据。此次调研设计了2套问卷,分别为 综合考量问卷 和 影响因素问卷 每套问卷发放150份,综合考量问卷 136份,有效问卷125份,有效率91 9 影响因素问卷 123份,有效问卷116...