1)计算成绩的平均数、方差、标准差、中位数、四分位距、离散系数、全距、不及。
格率; data="管理学院2007级学生统计学课程成绩。csv",head=true)>data=data[,-1]
平均数=mean(data);平均数[1] 79.2977
方差=var(data);方差[1] 167.7606
标准差=sd(data);标准差[1] 12.95224
中位数=median(data);中位数[1]80.975
四分位距=c(quantile(data,probs=c(0.75)))c(quantile(data,probs=c(0.25)))四分位距75%15.975
离散系数=标准差/平均数;离散系数[1] 0.1633369
全距=c(max(data)-min(data));全距[1] 72.8
不及格率=length(data[data<60])/length(data);不及格率[1] 0.08865248
2)分别计算会计大类、经济大类学生的统计学成绩的平均数、方差、标准差、中位。
数、四分位距、离散系数、全距、不及格率;会计大类:
data="管理学院2007级学生统计学课程成绩。csv",head=true)
data=data[,-1]> data1=data[1:141]
平均值1=mean(data1);平均值1[1] 81.90816
标准差1=sd(data1);标准差1[1] 10.64061
中位数1=median(data1);中位数1[1] 82.8
四分位距1=c(quantile(data1,probs=c(0.75)))c(quantile(data1,probs=c(0.25)))四分位距175%12.35
离散系数1=标准差1/平均值1;离散系数1[1] 0.129909
全距1=c(max(data1)-min(data1));全距1[1] 54.2
不及格率1=length(data1[data1<60])/length(data1);不及格率1[1] 0.03546099经济大类:
data="管理学院2007级学生统计学课程成绩。csv",head=true)>data=data[,-1]> data2=data[142:282]
平均值2=mean(data2);平均值2[1] 76.68723
标准差2=sd(data2);标准差2[1] 14.48346
中位数2=median(data2);中位数2[1] 78.4
四分位距2=c(quantile(data2,probs=c(0.75)))c(quantile(data2,probs=c(0.25)))四分位距275%18.8
离散系数2=标准差2/平均值2;离散系数2[1] 0.188864
全距2=c(max(data2)-min(data2));全距2[1] 72.8
不及格率2=length(data2[data2<60])/length(data2);不及格率2[1] 0.141844
3)选择合适图形,对两个大类学生统计学成绩进行图示,并进行比较分析;
data="管理学院2007级学生统计学课程成绩。csv",head=true)>data=data[,-1]>会计学=data[1:141]
经济大类=data[142:282]>
figureparameter=par(mfrow=c(2,2),bg="light green",>hist(会计学);hist(经济大类)
分析:会计学和经济大类都集中分布于75~90分,可见普遍成绩较好。经济大类的高分段(90~95)比例又高于会计学,但是不及格率高于会计学,可见经济大类的成绩离散程度高于会计,即成绩分布大。
4)设计一种或几种抽样方法,抽取40名学生的成绩,组成一个样本,计算该样本的。
平均数、方差、标准差、中位数、四分位距、离散系数、全距、不及格率,并与总体指标进行比较,看看是偏高了还是偏低了,你觉得应该如何改进抽样方法以进一步减小这种误差?
data="管理学院2007级学生统计学课程成绩。csv",head=true)
data=data[,-1]
样本=sample(data,40, replace = false)>均值=mean(样本);均值[1] 79.48
方差=var(样本);方差[1] 178.6356
标准差=sd(样本);标准差。
中位数=median(样本);中位数[1] 81.875
四分位距=c(quantile(样本,probs=c(0.75)))c(quantile(样本,probs=c(0.25)))四分位距75%
离散系数=标准差/均值;离散系数[1] 0.1681613
全距=c(max(样本)-min(样本));全距[1] 59.5
不及格率=length(样本[样本<60])/length(样本);不及格率[1] 0.05
summary(data);summary(样本)
min. 1st 3rd 1st 3rd
可以看出样本得出的均值、方差、标准差、不及格率高于总体数据,四分位距、离散系数、全距均低于总体数据,原因推测为总体为左偏分布,高分同学被抽到的概率大于低分同学,导致样本总体测值偏高。我认为可行的改进方法是进行分层抽样,这样抽到的数据更有代表性,可以减少上种方法出现的误差。
第二章作业
1 试画出下列各孔 轴配合的公差带图,并计算它们的极限尺寸 尺寸公差 配合公差及极限间隙或极限过盈。1 孔mm,轴mm 孔 轴 最大间隙 最大过盈 过渡配合。配合公差 若问 某孔轴配合,最大间隙37微米,配合公差64微米,此配合为?配合?2 孔mm,轴mm 孔 轴 最大间隙 最小间隙 配合公差 若问...
第二章作业
1两台火力发电机组并列运行,额定容量均为100mw,耗量特性分别为 f1 1 0.2pg1 0.001pg12 t h f2 2 0.1pg2 0.002pg22 t h 当负荷为160mw时,试求 平均分配负荷时每小时耗煤多少吨?最优分配负荷时每小时耗煤多少吨?2某火电厂装设两套发电设备,其耗量特...
第二章作业
1 什么是 导线和扩径导线?采用扩径导线或 导线的主要目的是什么?2 架空输电线为什么要换位?何谓 完全换位 3 什么是电力线路的电晕?它与哪些因素有关?4 标么值定义是什么?有何特点?基准值的选取应注意什么?5 架空线路与电缆线各有什么特点?在电气参数上主要有哪些差别?适用于什么场合?6 计算线路...