白杨树重量与其直径、高度、生长地点的相关指标数据表。
一、 散点图。
白杨树重量与地点的散点图相关性很弱。
白杨树重量与高度的散点图相关性较强,为正相关。
白杨树重量与直径的散点图相关性很强,为正相关。
二、 检验(统计-回归-回归)
回归分析: 重量与直径, 高度, 地点
回归方程为:重量 = 0.185 + 0.513 直径 - 0.210 高度 + 0.0019 地点。
自变量系数系数标准误 t p
常量 -0.18477 0.07859 -2.35 0.043
直径 0.51276 0.04428 11.58 0.000
高度 -0.21012 0.04172 -5.04 0.001
地点 0.00193 0.02861 0.07 0.948
s = 0.0469198 r-sq = 98.9% r-sq(调整) =98.6%
方差分析。**自由度 ss ms f p
回归3 1.85328 0.61776 280.61 0.000
残差误差 9 0.01981 0.00220
合计12 1.87309
**自由度 seq ss
直径 1 1.78807
高度 1 0.06520
地点 1 0.00001
异常观测值。
拟合值标准化。
观测值直径重量拟合值标准误残差残差。
2 2.12 0.1500 0.2423 0.0224 -0.0923 -2.24r
r 表示此观测值含有大的标准化残差。
因地点的p值大于0.05,无法通过回归方程检验,故剔除自变量“地点”。
回归分析: 重量与直径, 高度
回归方程为:重量 = 0.181 + 0.514 直径 - 0.211 高度。
自变量系数系数标准误 t p
常量 -0.18114 0.05432 -3.33 0.008
直径 0.51395 0.03851 13.35 0.000
高度 -0.21116 0.03682 -5.74 0.000
s = 0.0445233 r-sq = 98.9% r-sq(调整) =98.7%
方差分析。**自由度 ss ms f p
回归2 1.85327 0.92663 467.45 0.000
残差误差 10 0.01982 0.00198
合计12 1.87309
**自由度 seq ss
直径 1 1.78807
高度 1 0.06520
异常观测值。
拟合值标准化。
观测值直径重量拟合值标准误残差残差。
2 2.12 0.1500 0.2433 0.0162 -0.0933 -2.25r
r 表示此观测值含有大的标准化残差。
1. 拟合优度检验:
由于r-sq(调整) =98.7%,故数据之间拟合度很好,通过检验。
2. 回归系数显著性检验(t检验):
根据回归分析: 重量与直径, 高度, 地点。
由直径的p值=0.000(p<0.05即可通过检验),拒绝原假设,白杨树重量与直径之间存**性关系。
由高度的p值=0.001,拒绝原假设,白杨树重量与高度之间存**性关系。
由地点的p值=0.948,接受原假设,白杨树重量与生长地点间不存**性关系。
所以剔除变量地点,再回归分析: 重量与直径, 高度。
由直径的p值=0.000,拒绝原假设,白杨树重量与直径之间存**性关系。
由高度的p值=0.000,拒绝原假设,白杨树重量与高度之间存**性关系。
3. 回归方程显著性检验(f检验):
p=0.000(p<0.05即可通过检验),故拒绝原假设,方程通过检验。
三、 多重共线性检验:
回归分析: 直径与高度
回归方程为:直径 = 0.917 + 0.923 高度。
自变量系数系数标准误 t p
常量 -0.9173 0.3231 -2.84 0.016
高度 0.92323 0.07495 12.32 0.000
s = 0.348607 r-sq = 93.2% r-sq(调整) =92.6%
方差分析。**自由度 ss ms f p
回归1 18.438 18.438 151.72 0.000
残差误差 11 1.337 0.122
合计12 19.775
回归分析: 重量与高度
回归方程为:重量 = 0.653 + 0.263 高度。
自变量系数系数标准误 t p
常量 -0.6526 0.1707 -3.82 0.003
高度 0.26334 0.03959 6.65 0.000
s = 0.184127 r-sq = 80.1% r-sq(调整) =78.3%
方差分析。**自由度 ss ms f p
回归1 1.5002 1.5002 44.25 0.000
残差误差 11 0.3729 0.0339
合计12 1.8731
由p值<0.05,所以直径和高度有很大相关性,又由于高度和直径的拟合度更佳,故剔除高度,保留直径。
四、 随机误差项正态性检验。
p值》0.05,接受原假设,通过检验。
五、 自相关检验(杜宾检验):
回归分析: 重量与直径
回归方程为:重量 = 0.435 + 0.301 直径。
自变量系数系数标准误 t p
常量 -0.43547 0.06195 -7.03 0.000
直径 0.30070 0.01977 15.21 0.000
s = 0.0879171 r-sq = 95.5% r-sq(调整) =95.0%
方差分析。**自由度 ss ms f p
回归1 1.7881 1.7881 231.33 0.000
残差误差 11 0.0850 0.0077
合计12 1.8731
durbin-watson 统计量 = 1.64970
因为n=13 k=1 由查表知dl=1.01 du=1.34 du六、 异方差检验:
相关: c6, c7
c6 和 c7 的 pearson 相关系数 = 0.025
p 值 = 0.936
残差排秩和直径排秩
p值》0.05,接受原假设,为同方差,通过检验。
统计学实证分析作业例举
江西边界经济差异影响因素分析。一省边界经济是指在地理上与外省接壤,地处周边省际交界线的县 市 所构成的经济带或圈,它属于区域经济的范畴。江西边界县按2003年底行政区划分,共有37个,与周边湖北 湖南 安徽 广东 福建 浙江等6省39个县 市 相邻 边界县域土地面积7.40万平方公里,占县域行政区划...
统计学作业
课程 生物统计学。学号 2010114010132 作业次数 p23 第二章试验资料的整理与特征数的计算。习题2.5 某地100例30 40岁健康男子血清总胆固醇 mol l 测定结果如下 试根据所给资料编制次数分布表。解 1.求全距。7.22 2.70 4.52 mol l 2 确定组数和组距 参...
统计学作业
一 调查目的。了解当前大学生的课外活动情况,分析大学生课外活动的现状,指出大学生课外活动的误区,并提出建设性的对策思考。在此基础上,提出相应的改进建议,为今后的大学生的课外活动提供一个可供参考的方案。二 调查内容。本次调查涉及被调查者的性别 年级,课外活动的频率 类别 时长。3 抽样框和样本。1 抽...