统计学线性回归分析作业

发布 2022-08-26 07:33:28 阅读 8694

白杨树重量与其直径、高度、生长地点的相关指标数据表。

一、 散点图。

白杨树重量与地点的散点图相关性很弱。

白杨树重量与高度的散点图相关性较强,为正相关。

白杨树重量与直径的散点图相关性很强,为正相关。

二、 检验(统计-回归-回归)

回归分析: 重量与直径, 高度, 地点

回归方程为:重量 = 0.185 + 0.513 直径 - 0.210 高度 + 0.0019 地点。

自变量系数系数标准误 t p

常量 -0.18477 0.07859 -2.35 0.043

直径 0.51276 0.04428 11.58 0.000

高度 -0.21012 0.04172 -5.04 0.001

地点 0.00193 0.02861 0.07 0.948

s = 0.0469198 r-sq = 98.9% r-sq(调整) =98.6%

方差分析。**自由度 ss ms f p

回归3 1.85328 0.61776 280.61 0.000

残差误差 9 0.01981 0.00220

合计12 1.87309

**自由度 seq ss

直径 1 1.78807

高度 1 0.06520

地点 1 0.00001

异常观测值。

拟合值标准化。

观测值直径重量拟合值标准误残差残差。

2 2.12 0.1500 0.2423 0.0224 -0.0923 -2.24r

r 表示此观测值含有大的标准化残差。

因地点的p值大于0.05,无法通过回归方程检验,故剔除自变量“地点”。

回归分析: 重量与直径, 高度

回归方程为:重量 = 0.181 + 0.514 直径 - 0.211 高度。

自变量系数系数标准误 t p

常量 -0.18114 0.05432 -3.33 0.008

直径 0.51395 0.03851 13.35 0.000

高度 -0.21116 0.03682 -5.74 0.000

s = 0.0445233 r-sq = 98.9% r-sq(调整) =98.7%

方差分析。**自由度 ss ms f p

回归2 1.85327 0.92663 467.45 0.000

残差误差 10 0.01982 0.00198

合计12 1.87309

**自由度 seq ss

直径 1 1.78807

高度 1 0.06520

异常观测值。

拟合值标准化。

观测值直径重量拟合值标准误残差残差。

2 2.12 0.1500 0.2433 0.0162 -0.0933 -2.25r

r 表示此观测值含有大的标准化残差。

1. 拟合优度检验:

由于r-sq(调整) =98.7%,故数据之间拟合度很好,通过检验。

2. 回归系数显著性检验(t检验):

根据回归分析: 重量与直径, 高度, 地点。

由直径的p值=0.000(p<0.05即可通过检验),拒绝原假设,白杨树重量与直径之间存**性关系。

由高度的p值=0.001,拒绝原假设,白杨树重量与高度之间存**性关系。

由地点的p值=0.948,接受原假设,白杨树重量与生长地点间不存**性关系。

所以剔除变量地点,再回归分析: 重量与直径, 高度。

由直径的p值=0.000,拒绝原假设,白杨树重量与直径之间存**性关系。

由高度的p值=0.000,拒绝原假设,白杨树重量与高度之间存**性关系。

3. 回归方程显著性检验(f检验):

p=0.000(p<0.05即可通过检验),故拒绝原假设,方程通过检验。

三、 多重共线性检验:

回归分析: 直径与高度

回归方程为:直径 = 0.917 + 0.923 高度。

自变量系数系数标准误 t p

常量 -0.9173 0.3231 -2.84 0.016

高度 0.92323 0.07495 12.32 0.000

s = 0.348607 r-sq = 93.2% r-sq(调整) =92.6%

方差分析。**自由度 ss ms f p

回归1 18.438 18.438 151.72 0.000

残差误差 11 1.337 0.122

合计12 19.775

回归分析: 重量与高度

回归方程为:重量 = 0.653 + 0.263 高度。

自变量系数系数标准误 t p

常量 -0.6526 0.1707 -3.82 0.003

高度 0.26334 0.03959 6.65 0.000

s = 0.184127 r-sq = 80.1% r-sq(调整) =78.3%

方差分析。**自由度 ss ms f p

回归1 1.5002 1.5002 44.25 0.000

残差误差 11 0.3729 0.0339

合计12 1.8731

由p值<0.05,所以直径和高度有很大相关性,又由于高度和直径的拟合度更佳,故剔除高度,保留直径。

四、 随机误差项正态性检验。

p值》0.05,接受原假设,通过检验。

五、 自相关检验(杜宾检验):

回归分析: 重量与直径

回归方程为:重量 = 0.435 + 0.301 直径。

自变量系数系数标准误 t p

常量 -0.43547 0.06195 -7.03 0.000

直径 0.30070 0.01977 15.21 0.000

s = 0.0879171 r-sq = 95.5% r-sq(调整) =95.0%

方差分析。**自由度 ss ms f p

回归1 1.7881 1.7881 231.33 0.000

残差误差 11 0.0850 0.0077

合计12 1.8731

durbin-watson 统计量 = 1.64970

因为n=13 k=1 由查表知dl=1.01 du=1.34 du六、 异方差检验:

相关: c6, c7

c6 和 c7 的 pearson 相关系数 = 0.025

p 值 = 0.936

残差排秩和直径排秩

p值》0.05,接受原假设,为同方差,通过检验。

统计学实证分析作业例举

江西边界经济差异影响因素分析。一省边界经济是指在地理上与外省接壤,地处周边省际交界线的县 市 所构成的经济带或圈,它属于区域经济的范畴。江西边界县按2003年底行政区划分,共有37个,与周边湖北 湖南 安徽 广东 福建 浙江等6省39个县 市 相邻 边界县域土地面积7.40万平方公里,占县域行政区划...

统计学作业

课程 生物统计学。学号 2010114010132 作业次数 p23 第二章试验资料的整理与特征数的计算。习题2.5 某地100例30 40岁健康男子血清总胆固醇 mol l 测定结果如下 试根据所给资料编制次数分布表。解 1.求全距。7.22 2.70 4.52 mol l 2 确定组数和组距 参...

统计学作业

一 调查目的。了解当前大学生的课外活动情况,分析大学生课外活动的现状,指出大学生课外活动的误区,并提出建设性的对策思考。在此基础上,提出相应的改进建议,为今后的大学生的课外活动提供一个可供参考的方案。二 调查内容。本次调查涉及被调查者的性别 年级,课外活动的频率 类别 时长。3 抽样框和样本。1 抽...