《数据分析方法》
课程实验报告。
1.实验内容。
1)掌握回归分析的思想和计算步骤;
2) 编写程序完成回归分析的计算,包括后续的显著性检验、残差分析、box-cox变换等内容。
2. 模型建立与求解(数据结构与算法描述)
3.实验数据与实验结果。
解:根据所建立的模型在matlab中输入程序(程序见附录)得到以下结果:
1)回归方程为:
说明该化妆品的消量和该城市人群收入情况关系不大,轻微影响,与使用该化妆品的人数有关。
的无偏估计:
2)方差分析表如下表:
从分析表中可以看出:值远大于的值。所以回归关系显著。
复相关,所以回归效果显著。
解:根据所建立的模型,在matlab中输入程序(程序见附录)得到如下结果:
1)回归方程为:
在mtlab中计算学生化残差(见程序清单二),所得到的学生化残差r的值由残差可知得到的r的值在(-1,1)的概率为0.645,在(-1.5,1.
5)的概率为0.871,在(-2,2)之间的概率为0.968.
而服从正态分布的随机变量取值在(-1,1)之间的概率为0.68,在(-1.5,1.
5)之间的概率为0.87,在(-2.2)之间的概率为0.
95,所以相差较大,所以残差分析不合理,需要对数据变换。
取=0.6进行box-cox变换。
在matlab中输入程序(见程序**清单二)
取,所以得到r的值(r的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为:
拟合函数为:
通过f值,r值可以检验到,回归效果显著。
3)某医院为了了解病人对医院工作的满意程度和病人的年龄,病情的严重程度和病人的忧虑程度之间的关系,随机调查了该医院的23位病人,得数据如下表:
1) 拟合线性回归模型,通过残差分析与考察模型及有关误差分布正态性假定的合理性;
2) 若(1)中模型合理,分别在,,准则下选择最优回归方程,各准则下的选择结果是否一致?
3) 对,用逐步回归法选择最优回归方程,其结果和(2)中的数否一致?
4) 对选择的最优回归方程作残差分析,与(1)中的相应结果比较,有何变化?
习题2.6解:(1)回归参数的的最小二乘估计为:。
在matlab中输入程序(见程序**清单二)可得:,
所以回归方程为:
对数据做box-cox变换,(由于的取值在能力范围不好确定,所以经测试,取=0.6进行box-cox变换。
在matlab中输入程序(见程序**清单二)
取,所以得到r的值(r的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为:
拟合函数为:
通过f值,r值可以检验到,回归效果显著。
习题2.9解:根据所建立的模型,在matlab中输入程序,得到以下结果:
1) 所得到的回归方程为:
2) 所得到的学生化残差见附录,通过对残差的分析,很明显不符合正态分布所以(1)中所建立的模型不合理。
4.程序**清单:
习题2.4x=[1 274 2450
y=[162
n=15;p=3
b=inv(x'*x)*x'*y
h=x*inv(x'*x)*x';
sse=y'*(eye(n,n)-h)*y
d2=1/(n-p)*y'*(eye(n,n)-h)*y
sst=y'*(eye(n,n)-(1/n)*ones(n,n))*y
ssr=y'*(h-1/n*ones(n,n))*y
msr=ssr/(p-1)
mse=sse/(n-p)
f=msr/mse
r2=1-sse/sst
习题2.6x=[1 8.3 70
y=[10.3
n=31;p=3;
b=inv(x'*x)*x'*y;
h=x*inv(x'*x)*x';
sst=y'*(eye(n,n)-(1/n)*ones(n,n))*y
sse=y'*(eye(n,n)-h)*y
mse=sse/(n-p)
ssr=y'*(h-1/n*ones(n,n))*y
msr=ssr/(p-1)
f=msr/mse
r2=1-sse/sst
for i=1:n
a=h(2*(i-1)+i)
endt=sqrt((mse-mse*a))
q=y-(-57.9877+4.7082*x(:,2:2)+0.3393*x(:,3:3))
r=q/t程序三。
x=[1 8.3 70
y=[10.3
n=31;p=3;
m=0:0.01:1;
y=(y.^m-1)/m
b=inv(x'*x)*x'*y
h=x*inv(x'*x)*x';
sse=y'*(eye(n,n)-h)*y
mse=sse/(n-p)
f=msr/mse
r2=1-sse/sst
for i=1:n
a=h(2*(i-1)+i)
endt=sqrt((mse-mse*a))
q=y-(-57.9877+4.7082*x(:,2:2)+0.3393*x(:,3:3))
r=q/t习题2.9
a=[ 1 50 51 2.3 48
y=a(:,5:5)
x=a(:,1:4)
n=23;p=4;
b=inv(x'*x)*x'*y
h=x*inv(x'*x)*x';
sst=y'*(eye(n,n)-(1/n)*ones(n,n))*y
sse=y'*(eye(n,n)-h)*y
mse=sse/(n-p)
ssr=y'*(h-1/n*ones(n,n))*y
msr=ssr/(p-1)
f=msr/mse
r2=1-sse/sst
for i=1:n
a=h(2*(i-1)+i)
endt=sqrt((mse-mse*a))
q=y-(162.8575-1.2103*x(:,2:2)-0.6659*x(:,3:3)-8.613*x(:,4:4))
r=q/t附录:
习题2.6学生化残差。
江苏大学数值计算方法实习报告
学院 电气信息工程学院。班级 电气 x 学号 姓名 x 1 试用快速弦截法求此根,要求精确到小数点后第3位。include include define pi 3.1415 float f float x float y y x cos x return y main float x0 0,x1 p...
数值计算方法上机作业
地球科学与技术学院地球探测与信息技术研11 6班孙殿强s1 实验2.1迭代法 初始值与收敛性。实验目的 初步认识非线性问题的迭代法与线性问题的迭代法的差别,迭代法及初始值与迭代收敛性的关系。问题提出 迭代法是求解非线性方程 组 的基本方法,与线性方程的情况一样,其构造方法多种多样,但关键是怎样才能使...
数值计算方法实习作业小
2.1函数图形与极限。2.1.1实验目的。1.熟悉mathematica基本绘图语句。2.掌握函数极限的有关操作命令。3.学会利用mathematica软件对函数进行分析研究。4.熟悉mathematica二元函数绘图语句。2.1.2实验内容。基本语句 选项 功能 画出函数f x 从min到max间...