第六章线性回归分析。
2010级研究生:严飞。
学号:20101108012
2. 多元线性回归的显著性检验包括哪些内容?如何进行?
答:经过查找资料并总结得出多元线性回归的显著性检验主要包括:拟合优度检验、方程显著性检验和变量显著性检验三种。
一)拟合优度检验(r2检验)
拟合优度检验是检验回归方程对样本观测值的拟合程度,即检验所有解释变量与被解释变量之间的相关程度。检验的方法是构造一个可以表征拟合程度的指标,这个指标是通过对总变差(总离差)的分解而得到。
总变差平方和s总是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和s残是总变差平方和中未被回归方程解释的部分,由解释变量xl、x2……xk中未包含的一切因素对被解释变量y的影响而造成的;回归平方和s回是总变差平方和中由回归方程解释的部分。
一个拟合得好的回归模型,体现在总体平方和与回归平方和的接近程度,即s总中s残越小越好。于是采用:
对回归方程的拟合优度进行检验。如果所有样本观测值都位于回归方程上,即:
此时回归方程完全拟合了样本观测值,r等于1。如果r越接近1,则说明回归方程的拟合优度越高。
(二)方程显著性检验(f检验)
方程显著性检验就是对模型中解释变量与被解释变量之间的线性关系在总体上是否显著成立作出推断。即检验被解释变量y与所有解释变量 xl、x2……xk 之间的线性关系是否显著,方程显著性检验所应用的方法是数理统计学中假设检验。
检验的原假设h0与对立假设h1分别为:
h0:β0=β1……=k=0
h1:至少有一个β1不为零。
应用数理统计理论可以证明:s回与s残相互独立,且当:h0:β0=β1……=k=0为真时,s回与s残分别服从自由度为k、n-k-1的x2分布,故有:
即:f统计量服从以(k、n-k-1)为自由度的f分布。
首先根据样本观测值及回归值计算出统计量f,于是在给定的显著性水平α下,若f>fα (k、n-k-1),则拒绝h0,判定被解释变量y与所有解释变量 xl、x2……xk之间的回归效果显著,即确实存**性关系;反之,则不显著。
三)变量显著性检验(t检验)
r2检验和f检验都是将所有的解释变量作为一个整体来检验它们与被解释变量y的相关程度以及回归效果,但对于多元回归模型,方程的总体显著性并不意味每个解释变量对被解释变量y的影响都是显著的。如果某个解释变量并不显著,则应该从方程中把它剔除,重新建立更为简单的方程。所以必须对每个解释变量进行显著性检验。
等价于对每个解释变量检验假设:
h0: βj=0
h1: βj≠0
其中j=0,1,2……k。
应用数理统计理论可以证明:当:h0: βj=0为真时,统计量tj服从自由度为(n-k-1)的t分布,即:
在给定的显著性水平α下: 若︱tj︱>tα/2 (n-k-1),则拒绝h0,说明解释变量xj对被解释变量y有显著影响,即xj是影响y的主要因素;反之,接受 ,说明解释变量xj对被解释变量y无显著影响,则应删除该因素。
当影响y的主要因素只有一个变量x时,问题变成了元回归分析,此时t检验和f检验的作用是一样的,因此可以不用再做f检验。
3. 如何建立多元线性回归方程?偏相关系数有何意义?
答:一) 建立多元线性回归方程的步骤可总结如下:
1)确定研究目标,即明确建立回归方程的自变量变量和因变量,然后在一定样本中取得自变量与因变量所对应的观测值。通常,**变量是现实中容易测量的,被**变量则是现实中较难测量或是指未来发展的结果。
2)利用散点图或相关分析确定自变量与因变量之间是否存**性关系。
3)利用确定的计算方法或计算机软件计算回归方程的回归常数和回归系数,得到回归方程。
4)进行拟合优度检验。就是检验样本数据聚集在样本回归线周围的密集程度,从而判断回归方程对样本数据的代表程度。多元线性回归方程中由于引入的自变量不同,所以比较不同回归方程的拟合度时需要使用调整后的拟合度判定系数。
5)回归方程的显著性检验。回归方程显著性检验是对因变量与自变量之间线性关系是否显著的一种检验。检验方法采用方差分析 :f值等于平均的回归平方和与平均的残差平方和之比。
6)对回归系数的显著性检验(t 检验)。回归方程显著性检验是从总体上显示回归系数显著,多元线性回归,还需分别检验各回归系数的显著性。
二)偏相关系数的意义
在多个相关变量中,其他变量保持固定不变,所研究的两个变量间的线性相关称为偏相关。用来表示两个相关变量偏相关的性质与程度的统计量叫偏相关系数,绝对值越大,偏相关程度越大。根据被固定的变量个数可将偏相关系数分级,偏相关系数的级数等于被固定的变量的个数。
1)当研究2个相关变量x1、x2的关系时,用直线相关系数r12表示x1与x2线性相关的性质与程度。此时固定的变量个数为0,所以直线相关系数r12又叫做零级偏相关系数。
2)当研究3个相关变量x1、x2、x3的相关时,我们把x3保持固定不变,x1与x2的相关系数称为x1与x2的偏相关系数,记为r12-3,类似地,还有偏相关系数r13-2、 r23-1。这3个偏相关系数固定的变量个数为1,所以都叫做一级偏相关系数。
3)当研究4个相关变量x1、x2、x3、x4的相关时,须将其中的2个变量固定不变,研究另外两个变量间的相关。即此时只有二级偏相关系数才真实地反映两个相关变量间线性相关的性质与程度。二级偏相关系数共有个:
r12-34,r13-24,r14-23,r23-14,r24-13,r34-12。
一般,当研究m个相关变量x1、x2、、、xm的相关时,只有将其中的m-2个变量保持固定不变,研究另外两个变量的相关才能真实地反映这两个相关变量间的相关,即此时只有m-2级偏相关系数才真实地反映了这两个相关变量间线性相关的性质与程度。m-2级偏相关系数共有个。xi与xj的m-2级偏相关系数记为rij.
(i,j=1,2,…,m,i≠j)。
偏相关系数的取值范围为[-1,1],即:-1≤rij.≤1。
5. 如何将多项式回归转化为多元线性回归?
多项式回归问题可以通过变量转换化为多元线性回归问题来解决。
对于一元m次多项式回归方程(9-35),令、=、则(9-35)就转化为m 元线性回归方程:
因此用本章第一节的方法就可解决多项式回归问题。需要指出的是,在多项式回归分析中,检验回归系数bi是否显著,实质上就是判断自变量x的i次方项xi对依变量y的影响是否显著。
对于二元二次多项式回归方程(9-36),令,则(9-36)就转化为五元线性回归方程:
但随着自变量个数的增加,多元多项式回归分析的计算量急剧增加,于是就需要转化为多元线性回归方程进行分析了。
下面是我找的一具体实例对一元二次多项式回归作详细介绍:(大体上了解了多项式回归转化为多元回归的具体过程,不过其中数学水平要求高,还是有些地方不是很清楚,会继续努力看明白的)
例9.3】 给动物口服某种药物a 1000mg,每间隔1小时测定血药浓度(g/ml),得到表9-5的数据(血药浓度为5头供试动物的平均值)。试建立血药浓度(依变量y)对服药时间(自变量x)的回归方程。
表9-5 血药浓度与服药时间测定结果表。
一)根据表9-5的数据资料绘制x与y的散点。
图 (见下图)。由散点图我们看到:血药浓度最大值出现在服药后5小时,在5小时之前血药浓度随时间的增加而增加,在5小时之后随着时间的增加而减少,散点图呈抛物线形状,因此我们可以选用一元二次多项式来描述血药浓度与服药时间的关系,即进行一元二次多项式回归或抛物线回归。
图1 表9-5资料的散点图。
二)进行变量转换设一元二次多项式回归方程为:
令、,则得二元线性回归方程。
(三)进行二元线性回归分析先计算得:
再计算得:于是得到关于。
求出上述正规方程组系数矩阵的逆矩阵为:
关于。即:
而。于是得到二元线性回归方程为:
现在对二元线性回归方程或二元线性回归关系进行显著性检验。
列出方差分析表,进行f检验。
表9-6 二元线性回归关系方差分析表。
由查f值表得,因为f>f0.01(2,6),p<0.01,表明二元线性回归关系是极显著的。
偏回归系数的显著检验,应用f检验法:
由查f值表得,因为、,表明偏回归系数都是极显著的。
四)建立一元二次多项式回归方程将还原为,还原为x2,即得一元二次多项式回归方程为:
五)计算相关指数r2 因为,,相关指数r2为:
表明y对x的一元二次多项式回归方程的拟合度是比较高的,或者说该回归方程估测的可靠程度是比较高的。
6. 某地区的人均收入与同期某种耐用消费品的销售额之间的统计资料如下表所示。现要求确定两者之间是否存在相关关系。
具体操作步骤:
1)输入数据 (图1)
图12)分析 (图2 )
图23)变量选择 (图3)图3
spss作业 终
spss作业。班级12级心理咨询班。姓名韩兴国。学号 11122169017 19.2 咖啡屋需求调查案例。19.2.1 项目背景。1.研究目的。2003年,受毕业校友的委托,北京大学的几位在读研究生在校内进行了一次关于北京大学师生对咖啡屋及类似休闲场所的需求调查,以便对这些校友的创业决策 在北京大...
2023年终期考核方案
考核项目考核内容及分值项目要求评分细则工作完成量得分。统一居民健康档案的格式,健。为辖区常住人口建立统康档案主要信息包括 居民个。一 规范的居民健康档案,人基本信息 健康体检 重点并同步完成信息化管理健人群管理记录及其他卫生服康挡案。考核建档任务完务记录等 建立居民健康档成率和档案合格率。案,电子档...
SPSS作业
p.117第10题。把数据列入spss中为。得出两因素完全随机有重复观察值资料。glm 单变量方差分析 lgda为因变量,a b为固定变量 效应模型设定 a主效应 b主效应 a b互作效应 两两比较。方差分析得出 a因素各水平间 b因素各水平间及a b互作的sig均小于0.01,所以认为均存在极显著...