4. 转换---重新编码为不同变量,将-3,-2,-1,11,12→sysmis;0→0;1→6;2→9;3,4→12;5→11;6,7→15;,8,9→16;10→19
用select cases将行业编码缺失或父亲母亲受教育年限中sysmis的个案删除。
f值为367.536,是显著的,拒绝原假设,说明x1,x2,x3的作用至少有一个不为0
2)父亲受教育年限的影响更大。
父亲和母亲受教育年限的单位是相同的,且都是显著的,所以可以直接用非标准化的偏回归系数来比较,从上述回归模型中可以看出,在控制了其他变量之后,父亲受教育年限的系数为0.172,母亲受教育年限的系数为0.078<0.
172模型2在加入x2后,r2比模型1只有x1的情况下,增加了0.077,f减小了47.438;
模型3在加入x3后,r2比模型2有x1,x2的变量情况下,增加了0.005,f减小了164.69这说明,随着回归模型加入新的自变量,有更多的平方和被模型所解释。
f检验用来检验整个回归方程。模型1的f统计量检验的是年龄对受教育年限的影响这一回归方程是显著的;
模型2的f统计量检验的是年龄、父亲的受教育年限对受教育年限的影响这一回归方程是显著的,即x1,x2至少有一个系数不为0;
模型3的f统计量检验的是年龄、父亲的受教育年限、母亲受教育年限对受教育年限的影响这一回归方程是显著的,即x1,x2,x3至少有一个系数不为0。
4)相同:年龄这一变量无论在模型中都对受教育年限起着负向的作用,且都显著,这说明在控制了其他因素之后,被调查者年龄越大,受教育年限越低。
不同:随着加入新的变量,模型2加入了父亲的受教育年限,模型3在模型2的基础上加入了母亲的受教育年限,年龄的偏回归系数逐渐变小。
5)(a)h0:β1=0 h1: β1≠0 由模型1,f值为579.664,是显著的,可以拒绝原假设,说明年龄对受教育年限有着显著的影响。
b))h0:β2=β3 h1: β2≠β3
假设x4=x2—x3,将纳入到回归模型,f=24.276,显著,可以拒绝原假设。
c)h0:β1=β2=0,h1:β1=β2≠0,此检验即模型2的f检验,f=532.226,依然拒绝原假设。
d)h0:-β1=β2=β3,h1:x5=x1+x2+x3,将纳入带回归模型中,f=1333.225,依然拒绝原假设。
5.编码过程与4题相同。
1)模型ay2=843.857-2.151x1=0.272x3
2)模型by2=413.326-0.262x1+1.943x2-2.751x3+38.592y2
3)模型c38.592y1=(413.326-843.
857)+(0.262+2.151)x1+(1.
943-8.569)x2+(-2.751-0.
272)x3
11.15596-0.04895x1+0.171694x2+0.078332x3
4)模型cy1=11.156-0.049x1+0.172x2+0.078x3
根据模型c 的adjusted r2计算模型b中方差膨胀因子(vif)
vif=1/(1-0.195)=1.242
6)步骤:1.消除x1,x2,x3对的线性影响,得到残差y2*
2.消除x1,x2,x3对的线性影响,得到残差y1*
3.用残差*对*做回归。
y2*=38.592y1*
与模型b y2=413.326-0.262x1+1.
943x2-2.751x3+38.592y1进行比较,可知前者的回归系数与后者的片回归系数相等。
残差y2* y1* 已经消除了x1,x2,x3对y1和y2的线性效应,残差y2*和y1* 反映了 x1,x2,x3线性解释以外的变异,这两个残差之间的关系就是偏回归关系,是排除掉已解释部分的净关系。
7)两者有细微的差别,这是因为三步回归与整体的回归的自由度不一样,模型b更正确,三步控制的回归不能用于统计推断。
8)残差之差在保留一定小数是相同的。
通过描述统计的表可以看出。
统计学原理课程作业C
最终成绩 80.0 仅显示答错的题 一单选题。1.已知某企业4月,5月,6月,7月的平均职工人数分别为 290人,298人,296人和301人。则该企业二季度的平均职工人数应用 计算 首末折半法。简单平均法。几何平均法。加权平均法。本题分值 4.0 用户得分 0.0 用户解答 加权平均法 标准答案 ...
《统计学原理课程作业C
单选题。描述总体集中情况的统计指标称为。a 总体平均数。b 期望值。c 总体平均数或期望值。d 总体期望值。单选题。次数分配数列是 a 按数量标志分组形成的数列。b 按品质标志分组形成的数列。c 按统计指标分组所形成的数列。d 按数量标志和品质标志分组所形成的数列。单选题。为了了解某工厂职工家庭收支...
统计学原理课程作业C
一单选题。1.当变量x值增加时,变量y值随之下降,那么x与y之间存在着 直线相关关系。正相关关系。负相关关系。曲线相关关系。本题分值 4.0 用户得分 4.0 用户解答 负相关关系。标准答案 负相关关系。2.描述总体集中情况的统计指标称为 总体平均数。期望值。总体平均数或期望值。总体期望值。本题分值...