思考与练习。
1.什么是异方差性?举例说明经济现象中的异方差性。
2.考察以下模型。
式中的按下述方式取决于。
式中是一个独立于且满足全部古典假定的随机变量。对原模型(1)是否可以利用?为什么?
3.在如下回归中,你是否预期存在异方差?
4.对某沿海地区家庭每年生活开支和每年收入进行抽样研究,调查了20个家庭,其中每五个家庭收入相同,共分作四组,数据列表如下:
家庭生活开支模型设定为。
式中:表示家庭生活开支,表示家庭收入。
利用求回归方程。
做散点图,观察家庭生活开支离差量的变化情况。
把数据分作两个子样本,第一子样本包括收入为5000元与10000元的家庭,即低收入家庭。第二个子样本包括收入为15000元和20000元的家庭,即高收入的家庭。进行检验。
设,其中为一非零常数,变换原模型求回归方程。
5. 什么是自相关性?自相关**性回归模型中存在的主要原因有哪些?自相关可能造成哪些后果?
6. 利用以下给定的统计量进行序列相关检验。
(=自变量数目, =样本容量)
1)=0.81, =3, =21,显著性水平=5%
2)=3.48, =2, =15,显著性水平=5%
3)=1.56, =5, =30,显著性水平=5%
4)=2.64, =4, =35,显著性水平=5%
5)=1.75, =1, =45,显著性水平=5%
6)=0.91, =2, =28,显著性水平=5%
7)=1.03, =5, =26,显著性水平=5%
7.某子公司的年销售额与其总公司年销售额的观测数据如下表:
用估计关于的回归方程;
用检验分析随机项的一阶自相关性;
用两步法估计回归模型的参数;
直接用差分法估计回归模型参数。
8.什么是多重共线性? 多重共线性在多元线性回归模型中普遍存在的主要原因有哪些?多重共线性可能造成哪些不利后果?
9. 考虑以下模型:。由于和是的函数,所以它们之间存在多重共线性,你同意这种说法吗?为什么?
10. 将下列模型用适当的方法消除多重共线性:
1) 消费模型为。
其中,、、分别代表消费、工资收入和非工资收入,与可能高度相关,但研究表明。
2) 需求模型为。
其中。、、分别为需求量、收入水平、该商品**水平及其替代品**水平,、可能高度相关。
11. 下表给出因变量与解释变量的时间序列数据:
用适当的方法检验多重共线性。
用逐步回归分析法确定一个较好的回归模型。
12. 利用工具变量法估计模型参数的基本思想是什么?
13. 某经济学家想要估计税收入函数。
式中: =**税收。
=国内生产总值。
已知有测量误差,为了把注册的汽车数量作为一个工具变量,研究者决定采用工具变量法。有关数据如下表。
1) 试用估计税收函数;
2) 用工具变量法估计税收函数,比较这两个估计函数;
3) 是不是的一个好的工具变量?
思考与练习。
1. 解:古典线性回归模型的一个很重要的假定是随机项的同方差性,即对于每个,的方差都是同一个常数,当此假定不能满足时,则的方差在不同次的观测中不再是一个常数,而是取得不同的数值,即。
常数 1,2,…,
则称随机项具有异方差性(heteroscedasticity)。
例如,考虑家庭的可支配收入和储蓄的关系,如建立如下模型。
其中,为第个家庭的储蓄,为第个家庭的收入。从二者的关系不难看出,当收入增加时,储蓄平均也会随之增加。如果我们对不同收入水平家庭的储蓄进行观察,同样也会发现,低收入的家庭储蓄差异性较小,而高收入的家庭储蓄的差异性较大。
这是因为低收入的家庭,其收入中扣除必要的生活支出以外,用于其他支出和储蓄的部分也较少,因此随机项波动的程度小,即方差小;而高收入家庭,其收入中扣除必要的生活支出以外,剩余的就较多,就有更大的使用选择余地,这样储蓄的差异就较大,因而随机项波动的程度就大,即方差大。因此,对于家庭储蓄模型,随机项具有异方差性。
2. 解:模型(1)无法使用ols进行参数估计,因为随机误差项,即随机误差项与解释变量的平方之间有着显著地相关关系,这样会造成随机误差项的异方差现象,所以ols不可以使用。
3. 解:
4. 解:对某沿海地区家庭每年生活开支和每年收入进行抽样研究,调查了20个家庭,其中每五个家庭收。
入相同,共分作四组,数据列表如下:
家庭生活开支模型设定为。
式中:表示家庭生活开支,表示家庭收入。
利用求回归方程:。
做散点图,观察家庭生活开支离差量的变化情况。
由图形可以看出随着收入的增加,家庭生活开支的波动幅度逐渐增大。
把数据分作两个子样本,第一子样本包括收入为5000元与10000元的家庭,即低收入家庭。第二个子样本包括收入为15000元和20000元的家庭,即高收入的家庭。进行检验。
设,其中为一非零常数,变换原模型求回归方程。
5. 解:在古典假设下,线性回归模型中参数的最小二乘估计量具有线性、无偏和有效性。
其中,有效性不仅依赖于古典假设中关于随机项的同方差假定,还依赖与随机项不存在序列自相关假定,即。
这表明随机项在不同观测点下取值不相关。若这个假定违背,,即在不同观测点下的取值相关联,则称存在序列相关或叫自相关(autoregression)。
自相关产生的原因很多,主要有:
1)被解释变量的自相关,许多经济变量往往会有自相关,使用时间序列数据更是如此,其本期值往往受滞后值的影响。
2)模型省略了自相关的解释变量。在建立回归模型时,总是要略去某些次要的解释变量。如果略去的解释变量有一些存在自相关,它必然在随机项中反映出来,从而使随机项具有自相关性。
3)随机项本身存在自相关。在许多情况下,随机因素(如干旱、暴风雨、战争、**等)所产生的影响,常常持续好长时间。
4)回归模型的数学形式不正确。若回归模型所采用的数学形式与所研究问题的真实关系不一致,随机项就可能存在自相关。
5)经济变量的惯性作用。大多数的经济时间序列都有一个明显的特点,就是他们的惯性。由于经济变量的惯性,使得许多经济变量前后期总是相互关联的。
自相关产生的后果,如果模型中的随机项存在自相关,仍然采用普通最小二乘法,会有以下后果:
1)最小二乘估计量仍然是线性的和无偏的,但不具有最小方差性,即不是最优的。
2)最小二乘估计量的方差估计是有偏的,用来估计随机项的方差和回归参数的方差公式会严重低估真实的方差和标准差,导致值偏大,使得某些参数显著不为零,即高估了部分参数的显著性。
3)因变量的**精度降低。
6. 利用以下给定的统计量进行序列相关检验。(=自变量数目, =样本容量)
1)=0.81, =3, =21,显著性水平=5%:dl=1.03, du=1.67,因为=0.81< dl, 所以存在一阶正自相关。
2)=3.48, =2, =15,显著性水平=5%:dl=0.95, du=1.54,因为=3.48>4-dl, 所以存在一阶负自相关。
3)=1.56, =5, =30,显著性水平=5%:dl=1.
07, du=1.83,因为dl<=1.56(4)=2.
64, =4, =35,显著性水平=5%:dl=1.22, du=1.
73,因为(4-du)<=2.64<(4-dl), 所以无法判断。
5)=1.75, =1, =45,显著性水平=5%:dl=1.48, du=1.57,因为du <=1.75<(4-du), 所以不存在自相关。
6)=0.91, =2, =28,显著性水平=5%:dl=1.26, du=1.56,因为=0.91< dl, 所以存在一阶正自相关。
练习4答案
一选择题。1对do.while语句错误的描述是 c a 可构成多重循环结构 b 循环次数不可能为0 c 循环次数可能为0 d 先执行后判断。2当执行以下程序时,c include void main int a while a 5 printf d a a 循环体将执行5次 b 循环体将执行0次。c...
练习1 4答案
练习三。1.传统的六书把汉字分成象形 指事 会意 形声 转注 假借六类。许慎的说法 2.裘锡圭先生的三书说把汉字分成表意字 形声字 假借字三类。3.名词解释 六书说 三书说。六书说 汉代学者 许慎 创造的汉字基本构造理论,把汉字分成六类,象形 指事 会意 形声 转注 假借。三书说 新兴的汉字构造理论...
练习题4答案
一 填空题。1.数码管共阴接法下,要显示字形 5 则 a c d f g段亮,b e段灭。2.键盘工作方式有三种 分别是查询扫描方式 查询 中断混合方式和中断扫描方式。二 选择题。1.按键的机械抖动时间参数通常是 c a.0 b.5 10 s c.5 10ms d.1s 以上。2.n 位 led 显...