1. 普通最小二乘法(ols)
其中是的估计值,…
如何得到?普通最小二乘法选择能最小残差平方和的估计值。
即给定有关的n个观测。
同时选择的。
要使下式尽可能小:
这个问题可通过使用多元微积分求解。这样就得到这k+1个未知变量的k+1个线性方程:
这个方程组通常被称为ols一阶条件。
第i个观测值的残差:
1 残差的样本平均值为零。
2 每个自变量和ols残差之间的样本协方差为零。于是,ols拟合值和ols残差之间的样本协方差也为零。
3 点总位于ols回归线上:
2.拟合优度。
总平方和 解释平方和。
残差平方和
在回归中多增加一个自变量后,它绝对不会减少,而且通常会增大。
3.经典线性假设:
假定mlr.1(线性于参数)
总体模型可写成
其中,是我们所关心的未知参数(常数),而u则是无法观测的随机误差或随机干扰。
假定mlr.2(随机抽样)
我们有一个包含n次观测的随机样本。
它来自假定mlr.1中的总体模型。
假定mlr.3(不存在完全共线性)
在样本(因而在总体中),没有一个自变量是常数,自变量之间也不存在严格的线性关系。
假定mlr.4(条件均值为零)
给定自变量的任何值,误差u的期望值为零。换句话说,
定理:ols的无偏性。
在假定mlr.1~mlr.4下,下式对总体参数的任意值都成立,即ols估计量是总体参数的无偏估计。
在一个多元回归模型中包含一个或多个无关变量,或对模型进行了过度设定,并不会影响到ols估计量的无偏性。但对方差有影响。
遗漏了重要解释变量:设定不足时,真实总体模型为。
遗漏变量后的模型是(用“~”强调来自一个设定不足的模型。)
其中和是如下多元回归(如果我们能得到它们)的斜率估计量:对。
而则是如下简单回归的斜率:对。
由于仅取决于样本中的自变量,所以我们在计算时视之为固定(非随机)量。
这就意味着中的偏误为(遗漏变量偏误)
有两种情况使无偏:①;由于是和之间的样本协方差与的样本方差之比,所以当且仅当样本中的和不相关时,才会有。,有向上的偏误;,有向上的偏误;,有向零的偏误。
假定mlr.5(同方差性)
给定任意解释变量值,误差u都具有相同的方差。换言之,mlr.1~mlr.5一起被称作(横截面回归的)高斯-马尔可夫假定。
定理:ols斜率估计量的抽样方差。
在假定mlr.1~mlr.5之下,以自变量的样本值为条件,对所有的,都有:
其中是的总体样本变异,而则是将对所有其他自变量(并包含一个截距项)进行回归所得到的。
ols方差的成分:
1 误差方差,越大方差越大。
2 的总样本变异,的总变异越大,就越小。
3 自变量之间的线性关系。p91
除非和不相关,否则总比小。
假定和不相关,则:
1 当时,是有偏的,是无偏的,而且。
2 当时,和都是无偏的,而且。
在一般多元回归情形中,
自由度df=n-(k+1)=观测次数—估计参数的个数。
定理:的无偏估计。
在高斯-马尔可夫假定mlr.1~mlr.5下,.
的平方根被称为回归标准误或ser。
的标准差。由于未知,所以用估计量来取代,这就给出了的标准误,定理:高斯-马尔可夫定理。
在假定mlr.1~mlr.5下,分别是的最优线性无偏估计量。
假定mlr.6(正态性)
总体误差u独立于解释变量,而且服从均值为零和方差为的正态分布:。
mlr.1~mlr.6这六个假定被称为经典线性模型假定,这六个假定下的模型称为经典线性模型(clm)。
总结clm总体假定的一种简洁方法是:
定理:正态抽样分布。
在clm假定mlr.1~mlr.6下,以自变量的样本值为条件,有。
其中上面已给出。
因此, 1.检验。
定理:标准化估计量的t分布。
在clm假定mlr.1~mlr.6下,,其中。
是总体模型中未知参数的个数(个斜率参数和截距)。
虚拟假设,j对应着k个自变量中的任何一个。
用来检验虚拟假设的统计量被称为的“所谓”t统计量或“所谓”t比率,对单侧对立假设的检验。
i) 正数一侧:
拒绝法则:在显著性水平下被拒绝并支持。
ii) 负数一侧:
拒绝法则:在显著性水平下被拒绝并支持。
双侧对立假设。
拒绝法则:
检验的其他假设:检验是否等于其他某个给定的常数(不一定是0)。最常见的是和。
如虚拟假设,那么t统计量就是。
检验的p值:给定t统计量的观测值,能拒绝虚拟假设的最小显著性水平是多少?这个水平被称为检验的p值。
双侧对立假设值=,t表示一个自由度为n-k-1的t分布随机变量,而t表示该检验统计量的数值。
置信区间:利用服从自由度为的分布这个事实,经简单计算就能得到未知的一个置信区间(ci)。一个95%的置信区间就是。
2.检验关于参数的一个线性组合假设(p131)
重新写成:
如何得到?有两种方法:
分别是的无偏估计量,表示的一个估计值。
通过模型变换,改写假设检验。(p133)
3.对多个线性约束的检验:f检验(p134)
f统计量,其中是受约束模型的残差平方和,是不受约束模型的残差平方和。是从不受约束模型到受约束模型所施加的约束数(去掉了个自变量)。于是,
统计量分母中的ssr要除以不受约束模型的自由度:。
统计量服从自由度为的随机变量的分布:
拒绝法则:,则在选定的显著性水平上拒绝,而支持。
统计量的型:利用。得。
回归整体显著性的f统计量:
即,对立假设是,至少有一个异于零。
此时,其中就是y对回归的通常。
检验一般的线性约束(p144)。
计量经济学复习
11 最小二乘法 ols 的判断标准。残差平方和最小。12 参数b1,b2的计算公式。13 普通最小二乘估计量的性质。1 样本回归线通过y和x的样本均值,即 2 估计的y均值等于实测的y均值,即 3 残差ei的均值为零,即 4 残差ei和 的yi不相关,即 5 残差ei和xi不相关,即。14 经典 ...
计量经济学复习
题型 名词解释6个 单选 判断 简答 计算 2 12分 一 名词解释。1 总体回归函数 指在给定xi下的y的分布的总体均值与xi有函数关系。2 样本回归函数 指对应于某个给定的x的y值的一个样本而建立的回归函数。3 线性回归模型 指对参数 为线性的回归,即 只以它的一次方出现,对x可以是或不是线性的...
计量经济学复习
一。名词解释。1.最大似然估计。2.平稳性。3.加权最小二乘法。4.序列相关性。5.多重共线性。6.解释变量的内生性。7.虚拟变量。10.单位根。11.高斯 马尔可夫定理。12.异方差性。13最佳线性无偏估计量。14调整的可决系数。16.经典假定。17.广义差分法。18.拟合优度。19.随机误差项。...