计量经济学,即使在实用和简明的形式下,对数据统计学的基本原理的清晰理解都是必不可少的。数理统计学是计量经济学的基础,它为计量经济学的研究提供了唯一而有效的方法,从某种意义上来说,计量经济学就是使数理统计学在建立经济模型中得以应用的一门学科。
数量统计学的逻辑结构如下:
1) 总体和样本。
引入随机变量来描述总体。
2)对总体的描述:随机变量的数字特征。
数学期望描述总体的一般水平。
方差描述总体的离散程度。
3)对样本的描述:样本分布的数学特征。
样本平均数,描述样本的一般水平,样本方差,描述样本的离散程度。
实际上,和是和的无偏估计量。
4)总体与样本的连接:随机变量的分布。
5)如何通过样本数据和样本分布特征来估计总体的数字特征,即和,以及总体中数据生成过程的各种参数。
a. 估计量的特征:无偏性,有效性,一致性等。
b. 估计的方法:
矩法。点估计最大似然估计法。
最小二乘估计法。
估计方法估计期望。
单个总体。估计方差。
区间估计估计其它参数。
两个总体。c.对估计量的检验:假设检验。
一个正态总体。
的假设检验。
对总体分布的检验两个正态总体。
假设检验的假设检验。
总体分布。的假设检验。
对各种系数、参数估计值的检验。
第一节总体、样本和随机函数。
四个重要的定义:
总体:研究对象的全体称为总体,组成总体的的每个基本单位称为个体。有限总体和无限总体。
样本:总体中随机抽出若干个体而组成的集体,称样本,样本中所含个体的个数,称样本容量。
随机变量:根据概率的不同而取不同数值的变量,叫做随机变量。离散型随机变量和连续型随机变量。
我们经常对表示总体特征的数量指标感兴趣,如一批灯泡的平均寿命。就总体的某一数量特征而言,每个个体的取值不一定完全相同,但它是按照一定规律分布的。符合随机变量的定义,可以将之看成一个随机变量。
所谓总体就是一个随机变量,而所谓样本就是n个(样本容量是n)相互独立且与总体有相同分布的随机变量。每一次具体抽样所得的数据,就是n元随机变量的一个观察值(样本值),记为。
总体可以表示为一个随机变量,并具有自己的分布。而样本就是n个相互独立且与总体有相同分布的随机变量。可见,通过分布可以把样本与总体联系起来,换句话来说,总体分布是样本和总体的连接点。
统计量:设()为一个样本,则称()为统计量。如:
一、 随机变量的分布。
(一)离散型随机变量的分布。
以**来表示:
的概率分布情况也可以用数学等式(概率函数)来表达:
显然: 例1:用随机变量描述掷一颗骰子的试验。
解:分布表如下表所示:
概率函数为。
二)随机变量的分布函数。
若是一个随机变量(可以是离散的,也可以是非离散的),对任何实数,令。
称为随机变量的分布函数。
对于任意,有: =可见,只要知道分布函数,就可以知道在任一区间取值的概率,它完整地描述了随机变量的变化情况。
性质:(1)对一切。
(2)为不减函数。
例2:求例1中的分布函数。
解: 分布函数与概率函数满足下列关系。
三)连续型随机变量的分布。
对于任何实数,如果随机变量的分布函数可以写成,其中,则称为连续型随机变量,称为的概率分布密度函数,常写作。
性质:(1);(2)
例3:若有密度函数,则称服从区间上的均匀分布,试求。
解: 分布函数、概率函数、密度函数三者的关系。
分布函数既适用于离散型变量,也适用于连续型变量,是描述各种随机变量的最一般的。
共同形式。但由于不直观,所以很少使用。
对于离散型随机变量,概率函数简单而直观地说明了随机变量取某个值的概率;对于连续型变量,密度函数直观地表示了在附近取值的概率大小,比分布函数要直观。
二、二元随机变量。
定义:如果二元随机变量所有可能的取值为有限个或可列个,并且以确定的概率取各个不同的数值,则称为二元离散型随机变量。
可以用**表示如下:
也可以用数学表达式来说明:
显然,定义:如果存在一个非负函数,使得二元随机变量的分布函数,对于任意的实数都有:
则称是二元连续型随机变量,称的联合分布密度。的性质:
对于任意实数,有。
三、独立性。
事件的独立性。
如果事件a发生的可能性不受事件b发生与否的影响,即,称事件a对于事件b独立。显然,若a对于b独立,则b对于a也一定独立。我们称事件a与b相互独立。a与b独立的充要条件是
随机变量的独立性
对于任何实数,如果二元随机变量的联合分布函数等于和的边缘分布函数的乘积,即=,则称随机变量和相互独立。
第二节对总体的描述——随机变量的数字特征。
分布是对随机变量的一种最完全的描述,但求出总体分布不是一件容易的事情。在许多情况下,我们不需要全面考察随机变量的变化情况,只需要了解它的一些综合指标就够了。所谓数学特征,就是用数字来表示的随机变量的一些重要综合指标。
一、 数学期望。
假定一个随机变量x有个不同的可能取值 ,而是它们相应的被取到的概率,则随机变量x的数学期望为
性质:1.如果为常数,则。
2.如果x和y是两个随机变量,则。
3.如果x和y分别是两个独立的随机变量,则。
设连续型随机变量x有分布密度,若积分绝对收敛,则为x的数学期望。
二、方差。定义:如果随机变量x的数学期望e(x)存在,称[e(x)-x]为随机变量x的离差。随机变量离差平方的数学期望,叫做随机变量的方差。
离差和方差的区别与联系:都反映了随机变量对期望值的偏离程度,但方差消除了正负号的影响,从而能够更好地反映方差的总的影响。性质:
2. x为随机变量,则
3.x为随机变量,为常数,则。
三、矩。设x和y是随机变量,若存在,则称它为x的阶原点矩,简称阶矩。
若存在,则称它为x的阶中心矩。
显然,期望是x的一阶原点矩,方差是x的二阶中心矩。
四、协方差和相关系数。
两个或两个以上的随机变量的关系可以通过数字特征,主要是协方差和相关系数加以描述。
设随机变量的均值和方差都存在,则协方差为:
相关系数为:
第三节对样本的描述——样本分布的数字特征。
一、 样本分布函数。
如果把随机变量的分布看作某个总体的分布,的分布函数就是一个总体分布。
函数。设为总体的一个样本观察值,把它们按大小排列为
令称之为样本分布函数。
二、样本平均数。
对于样本,称为样本平均数。
三、样本方差。
对于样本,称为样本方差,称为样本标准差。
同时,第四节随机变量的分布——总体和样本的连接点。
一、几种重要的分布。
计量经济学的学习要求把注意力集中在各个分布的关系上,而不是某个分布的具体函数表达式上面。
正态分布:正态分布是最常见的连续型概率分布,它是t 分布、f分布和分布的基础,在概率统计和计量经济分析中都非常有用。
正态分布是取值于的连续分布,分布密度函数是,其中和分别是数学期望和方差,可见,正态分布函数完全由数学期望和方差决定,所以正态分布记为。
服从正态分布的随机变量还有这样的性质:正态分布随机变量的线性组合仍然服从正态分布。
当=0, =1时的正态分布,称为标准正态分布,记作,其中。
如果 ,而,那么。
分布:标准正态分布随机变量的平方所服从的分布是分布,标准正态分布随机变量的平方和,也服从分布,求和项数被称为分布的自由度。自由度为k的分布用来表示。
分布随机变量的取值范围是,且自由度越大,形状越接近于正态分布。数学期望为k,方差为2k。
t 分布:从标准正态分布和分布可以引出t分布。设,,则随机变量服从t 分布。记作,是期望为零的对称分布,它的概率密度函数和标准正态分布函数很相似。
f分布:f分布是分布的商。设,,且相互独立,则:
t分布随机变量的平方服从分子自由度为1,分母自由度为t分布自由度的f分布。
二、分布是样本与总体的连接点。
所谓总体就是一个随机变量,所谓样本就是个相互独立且与总体有相同分布的随机变量,即一个元随机变量。总体与样本之间的联系在于具有相同的分布,这就需要通过一系列定理来通过样本的特征来估计和代替总体的特征(这是我们研究的根本任务和方向)铺平道路。
概率统计第二章作业
概率论与数理统计 作业二 一维随机变量 选择题和填空题答案填到相应大题题首答案处。学院专业班级姓名学号序号 一 选择题 每小题4分,共32分 答案 1 2 3 4 5 6 7 8 1 下列函数中 可以作为某个随机变量的概率密度函数。a b c d 2 任何一个连续型随机变量的概率密度函数一定满足 a...
概率统计第二章答案
概率论与数理统计作业。班级姓名学号任课教师 第二章随机变量及其分布。教学要求 一 理解随机变量的概念 理解离散型随机变量及其分布律的定义,理解分布律的性质 掌握 0 1 分布 二项分布 poisson分布的概念 性质 会计算随机变量的分布律。二 理解分布函数的概念及其性质 理解连续型随机变量的定义 ...
概率统计第二章答案
概率论与数理统计作业。班级姓名学号任课教师 第二章随机变量及其分布。教学要求 一 理解随机变量的概念 理解离散型随机变量及其分布律的定义,理解分布律的性质 掌握 0 1 分布 二项分布 poisson分布的概念 性质 会计算随机变量的分布律。二 理解分布函数的概念及其性质 理解连续型随机变量的定义 ...