计量经济学.docx
《计量经济学.docx》由会员分享,可在线阅读,更多相关《计量经济学.docx(28页珍藏版)》请在冰豆网上搜索。
计量经济学
附录
基础知识回顾
●第一部分基本统计概念的回顾
●第二部分一些重要的概率分布
第一部分基本统计概念的回顾
§1、试验、样本空间、样本点和事件
§2、随机变量
§3、概率
§4、随机变量和概率密度函数
§5、多元随机变量的概率密度函数
§6、数字特征
§7、从总体到样本
§1、试验、样本空间、样本点和事件
●1.1、随机试验:
指至少有两个可能结果,但不确定哪一个结果会出现的过程。
●例1:
抛一枚硬币、掷一颗筛子、从一副纸牌中抽取一张等,都是随机试验的例子
●1.2样本空间(或总体):
随机试验所有可能结果的集合称为总体或样本空间。
●例2:
抛两枚同样的硬币。
H代表正面朝上,T代表正面朝下。
结果有四种:
HH、HT、TH、TT。
●1.3样本点:
样本空间的每一元素,即每一种结果称为样本点。
●例如:
HH、TH等。
●1.4事件:
随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集。
●例如:
事件A:
一上一下(HT、TH)
●事件B:
两上(HH)
●互斥事件:
不能同时发生的两个事件。
●等可能性事件:
确信一个事件的发生与另一个事件的发生可能性相同。
●例如:
HH与TT。
§2、随机变量
●取值由随机试验结果决定的变量称为随机变量。
第一枚硬币
第二枚硬币
正面朝上次数
T
T
0
T
H
1
H
T
1
H
H
2
我们将正面超上次数作为一个随机变量,取值为:
0、1、2。
表示方法:
随机变量通常用大写字母X、Y、Z或X1、X2、X3等表示。
随机变量的类型:
1)离散型随机变量:
抛硬币、掷筛子等。
2)连续型随机变量:
身高、体重、降雨量、温度等
§3、概率
●3.1事件的概率(古典或先验)
●3.2概率的频率定义:
●3.3概率的性质
●3.4条件概率
●3.1事件的概率(古典或先验):
●如果一个随机试验的n个结果互斥且每个结果等可能发生,并且事件A含有m个基本结果,则事件A发生的概率为:
(3-1)
古典概率定义的两个特征:
⑴试验的结果必须互斥——即它们不能同时发生。
⑵试验的每个结果等可能发生。
例如:
根据古典概率的定义,抛一枚硬币,正面朝上和朝下的概率均为1/2;掷一枚筛子,任何一个数字朝上的概率为1/6。
古典概率定义的缺陷:
对试验结果不是有限的或者不是等可能发生的情况无能为力。
引入概率的频率定义(或者称经验定义)
表3-1200个学生微观考试成绩的分布
分数
(1)
区间均值
(2)
频数(3)
频率(4)=(3)/200
0-9
5
0
0
10-19
15
0
0
20-29
25
0
0
30-39
35
10
0.005
40-49
45
20
0.100
50-59
55
35
0.175
60-69
65
50
0.250
70-79
75
45
0.225
80-89
85
30
0.150
90-99
95
10
0.050
总计:
200
1.0
●3.2概率的频率定义:
●如果在n次试验(或n个观察值)中,m次有利于事件A,假定试验的次数n足够多,那么,事件A的概率P(A)就简单的等于m/n(频率)。
●注意:
频率定义不要求试验结果互斥,也不要求每种结果等可能发生。
3.3概率的性质:
●1、0
●2、若事件A,B,C,…为互斥事件,则:
●P(A+B+C+…)=P(A)+P(B)+P(C)+…
●3、若事件A,B,C,…为互斥事件,且为一完备事件组,则:
●P(A+B+C+…)=P(A)+P(B)+P(C)+…=1
●4、当P(ABC…)=P(A)P(B)P(C)…时,称事件A,B,C,…为相互独立的事件
●例:
同时抛两枚硬币。
那么两枚均正面向上的概率是多少?
●令事件A表示第一枚正面向上,事件B表示第二枚正面向上,因此,现在要求概率P(AB)。
一般地认为第一枚正面向上的概率独立于第二枚正面向上的概率,所以:
●P(AB)=P(A)P(B)=(1/2)(1/2)=1/4
●5、若事件A,B,不是互斥事件,则:
P(A+B)=P(A)+P(B)-P(AB)
●例如:
从一副扑克中抽取一张,则是红心或是皇后的概率是多少?
很显然,抽红心和和抽皇后不是互斥事件,因为四张皇后中有一张是红心。
请看下图:
图1:
从一副扑克中任意抽取一张,求是红心或是Q的概率是多少?
第17页
●因此有:
●P(或是红心或是皇后)
●=P(红心)+p(皇后)-p(既是红心又是皇后)
●=13/54+4/54-1/54
●=16/54
●=8/27
3.4条件概率:
●若有事件A、B,求在事件B发生的情况下,事件A发生的概率,即为条件概率。
●计算公式为:
其中,P(AB)为事件A、B的联合概率,P(B)为事件B的边缘概率。
例如:
会计入门班有500个学生,其中男生300人,女生200人。
在这些学生中,100个男生和60个女生计划主修会计学。
现随机抽取一人,发现该学生主修会计学,问这位学生是男生的概率是多少?
分析:
事件A代表男生;事件B代表主修会计学的学生;求条件概率:
P(A/B)
根据公式计算:
非条件概率P(A)=300/500=0.6,即抽取一人是男生的非条件概率为0.6。
由此可见,一般条件概率不等于非条件概率。
§4、随机变量和概率密度函数
4.1离散型随机变量的概率密度函数
4.2连续型随机变量的概率密度函数
4.3累积分布函数
引言:
根据随机变量X的概率分布函数或概率密度函数(probabilitydistributionfunction,PDF),可以知道随机变量的取值及与之相对应的概率。
为了便于理解,我们首先看离散型随机变量的概率密度函数,然后再考虑连续型随机变量的概率密度函数。
4.1、离散型随机变量的概率密度函数
例如:
随机变量X代表抛两枚硬币正面向上的次数,则X可取3个不同的数值0,1,2。
其概率如下表:
正面向上的次数(X)
概率f(X)
0
¼
1
½
2
¼
1.00
离散型概率密度函数的表现形式:
函数形式:
其中,P(X=xi)表示离散型随机变量X取xi时的概率值。
上例中,P(X=2)表示随机变量“正面朝上的次数”为2时的概率。
几何形式:
第25页图
“抛两枚硬币正面朝上”的次数的概率密度函数
4.2、连续型随机变量的概率密度函数
连续型随机变量的概率密度函数的概念与离散型随机变量的概念相类似,不同的是,度量的是随机变量在某一特定范围或区间内的概率。
连续型随机变量取某一特定值的概率为0。
例如:
X代表身高,求人的身高在170cm-180cm区间的概率。
连续性随机变量的几何图形:
第27页图
连续型随机变量的概率密度函数
4.3、累积分布函数
●与随机变量X的概率密度函数相对应,F(X)称为累积分布函数(cumulativedistributionfunction,CDF),定义如下:
●F(X)=P(X≦x)
●其中,P(X≦x)表示随机变量X取值小于或等于x的概率。
●例:
P(X≦2)表示X取值小于或等于2的概率
正面向上的次数(X)
概率f(X)F(X)
0
¼1/4
1
½3/4
2
¼1
根据累积分布函数的定义,累积分布函数仅仅是当X的值小于或者等于给定x时的概率密度函数的“累积”或简单求和。
计算公式为:
连续型随机变量与此类似,只不过将求和符号改为积分号。
§5、多元随机变量的概率密度函数
●5.1、边缘概率密度函数
●5.2、条件概率密度函数
●5.3、统计独立性
●含义:
用不止一个的随机变量来描述一个试验的结果,在此情况下,求得的概率密度称为多元(多维)概率密度。
最简单的多元概率密度函数是双变量概率密度函数。
●例如:
下表给出了50支债券的债券等级(X)及收益率(Y)的数据,其中X有三个不同水平:
X=1(Bbb),X=2(Bb),X=3(B)。
根据标准普尔债券等级评定,Bbb,Bb,B都是中等信用的债券;Bb的信用略高于B,而Bbb的信用又略高于Bb,即字母越少,股票的风险越大。
双变量的频数分布:
债券等级(X)与债券收益(Y)
等级(X)
收益(Y)(%)
1
(Bbb)
2
(Bb)
3
(B)
总计
8.5
13
5
0
18
11.5
2
14
2
18
17.5
0
1
13
14
合计
15
20
15
50
假设样本空间由50种债券组成,将每一个数值都除以50,得到相对频率,即概率。
见下表。
双变量概率密度
等级(X)
收益(Y)(%)
1
(Bbb)
2
(Bb)
3
(B)
总计
8.5
0.26
0.10
0.00
0.36
11.5
0.04
0.28
0.04
0.36
17.5
0.00
0.02
0.26
0.28
合计
0.30
0.40
0.30
1.00
上表提供的是一个双变量或联合概率密度函数,表中的每一个值均为联合概率,即变量X取一给定值(例如取2)与变量Y取给定值(例如取11.5%)时的概率(0.28)。
通常用f(X,Y)表示联合概率密度函数。
令X、Y是两个离散型随机变量,则离散型概率密度函数为:
两个连续型随机变量的联合概率可以类似定义,只是数学表达式较为复杂。
5.1、边缘概率密度函数
●f(X,Y)称为X和Y的联合概率密度函数;
●与此相对应,f(X)和f(Y)称为边缘概率密度函数(又称单变量或非条件概率密度函数)。
即当X取一给定值(如取2),无论Y取值如何时的概率。
见下表。
●一旦计算出概率边缘概率,可根据随机变量的概率密度函数,直接列出边缘概率密度函数。
第36页
表双变量的概率密度、
等级(X)
收益(Y)(%)
1
(Bbb)
2
(Bb)
3
(B)
f(y)
8.5
0.26
0.10
0.00
0.36
11.5
0.04
0.28
0.04
0.36
17.5
0.00
0.02
0.26
0.28
f(x)
0.30
0.40
0.30
1.00
5.2、条件概率密度函数
●现在假设我们想知道在债券等级为1的条件下,收益为8.5%的概率是多少?
这就是所谓的条件概率(conditionalprobolity)
●条件概率密度函数(conditionalprobolitydensityfunction)的定义如下:
其中,f(Y/X)代表Y的条件密度函数,即当X=x条件下Y取y值的概率。
计算条件概率密度的方法:
上式表示,在给定另一变量取值条件下某变量的条件概率密度函数等于这两个变量的联合概率与另一变量的边缘概率密度函数之比。
例如:
求f(Y=8.5/X=1),则有:
从概率密度表中可知,Y取8.5%的非条件概率时0.36,但在债券等级为1的条件下,Y取8.5%的概率增加到0.87。
5.3、统计独立性
●当且仅当两个变量X、Y的联合概率密度函数可以表示成为其边缘概率密度函数之积时,这两个变量称为统计独立。
用符号表示为:
注:
统计独立要求对所有的X值和Y值,均满足上式
§6、概率密度的数字特征
●6.1、期望值:
集中趋势的度量
●6.2、方差:
离散程度的度量
●6.3、