概率论与数理统计考试重点文档格式.docx
《概率论与数理统计考试重点文档格式.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计考试重点文档格式.docx(32页珍藏版)》请在冰豆网上搜索。
互斥未必对立。
②运算:
结合率:
A(BC)=(AB)C
A∪(B∪C)=(A∪B)∪C
分配率:
(AB)∪C=(A∪C)∩(B∪C)
(A∪B)∩C=(AC)∪(BC)
德摩根率:
,
(7)概率的公理化定义
设
为样本空间,
为事件,对每一个事件
都有一个实数P(A),若满足下列三个条件:
1°
0≤P(A)≤1,
2°
P(Ω)
=1
3°
对于两两互不相容的事件
,…有
常称为可列(完全)可加性。
则称P(A)为事件
的概率。
(8)古典概型
设任一事件
,它是由
组成的,则有
P(A)=
=
(9)几何概型
若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。
对任一事件A,
其中L为几何度量(长度、面积、体积)。
(10)加法公式
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B)
(11)减法公式
P(A-B)=P(A)-P(AB)
当B
A时,P(A-B)=P(A)-P(B)
当A=Ω时,P(
)=1-
P(B)
(12)条件概率
定义
设A、B是两个事件,且P(A)>
0,则称
为事件A发生条件下,事件B发生的条件概率,记为
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如P(Ω/B)=1
P(
/A)=1-P(B/A)
(13)乘法公式
乘法公式:
更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>
0,则有
…
……
(14)独立性
①两个事件的独立性
设事件
、
满足
,则称事件
是相互独立的。
若事件
相互独立,且
,则有
相互独立,则可得到
与
也都相互独立。
必然事件
和不可能事件Ø
与任何事件都相互独立。
Ø
与任何事件都互斥。
②多个事件的独立性
设ABC是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);
P(BC)=P(B)P(C);
P(CA)=P(C)P(A)
并且同时满足P(ABC)=P(A)P(B)P(C)
那么A、B、C相互独立。
对于n个事件类似。
(15)全概公式
满足
两两互不相容,
则有
(16)贝叶斯公式
,…,
及
>
0,
1,2,…,
则
,i=1,2,…n。
此公式即为贝叶斯公式。
,(
),通常叫先验概率。
),通常称为后验概率。
贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
(17)伯努利概型
我们作了
次试验,且满足
u
每次试验只有两种可能结果,
发生或
不发生;
次试验是重复进行的,即
发生的概率每次均一样;
每次试验是独立的,即每次试验
发生与否与其他次试验
发生与否是互不影响的。
这种试验称为伯努利概型,或称为
重伯努利试验。
用
表示每次试验
发生的概率,则
发生的概率为
,用
表示
重伯努利试验中
出现
次的概率,
第二章
随机变量及其分布
(1)离散型随机变量的分布律
设离散型随机变量
的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…,
则称上式为离散型随机变量
的概率分布或分布律。
有时也用分布列的形式给出:
显然分布律应满足下列条件:
(1)
(2)
(2)连续型随机变量的分布密度
是随机变量
的分布函数,若存在非负函数
,对任意实数
,有
则称
为连续型随机变量。
称为
的概率密度函数或密度函数,简称概率密度。
密度函数具有下面4个性质:
(3)离散与连续型随机变量的关系
积分元
在连续型随机变量理论中所起的作用与
在离散型随机变量理论中所起的作用相类似。
(4)分布函数
为随机变量,
是任意实数,则函数
称为随机变量X的分布函数,本质上是一个累积函数。
可以得到X落入区间
分布函数
表示随机变量落入区间(–
∞,x]内的概率。
分布函数具有如下性质:
;
是单调不减的函数,即
时,有
4°
,即
是右连续的;
5°
对于离散型随机变量,
对于连续型随机变量,
(5)八大分布
0-1分布
P(X=1)=p,
P(X=0)=q
二项分布
在
重贝努里试验中,设事件
事件
发生的次数是随机变量,设为
,则
可能取值为
其中
则称随机变量
服从参数为
的二项分布。
记为
当
时,
,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。
泊松分布
设随机变量
的分布律为
的泊松分布,记为
或者P(
)。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超几何分布
随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。
几何分布
,其中p≥0,q=1-p。
随机变量X服从参数为p的几何分布,记为G(p)。
均匀分布
的值只落在[a,b]内,其密度函数
在[a,b]上为常数
,即
a≤x≤b
其他,
在[a,b]上服从均匀分布,记为X~U(a,b)。
分布函数为
x<
a,
1,
x>
b。
当a≤x1<
x2≤b时,X落在区间(
)内的概率为
指数分布
0,
,则称随机变量X服从参数为
的指数分布。
X的分布函数为
0。
记住积分公式:
正态分布
的密度函数为
为常数,则称随机变量
的正态分布或高斯(Gauss)分布,记为
具有如下性质:
的图形是关于
对称的;
为最大值;
若
的分布函数为
参数
时的正态分布称为标准正态分布,记为
,其密度函数记为
是不可求积函数,其函数值,已编制成表可供查用。
Φ(-x)=1-Φ(x)且Φ(0)=
如果
~
(6)分位数
下分位表:
上分位表:
(7)函数分布
离散型
已知
的分布列为
的分布列(
互不相等)如下:
若有某些
相等,则应将对应的
相加作为
连续型
先利用X的概率密度fX(x)写出Y的分布函数FY(y)=P(g(X)≤y),再利用变上下限积分的求导公式求出fY(y)。
第三章
二维随机变量及其分布
(1)联合分布
如果二维随机向量
(X,Y)的所有可能取值为至多可列个有序对(x,y),则称
为离散型随机量。
=(X,Y)的所有可能取值为
,且事件{
=
}的概率为pij,,称
为
=(X,Y)的分布律或称为X和Y的联合分布律。
联合分布有时也用下面的概率分布表来表示:
Y
X
y1
y2
…
yj
x1
p11
p12
p1j
x2
p21
p22
p2j
xi
pi1
这里pij具有下面两个性质:
(1)pij≥0(i,j=1,2,…);
(2)
对于二维随机向量
,如果存在非负函数
,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D={(X,Y)|a<
b,c<
y<
d}有
为连续型随机向量;
并称f(x,y)为
=(X,Y)的分布密度或称为X和Y的联合分布密度。
分布密度f(x,y)具有下面两个性质:
f(x,y)≥0;
(2)二维随机变量的本质
(3)联合分布函数
设(X,Y)为二维随机变量,对于任意实数x,y,二元函数
称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。
分布函数是一个以全平面为其定义域,以事件
的概率为函数值的一个实值函数。
分布函数F(x,y)具有以下的基本性质:
(1)
(2)F(x,y)分别对x和y是非减的,即
当x2>
x1时,有F(x2,y)≥F(x1,y);
当y2>
y1时,有F(x,y2)
≥F(x,y1);
(3)F(x,y)分别对x和y是右连续的,即
(4)
(5)对于
.
(4)离散型与连续型的关系
(5)边缘分布
X的边缘分布为
Y的边缘分布为
X的边缘分布密度为
Y的边缘分布密度为
(6)条件分布
在已知X=xi的条件下,Y取值的条件分布为
在已知Y=yj的条件下,X取值的条件分布为
在已知Y=y的条件下,X的条件分布密度为
在已知X=x的条件下,Y的条件分布密度为
(7)独立性
一般型
F(X,Y)=FX(x)FY(y)
有零不独立
f(x,y)=fX(x)fY(y)
直接判断,充要条件:
①可分离变量
②正概率密度区间为矩形
二维正态分布
=0
随机变量的函数
若X1,X2,…Xm,Xm+1,…Xn相互独立,
h,g为连续函数,则:
h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。
特例:
若X与Y独立,则:
h(X)和g(Y)独立。
例如:
3X+1和5Y-2独立。
(8)二维均匀分布
设随机向量(X,Y)的分布密度函数为
其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。
例如图3.1、图3.2和图3.3。
y
1
D1
O
1
x
图3.1
D2
2
图3.2
D3
d
c
a
b
图3.3
(9)二维正态分布
是5个参数,则称(X,Y)服从二维正态分布,
记为(X,Y)~N(
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,
即X~N(
但是若X~N(
,(X,Y)未必是二维正态分布。
(10)函数分布
Z=X+Y
根据定义计算:
对于连续型,fZ(z)=
两个独立的正态分布的和仍为正态分布(
n个相互独立的正态分布的线性组合,仍服从正态分布。
Z=max,min(X1,X2,…Xn)
相互独立,其分布函数分别为
,则Z=max,min(X1,X2,…Xn)的分布函数为:
分布
设n个随机变量
相互独立,且服从标准正态分布,可以证明它们的平方和
的分布密度为
我们称随机变量W服从自由度为n的
分布,记为W~
,其中
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
分布满足可加性:
设
t分布
设X,Y是两个相互独立的随机变量,且
可以证明函数
的概率密度为
我们称随机变量T服从自由度为n的t分布,记为T~t(n)。
F分布
,且X与Y独立,可以证明
的概率密度函数为
我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1,
n2).
第四章
随机变量的数字特征
(1)一维随机变量的数字特征
期望
期望就是平均值
设X是离散型随机变量,其分布律为P(
)=pk,k=1,2,…,n,
(要求绝对收敛)
设X是连续型随机变量,其概率密度为f(x),
函数的期望
Y=g(X)
方差
D(X)=E[X-E(X)]2,
标准差
矩
①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)=
k=1,2,
….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为
νk=E(Xk)=
切比雪夫不等式
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有下列切比雪夫不等式
切比雪夫不等式给出了在未知X的分布的情况下,对概率
的一种估计,它在理论上有重要意义。
(2)期望的性质
E(C)=C
E(CX)=CE(X)
(3)
E(X+Y)=E(X)+E(Y),
(4)
E(XY)=E(X)
E(Y),充分条件:
X和Y独立;
充要条件:
X和Y不相关。
(3)方差的性质
D(C)=0;
D(aX)=a2D(X);
E(aX)=aE(X)
D(aX+b)=
a2D(X);
E(aX+b)=aE(X)+b
D(X)=E(X2)-E2(X)
(5)
D(X±
Y)=D(X)+D(Y),充分条件:
Y)=D(X)+D(Y)
±
2E[(X-E(X))(Y-E(Y))],无条件成立。
而E(X+Y)=E(X)+E(Y),无条件成立。
(4)常见分布的期望和方差
p
np
2n
(n>
2)
(5)二维随机变量的数字特征
=
协方差
对于随机变量X与Y,称它们的二阶混合中心矩
为X与Y的协方差或相关矩,记为
与记号
相对应,X与Y的方差D(X)与D(Y)也可分别记为
相关系数
对于随机变量X与Y,如果D(X)>
D(Y)>
0,则称
为X与Y的相关系数,记作
(有时可简记为
|
|≤1,当|
|=1时,称X与Y完全相关:
完全相关
而当
时,称X与Y不相关。
以下五个命题是等价的:
①
②cov(X,Y)=0;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y);
⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
混合矩
对于随机变量X与Y,如果有
存在,则称之为X与Y的k+l阶混合原点矩,记为
k+l阶混合中心矩记为:
(6)协方差的性质
(i)
cov
(X,
Y)=cov
(Y,
X);
(ii)
cov(aX,bY)=ab
cov(X,Y);
(iii)
cov(X1+X2,
Y)=cov(X1,Y)+cov(X2,Y);
(iv)
cov(X,Y)=E(XY)-E(X)E(Y).
(7)独立和不相关
若随机变量X与Y相互独立,则
反之不真。
若(X,Y)~N(
),
则X与Y相互独立的充要条件是X和Y不相关。
第五章
大数定律和中心极限定理
(1)大数定律
切比雪夫大数定律
设随机变量X1,X2,…相互独立,均具有有限方差,且被同一常数C所界:
D(Xi)<
C(i=1,2,…),则对于任意的正数ε,有
特殊情形:
若X1,X2,…具有相同的数学期望E(XI)=μ,则上式成为
伯努利大数定律
设μ是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数ε,有
伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即
这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律
设X1,X2,…,Xn,…是相互独立同分布的随机变量序列,且E(Xn)=μ,则对于任意的正数ε有
(2)中心极限定理
列维-林德伯格定理
设随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:
,则随机变量
的分布函数Fn(x)对任意的实数x,有
此定理也称为独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理
为具有参数n,
p(0<
p<
1)的二项分布,则对于任意实数x,有
(3)二项定理
若当
,则
超几何分布的极限分布为二项分布。
(4)泊松定理
其中k=0,1,2,…,n,…。
二项分布的极限分布为泊松分布。
第六章
样本及抽样分布
(1)数理统计的基本概念
总体
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。
我们总是把总体看成一个具有分布的随机变量(或随机向量)。
个体
总体中的每一个单元称为样品(或个体)。
样本
我们把从总体中抽取的部分样品
称为样本。
样本中所含的样品数称为样本容量,一般用n表示。
在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。
在泛指任一次抽取的结果时,
表示n个随机变量(样本);
在具体的一次抽取之后,
表示n个具体的数值(样本值)。
我们称之为样本的两重性。
样本函数和统计量
为总体的一个样本,称
(
)
为样本函数,其中
为一个连续函数。
中不包含任何未知参数,则称
)为一个统计量。
常见统计量及其性质
样本均值
样本方差
样本标准差
样本k阶原点矩
样本k阶中心矩
,为二阶中心矩。
(2)正态总体下的四大分布
为来自正态总体
的一个样本,则样本函数
其中t(n-1)表示自由度为n-1的t分布。
表示自由度为n-1的
分布。
的一个样本,而
其中
表示第一自由度为
,第二自由度为
的F分布。
(3)正态总体下分布的性质
独立。
第七章
参数估计
(1)点估计
矩估计
设总体X的分布中包含有未知数
,则其分布函数可以表成
它的k阶原点矩
中也包含了未知参数
又设
为总体X的n个样本值,其样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
由上面的m个方程中,解出的m个未知参数
即为参数(
)的矩估计量。