概率论与数理统计公式大全.docx
《概率论与数理统计公式大全.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计公式大全.docx(14页珍藏版)》请在冰豆网上搜索。
概率论与数理统计公式大全
随机变量的数字特征
(1)一维随机变量的数字特征
离散型
连续型
期望
期望就是平均值
设X是离散型随机变量,其分布律为P()=pk,k=1,2,…,n,
(要求绝对收敛)
设X是连续型随机变量,其概率密度为f(x),
(要求绝对收敛)
函数的期望
Y=g(X)
Y=g(X)
方差
D(X)=E[X-E(X)]2,
标准差
,
矩
①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)=,k=1,2,….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即
=,k=1,2,….
①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)=
k=1,2,….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即
=
k=1,2,….
切比雪夫不等式
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有下列切比雪夫不等式
切比雪夫不等式给出了在未知X的分布的情况下,对概率
的一种估计,它在理论上有重要意义。
(2)期望的性质
(1) E(C)=C
(2) E(CX)=CE(X)
(3) E(X+Y)=E(X)+E(Y),
(4) E(XY)=E(X)E(Y),充分条件:
X和Y独立;
充要条件:
X和Y不相关。
(3)方差的性质
(1) D(C)=0;E(C)=C
(2) D(aX)=a2D(X); E(aX)=aE(X)
(3) D(aX+b)=a2D(X); E(aX+b)=aE(X)+b
(4) D(X)=E(X2)-E2(X)
(5) D(X±Y)=D(X)+D(Y),充分条件:
X和Y独立;
充要条件:
X和Y不相关。
D(X±Y)=D(X)+D(Y)±2E[(X-E(X))(Y-E(Y))],无条件成立。
而E(X+Y)=E(X)+E(Y),无条件成立。
(4)常见分布的期望和方差
期望
方差
0-1分布
p
二项分布
np
泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布
n
2n
t分布
0
(n>2)
(5)二维随机变量的数字特征
期望
函数的期望
=
=
方差
协方差
对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即
与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。
相关系数
对于随机变量X与Y,如果D(X)>0,D(Y)>0,则称
为X与Y的相关系数,记作(有时可简记为)。
||≤1,当||=1时,称X与Y完全相关:
完全相关
而当时,称X与Y不相关。
以下五个命题是等价的:
①;
②cov(X,Y)=0;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y);
⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
混合矩
对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为:
(6)协方差的性质
(i) cov(X,Y)=cov(Y,X);
(ii) cov(aX,bY)=abcov(X,Y);
(iii) cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y);
(iv) cov(X,Y)=E(XY)-E(X)E(Y).
(7)独立和不相关
(i) 若随机变量X与Y相互独立,则;反之不真。
(ii) 若(X,Y)~N(),
则X与Y相互独立的充要条件是X和Y不相关。
第五章 大数定律和中心极限定理
(1)大数定律
切比雪夫大数定律
设随机变量X1,X2,…相互独立,均具有有限方差,且被同一常数C所界:
D(Xi)
特殊情形:
若X1,X2,…具有相同的数学期望E(XI)=μ,则上式成为
伯努利大数定律
设μ是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数ε,有
伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即
这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律
设X1,X2,…,Xn,…是相互独立同分布的随机变量序列,且E(Xn)=μ,则对于任意的正数ε有
(2)中心极限定理
列维-林德伯格定理
设随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:
,则随机变量
的分布函数Fn(x)对任意的实数x,有
此定理也称为独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理
设随机变量为具有参数n,p(0
(3)二项定理
若当,则
超几何分布的极限分布为二项分布。
(4)泊松定理
若当,则
其中k=0,1,2,…,n,…。
二项分布的极限分布为泊松分布。
第六章样本及抽样分布
(1)数理统计的基本概念
总体
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。
我们总是把总体看成一个具有分布的随机变量(或随机向量)。
个体
总体中的每一个单元称为样品(或个体)。
样本
我们把从总体中抽取的部分样品称为样本。
样本中所含的样品数称为样本容量,一般用n表示。
在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。
在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。
我们称之为样本的两重性。
样本函数和统计量
设为总体的一个样本,称
()
为样本函数,其中为一个连续函数。
如果中不包含任何未知参数,则称()为一个统计量。
常见统计量及其性质
样本均值
样本方差
样本标准差
样本k阶原点矩
样本k阶中心矩
,,
,,
其中,为二阶中心矩。
(2)正态总体下的四大分布
正态分布
设为来自正态总体的一个样本,则样本函数
t分布
设为来自正态总体的一个样本,则样本函数
其中t(n-1)表示自由度为n-1的t分布。
设为来自正态总体的一个样本,则样本函数
其中表示自由度为n-1的分布。
F分布
设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数
其中
表示第一自由度为,第二自由度为的F分布。
(3)正态总体下分布的性质
与独立。
第七章 参数估计
(1)点估计
矩估计
设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。
又设为总体X的n个样本值,其样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。
若为的矩估计,为连续函数,则为的矩估计。
极大似然估计
当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。
又设为总体的一个样本,称
为样本的似然函数,简记为Ln.
当总体X为离型随机变量时,设其分布律为,则称
为样本的似然函数。
若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。
若为的极大似然估计,为单调函数,则为的极大似然估计。
(2)估计量的评选标准
无偏性
设为未知参数的估计量。
若E()=,则称为的无偏估计量。
E()=E(X),E(S2)=D(X)
有效性
设和是未知参数的两个无偏估计量。
若,则称有效。
一致性
设是的一串估计量,如果对于任意的正数,都有
则称为的一致估计量(或相合估计量)。
若为的无偏估计,且则为的一致估计。
只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
(3)区间估计
置信区间和置信度
设总体X含有一个待估的未知参数。
如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即
那么称区间为的置信区间,为该区间的置信度(或置信水平)。
单正态总体的期望和方差的区间估计
设为总体的一个样本,在置信度为下,我们来确定的置信区间。
具体步骤如下:
(i)选择样本函数;
(ii)由置信度,查表找分位数;
(iii)导出置信区间。
已知方差,估计均值
(i)选择样本函数
(ii)查表找分位数
(iii)导出置信区间
未知方差,估计均值
(i)选择样本函数
(ii)查表找分位数
(iii)导出置信区间
方差的区间估计
(i)选择样本函数
(ii)查表找分位数
(iii)导出的置信区间
第八章 假设检验
基本思想
假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设H0是否成立。
我们先假定H0是成立的。
如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。
与H0相对的假设称为备择假设,用H1表示。
这里所说的小概率事件就是事件,其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。
基本步骤
假设检验的基本步骤如下:
(i) 提出零假设H0;
(ii) 选择统计量K;
(iii) 对于检验水平α查表找分位数λ;
(iv) 由样本值计算统计量之值K;
将进行比较,作出判断:
当时否定H0,否则认为H0相容。
两类错误
第一类错误
当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。
这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即
P{否定H0|H0为真}=;
此处的α恰好为检验水平。
第二类错误