数学分布泊松分布二项分布正态分布均匀分布指数分布生存分析贝叶斯概率公式全概率公式Word格式文档下载.docx
《数学分布泊松分布二项分布正态分布均匀分布指数分布生存分析贝叶斯概率公式全概率公式Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《数学分布泊松分布二项分布正态分布均匀分布指数分布生存分析贝叶斯概率公式全概率公式Word格式文档下载.docx(11页珍藏版)》请在冰豆网上搜索。
80分,由正态分布的图形知x=80时的函数值最大,即随机变量在80附近取值最密集,也
即考试成绩在80分左右的人最多。
下图为概率密度函数图(F(x)应为f(x),表示概率密度):
连续型分布:
指数分布、正态分布、
X2分布、t分布、
离散型分布:
二项分布、泊松分布
F分布
J
抽样分布
抽样分布只与自由度,即样本含量(抽样样本含量)有关
二项分布(binomialdistribution):
例子抛硬币
1、重复试验(n个相同试验,每次试验两种结果,每种结果概率恒定
伯努利试验)
很事件A出现的辄率为恥则蛊刃次独立渕验中,事件A恰好出现比次的概率务:
P(X=k)=C^k(l-7r)nk
3、P(X=O),P(X=1),P(X=3),所有可能的概率共同组成了一个分布,即二
项分布
某毒物的50%致死剂拭后5只动物妊亡数的二项分布(0=5,^0,5)
泊松分布(possiondistribution:
1、一个单位内(时间、面积、空间)某稀有事件
2、此事件发生K次的概率
•所有可能的概率共同组成了一个分布,即泊
3、P(X=0),P(X=1),P(X=3),
松分布
0.2
P(X)
().1
0.()HI川l!
h
04804812
三、泊松分布产生的一般条件
在自然界和人们的现实生活中,经常要遇到在随机时刻出现的某种事件•我们把在随机时刻相继出现的事件所形成的序列,叫做随机事件流.
若事件流具有平稳性、无后效性、普通性,
则称该事件流为泊松事件流(泊松流)・
下面简要解释平稳性、无后效性、普通性.
平稳性:
在任意时间区间内,事件发生*次仗二0)的
概率只依赖于区间长度而与区间端点无关.
无后效性:
在不相重叠的时间段内,事件的发生是相互独立的.
普通性:
如果时间区间充分小,事件出现两次或两次以上的概率可忽略不计.
对泊松流,在任意时间间隔(0/)内,事件(如交通事故)出现的次数服从参数为入t的泊松分布・入称为泊松流的强度.
二项分布与泊松分布的关系:
二、二项分布与泊松分布
历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的.
在实际中,许多随机现象服从或近似服从泊松分布’
近数十年來,泊松分和日益显示其重要性,成为概率论中最重要的几个分布之一.
二项分布在事件发生概率很小,重复次数n很大的情况下,其分布近似泊松分布
均匀分布(uniformdistribution):
分为连续型均匀分布和离散型均匀分布
离散型均匀分布:
1、n种可能的结果
2、每个可能的概率相等(1/n)
连续型均匀分布:
1、可能的结果是连续的
2、每个可能的概率相等()
连续型均匀分布概率密度函数如下图:
1_
p-a
k
aPx
指数分布(exponentialdistribution:
中文维基
用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、
百科新条目出现的时间间隔等等。
指数分布常用于各种“寿命”分布的近似。
1、连续型分布,每个点的概率:
当x>
[0其它
其中则称X服从
参数为御指数分布.
2、无记忆性。
已经使用了s小时的元件,它能再使用t小时的概率,与一个从未使用过的元件使用t小时的概率相同。
即它对已经使用过的s小时没有记忆。
指数分布的概率密度函数如下图:
/U)
正态分布(normaldistribution):
又称咼斯分布。
1、描述一个群体的某个指标。
2、这个指标是连续的。
p为均数
3、每个特定指标在整个群体中都有一个概率(“)
15/0,
4、所有指标概率共同组成了一个分布,这个分布就是正态分布
正态分布的概率密度函数如下图:
片勿pp#filter
中心极限定理:
不论总体的分布形式如何(正态或非正态),只要样本(抽样样本)含量n足够大时,样本均数的分布就近似正态分布,且均数与总体均数相等,标准差为(总体标准差)/(n的开方)。
中心极限定理使得t分布、F分布和X2分布在抽样样本含量很大时不需要对总体样本是否正态有要求。
t分布(studenttdistribution:
1、t分布是以o为中心的一簇曲线,每个自由度决定一个曲线
2、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-1
3、总体样本呈正态分布(抽样样本含量较小时,要求总体样本呈正态分布,如果抽样样本含量很大(eg.n>
=100),由中心极限定理可知抽样样本均数也近似正态分布,因而
“差值”的概率也呈正态分布,而t分布的每一条曲线实际上都是正态分布曲线)
4、从一个总体样本中抽取很多个小样本抽样
5、每个小样本都有一个均值
6每个小样本的均值与总体样本均值有一个差值,这个差值用t估计
全国成年人身高平均值
我们班身高的标准误・替代总体标准差。
7、可能有多个小样本的差值估计都是t,t出现的次数占所有小样本的比例可以
用一个概率衡量
8、所有t值的概率组成一个分布,就是t分布的一个曲线
9、另外做一个抽样,每个小样本包含的观测值不同,则形成t分布的另外一个曲线
10、自由度越大,则曲线越接近于标准正态分布
11、t分布只与自由度相关
t分布的概率密度函数如下图(v为自由度):
计=°
°
(标准正态曲线)
\r
[f
\\
-\\
-4-3-2-1
X2分布(chisquaredistribution:
1、X2分布也是一簇曲线,每个自由度决定一个曲线
2、总体样本呈正态分布(抽样样本含量(n)较小时,要求总体样本呈正态分布)
3、从总体样本中抽取n个观测值:
Z1,Z2,Z3抽样
4、将它们平方后求和,这个和用一个新变量表示,即X2
讥=兀;
*右…斗z/=£
(^^)2
Z7(7
5、重复抽样并获得多个X2:
X12,X22,X32,X42
6可能有多次抽样的X2值相同,同一个X2值的抽样次数占总次数的比例可以用一个概率表示
f(r)=1
2r("
2)l2丿
o
7、所有的概率值共同组成一个分布,就是X分布的一条曲线
8、另外做一次,只要从总体中选取观测值数目n不同,得到的就是另外一条曲线
11、X分布只与自由度相关
X2分布的概率密度函数如下图(n在这里为自由度):
F分布(F-distribution):
1、F分布也是一簇曲线,每对自由度决定一个曲线
7、重复抽取样本,计算多个F值:
Fi,F2,F3……..
8、可能有多次抽样的F值相同,同一个F值的抽样次数占总次数的比例可以用一个概率表示
9、所有的概率值共同组成一个分布,就是F分布的一条曲线
10、另外做一次,只要从总体中选取观测值数目n不同,得到的就是另外一条曲线
10、两个自由度越大,则曲线越接近于标准正态分布
11、F分布只与自由度相关
F分布的概率密度函数如下图(m,n在这里为自由度)
【在推估总体平均值时,基于样本平均数的抽样分布】一一t分布
【在用样本方差来推估总体方差时,必须知道样本方差的抽样分布】一X2分布【比较两个总体的方差是否相等时,必须知道样本方差的联合抽样分布】一F分布
生存分析(survivalanalysis:
1、多种影响慢性疾病的因素(不同手术方法、不同药物)2、随访一群患者3、一段时间后统计生存和死亡
3、最终给出的结果是一个评价各种因素对生存时间的影响(生存时间、生存率有无差异)
址存分析方法
些KEEBrknnei巳「过无呈
这是一种非参数法,主要用于小样本’适用于能够准确记录事件和删失发生时点的数据.
vLifeTablesj1£
e
也叫寿命农法,适用于样本量大,且不太可能准确记载每个观察对象的死亡或删失发生时间的数据.
回归模型分析法
用于描述多个变量对生存时间的影响
贝叶斯公式(bayesformula):
1、描述两个条件概率之间的关系P(Bi|A)与P(A|Bi),A为事件,Bi
为一个划分
3、看图理解
此时,取口=肪k=5
全概率公式(fullprobabilityformula):
1、描述一个特定事件的概率与条件概率间的关系
2、P(A)=P(A|B1)*P(B1)+P(A|B2)*P(B2)+...+P(A|Bn)*P(Bn)