卫生统计学6——正态分布PPT课件下载推荐.ppt
《卫生统计学6——正态分布PPT课件下载推荐.ppt》由会员分享,可在线阅读,更多相关《卫生统计学6——正态分布PPT课件下载推荐.ppt(53页珍藏版)》请在冰豆网上搜索。
,正态分布(normaldistribution):
频数分布中间高,两端低,由中间向两端对称性减少,且永不与横轴相交的“钟型”曲线分布。
正态曲线(normalcurve):
高峰位于中央,向两侧对称性地逐渐下降,且永不与横轴相交的“钟型”曲线。
正态分布曲线的数学函数表达式:
X为连续随机变量,为X值的总体均数,为总体标准差,记为XN(,2),(-X),(5-15),X服从的概率密度函数f(x),f(X),记为:
xN(23,9),位置参数:
决定曲线位置形状参数:
决定曲线形状,正态概率密度曲线的位置与形状具有如下特点:
(1)以X=为中心,呈钟型分布。
(2)在X=处,f(x)取最大值,在x=处有拐点。
(3)曲线下总面积为1。
(4)正态分布由、决定正态分布的位置和形状。
为位置参数,为形状参数。
为位置参数,随不同,曲线位置不同。
增大,曲线沿横轴向右移;
反之,减小,曲线沿横轴向左移。
为形状参数,随不同,曲线形状不同。
越大,数据越分散,曲线越“矮胖;
越小,数据越集中,曲线越瘦高。
图:
正态分布参数位置变化示意图,图:
正态分布变异度不同变化示意图,=0.5,=1.0,=1.5,二、正态概率密度曲线下的面积,1、正态概率密度曲线下的面积分布规律曲线下x值的分布面积在医学应用非常重要,面积可对公式进行积分实现:
曲线下的面积分布有一定的规律:
区间面积占总面积的68.27%,1.96区间面积占总面积的95%,2.58区间面积占总面积的99%。
正态分布,正态曲线下面积的分布规律,-3-2-+2+3,68.27%,99.74%,95.44%,正态曲线下面积分布规律的意义:
(以1.96为例),实际工作中,、往往未知,可用大样本的和S估计。
1、1.96范围内的面积占总面积的95%。
2、1.96范围内的观察值例数占总例数的95%。
3、从总体中随机抽取一个变量,其落在1.96范围内的概率为95%。
2.Z变换及标准正态分布,对于任一个服从正态分布N(,2)的随机变量,作如下变换:
新变量Z值服从正态分布,并且服从总体均数为0、总体标准差为1的正态分布。
我们称此正态分布为标准正态分布(standardnormaldistribution),用N(0.1)表示。
这种变换常称作标准化变换,或Z变换。
-3-2-+23,-3-2-+2+3,-3-2-10+1+2+3,x,对服从正态分布(,2)的随机变量X按以下公式做标准化变换,则新变量Z将服从N(0,1)的标准正态分布。
标准正态分布N(0,1),正态分布与标准正态分布,m,s,DensityofX,0,(Z),-3-2-10123,标准正态曲线下的面积分布仍有一定规律,为便于应用,统计学家对标准正态分布编制了曲线下面积分布表(P436,附表1)表内所列数据表示Z取不同值时标准正态分布的分布函数值,此值大小相当于Z值左侧标准正态曲线下面积,记作(Z)。
Z,Z取不同值时的标准正态曲线下左侧的尾部面积(Z)(即尾部概率值);
由于正态分布有对称性,表中只给出了Z取负值的情况,如:
根据Z值查面积,Z=-1.96(-1.96)=0.025=2.5%;
若Z=1.96怎么做?
同理;
根据一定的面积也可确定对应的Z值。
正态分布,正态分布,例5-11已知X服从均数为、标准差为的正态分布,试估计:
(1)X取值在区间上的概率:
(2)X取值在区间上的概率。
解:
正态分布,查附表1,。
因为曲线下两侧面积对称,区间(1.96,)相应面积也是0.025。
故Z取值于(1.96,1.96)的概率为:
1-20.025=0.95,即取值在区间上的概率为0.95。
正态分布,同理,我们可以求出X取值在区间上的概率为0.99。
z界值表(需要记忆),变量值分布单侧双侧范围(%)z值z值800.841.28901.281.64951.641.96992.332.58,变量值分布的范围表达,X占的百分比(%),68.27%,95.00%,99.00%,任意正态分布变量值(X)理论上分布规律,3.医学常用的三个X分布范围及u界值,
(1)X值分布范围,例5-12已知某地1986年120名8岁男孩身高均数为123.02cm,标准差为4.79cm,试估计:
(1)该地8岁男孩身高在130cm以上者占总数的百分比。
(2)身高在120128cm者占该地8岁男孩总数的百分比。
(3)该地80%的男孩身高集中在哪个范围?
正态分布,解:
(1)求Z值:
查表:
理论上该地8岁男孩身高在130cm以上者占该地8岁男孩总数的7.21%。
正态分布,
(2)先计算120和128所对应的Z值:
故正态曲线下区间(0.63,1.04)上的面积等于,正态分布,(3)查附表1,标准正态分布曲线下左侧面积为0.10所对应的Z值为1.28。
80%的8岁男孩身高集中在区间内,将数值代入上式,记得116.9cm与129.2cm之间。
三、正态分布的应用,
(一)确定医学参考值范围1、概念:
医学参考值范围(referenceranges):
是指特定的“正常”人群解剖、生理、生化某项指标值的数据中大多数个体的取值所在的范围。
大多数可用80%、90%、95%或99%。
人们习惯常用95%取值范围作为该指标的医学参考值范围。
2、医学参考值范围的单、双侧问题,主要按照专业知识去确定单双侧问题。
若某指标过高过低均属异常(如RBC、WBC),则参考值范围是双侧,须确定其下限和上限;
若该指标只是过低属异常(如肺活量等)或只是过高属异常(发/尿铅),则其参考值范围应为单侧,即需分别确定其下限或上限。
常用的有百分位数法、正态分布法。
以95%参考值范围为例列出两种方法的计算公式:
3、参考值范围的计算方法,
(1)百分位数法:
适用于任何分布类型的资料双侧95%参考值范围:
P2.5P97.5单侧95%上线:
P95以下(如血铅、发汞),95%下线:
P5以上(如肺活量)。
(2)正态分布法:
适用于正态分布资料双侧95%参考值范围:
单侧95%上限:
95%下限:
正态分布,例4-11调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,(g/L),(g/L),试估计该地健康女性血红蛋白的95%参考值范围。
分析:
因血红蛋白过高、过低均为异常,所以按双侧估计95%医学参考值范围,
(二)质量控制,利用随机误差的特性,估计变量值的范围或对极端值进行取舍。
质量控制图:
7条水平线(三)正态分布是许多统计推断方法在基础。
二项分布,泊松分布的正态近似,警戒线,控制线,四二项、泊松分布的正态近似,
(一)二项分布的正态近似正态近似条件:
当n和n(1-)都大于5,或np和n(1-p)都大于5时,二项分布B(n,)就近似于正态分布Nn,n(1-)。
二项分布是离散型变量,X只能取整数值,正态分布是连续型变量,须作校正-将概率函数进行连续化校正,将“直条”改成“直方”),校正后可借用正态分布原理处理二项分布资料的问题。
二项分布累计概率的正态近似计算公式:
二项分布计算公式,正态分布计算公式z=(X-)/,解:
n=150,=0.13,因n=19.5和n(1-)=130.5,均远大于5,可用正态分布近似计算。
正态近似处理可简化运算过程,譬如:
例5-15某地钩虫感染率为13%,随机抽查当地150人,问至少有20名感染钩虫的概率是多少?
(二)Poisson分布的正态近似,Poisson分布与总体均数有关,随的增大,分布趋于对称,理论上证明,当,Poisson分布也逼近正态分布。
一般在20时,Poisson分布资料可按正态分布处理。
和二项分布一样,Poisson分布也是离散型变量分布,为借用连续型变量的分布原理,也需要校正。
例5-16实验显示某放射性物质半小时内发出的脉冲数服从Poisson分布,平均360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。
Poisson分布计算公式,正态分布计算公式z=(X-)/,该放射性物质半小时内发出的脉冲数大于400个的概率为1.64%。
二项、泊松、正态分布之间的关系,课堂小结,正态分布,正态曲线的概念正态概率密度曲线的位置与形状特点正态概率密度曲线下的面积分布规律Z变换及标准正态分布及(Z)估计正态分布的应用,医学参考值范围的概念和计算方法二项、泊松分布的正态近似,