正态分布Word下载.docx

上传人:b****1 文档编号:15396801 上传时间:2022-10-30 格式:DOCX 页数:7 大小:33.62KB
下载 相关 举报
正态分布Word下载.docx_第1页
第1页 / 共7页
正态分布Word下载.docx_第2页
第2页 / 共7页
正态分布Word下载.docx_第3页
第3页 / 共7页
正态分布Word下载.docx_第4页
第4页 / 共7页
正态分布Word下载.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

正态分布Word下载.docx

《正态分布Word下载.docx》由会员分享,可在线阅读,更多相关《正态分布Word下载.docx(7页珍藏版)》请在冰豆网上搜索。

正态分布Word下载.docx

P.S.拉普拉斯和高斯研究了它的性质。

  生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。

例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;

同一种生物体的身长、体重等指标;

同一种种子的重量;

测量同一物体的误差;

弹着点沿某一方向的偏差;

某个地区的年降水量;

以及理想气体分子的速度分量,等等。

一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。

从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;

还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

  正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。

  1.正态分布

  若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号~。

其中μ、σ2是两个不确定常数,是正态分布的参数,不同的、不同的对应不同的正态分布。

  正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。

  2.正态分布的特征

  服从正态分布的变量的频数分布由、完全决定。

  

(1)是正态分布的位置参数,描述正态分布的集中趋势位置。

正态分布以为对称轴,左右完全对称。

正态分布的均数、中位数、众数相同,均等于。

  

(2)描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。

也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高。

标准正态分布

  1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,通常用(或Z)表示服从标准正态分布的变量,记为Z~N(0,1)。

  2.标准化变换:

此变换有特性:

若原分布服从正态分布,则Z=(x-μ)/σ~N(0,1)就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。

故该变换被称为标准化变换。

  3.标准正态分布表

  标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。

正态曲线下面积分布

  1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。

不同范围内正态曲线下的面积可用公式计算。

  2.几个重要的面积比例

  轴与正态曲线之间的面积恒等于1。

正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.27%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%。

正态分布的应用

  某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;

有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。

其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

  1.估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

  2.制定参考值范围

  

(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

  

(2)百分位数法常用于偏态分布的指标。

表3-1中两种方法的单双侧界值都应熟练掌握。

  3.质量控制:

为了控制实验中的测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。

这样做的依据是:

正常情况下测量(或实验)误差服从正态分布。

  4.正态分布是许多统计方法的理论基础。

检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。

许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

研究过程

  正态分布的概念和特征一、正态分布的概念

  由一般分布的频数表资料所绘制的直方图,图

(1)可以看出,高峰位于中部,左右两侧大致对称。

我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图(3)。

这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normaldistribution)。

由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。

  为了应用方便,常对正态分布变量X作变量变换。

  该变换使原来的正态分布转化为标准正态分布(standardnormaldistribution),亦称u分布。

u被称为标准正态变量或标准正态离差(standardnormaldeviate)。

  二、正态分布的特征:

  1.正态曲线(normalcurve)在横轴上方均数处最高。

  2.正态分布以均数为中心,左右对称。

  3.正态分布有两个参数,即均数μ和标准差σ。

μ是位置参数,当σ固定不变时,μ越大,曲线沿横轴越向右移动;

反之,μ越小,则曲线沿横轴越向左移动。

σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;

σ越小,曲线越尖峭。

通常用N~(μ,σ2)表示均数为μ,方差为σ2的正态分布。

用N(0,1)表示标准正态分布。

  4.正态曲线下面积的分布有一定规律。

  实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。

正态曲线下一定区间的面积可以通过附表1求得。

对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。

  查附表1应注意:

①表中曲线下面积为-∞到u的左侧累计面积;

②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;

③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。

  图2正态曲线与标准正态曲线的面积分布

  第二节正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;

有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。

  1.估计正态分布资料的频数分布

  例1.10某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;

②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。

  本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。

查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。

该地18岁男大学生身高在168cm以下者,约占总数12.10%。

其它计算结果见表3。

  表3100名18岁男大学生身高的实际分布与理论分布

分布

  x+-s

  

身高范围(cm)

实际分布

  人数

  百分数(%)

理论分布(%)

X+-1s

168.69~176.71

67

67.00

68.27

X+-1.96s

164.84~180.56

95

95.00

X+-2.58s

162.35~183.05

99

99.00

  2.制定医学参考值范围:

亦称医学正常值范围。

它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。

制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;

其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;

根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。

另外,还要根据资料的分布特点,选用恰当的计算方法。

常用方法有:

  

(1)正态分布法:

适用于正态或近似正态分布的资料。

  双侧界值:

X+-u(u)^S单侧上界:

X+u(u)^S,或单侧下界:

X-u(u)^S

  

(2)对数正态分布法:

适用于对数正态分布资料。

lg-1[X(lgx)+-u(u)S(lgx)];

单侧上界:

lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:

lg-1[X(lgx)-u(u)S(lgx)]。

  常用u值可根据要求由表4查出。

  (3)百分位数法:

常用于偏态分布资料以及资料中一端或两端无确切数值的资料。

P2.5和P97.5;

P95,或单侧下界:

P5。

  表4常用u值表

参考值范围(%)

单侧

双侧

80

0.842

1.282

90

1.645

1.960

2.326

2.576

  3.正态分布是许多统计方法的理论基础:

如t分布、F分布、x2分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。

此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 职业规划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1