医学统计学复习重点南医医政.docx-资源下载

医学统计学复习重点南医医政.docx

1、医学统计学复习重点南医医政医学统计学复习资料定量资料的统计指标集中趋势的统计描述指标及应用条件用平均数描述一组变量值的集中位置或平均水平，包括算术均数、几何均数、中位数、百分位数。均数几何均数中位数百分位数计算方法Px适用资料单峰对称分布等比资料、对数正态分布（抗体滴度、细菌计数）各种分布、偏态分布、不确定值各种分布、偏态分布、不确定值计算特点全部数据全部数据中间数据部分数据极端值的影响敏感不能有0，不能同时存在正负值不敏感不敏感离散趋势的统计描述指标描述数据变异大小的常用指标有极差、四分位数间距、方差、标准差和变异系数。极差四分位间距方差标准差变异系数计算方法R=Rmax-RminQl(P2

2、5),Qu(P75)Qu-QlCV=100%含义R，数据变异度。Qu-Ql，数据的变异度大。反映个体变异，个体变异越大，方差和标准差越大。变量值的分布分散、离散S=（校正）派生于标准差，排除了平均水平和量纲的影响。取消了单位。适用资料任何分布常用于偏态资料正态资料度量衡单位、均数相差悬殊的两组或多组资料的变异度。计算特点用到两端数据中间数据全部数据全部数据极端值的影响敏感不敏感敏感敏感平均数与变异度的关系：数据分布越集中，变异度越小，平均数的代表性就越好。通常，用平均数与变异指标一起描述资料的分布特征。用均数和标准差描述正态分布资料的特征；用中位数和四分位间距描述偏态分布资料的特征。定性资料和

3、等级资料的统计指标相对数表示相对关系，包括率、构成比、相对比。率构成比比定义又称频率指标，说明某现象发生的频率和强度 (强度相对数)又称构成指标，说明一种事物内部各组成部分所占的比重或分布。又称相对比，是A，B两个有关指标之比，说明A为B的若干倍或百分之几。两个指标可以性质相同，也可以不同。公式比注意事项分母不能太小；区分率和构成比，构成比只能说明事物内部各组成部分的比重或分布，不能说明某现象发生的频率或强度。合并率的计算不是直接求率的均数；计算率时要注意资料的同质性，两个合并率的对比需要注意可比性。率的标准化法为了消除构成比不同影响比较结果的真实性，可采用率的标准化法。率的标准化法：即采用统

4、一的标准对内部构成不同的各组频率进行调整和对比的方法，调整后的率为标准化率，简称标化率或调整率。实质：加权平均，以标准组各组构成比作为权重系数。各组按标准组的系数求加权平均率，即为标准化率。（例子）正态分布正态分布是描述个体变异的重要分布之一。连续型随机变量的概率分布。1、正态分布的特征单峰分布；高峰在均数处；以均数为中心，均数两侧完全对称。正态分布有两个参数，即位置参数(均数)和变异度参数(标准差)。越大，则曲线向右移动；表示数据的离散程度，若小，则曲线形态“瘦高”。正态曲线下的面积分布有一定的规律。 2、标准正态分布标准正态分布是均数为0，标准差为1的正态分布。记为N(0,1)。标

5、准正态分布是一条曲线。正态分布转换为标准正态分布：若 XN(,2)，作变换：，则u服从标准正态分布。u称为标准正态离差。3、正态曲线下的面积规律 X轴与正态曲线所夹面积恒等于1 。对称区域面积相等。正态分布的一个显著特点，其曲线下面积完全决定于以标准差为单位从点X到的离差4、常用的u值表：参考值范围（%）单侧双侧80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.5765、正态分布的应用估计频数分布；确定临床参考值范围二项分布离散型随机变量的概率分布。如果个体观察值之间是相互独立的，结局只有两种互相对立的结果，用二项分布描述个体

6、变异。1、二项分布的概念令x为n次试验中的二项随机变量，成功的概率P(成功)p，则x的取值为0，l，2，n，所有可能结果的概率的联合概率分布为二项分布。设事件A出现的概率为。则在n次独立试验中，事件A恰好出现 k 次的概率为： 2、二项分布的性质（1）均数和方差当和n已知时，阳性数X的均值=nX，=，若均数和标准差不用绝对数而用率表示时，（2）累计概率从阳性率为的总体中随机抽取n个个体，则最多有k例阳性的概率：最少有k例阳性的概率：（3）图形给定n后，二项分布的形状取决于参数的大小。当=0.5，分布对称；当0.5，分布呈偏态；当0.5时分布呈负偏态；特别是当n值不是很大时，偏离0.5愈

7、远，分布愈偏。随着n的增大，二项分布逐渐逼近正态分布。一般地说，如果n或n(1-)大于5时，常可用正态近似原理处理二项分布问题。（4）二项分布的应用率的抽样分布及其性质在n足够大时，样本率 p 的分布近似正态分布；率的均数和方差。总体率的可信区间估计查表法（精确概率法） n50时，查询附表率的可信区间正态近似法：当np5和n(1-p)5均成立时，用正态近似法。可信区间为两总体率之差1-2的区间估计设p1=r1/n1，p2=r2/n2是两个样本率，p1p2是它们的差。如果 n1p1，n1(1-p1)，n1p1，n2(1-p2)均大于5，则正态近似的方法可用于求总体率之差的可信区间：

8、两样本率的比较样本率与总体率的比较Poisson分布1、概念罕见事件发生数的分布规律。单位时间、单位空间内某事件的发生数。如果某事件的发生是完全随机的，则单位时间或单位空间内，事件发生即一个随机变量X的取值为0,1,2,的概率为：，则该事件的发生服从参数为的泊森分布。2、性质（1）均数与方差：（2）累计概率3、Poisson分布的图形Poisson分布的形状取决于的大小。Poisson分布为正偏态分布，且越小分布越偏。当50时，可用正态分布原理处理Poisson分布的有关问题。4、Poisson分布的应用平均计数的区间估计（X）50时，可用正态近似法；X较小时，查表法）两个平均计数的比较样

9、本平均计数与总体平均计数的比较应用条件二项分布、Poisson分布、正态分布间的关系n较大时，二项分布B(n,)中样本率的分布近似正态分布；较大(20)时，Poisson分布中平均计数近似正态分布N( , ) ；XiB(ni,i)，若C=nii不变，则ni 时，二项分布近似Poisson分布。参考值范围1、参考值范围的涵义：绝大多数的正常人在该范围内。2、参考值范围的估计方法：方法双侧单侧下限单侧上限正态分布法百分位数法中心极限定理1、从正态分布总体N(,2),中随机抽样(每个样本的含量为n)，可得无限多个样本，每个样本计算样本均数，则样本均数也服从正态分布。样本均数的均数为，样本均数的标准差

10、为。2、从非正态分布总体(均数为，方差为2)中随机抽样(每个样本的含量为n)，可得无限多个样本，每个样本计算样本均数，则只要样本含量足够大(n50),样本均数也近似服从正态分布。样本均数的均数为，样本均数的标准差为。标准误（1）标准误定义：将样本统计量的标准差称为统计量的标准误，用来衡量抽样误差的大小。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时，用样本标准差代替，。（2）标准误的意义反映了样本统计量分布的离散程度，体现了抽样误差的大小。标准误越大，说明样本统计量的离散程度越大，即用样本统计量来直接估计总体参数越不精确。反之亦然。标准误的大小与标

11、准差有关，在例数n一定时，从标准差大的总体中抽样，标准误较大；而当总体一定时，样本例数越多，标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。标准误与标准差的区别与联系联系：都是变异指标。当n不变时，标准差，标准误区别：标准差标准误含义描述观察值的变异程度的大小的指标描述样本均数的抽样误差大小的指标公式（）意义标准差较小，表示观察值围绕均数波动较小，说明样本均数代表性好小，表明样本均数围绕总体均数的波动较小，说明样本均数可靠性好应用1、表示观察值变异程度2、结合样本均数描述正态分布资料特征，确定医学参考值范围3、计算标准误4、计算CV1、估计样本均数抽样可靠程度2、估计总体均数的

12、可信区间3、进行假设检验N趋于稳定（）逐渐减小抽样分布来自不同总体的样本均数之抽样误差和抽样分布规律都是不同的。任何一个样本统计量均有其抽样分布规律。t分布、分布、F分布都是抽样分布。来自正态分布总体的样本方差服从分布；方差之比服从F分布；相关系数做适当变换后近似服从正态分布；率的分布与样本统计量n和率的大小有关，在样本含量较小时服从二项分布，在n足够大时，近似服从正态分布。t分布(均数的抽样分布)中心极限定理表明，从任何总体中随机抽样，当样本含量较大时，其样本均数的抽样分布将趋于正态分布。（1）定义设从正态分布N（）中随机抽取含量为n的样本，样本均数和标准差分别为和S，且=，则t值服从n-1

13、的t分布。（总体方差未知，用样本方差代替，此时t分布不服从正态分布）（2）u分布因为当X N(,) 时， N（0，1）（标准正态分布）所以当时，u=N（0，1）（u分布）（总体方差已知）（3）t分布的特征 t分布是一簇曲线，当不同时，曲线形状不同；单峰分布，以0为中心，左右对称；当逼近时，t分布逼近u分布，故标准正态分布是t分布的特例； t分布曲线下面积是有规律的。（t界值表）单尾：P(t- t,)=，或P(tt,)=双尾：P(t- t/2,)+P(tt/2,)=，即P(-t/2,t100时，u分布v=n1+n2-2的t分布(1- )可信区间（n100)公式含义为自由度为V，两侧尾部面积

14、各为/2的t界值可信区间长度与标准差成正比，与样本含量之平方根成反比（2）率的可信区间率也存在抽样误差，率的标准差称为率的标准误。率的分布是偏态的：当总体率0.5时为负偏态；当总体率=0.5时为对称分布。当n5且n(1-)5时，率的抽样分布近似服从正态分布。区间估计方法总体率两总体率之差正态近似法np5且n(1-p)5时，n1p15、n2p25、n1(1-p1)5、n2(1-p2)5均成立时，公式：查表法n50时，正态近似法总体计数的可信区间为当X50时，查表法（4）方差的可信区间可信区间与参考值范围的区别可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围

15、，变量值可能很多甚至无限。 95%的可信区间中的95%是可信度，即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例，即所求参考值范围包含了95%的正常人。假设检验的步骤建立假设检验和确定检验标准计算检验统计量确定P值推断结论假设检验的几个相关问题（1）I型错误和II型错误拒绝H0，接受H1不拒绝H0H0真实第一类错误( )正确推断(1)H0不真实正确推断(1)第二类错误()统计学上规定：H0真实时被拒绝为第一类错误(又称型错误)，H0不真实时不拒绝为第二类错误(又称型错误)。拒绝H0时可能犯I类错误；不拒绝H0时可能犯II类错误。错误和错误的关系：和的关

16、系就像翘翘板，小就大，大就小。要同时降低两类错误的概率，或者要在不变的条件下降低，需要增加样本容量。（2）双侧检验与单侧检验H1从一个方向上偏离H0所规定者，称为单侧检验；H1从两个方向上偏离H0所规定者，称为双侧检验；检验假设的写法不同：原则上依据资料的性质来选择双侧检验与单侧检验。（3）P和的涵义P值是指由H0所规定的总体作随机抽样，获得等于大于现有样本获得的检验统计量值的概率。拒绝H0时所冒的风险。P值的大小标明以多大的误差拒绝H0。P值越小，说明越有理由拒绝H0而接受H1，越有理由说明样本所分别来自的总体有差别。的意义：水准是在假设检验之前设定的，说明按不超越多大的误差为条件作结论，

17、是犯I型错误的最大风险。确定=0.05，即I型错误的概率为0.05，理论上100次抽样中发生这样的错误平均有5次。（4）假设检验和可信区间的关系假设检验：样本是否来自于同一总体？可信区间：总体参数在哪里？在相同的之下，若假设检验拒绝H0(p5且n(1-p)5时，用u检验；当n和p不符合此条件时，用二项分布法计算可信区间。（2）两样本率的比较目的：推断相应的两总体率是否相等。检验方法：u检验：当n1p15、n2p25、n1(1-p1)5、n2(1-p2)5均成立时用u检验；如果n较小，则用校正u检验；若n40时，用确切概率法。检验：n 40，T 5，用检验； n40，但1 T 5 ，用校正检验。

18、n 40，或T 1，用确切概率法。（3）配对设计两样本率的比较目的：通过对单一样本数据的分析，推断两种处理的结果有无差别。用途：比较两种检验方法、两种培养方法、两种提取方法等的差别。基本思想：结果有四种情况，甲法乙法合计+-+aBa+b-cDc+d合计a+cb+da+b+c+d=n若两法没有差别，则总体B=C。检验方法：当b+c40时，用配对检验；当20b+c40时，用校正配对检验；当b+c5，用2； n 40，但1 T 5，用校正2。 n 40，或T 40； 20b+c40用校正2 。 b+c20,二项分布直接计算概率。 RC表的分析方法选择条件：理论数不能小于1；理论数大于等于1小于5

19、的格子数不超过总格子数的1/5。否则用Fisher确切概率; 或似然比检验(likelihood ratio test) 如果以上条件不能满足，可采用：增加样本含量删去某行或某列合理地合并部分行或列 Fisher精确概率法（7）确切概率法成组四格表确切概率法：基本思想：在四格表的周边合计不变的条件下，直接计算表内四个数据的各种组合之概率。公式：步骤：在四格表的周边合计不变的条件下，列出所有的组合情况分别计算各个组合的|A-T|值和Pi值将|A-T|值大于等于现有样本差别的各组合概率相加得到P值。配对四格表确切概率法：步骤：在四格表的B+C之和不变的条件下，计算各个b和c的所有组合

20、；计算各个组的差别b-c；按照二项分布原理计算出差值大于等于现有样本差别的组合的概率。各个概率相加得到P。（8）两事件数的比较（9）定性资料假设检验的正确应用等级资料的分析（1）秩次和秩和秩次：全部观察值按某种顺序排列的位序，在一定程度上反映了等级的高低；秩和：各组秩次之和，在一定程度上反映了各组等级的分布位置；实际秩和：理论秩和：秩变换：对等级的分析，转化为对秩次的分析。秩次反映等级的高低，秩和反映各组等级的分布位置。秩和检验就是通过秩次的排列求出秩和，进行假设检验。（2）成组设计两样本比较的秩和检验目的：通过对两个随机样本推断两样本所代表的两个总体分布位置是否相同。（3）多组比较的秩和检验（了解）（4）配对设计资料的秩和检验（配对设计差值比较的符号秩和检验）（5）区组设计资料的秩和检验（？）（6）秩和检验的正确应用（考点）适用范围广等级资料定量资料：正态分布但组间方差不齐，数据的某一端

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？