医学统计学 讲义.docx

上传人:b****8 文档编号:10581866 上传时间:2023-02-21 格式:DOCX 页数:96 大小:66.99KB
下载 相关 举报
医学统计学 讲义.docx_第1页
第1页 / 共96页
医学统计学 讲义.docx_第2页
第2页 / 共96页
医学统计学 讲义.docx_第3页
第3页 / 共96页
医学统计学 讲义.docx_第4页
第4页 / 共96页
医学统计学 讲义.docx_第5页
第5页 / 共96页
点击查看更多>>
下载资源
资源描述

医学统计学 讲义.docx

《医学统计学 讲义.docx》由会员分享,可在线阅读,更多相关《医学统计学 讲义.docx(96页珍藏版)》请在冰豆网上搜索。

医学统计学 讲义.docx

医学统计学讲义

医学统计学讲义.txt27信念的力量在于即使身处逆境,亦能帮助你鼓起前进的船帆;信念的魅力在于即使遇到险运,亦能召唤你鼓起生活的勇气;信念的伟大在于即使遭遇不幸,亦能促使你保持崇高的心灵。

医学统计学之1--平均数与标准差(在医科院皮研所统计培训班编写的讲义)2008年05月06日星期二06:

51  平均数是分析测量资料常用的一种统计指标。

它说明一组观察值的平均水平或集中趋势。

在麻风病统计中常用的有算术均数、几何均数和中位数。

标准差也是分析测量资料常用的统计指标,它说明一组观察值的离散程度。

在应用中,常常把平均数和标准差结合运用,综合表达一组观察值的集中和离散特性。

  

(一)小样本均数、标准差直接计算法

  1、公式

_ ∑X

 X= ────           (1.1)

 N

┌─────

│ _

│∑(X-X)2

S=│──────(1.2)

√N-1

┌────────

│ (∑X)2

│∑X2-───

│N

S=│──────(1.3)

√N-1

_

X:

观察值       X:

算术均数

 N:

观察值个数     S:

标准差

 ∑X:

观察值总和

 ∑X2:

观察值平方的总和

_

 ∑(X-X)2:

观察值的离均差平方和

 

  2、应用范围及注意事项

  

(1).观察值必须是同质的。

  

(2).观察值资料必须大体符合正态分布才能计算均数,而偏态分布的资料不宜用均数描述其集中趋势。

  (3).标准差越大,表示观察值的分布越分散、标准差越小,说明观察值分布越集中。

  (4).常以“均数±标准差”的写法综合表达一组观察值的集中和离散特征。

  3、实例

  [例1.1] 10例麻风病人空腹测定转氨酶GPT的结果为43、50、36、32、40、38、47、41、45、40单位,求GPT的平均值和标准差。

  计算步骤:

  ∑X=43+50+36+32+……+40=412

∑X2=432+502+362+322+……+402=17228

  代入公式(1.1)求均数得

_412

  X=───=41.2

10

代入公式(3.2)求标准差得

┌─────────

│4122

  │17228-────

│10

S=│───────────=5.308

√10-1

  故可用均数与标准差综合表示10名麻风病人转氨酶测定结果为:

41.2±5.308。

  

(二)、大样本均数、标准差的计算法

  1、公式

_∑fx

X=────(1.4)

∑f

   ┌──────────

│(∑fx)2

│∑fX2-────

│∑f

S=│──────────(1.5)

√∑f-1

_

 X:

均数 X:

各组的组中值 

   f:

频数    S:

标准差          

  2、应用范围及注意事项

  

(1)样本观察值与小样本资料一样,必须同质并呈正态分布。

  

(2)大样本资料应先整理成频数表后再进行计算。

频数表一般以8—15个组段为宜。

  3、实例

  [例1.2]某地在1975年调查麻风发病情况,共发现640例麻风病人,其年龄分布如表1.1所示,求麻风病人发现时平均年龄。

表1.1 某地麻风病人发现年龄统计(1975)

─────────────────────

 年龄组   组中值   病人数

─────────────────────

  0-2.53

5-7.511

10-12.546

15-17.595

20-22.5110

25-27.5181

30-32.590

35-37.568

40-42.530

45-47.513

50-52.58

55-6057.57

─────────────────────

合计  640

─────────────────────

  计算步骤:

  

(1).首先将数据分组,整理成如表1.1所示的频数分布表。

可利用函数型电子计算器的统计计算功能,方便地求得均数及其标准差。

不同的计算器其操作方法有些差别,本书均以CASIOfx-180P为例,其它种类计算器请参考说明书。

 

  

(2).将计算器置于“SD”工作状态,即按下MODE3,液晶屏显示“SD”,然后按下INV AC,清除内存中遗留的数字。

在每次进行新的运算之前,都应进行上述操作。

  (3).输入数据:

2.5×3RUN7.5×11RUN12.5×46RUN……57.5×7RUN。

  (4).取出结果:

INV3,显示:

9.6137(标准差SD),INV 1, 显示:

27.145(均数值)。

医学统计学之2--平均数与标准差,t检验(在医科院皮研所统计培训班编写的讲义)2008年05月07日星期三14:

20(三)几何均数

  1、公式

      ∑lgX

G=lg-1(────)(1.6)

N

∑flgX

G=lg-1(────)(1.7)

∑f

G:

几何均数        X:

观察值

  N:

观察值个数       f:

频数

  2、应用范围及注意事项

  

(1).当样本观察值呈等比关系或对数正态分布而求均数时,如计算抗体平均滴度、传染病平均潜伏期等,可用几何均数。

  

(2).一般采用以10或e为底的对数进行计算。

  (3).公式(1.6)适用于未分组小样本资料,公式(1.7)适用于分组的大样本资料。

  3、实例

  [例1.]  8例麻风病人的估计潜伏期分别为2、3、5、8、9、14、20、31年,求其平均潜伏期。

  计算步骤:

  

(1) ∑lgX=lg2+lg3+lg5+……+lg31

=7.2730

7.2730

(2) G=lg-1(────)

8

=lg-1(0.9091)

=8.1(年)

(四)中位数计算法

  1、公式

  小样本未分组资料计算法:

  一组观察值按大小顺序排列,如个数为单数,则居中的一个观察值即为中位数;如个数为双数,则居中的两个观察值的平均数为中位数。

  大样本分组资料计算法:

     N

──-C

2

M=L+─────────(i)(1.8)

fm

M:

中位数   N:

总频数

  L:

中位数所在组段的下限i:

组距

 fm:

中位数组段内的频数   C:

小于L的各组段的累计频数

  2、应用范围及注意事项

  

(1).中位数适用于表示大多数观察值分布比较集中、少数极大值或极小值分布两端的样本的集中趋势。

这种资料的算术均数易受极端值的影响,而对中位数则影响很小。

 

  

(2)大样本资料应先编制频数表再计算中位数。

  3、实例

 [例1.4]有204例麻风病人血中大单核细胞百分数资料,制成频数分布表如表1.2所示,计算其中位数。

  表1.2 204例麻风病人大单核细胞百分数中位数计算表。

───────────────────

分组  频数 累积频数

───────────────────

  0-2424

  2-4064

  4-55119

  6-37

  8-27

 10-18

12-1

14-0

16-1

18-0

20-1

──────────────────

204

──────────────────

计算步骤:

(1).自上而下累计各组段频数。

  

(2).找中位数所在组段。

本例中位数在第3组。

  (3).本例:

L=4,N=204,i=2,fm=55,C=64

204

──-64

2

M=4+────────·2=5.38%

55

 

  二、t检验

  用计算t值进行差异显著性检验的方法称做t检验。

检验适用于服从正态分布而且符合随机抽样原则的资料。

t检验习惯上按下列标准判定检验结果:

  t<t(0.05)P>0.05无显著性差异

  t(0.05)≤t<t(0.01)0.05≥P>0.01有显著性差异

  t≥t(0.01)P≤0.01有高度显著性差异

  检验有显著性差异并不等于有实际意义,还需要根据专业知识判断,谨慎地下结论。

  

(一)、样本均数的标准误

  1、公式

       S

   Sx=────(2.1)

     ┌───

√N

Sx:

样本均数的标准误

S:

样本标准差

  N:

样本例数

  2、应用范围及注意事项

  

(1).标准误是样本均数的标准差,表示样本平均数分布的离散程度。

可用于估计总体均数的可信区间和进行均数间的差异显著性检验。

  

(2).表示样本均数离散情况时,可以写成“均数±标准误”的形式。

但必须标明是标准误,或用符号SE表示,以便和标准差相区别。

医学统计学之3--t检验(在医科院皮研所统计培训班编写的讲义)2008年05月08日星期四06:

40

(二)、配对资料的t检验

  1,公式

_

     d

   t=──              (2.2)

Sd

_

  d:

差数均数   Sd:

差数均数标准误

 

  2、应用范围及注意事项

  

(1).医学研究中常采用的自身对照和配对比较设计得到的都是配对资料。

  

(2).配对资料t检验比用两个分组均数的差异显著性检验法的效率高,但事先未经配对设计的资料不能用本法检验。

 

  3,实例

  [例2.1] 用DDS、RFP和B663联合用药治疗10例瘤型麻风病人,治疗前及治疗一年后的BI值如表2.1所示,试问治疗前后的BI值是否有显著性差异?

 表2.1  10例麻风病人联合化疗前后BI变化

──────────────────────────

例号 治疗前 治疗后 差数(d)  d2

──────────────────────────

1   5.4 4.01.41.96

23.22.50.70.49

32.52.6-0.10.01

43.01.91.11.21

54.23.30.90.81

64.63.70.90.81

73.42.70.70.49

84.13.40.70.49

93.62.80.80.64

102.72.10.60.36

──────────────────────────

7.77.27

──────────────────────────

  1、检验假设:

治疗前后BI值无差异。

  2、计算步骤:

  

(1).求治疗前后BI差数d和d2(见表2.1第4和第5列),计算其总和,∑d=7.7,∑d2=7.27。

                _

  

(2).把数据代入公式(1.1)和(1.3)计算差数的均数d和标准误Sd得:

    7.7

 d=───=0.77

     10

     

     ┌─────────

│7.72

│7.27-────

│10 

Sd=│────────────=0.3860

√    10—1

             

  (3).把数据代入公式(2.1)求标准误Sd得

        0.3860

    Sd=───────=0.1221

┌───

     √10

  (4)把数据代入公式(2.2)求t值得:

     0.77

   t=────=6.308

     0.1221

  3、确定P值

   计算自由度(df),df=10—1=9,

查t值表(见附表 ),t(0.01(9))=3.250,

   本例t>t(0.01(9)),故P<0.01。

  4、统计判断:

   该组病例在治疗前与治疗一年后,BI有非常显著性差别(P<0.01),所以可以认为该疗法有显著降低BI的作用。

  (三)、两样本均数差别的t检验

  1,公式

   _ _

 ∑(X1-X1)+∑(X2-X2)

    Sc2=─────────────────

   N1+N2-2

  (∑x1)2(∑x2)2

    ∑X12-────+∑X12-────

  N1N2

  =──────────────────────────(2.3)

 N1+N2-2

         ┌─────────

  │11

 Sx1-x2=│Sc2(──+──)(2.4)

√N1N2

   _  _ 

│X1-X2│

t=──────(2.5)

Sx1-x2

__

X1:

样本I的均数X2:

样本II的均数 

S2c:

合并方差      X1:

样本I的观察值

 X2:

样本II的观察值   N1:

样本I的例数

 N2:

样本II的例数   Sx1-x2:

两样本均数之差的标准误

 2、应用范围及注意事项

  

(1).两个样本均数差别的t检验,适用于按完全随机化设计的两样本均数的差异显著性检验。

  

(2).两样本例数不相等也可以检验,但当两样本例数相等时,检验的效率最高。

  (3).如每组例数大于10,而两标准差的平方相差5倍以上时,不能直接用t检验,可考虑用非参数统计方法。

  3、实例

  [例2.2] 为研究正常成年男、女血液红细胞均数之差别,检查了某地25—29岁正常成年男子156名,正常女子74名,男性红细胞均数为465.13万/mm3,标准差为54.80万/mm3。

问两组均数差别有无显著意义?

  1、检验假设:

 两性间红细胞数无差异。

  2、计算步骤:

  将数值代入公式(2.3)、(2.4)和(2.5):

(156-1)(54.80)2+(74-1)(44.20)2

Sc2=────────────────────────

156+74-2

=2667.05(万/mm3)

       ┌─────────

│156+74

Sx1-x2=│2667.05×────=7.29(万/mm3)

√156×74

465.13-422.16

   t=────────=5.89

7.29

3、确定P值:

 计算自由度df=156+74-2=228,

  查t值表t(0.01(120))=2.67,n'越大则t的临界值越小,本例t>t(0.01(120)),则必大于t(0.01(228)), 故P<0.01。

 4、统计判断  25—29岁正常男女间红细胞数之差别有极显著意义。

  (四)、两样本含量较大时均数差别的t检验

  1、公式   

  _ _          

   │X1-X2│

u=──────(2.6)

┌─────

√S2x1+S2x2

        _        _

u:

u值,  X1:

样本I的均数,X2:

样本II的均数 

  Sx1:

样本I的标准误

  Sx2:

样本II的标准误

  2、应用范围及注意事项

  

(1).样本量大于100时,t分布近似正态分布,可用u检验。

  

(2).按下列标准判定结果:

  u<1.96,P>0.05差异不显著

  1.96≤u<2.58,0.05≥P>0.01 差异显著

  u≥2.58,P≤0.01  差异非常显著

  (3).其它条件与(三)相同。

  3、实例

  [例2.3]某院测定200例银屑病人的血清铜含量均数为110.49ug%,标准差为29.13ug%;健康对照组165例,平均值为125.91ug%,标准差为17.74ug%。

比较两组的血清铜值是否有差异?

 

  1、检验假设:

两者血清铜值无差异。

  2、计算步骤:

  将数值代入公式(2.6)

|110.49-125.91|

u=────────────=4.224

│29.1317.74

│(───)2+(───)2

 √ √100√65

 3、确定P值:

  u>2.58,故P<0.01

  4、统计判断  本例两样本均数差别非常显著(P<0.01),说明银屑病人的血清铜含量比正常人偏低。

  (五)、关于t检验的说明

  1、显著性检验有双侧检验和单侧检验之分,请读者参考有关统计书。

  2、t检验只有在两个样本均数的方差没有显著差别的前提下,才可使用,否则须改用t'检验。

  3、例2.1是对配对资料BI进行t检验,BI属半定量资料,有些BI值并不服从正态分布,所以使用t检验时要慎重;但目前国内外普遍使用t检验来比较治疗前后BI均数差异,故在此举一例。

医学统计学之4--卡方检验(在医科院皮研所统计培训班编写的讲义)2008年05月10日星期六09:

31  X2检验是一种用途广、简单常用的差异显著性检验方法之一。

主要可以用于计数资料(Enumerationdata)的两组或两组以上的两类属性、两类或两类以上现象之间的比较,如检验两个样本率、构成比等之间的差别。

  一、基本原理和步骤:

  X2检验的基本原理是假设各个样本(Sample)来自同一属性的总体(Population),各组中实际数之间的差别仅仅由于抽样误差造成的;通过分别计算各组实际数与理论数的离散情况,求得总的误差X2值,从而测定假设存在的概率(Probability),即可能性P,如果假设成立,那么X2值就不会很大,而保持在一定范围内,相应的P值就大于5%(P>0.05),即仅仅由于抽样误差而造成样本之间这么大小差别的可能性大于5%,说明各样本间的差别本质上无明显差异,它们来之于同一属性的总体,假设被肯定。

反过来说,如果推算出的X2值很大,而超出了一定范围,相应的P

值就小于5%或1%,即由于抽样误差造成样本之间如此大的差别的可能性小于5%或1%;说明各组间差别不是由于抽样造成的,可能两者的确有差别,它们不是来之于同一属性的总体,假设被否定。

 

  具体步骤:

  

(一)、建立2×2的四格表(Fourboldtable)或r×c的行×列表:

分析资料,将实验组(Exporimentalgroup)和对照组(Controlgroup)资料,按两类属性分类,组成如下计算表格:

    │属性Ⅰ│属性Ⅱ│合  计

──────┼──────┼────┼──────

实验组 │αTa│bTb│α+b

──────┼──────┼────┼──────

对照组 │c Tc│dTd│c+d

──────┼──────┼────┼──────

合 计 │α+c│b+d│N=α+b+c+d

    a│b 

表格中 ─┼─以a、b、c、d四个数为基础计算统计量,故称四格表。

    c│d

  

(二)、建立检验假设:

假设两组间无显著差异。

  (三)、计算理论数:

          同行合计数×同列合计数

  任何一格理论数=────────────

            总 合 计 数

  T代表理论数(theoretical),那么a、b、c、d分别有四个理论数:

  Ta,Tb,Tc,Td,

(a+b)(a+c)

Ta=─────────

N

(a+b)(b+d)

  Tb=─────────=(a+b)-Ta

N

(a+c)(c+d)

Tc=─────────=(a+c)-Ta

N

(b+d)(c+d)

Td=─────────=(c+d)-Tc

N

 

  用字母表达写成通式为:

  NrNc

   T=──────

N

Nr:

为行合计数,(N:

number r:

row)。

  Nc:

 为列合计数,(c:

Column)。

  (四)、计算X2值:

          (A-T)2

  基本公式:

X2=∑──────          

(1)

T

  ∑:

(Sigma)即总和的意思,表示各个格子实际数与理论数之间的误差总和。

  A:

代表a、b、c、d实际数(actual)。

  上式展开:

(a-Ta)2(b-Tb)2(c-Tc)2(d-Td)2

X2=──────+──────+──────+──────

TaTbTcTd

(五)、求自由度:

    自由度(n')=(行数-1)(列数-1)

n'=(r-1)(c-1)

(六)、差X2表,确定P值:

    X2<X2(0.05(n')),P>0.05,无显著性差异。

    X2(0.05(n'))≤X2<X20.01(n'),0.05≥P>0.01,有显著性差异。

    X2≥X20.01(n'),P≤0.01,有高度显著性差异。

  (七)、 结论:

 1、有否显著性。

2、P值为多少。

3、由本资料推论总体,应当从实际出发,谨慎地下结论。

  二、四格表资料的X2检验。

  

(一)、计算X2值的四格表基本公式:

  例1:

 某研究所进行HLA与麻风的相关研究,随机选取32例瘤型病人和65例健康人为对照组。

病人组中18例HLA—DR2抗原阳性,健康人组中有14例HLA—DR2阳性。

是否可以认为HLA—DR2抗原阳性率在瘤型麻风病人比健康人中为高?

 

表1.HLA—DR2在瘤型麻风病人和健康人中的测定结果

──────────────────────────────────────

  瘤型病人   健康人 合 计

──────────────────────────────────────

       + 18     14    32 

 HLA—DR2

       -  14     51    65

──────────────────────────────────────

 合  计    32 6597

──────────────────────────────────────

  (徐可愚等:

中华皮肤科杂志,Vol.16

(1):

24,1983)

  1、检验假设:

LA—DR2抗原在瘤型麻风病人和正常健康人中分布无显著性差别。

          32×32

  2、求X2值:

Ta=────=10.557(小数点后保留三位有效数字)

       97

   Tb

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 经济学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1