定性资料的统计描述.docx

上传人:b****5 文档编号:8281385 上传时间:2023-01-30 格式:DOCX 页数:16 大小:77.40KB
下载 相关 举报
定性资料的统计描述.docx_第1页
第1页 / 共16页
定性资料的统计描述.docx_第2页
第2页 / 共16页
定性资料的统计描述.docx_第3页
第3页 / 共16页
定性资料的统计描述.docx_第4页
第4页 / 共16页
定性资料的统计描述.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

定性资料的统计描述.docx

《定性资料的统计描述.docx》由会员分享,可在线阅读,更多相关《定性资料的统计描述.docx(16页珍藏版)》请在冰豆网上搜索。

定性资料的统计描述.docx

定性资料的统计描述

第五章定性资料的统计描述

在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这

类资料称为定性资料,也称分类资料或计数资料。

如性别、HIV感染情况、病情

轻重等都属于分类资料。

对于这类资料,其绝对数往往不便于进行相互比较。

例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。

但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。

第一节常用相对数及其应用

相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。

、率

率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。

根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。

频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0T之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。

其计算公式可表达为:

(5.1)

同时期实际发生某现象的观察单位数

某时期可能发生某现象的观察单位总数

式中,K为比例基数,可以是100%、1000%。

、100000/10万等。

比例基数的选择主要根据习惯用法或使计算结果保留1~2位整数,以便阅读。

例5.1为研究吸烟与肺癌的关系,某医生收集了2003~2005年286例住院肺癌患者的吸烟史,吸烟的肺癌患者有166例,而同时期同年龄段的1855名非肺癌患者中,吸烟的有407例。

试计算该资料中肺癌患者与非肺癌患者的吸烟率。

由式(5.1),肺癌患者的吸烟率=166/286100%=58.04%,非肺癌患者吸烟率=407/1855100%=21.94%,肺癌患者的吸烟率比非肺癌患者的吸烟率高36.1%。

速率(rate)是带有时间因素的频率,根据数理统计的定义是指随时间变化而

改变的速度,此处取其某现象在单位时间内的发生频率之意。

如肿瘤患者的

年生存率;根据追踪随访资料计算的死亡率;年(月、季)发病率等指标,都包含有时间因素,在流行病学中也称为发生密度。

速率具有量纲,取值范围是[0,;),其计算公式可表达为:

(5.2)

速率「见察时段内某现象的发生数

可能发生某现象的观察人时数

式中的比例基数K与式(5.1)相同。

例5.2在一项随访研究中,对125人追踪随访了2年,结果有2人发生了

死亡,则由式(5.2)可得,

二、构成比

构成比(proportion)即比例,是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,用以说明事物内部各组成部分所占的比重,常用百分数表示。

计算公式为:

例5.3某医院2003年各科室收治住院患者的构成情况如表5.1所示。

外科患者的构成比为1133/2826>100%=40.09%,在各科室中所占比重最大;其次是内科患者,其构成比为850/2826>00%=30.08%;接下来依次是妇科和儿科,分别占了15.04%和14.79%,各科室合计构成比为100%。

表5.1某医院2003年各科室收治住院患者的构成情况

病例数

构成比(%)

850

30.08

1133

40.09

425

15.04

418

14.79

2826

100.00

构成比具有以下特点:

分子是分母的

部分,各组成部分构成比数值在

0~1之间波动,各组成部分的构成比数值之和等于1或100%。

②事物内部各组成部分之间呈此消彼长,当其中某一组成部分构成比数值增大,其他组成部分构

成比数值必然会减少。

例如在一定数量的人口性别构成中,若男性比例增加,则女性比例减少。

三、相对比

相对比简称比(ratio),是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。

如前面讲到的变异系数、流行病学中常用的相对危险度、人口学研究中常用到的性别比等都属于相对比。

相对比的分子和分母可以

是绝对数、相对数或平均数,计算公式为:

甲指标

相对比二八标(或100%)(5.4)

乙指标

根据其分子与分母的关系,相对比也可取分为:

①关系指标:

指两个有关

的非同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。

②对比指标:

指同类事物的两个指标之比,以达到比较的目的。

女口2000年我国出

生性别比为116.9,说明2000年我国男性出生人数比女性高,男、女性别比有所失衡。

又如同时期不同人群的某病发病率之比,以说明该时期不同人群的发病情

况。

例5.4为了解新生儿的锌的营养状况,分别测量某医院足月儿以及早产儿的脐血血清锌含量,结果显示足月儿及早产儿的脐血血清锌含量的均数分别为1.85mg/L和1.41mg/L,则该医院足月儿与早产儿的脐血血清锌含量之比为1.85/1.41=1.31,即该医院足月儿脐血血清锌含量是早产儿的1.31倍。

在流行病学研究中,常用的相对危险度(RR)和比值比(OR)都属于相对比指

标。

相对危险度(relativerisk,RR)是指暴露于某种危险因素的观察对象的发病危险度与低暴露或非暴露的观察对象的发病危险度之间的比值。

相对危险度常用

于流行病学队列研究中,用来度量暴露的危险性大小。

其计算可用暴露与低暴露(或非暴露)于危险因素的累积发病率或发病密度(P)估计:

例5.5某锡矿为了解一线作业对工人健康的影响,对1000名新参加工作的工人进行了20年的追踪随访,结果发现从事一线作业的680名工人有5人发生了肺癌,而从事非一线作业的320名工人仅1人发生了肺癌。

试估计该锡矿一线

作业对肺癌的相对危险度。

一线作业工人肺癌的发病率p1=5/680=73.53万;非一线作业工人肺癌的发

病率P2=1/320=31.25万。

可见,该锡矿一线作业工人发生肺癌的危险是非一线作业工人的2.35倍

比值比(oddsratio,OR),又称优势比,是指病例组有无暴露于某危险因素的

比值与对照组有无暴露于同一危险因素的比值之比,常用于流行病学病例对照研

究中,以度量暴露的危险性。

计算公式:

式中,a为病例组中暴露的人数;b为对照组中暴露的人数;e为病例组中未暴露的人数;d为对照组中未暴露的人数。

例5.6某中学发生一起因饮水引起的甲型肝炎(甲肝)爆发,经调查发现,

该校部分学生有生饮自来水的习惯,34名甲肝患者中有22人生饮自来水;而1449

比值比(OR)二

病例组暴露的比值对照组暴露的比值

名健康学生中,生饮自来水的有255人,结果见表5.2。

试估计该中学甲肝发病与生饮自来水的比值比。

表5.2甲肝与生饮自来水的病例对照研究结果

暴露或特征

病例组

对照组

合计

生饮自来水

22(a)

255(b)

277(a+b)

未生饮自来水

12(e)

1194(d)

1206(e+d)

合计

34(a+e)

1449(b+d)

1483(N)

ad22/12

8.58be255/1194

由此可见,甲肝患者生饮自来水与未生饮自来水的比值是健康学生的8.58倍

第二节应用相对数的注意事项

一、计算相对数应有足够的观察单位数

计算相对数时,应注意观察的单位数不能太小。

必须要有足够的观察单位数作为分母,计算的率才是稳定的。

例如临床试验中用某种疗法治疗2例患者,1

例有效,则认为有效率是50%;如果2例都有效,则有效率是100%,可见相差1例其有效率波动非常大。

因此,观察单位数少时,建议采用绝对数表示结果,如果必须要用相对数表示,应同时列出率的置信区间。

但通常认为,在设计周密、质量控制严格的动物实验中,观察数量相对较少时所得的相对数指标也较为稳

^定。

二、分析时不能以构成比代替率

构成比说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。

在实际应用中,错误地将构成比当成率来应用,常导致一些不合理的推论。

例如在对某月交通事故的数据进行分析后发现,在发生交通事故的车辆中,高速行驶的占31%,中速行驶的占56%,低速行驶的占13%。

据此认为,中速行驶的车辆最容易发生交通事故,这明显与常识不符。

产生此错误的原因是将发生交通事故的车辆的不同速度构成当成不同速度行驶车辆的事故发生率,由于实

际生活中以中速行驶的车辆较多,所以中速行驶车辆的事故发生数构成比较大。

车辆事故发生率应该是事故发生数与行驶的车辆数之比。

在医学研究中这种情况也常出现,常见的错误是采用门诊患者或住院患者的资料来分析疾病与年龄、性别、职业等的关系,这种资料所计算的相对数指标通常是构成比,不能当作率来分析。

例如,某医师根据门诊资料分析慢性支气管炎与年龄的关系,如表5.3所示:

表5.3门诊慢性支气管炎患者的年龄构成

年龄组(岁)

患者人数

患者构成比(%)

0~

48

19.4

20~

74

29.8

40~

87

35.1

60~

39

15.7

合计

248

100.0

表中“患者构成比”一栏,仅说明各年龄组患者所占的比重,只能计算构成比指标,不能反映各年龄组的患病水平,不能由40~59岁组构成比最高而得出该年龄组最容易患慢性支气管炎的结论。

因为各年龄组的人口数、就诊机会等因素

都会影响门诊患者的年龄构成,若要分析慢性支气管炎患病率与年龄的关系,只

能通过对一般人群的调查才能了解各年龄组患病率的情况。

在构成比指标中,某一组成部分构成比的增减会影响到其他组成部分构成比

的变化。

某地2000年和2005年慢性疾病的发病情况如表5.4所示:

病例数

构成比(%)

病例数

构成比(%)

呼吸系统疾病

1685

30.24

2577

28.88

循环系统疾病

1433

25.71

2671

29.93

恶性肿瘤

915

16.42

1711

19.18

其他

1540

27.63

1964

22.01

合计

5573

100.00

8923

100.00

表5.4某地2000年和2005年慢性疾病的发病情况

2000年2005年

疾病

2005年与2000年相比,呼吸系统疾病的构成比明显下降,而循环系统疾病、恶性肿瘤的构成比均有所上升。

如果据此作出呼吸系统疾病发病下降,循环系统疾病、恶性肿瘤发病上升的结论,就犯了以构成比的动态分析代替率的动态分析

的错误。

因为2005年与2000年相比,各类型慢性疾病发病的人数都在增加,若要反映各类型慢性疾病发病强度的变化,应对2000年和2005年各类型慢性疾病的发病率进行比较。

三、应分别将分子和分母合计求合计率

对分组资料计算合计率时,不能简单地把各组率取平均数,而应分别将分子和分母合计,再求出合计率。

例如,某医院消化内科上半年收治250例胃溃疡患者,治愈200例,治愈率为80.0%;下半年收治280例胃溃疡患者,治愈238例,治愈率为85.0%。

则该消化内科全年对胃溃疡的治愈率应该是

而不是(80%+85%)/2=82.5%。

四、相对数的比较应注意其可比性

影响相对数高低的因素较多,在比较相对数时,除了欲对比的因素之外,其余的影响因素应尽可能相同或相近。

例如比较各组患者的年龄、性别、病情轻重等构成是否相同,若构成不同,则应考虑进行分层(分年龄、性别、病情轻重)比

较,或者对合计率进行标准化后再作比较。

例如,两种疗法治疗某病的病死率如

表5.5所示:

表5.5两种疗法治疗某病的病死率

病型

新疗法

一般疗法

治疗人数

死亡人数

病死率(%)

治疗人数

死亡人数

病死率(%)

普诵型

75

15

20.0

25

5

20.0

重型

35

14

40.0

65

26

40.0

合计

110

29

26.4

90

31

34.4

如果只比较合计病死率,似乎新疗法优于一般疗法,但当分别考察普通型病例和重型病例时,两种疗法的病死率是相同的。

其原因在于:

两种疗法治疗对象的病型构成不同,新疗法组普通型病例多而重型病例少,一般疗法组却是普通型病例少而重型病例多。

因此要正确比较两种疗法的病死率,可按病情轻重分层分析,或通过计算标准化病死率进行比较。

五、样本率或样本构成比的比较应作假设检验

由于样本率或样本构成比存在抽样误差,如果通过样本推断总体率或总体构成比有无差异,不能凭样本率或样本构成的差别作结论,而须进行差别的假设检验。

第三节动态数列及其应用

动态数列(dynamicseries是一系列按照时间顺序排列的统计指标(包括绝对数、相对数或平均数),用以反映事物或现象在时间上的变化和发展趋势。

常用的动态数列分析指标有:

绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

例5.7表5.6是某地区1999~2002年住院患者数的统计数据,试计算动态数列的分析指标。

表5.6某地区1999~2002年住院患者数发展动态

绝对增长量发展速度增长速度

年份符号患者数—

累计逐年定基比环比定基比环比

(1)

(2)(3)(4)(5)(6)(7)(8)(9)

1999a026694——————

2000

a1

50175

23481

23481

1.88

1.88

0.88

0.88

2001

32

50600

23906

425

1.90

1.01

0.90

0.01

2002

a3

54713

28019

4113

2.05

1.08

1.05

0.08

一、绝对增长量

绝对增长量是指事物现象在一定时期增长的绝对值,可分为两种:

(一)累计增长量

累计增长量(cumulativequantityofincrease)是指报告期的指标值与某一固定期(基期)指标值的差值,其计算公式为:

累计增长量二报告期指标值-某固定期指标值(5.7)

本例中,该地区2002年患者数的累计增长量=54713—26694=28019人,见表5.6第(4)栏。

(二)逐年增长量

指报告期的指标值与相邻的前期指标值之差,其计算公式为:

逐年增长量二报告期指标值-相邻前期指标值(5.8)

本例中,该地区2002年较2001年患者数的逐年增长量=54713-50600=4113人,见表5.6第⑸栏。

二、发展速度与增长速度

发展速度(speedofdevelopment)与增长速度(speedofincrease)都是相对比指标,用以说明事物现象在一定时期的速度变化。

发展速度说明报告期指标值水平与某一固定期指标值相比或与相邻的前期指标值相比,是其多少倍。

根据其比较对象的不同,分为定基比发展速度和环比发展速度。

定基比发展速度:

指报告期的指标值与某一固定期(基期)指标值之比,可表

达为aja。

,a2/a°,…,an/ag。

玄为某一固定期(基期)指标值,an为报告期指标值。

本例中,该地区2000年住院患者数的定基比发展速度=50175/26694=1.88,2001年住院患者数的定基比发展速度=50600/26694=1.90,…,以此类推,见表5.6第⑹栏。

环比发展速度:

指报告期指标值与相邻前期指标值之比,可表达为a1/a0,a2/a1,…,an/an^。

本例中,该地区2000年住院患者数的环比发展速度

=50175/26694=1.88,2001年住院患者数的环比发展速度=50600/50175=1.01,…,以此类推,见表5.6第⑺栏。

增长速度是发展速度的净增长量,增长速度=发展速度-1,以说明报告期指标值与某一固定期指标值相比或与相邻的前期指标值相比,增长了多少倍。

本例

中,该地2001年住院患者数的定基比增长速度=1.90—1=0.90,见表5.6第(8)栏;同年住院患者数的环比增长速度=1.01-1=0.01,见表5.6第(9)栏。

二、平均发展速度与平均增长速度

平均发展速度(averagespeedofdevelopment)是指一定时期内各环比发展速

常用几何平

(5.9)

度的平均值,用以说明事物现象在一定时期内逐年的平均发展程度,

均数来计算平均发展速度。

计算公式为:

平均发展速度=nan/a0

式中,a。

为某一固定期(基期)指标值,an为报告期指标值。

平均增长速度(averagespeedofincrease是说明某事物在一定时期内逐年的平均增长程度。

计算公式为:

平均增长速度=平均发展速度—1(5.10)

根据表5.6的资料,该地区1999年有住院患者26694人,到2002年增加到

54713人,相当于1999年的2.05倍,3年间共增加患者28019人,增加了1.05倍。

1999~2002年的平均发展速度为354713/26694=1.27倍,平均增长速度=1.27-1=0.27倍,住院患者数总体呈增长趋势。

从环比增长速度看,2000年增长较快,增长了0.88倍,但2000年后增长速度明显放缓。

动态数列不仅可以分析过去一段时间的变化规律,也可根据其过去的变化

规律预测未来发生情况,计算未来几年后指标所达到的水平。

如根据表5.6资

料,可预测到2004年该地区住院患者数规模,相当于按式(5.9)计算比:

1.27=5a5/26694

a5=1.27526694=88193

即根据某地区1999~2002年住院患者数的平均发展速度,预计到2004年该地区的住院患者数将达到88193人。

第四节率的标准化

一、标准化法的意义

在本章第二节中曾提到,当所比较的各组观察对象内部构成不同时,应考虑

进行分层比较,或者对合计率进行标准化后再作比较。

以表5.5资料为例,要比较新疗法和一般疗法的病死率,如果仅比较合计率,一般疗法的合计病死率是34.4%,而新疗法的合计病死率是26.4%,显然一般疗法比新疗法的病死率高。

但当我们分别考察普通型病例和重型病例两组人群时,两种疗法的病死率均相同,普通型病例的病死率都是20%,而重型病例的病死率都是40%。

那么,为什么一般疗法的合计病死率就比新疗法高呢?

其原因就是:

两种疗法治疗对象的病型构成不同,新疗法组普通型病例多而重型病例少,一般

疗法组却是普通型病例少而重型病例多。

要消除这种假象,可以采用率的标准化

法进行比较。

标准化法(standardization)的基本思想就是采用统一的标准构成,以消除年龄、性别、病情轻重及病程长短等因素构成不同对病死率、死亡率、治愈率等的影响,使算得的标准化率(standardizedrate)具有可比性。

标准化法的思想也可用于平均数的比较,如比较两个医院平均住院天数,需考虑不同科室住院患者的构成对平均住院天数的影响。

总之,标准化的目的在于消除年龄、性别、病情轻重等混杂因素对研究结果的影响。

在医学研究中,混杂因素(confoundingfactor)通

常指与研究因素有关并对研究结果产生影响的非研究因素。

在资料分析阶段有许

多控制混杂因素的方法,标准化法是其中之一。

二、标准化率的计算

计算标准化率的常用方法有直接法和间接法两种。

以表5.7为例说明两组观察对象的年龄构成不同时,其标准化死亡率的计算方法和计算公式。

其它标准化率的计算与之类似。

表5.7计算标准化率的数据符号

年龄组-

人口数

标准组

死亡数

死亡率

被标化组

人口数

死亡数

死亡率

1

N1

&

R

Pi

2

N2

R2

P2

n2

「2

P2

(1)直接法

当已知被标化组的年龄别死亡率Pi时,宜采用直接法计算标准化率,这里又分两种情况:

1.已知标准组年龄别人口数时,

(5.11)

-'NPi

P-

N

式中,P•为标准化率;Nipi为各年龄组的预期死亡数,是指用被标化组的年龄

别死亡率Pi去预测在标准人口Ni中,可能会有多少人发生死亡。

总的预期死亡数aNiPi除以标准组总人口数N就得到标准化率。

2.已知标准组年龄别人口构成比时,

Ni

P八(」)Pi(5.12)

N

N

式中,标准组的年龄构成比仝乘以被标化组的年龄别死亡率P称为分配死亡率,

N

分配死亡率的累计'•(丛)P就是标准化率。

N

如果采用相同的标准组,式(5.11)和式(5.12)计算的结果是完全一致的。

(2)间接法

当被标化组的年龄别死亡率P未知,只有年龄别人口数ni和死亡总数r时,

可采用间接法。

间接法必须有标准组的年龄别死亡率P,计算公式为:

(5.13)

lr

式中,p为标准组的合计死亡率,送nP是被标化组的预期死亡人数,■是

nip

被标化组的实际死亡数与预期死亡数之比,称为标准化死亡率比(standardized

mortalityratio,SMR)。

若SMR1,表示被标化组的死亡数高于标准组;若SMR:

1,表示被标化组死亡数低于标准组。

用标准化死亡比(SMR)乘以标准组的合计死亡率P,即得到间接法标准化死亡率P。

(3)标准化率的计算步骤

1•根据被标化组的数据条件选择直接法或间接法如对死亡率的年龄构成

标准化,如果已知被标化组的年龄别死亡率,宜采用直接法计算标准化率;如果

没有被标化组的年龄别死亡率,只有年龄别人口数和死亡总数,应采用间接法计算标准化率。

2•选择标准组①根据研究目的选择有代表性的、较稳定的、数量较大的人群,例如全国的、全省的或本地区的数据;②也可将欲比较的两地或两组的人口数合并作为标准组,或选择其中一组人口作为标准。

3•选择公式计算标准化率根据所选方法和数据条件选择相应的公式。

现以表5.5为例,具体说明标准化率的计算,此处是对病死率进行标准化。

(1)已知新疗法和一般疗法分别治疗普通型病例和重型病例的病死率,采用直接法计算标准化病死率。

(2)选择新疗法和一般疗法两组的合并治疗例数作为标准人口数Ni,见表

5.8第

(2)栏。

(3)按式(5.11)计算新疗法组和一般疗法组的标准化病死率。

表5.8

直接法计算两种疗法的标准化病死率

(%)

病型

标准人口数

新疗法

一般疗法

病死率

预期病死数

病死率

预期病死数

Ni

Pi

NiPi

P

NiPi

(1)

(2)

(3)

(4)=

(2)(3)

(5)

(6)=

(2)(5)

普通型

100

20.0

20

20.0

20

重型

100

40.0

40

40.0

40

合计

200(N)

26.4

60(、NQ

34.4

60CMp)

新疗法组的标准化病死率pi60100%=30.0%

200

一般疗法组的标准化病死率p2一100%

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1