流行病学的常用指标.docx
《流行病学的常用指标.docx》由会员分享,可在线阅读,更多相关《流行病学的常用指标.docx(39页珍藏版)》请在冰豆网上搜索。
流行病学的常用指标
流行病学的常用指标
⏹疾病发病频率测量指标
●发病率(incidencerate)
●罹患率(attackrate)
●患病率(prevalencerate)
●感染率(infectionrate)
●续发率(secondaryattackrate,SAR)
●病残率(disablilityrate)
●生存率(survivalrate)
发病率(incidencerate):
表示在一定期间内,一定人群中某病新病例出现的频率,是用来衡量某时期一个地区人群发生某病的危险性大小的指标。
一定期间内某人群中某病新病例数
发病率=-------------------------------×K
同期暴露人口数
K=(100%,1000/千,或10000/万)。
发病率的准确性取决于疾病报告,登记制度以及诊断的正确
●计算发病率时,要考虑的几个因素:
◆发病时间在观察期内。
◆观察时间观察时间多以年表示。
◆暴露人口数指可能会发生该病的人群。
◆新发病例数分子是一定期间的新发病例,若在观察期间内一个人可多次患病时,则应分别计为新发病例数,如腹泻,流感等。
发病率可按不同特征(如年龄、性别、职业、民族等)分别计算,此即发病专率。
●罹患率(attackrate):
与发病率一样,也是测量新发病例的指标。
观察期间的新病例
罹患率=------------------------×100
同期暴露人口数
常用于较小范围或短期间的疾病流行。
观察时间可以日、周、旬、月为单位。
适用于局部地区疾病的爆发,食物中毒、传染病及职业中毒等爆发流行情况。
其优点是可以根据暴露程度精确的测量发病机率。
●患病率(prevalencerate):
也称现患率。
指某特定时间内总人口中某病新旧病例所占比例。
可按观察时间的不同分为期间患病率和时点患病率。
某一时点一定人群中现患某病新旧病例数
时点患病率=-------------------------------------×K
该时点人口数
某观察期间一定人群中现患某病新旧病例数
期间患病率=-------------------------------------×K
同期的平均人口数
K=100%,1000/千,或10000/万等
期间患病率实际上等于某一特定期间开始时患病率加上该期间内的发病率。
患病率升高或降低的原因:
影响升高的因素:
①病程延长,
②未治愈者的寿命延长,
③新病例增加(即发病率增),
④病例迁入,
⑤健康者迁出,
⑥易感者迁入,
⑦诊断水平提高,
⑧报告率提高。
影响降低的因素:
①病程缩短,
②病死率高,
③新病例减少(发病率下降),
④健康者迁入,
⑤病例迁出,
⑥治愈率提高
●感染率(infectionrate):
是指在某个时间内能检查的整个人群样本中,某病现有感染者人数所占的比例。
调查时某病感染人数
感染率=----------------------×100%
调查时受检人数
感染率常用于研究某些传染病或寄生虫病的感染情况和分析防治工作的效果,估计某病的流行势态,为制定防治措施提供依据。
特别是对隐性感染、病原携带及轻型和不典型病例的调查较为有用。
如乙型肝炎、乙型脑炎、脊髓灰质炎、结核、寄生虫等。
●续发率(secondaryattackrate,SAR):
指在某些传染病最短潜伏期到最长潜伏期之间,易感接触者中发病的人数占所有易感接触者总数的百分率。
一个潜伏期内易感接触者中发病人数
续发率=----------------------------------×100%
易感接触者总人数
多指在一个家庭内、病房、集体宿舍、托儿所、幼儿园班组中第一个病例发生后,在该病最短与最长潜伏期之间出现的病例称续发病例。
也称二代病例。
计算时,须将原发病例从分子及分母中去除。
对那些在同一家庭中来自家庭外感染或短于最短潜伏期、或长于最长潜伏期者均不应计入原发病例。
续发率可以用于比较传染病传染力的强弱,用于分析传染病流行因素,包括不同条件对传染病传播的影响(如年龄、性别、家庭中儿童数、家庭人口数、经济条件等)及评价卫生防疫措施的效果(如对免疫接种、隔离、消毒等措施的评价)。
●病残率(disablilityrate):
某一人群中,在一定期间内每百(或千、万、十万)人中实际存在的病残人数。
是指通过调查询问或健康调查,确诊的病残人数与调查人数之比。
病残人数
病残率=----------------------×K
调查人数
(K=100%,1000/千,或10000/万,等)
病残率可以说明病残在人群中发生的频率,是作为人群健康状况的评价指标之一。
⏹疾病死亡频率测量指标:
●死亡率(mortalityrate)
●病死率(fatalityrate)
●生存率(survivalrate)
●死亡率(mortalityrate):
是某人群在一定期间(一般为一年)的死亡人数与该人群同期人口数之比。
表示在一定时期内,死于某病(或死于所有原因)的频率。
某人群某年总死亡人数
粗死亡率=--------------------------------×K
该人群同年平均人口数
某期间内(因某病)死亡总数
死亡专率=---------------------------------×K
同期平均人口数
(K=100%,1000/千,或10000/万,等)
死亡率是测量人群死亡危险性大小最常用的指标。
●病死率(fatalityrate):
表示在一定时间内(通常为1年),患某病的病人中因该病而死亡者的比例。
某时期内因某病死亡人数
病死率=---------------------------×100%
同期确认的某病病例数
病死率表示某病确诊后发生死亡的概率,它受疾病的严重程度、早期诊断和治疗水平的影响。
●生存率(survivalrate):
指在接受某种治疗的病人或患某病的人中,经若干年随访(通常为1,3,5年)后,尚存活的病人数所占的比例。
随访满n年尚存活的病例数
生存率=----------------------------×100%
随访满n年的病例数
生存率反应了疾病对生命的危害程度,也是考核治疗措施效果的指标。
●率和比
①率(rate):
指在某一确定人群中某些事件发生的频率。
一个率由分子(发生数)、分母(可能发生的总数)、事件发生的特定时间和乘数组成。
大多数率是构成比。
②比(ratio):
是两个变量的数值之商,表示分子和分母之间的数量关系。
③比例(proportion):
是表示同一事物局部与总体之间数量上的比值,分子和分母的单位相同,而且分子包含与分母之中。
常用P=a/a+b表示。
有两类,一、反映事物静止状态内部构成成分占全体的比重,也称构成比例,二、与动态的发生变化概率密切相关的发生频率比例,它反映一定时间内,发生某种变化者占全体的比例。
率与比的区别
◆率
◆分子是分母的一部分,分子和分母代表的应该是同一人群;
◆如果分子被限定在某一年龄、性别或种族组内,分母也应该有同样的限定;
◆可以取任何值,是反映动态过程的一个参数。
◆比
◆不管分子和分母所来自的总体如何;可以是两个彼此分离的互不相重叠或包含的量;
◆分子和分母本身可以是绝对数,也可以是率、比例或比;
◆构成比取值仅在0到1之间,是变量在一定期间内发生变化的概率
⏹疾病残疾失能指标:
●潜在减寿年数(potentialyearsoflifelost,PYLL)
●伤残调整寿命年
潜在减寿年数(potentialyearsoflifelost,PYLL):
是指某病某年龄组人群死亡者的期望寿命与实际死亡年龄之差的总和。
即死亡所造成的寿命损失。
潜在减寿年数是评价人群健康水平的一个重要指标;也是评价人群健康水平的一个重要指标;可以用于衡量某种死因对一定年龄组人群的危害程度。
可以反映出对各年龄组人群的危害大小。
●伤残调整寿命年(disabilityadjustedlifeyear,DALY):
是指从发病到死亡所损失的全部健康寿命年,包括因早死所致的寿命损失年(YLL)和疾病所致伤残引起的健康寿命损失年(YLD)两部分。
DALY是生命数量和生命质量以时间为单位的综合度量。
DALY是一个定量的计算因各种疾病造成的早死与残疾对健康寿命年损失的综合指标。
是将由于早死(实际死亡年数与低死亡人群中该年龄的预期寿命之差)造成的损失和因伤残造成的健康损失二者结合起来加以测算的。
流行病学是从宏观的高度和群体的角度来认识疾病和健康状况的分布及其机制,研究制定防治对策及评价其效果。
DALY的出现是疾病经济负担研究的划时代变化,在1980年以前,DALY的概念还没有提出,疾病负担的评价指标主要是发病率、死亡率等传统指标。
随着医学模式的转变,传统的指标越来越不适应现代医学模式的要求,1988年,为了量化失去健康生命的全部损失,哈佛大学和世界卫生组织的专家进行了DALY的研究,并成功地应用于GDB的分析。
DALY是目前应用最多的、最具代表性的疾病经济负担评价和测量指标。
表示流行强度的术语有:
散发(sporadic)
暴发(outbreak)
流行(epidemic)
大流行(pandemic
⏹散发(sporadic):
是指某病在一定地区的发病率呈历年来一般水平,各病例间在发病时间和地点方面无明显联系,表现为散在发生。
确定某病在某地区是否属于散发,应参照当地前3年该病的发病率,如当年发病率未显著超过既往一般发病率,则称为散发。
不同病种、不同时期散发水平不同。
一般多用于区、县以上范围,不适于小范围的人群,如一个托儿所、工厂和学校等。
疾病分布呈散发形式的主要原因:
①该病常年流行,人群有一定免疫力或因疫苗接种维持着人群的免疫水平,如麻疹。
②隐性感染为主的传染病,如脊髓灰质炎、病毒性肝炎等。
③传播机制难以实现的传染病,如流行性回归热。
④潜伏期较长的传染病,如麻风病、炭疽。
⏹暴发(outbreak)是指在局限的区域范围或集体单位中,短时间内突然发生很多相同的病人,病人之间有相同的传染源或传播途径。
如食物中毒、托幼机构的麻疹,流脑等容易发生暴发。
暴发的几个类型:
①点源暴发易感人群在一个相同的短时间内暴露于共同的传播因素而引起的流行。
②重复暴露同源暴发 易感人群在一定期间内重复(多次)暴露于共同的传播因素而引起的流行,流行曲线呈多峰或不规则型。
③蔓延暴发是指通过宿主间传播或人传人所引起的流行。
⏹流行(epidemic):
流行是指一个地区某病发病率明显超过历年的散发发病率水平称为流行。
流行与散发是相对的,各地应根据不同时期、不同病种等作出判断。
有时在实际工作中用暴发流行一词。
它表示在一个地区某病病例突然大量增多,发病率常超过一般流行的发病率水平,来势较迅猛,流行持续时间往往超过该病的最长潜伏期。
这个词仅仅是实际工作中使用的,它和流行病学中的暴发之词不同。
有些传染病隐性感染占大多数。
当它流行时临床症状明显病例可能不多,而实际感染率却很高,这种现象称为隐性流行。
如流行性乙型脑炎和脊髓灰质炎常具有这种现象。
⏹大流行(pandemic):
大流行即疾病蔓延迅速,涉及地域广,往往在比较短的期间内越过省界、国界、甚至洲界,而形成大流行。
如流行性感冒、霍乱,历史上曾发生过多次世界性流行。
当前艾滋病的流行也是呈世界性的。
筛检(screening):
是在大量人群中通过快速的试验和其他方法,从外表健康的人群中查出某病的可疑患者的一种预防性措施。
筛检不是诊断试验,它是把健康人和病人(疑似病人、有缺陷的人)区别开来的方法,它仅是初步检查,是早期发现病人的一种方法。
对筛检试验阳性还应进一步确诊。
对某种疾病来说,在一般人群中包括三种人,一种是无该病的健康人,一种是可疑有该病但实际无该病的人,一种是有该病的人,这三种人混杂存在。
筛检的工作即是将健康人与其他两类人区别开来。
然后用更完善的诊断方法,将可疑患该病但实际无该病的人与实际患该病的人区别开来。
第三步为对有该病的人进行治疗,使之恢复。
因此,筛检是第一步,诊断试验是第二步,治疗是第三步。
筛检试验评价
筛检试验
金标准
合计
患者
非患者
阳性
真阳性A
假阳性B
R1
阴性
假阴性C
真阴性D
R2
合计
C1
C2
N
筛检的评价指标:
1.真实性(validity),亦称效度,指测量值与实际值相符合的程度,故又称准确性(accuracy)。
用于评价真实性的指标有:
灵敏度与假阴性率、特异度与假阳性率、正确指数、似然比和符合率。
①灵敏度与假阴性率
灵敏度(sensitivity),又称真阳性率(truepositiverate),即实际有病而按该筛检试验的标准被正确地判为有病的百分比。
它反映了筛检试验发现病人的能力。
假阴性率(falsenegativerate),又称漏诊率,指实际有病,根据筛检试验被确定为无病的百分比。
它反映的是筛检试验漏诊病人的情况。
灵敏度与假阴性率之间为互补关系:
灵敏度=1-假阴性率
即灵敏度越高,假阴性率越低,反之亦然。
特异度与假阳性率
特异度(specificity),又称真阴性率(truenegativerate),即实际无病按该诊断标准被正确地判为无病的百分比。
它反映了筛检试验确定非病人的能力。
假阳性率(falsepositiverate),又称误诊率,即实际无病,但根据筛检被判为有病的百分比。
特异度与假阳性率之间为互补关系:
特异度=1-假阳性率
即特异度越高,假阳性率越低,反之亦然。
正确指数
正确指数也称约登指数(Youden’sindex),是灵敏度与特异度之和减去1,表示筛检方法发现真正病人与非病人的总能力。
正确指数的范围在0~1之间。
指数越大,其真实性越高。
正确指数=(灵敏度+特异度)–1
=1–(假阴性+假阳性)
似然比(likelihoodratio,LR)
属于同时反映灵敏度和特异度的复合指标,即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。
全面反映了筛检试验的诊断价值,非常稳定。
它的计算只涉及灵敏度与特异度,不受患病率的影响。
检验结果有阳性与阴性之分,故似然比相应地区分为:
阳性似然比(positivelikelihoodratio,+LR)
阴性似然比(negativelikelihoodratio,-LR)
阳性似然比是筛检结果的真阳性率与假阳性率之比。
该指标反映了筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。
比值越大,试验结果阳性时为真阳性的概率越大。
阴性似然比是筛检结果的假阴性率与真阴性率之比。
该指标表示错误判断阴性的可能性是正确判断阴性可能性的倍数。
比值越小,试验结果阴性时为真阴性的可能性越大。
阳性似然比越大,筛检试验的诊断价值越高;阴性似然比越小,筛检试验的诊断价值也越高。
因此,在选择筛检试验时应选择阳性似然比高的方法。
人群某病患病状况与筛检结果的关系
筛检试验
金标准诊断结果
合计
患者
非患者
阳性
165A
80B
245R1
阴性
45C
730D
775R2
合计
210C1
810C2
1020N
可靠性(reliability)
也称信度、精确度(precision)或可重复性(repeata
-bility),是指在相同条件下用某测量工具(如筛检试验)重复测量同一受试者时获得相同结果的稳定程度。
评价筛检试验可靠性的方法和指标有下面一些方法:
①标准差和变异系数当某试验是做定量测定时,可用标准差和变异系数(coefficientvariance,CV)来表示可靠性。
标准差和变异系数的值越小,表示可重复性越好,精密度越高。
反之,可重复性就越差,精密度越低。
变异系数为标准差与算术均数之比。
变异系数(CV)=(标准差/算术均数)×100%
符合率(agreementrate,consistencyrate)与Kappa值
符合率又称一致率,是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例。
符合率可用于比较两个医师筛检诊断同一组病人,或同一医师两次筛检诊断同一组病人的结果。
影响筛检试验可靠性的因素有:
①受试对象生物学变异由于个体生物周期等生物学变异,使得同一受试对象在不同时间获得的临床测量值有所波动。
例如,血压在一天内不同时间的测量值存在变异。
②观察者由于测量者之间、同一测量者在不同时间的技术水平不一,认真程度不同,生物学感觉差异,预期偏倚等均可导致重复测量的结果不一致。
例如,血压测量者的不一致性,X线读片与化验结果判断的不一致性等。
③实验室条件重复测量时,测量仪器不稳定,试验方法本身不稳定,不同厂家、同一厂家生产的不同批号的试剂盒的纯度、有效成份的含量、试剂的稳定性等均有不同,由此可能引起测量误差。
预测值(predictivevalue)
预测值是反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。
根据筛检的阳性与阴性结果进行的估计分别称为阳性预测值和阴性预测值。
①阳性预测值(positivepredictivevalue,PPV)是指筛检试验阳性者患目标疾病的可能性。
阴性预测值(negativepredictivevalue,NPV)是指筛检试验阴性者不患目标疾病的可能性。
筛检试验的灵敏度越高,阴性预测值越高;
筛检试验的特异度越高,阳性预测值越高。
预测值还与受检人群目标疾病患病率(P)的高低密切相关:
人群在不同患病率、灵敏度与特异度的情况下,阳性预测值与阴性预测值的变化。
当灵敏度与特异度一定,疾病患病率降低时,阳性预测值降低,阴性预测值升高;
当患病率不变,降低灵敏度,特异度将提高,此时阳性预测值将升高,阴性预测值将下降。
在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果
患病率
(%)
灵敏度
(%)
特异度
(%)
筛检
结果
金标准
合计
阳性预
测值(%)
阴性预
测值(%)
患者
非患者
50
50
50
+
250
250
500
50
-
250
250
500
50
合计
500
500
1000
20
50
50
+
100
400
500
20
-
100
400
500
80
合计
200
800
1000
20
90
50
+
-
20
400
420
95
合计
200
800
1000
20
50
90
+
100
80
180
56
-
100
720
820
88
合计
200
800
1000
卫生统计学常用指标分析与图表制作
⏹总体:
是根据研究目的确定的同质研究对象的全体。
按研究对象来源又分目标总体和研究总体。
⏹样本:
是指从研究总体中抽取的一部分有代表性的个体。
⏹同质是指同一总体中个体的性质、影响条件和背景相同或非常相近;
⏹变异是指同质的个体之间存在的差异。
⏹变量:
每个观察单位的某项特征
⏹资料:
对变量的测得值称为变量值或观察值,亦称为资料
资料的两种类型
定量资料(计量资料)连续
离散
定性资料(分类资料)无序二项分类
多项分类
有序(等级资料)
根据变量取值特点,计量资料分为:
⏹连续性资料:
变量值可以在实数轴上连续变动。
如年龄、身高、体重。
⏹离散型资料:
变量取值能一一列举。
只能取整数。
如毒性试验小鼠死亡只数。
⏹习题:
⏹某人记录了50名病人体重的测定结果:
小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于:
A:
定量资料B:
分类资料C:
有序资料D:
二分类资料E:
名义变量资料
概率
⏹概率是描述随机事件发生的可能性大小的数值,用P表示。
⏹随机事件概率的大小在0和1之间,即0≤P≤1,常用小数或百分数表示。
⏹P越接近1,表示某事件发生的可能性越大,P越接近0,表示某事件发生的可能性越小。
⏹P≤0.05,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。
二、统计分析的内容
统计描述
统计推断:
包括参数估计和假设检验
统计资料的描述
⏹列表描述:
频数分布表、一览表……
⏹图形描述:
频数分布图、趋势图……
⏹指标描述
⏹定量资料
集中位置:
算术均数、几何均数、中位数
离散程度:
极差、四分位数间距、方差、标准差、变异系数
⏹定性或等级资料
相对数指标:
率、构成比、比
集中趋势的描述
⏹广义的平均数包含各种表示数据分布集中位置的指标。
⏹卫生领域最常用的三种平均数指标:
算术均数、几何均数、中位数
定量资料的集中趋势指标
平均数
意义
应用
算术均数
平均数量水平
对称分布,特别是正态分布或近似正态分布的资料
几何均数
平均增(减)倍数
(对于等比资料)
等比资料;对数正态分布资料
中位数
位次居中的观察值水平
偏态分布;两端无确切值;分布不明确的资料
算术平均数
算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。
算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。
(一)直接法
主要用于样本含量n≤30以下、未经分组资料平均数的计算。
设某一资料包含n个观测值:
x1、x2、…、xn,
则样本平均数可通过下式计算:
其中,Σ为总和符号;表示从第一个观测值x1累加到第n个观测值xn。
当在意义上已明确时,可简写为Σx,(3-1)式可改写为:
加权法
对于样本含量n≥30以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:
式中:
—第i组的组中值;
—第i组的次数;
—分组数
第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量,因此将fi称为是xi的“权”,加权法也由此而得名
(三)平均数的基本性质
1、样本各观测值与平均数之差的和为零,即离均差之和等于零。
或简写成
2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。
(xi-)2<(xi-a)2(常数a≠)
或简写为:
<
对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:
中位数
将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为