统计流行病学综合材料名解填空问答.docx
《统计流行病学综合材料名解填空问答.docx》由会员分享,可在线阅读,更多相关《统计流行病学综合材料名解填空问答.docx(42页珍藏版)》请在冰豆网上搜索。
统计流行病学综合材料名解填空问答
1、抽样误差:
有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异。
2、标准误:
将样本统计量的标准差称为标准误。
3、均数的标准误:
样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。
4、u分布:
若某一随机变量X服从总体均数为υ、总体标准差为σ的正态分布N(υ,σ2),则通过u变换(X-u/σ)可将一般正态分布转化为标准正态分布N(0,12),即u分布。
5、t分布:
在实际工作中,由于σ-X未知,用S-X代替,则-X-υ/S-X不再服从标准正态分布,而服从t分布。
6、可信区间:
是按照预先给定的概率(1-α)所确定的包含总体均数的区间估计范围。
其确切含义为:
如果能够进行重复抽样试验,平均有1-α(如95%)的可信区间包含了
总体均数,而不是总体均数落在该可信区间。
7、假设检验:
也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)出发间接判定要解决的问题(H1)是否成立。
然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。
8、Ⅰ型错误:
拒绝了实际上成立的Ho,这类“弃真”的错误称之。
Ⅱ型错误:
“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。
9、检验效能:
1-β,即把握度,指当两总体确有差异,按规定检验水准α所能发现该差异的能力。
10、方差分析:
又称变异数分析或F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。
11、单向方差分析(onewayanalysisofvariance)是指处理因素只有一个。
这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。
12、均方:
每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(meansquare,MS)
13、LSD-t检验:
即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。
14、SNK(student-Newman-Keuls)法:
又称q检验,是根据q值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较。
15、Dunnett-t检验:
适用于g-1个实验组与一个对照组均数差别的多重比较。
16、完全随机设计:
是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。
17、析因设计(factorialdesign)实验:
凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorialdesign)实验。
18、随机区组设计(randomizedblockdesign)是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象。
19、二项分布:
是指只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现阳性次数X=0,1,2,3……的一种概率分布。
20、Poisson分布:
作为二项分布的一种极限情况,已发展为描述小概率事件发生规律的一种重要分布。
21、
分布:
是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题。
22、拟合优度检验:
根据样本的频率分布检验其总体分布是否等于某给定的理论分布。
23、回归(regression)与相关(correlation)是研究两个或多个随机变量之间相互关系的一种重要的统计分析方法,应用较广。
回归是研究随机变量之间的数量依存关系,相关是研究随机变量间相互联系的密切程度和方向。
24、回归系数(regressioncoefficient):
又称斜率(slope),是当X每改变一个观测单位时所引起的Y的平均改变的估计量,它是回归分析中最重要的统计量。
25、SS总:
称为总离均差平方和(totalsumofsquares),说明未考虑X与Y的回归关系时Y的变异。
SS回:
称为回归离均差平方和。
它反映在Y的总变异中由于X与Y的直线关系而使Y变异减小的部分,也就是在Y的总平方和中可以用X解释的部分。
SS回越大,说明回归效果越好。
SS残:
称为残差平方和或剩余平方和,它反映X对Y的线性影响之外的一切因素对Y的变异的作用,也就是在总平方和中无法用X解释的部份。
26、logistic回归分类:
是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。
27、生存分析:
是将事件发生的结果和随访时间两因素结合在一起进行分析的一种统计分析方法,它能充分利用所得的研究信息,更加准确地评价和比较随访资料。
28、生存时间:
是任何两个有联系事件之间的时间间隔。
29、总体:
总体(population)(大同小异的对象全体)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:
从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应
具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
30、随机抽样:
随机抽样(randomsampling)是指按照随机化的原则(总体中每一个观
察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
31、变异:
同一总体中不同个体间存在的差异称为变异。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
32、
(1)计量资料:
对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为
计量资料(measurementdata)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表
现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、
脉搏(次/分)、血压(KPa)等。
(2)计数资料:
将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料
(countdata)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的
类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效
的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。
(3)等级资料:
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察
单位数,称为等级资料(ordinaldata)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
等级资料与计数资料不同:
属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:
每个观察单位未确切定量,故亦称为半计量资料。
33.、随机误差:
随机误差(randomerror)又称偶然误差,是指排除了系统误差后尚存的
误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服
从正态分布。
随机误差可以通过统计处理来估计。
抽样误差(samplingerror)是指样本统计量与总体参数的差别。
在总体确定的情
况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
34、随机变量:
随机变量(randomvariable)是指取指不能事先确定的观察结果。
随机
变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上
讲,每个变量的取值服从特定的概率分布。
35、参数:
参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数
是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样
本,用算得的样本统计量估计未知的总体参数。
36、统计量:
统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
37、几何均数(geometricmean)用以描述对数正态分布或数据呈倍数变化资料的
水平。
记为G。
38、百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次
依次转化为百分位。
百分位数的另一个重要用途是确定医学参考值范围。
39、四分位数间距(inter-quartilerange)是由第3四分位数和第1四分位数相
减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
40、变异系数(coefficientofvariation)用于量纲不同或均数差别较大的资料间变异程度的比较。
用CV表示。
计算:
标准差/均数*100%
41、统计推断:
通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称
为统计推断(statisticalinference)。
42、抽样误差:
由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽
样误差(samplingerror)。
43、标准误及Xs:
通常将样本统计量的标准差称为标准误。
许多样本均数的标准差Xs
称为均数的标准误(standarderrorofmean,SEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
44、可信区间:
按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidenceinterval,CI)。
它的确切含义是:
可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α。
45、参数估计:
指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种
方法:
点估计和区间估计。
46、假设检验中P的含义:
指从H0规定的总体随机抽得等于及大于(或等于及小于)
现有样本获得的检验统计量值的概率。
47、I型和II型错误:
I型错误(typeIerror),指拒绝了实际上成立的H0,这类“弃真”
的错误称为I型错误,其概率大小用α表示;II型错误(typeIIerror),指接受了实际上不成立的H0,这类“存伪”的误称为II型错误,其概率大小用β表示。
48、检验效能:
1-β称为检验效能(poweroftest),它是指当两总体确有差别,按规定的检验水准a所能发现该差异的能力。
49、检验水准:
是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(levelofatest),记为α。
50、构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分
布。
计算公式为:
某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:
百分数等。
51、非参数统计:
针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体
分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种
不依赖总体分布的具体形式的统计分析方法。
由于这类方法不受总体参数的限制,故称非参
数统计法(non-parametricstatistics),或称为不拘分布(distribution-freestatistics)
的统计分析方法,又称为无分布型式假定(assumptionfreestatistics)的统计分析方法。
52、参数统计:
通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的
基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametricstatistics)
53、秩次:
变量值按照从小到大顺序所编的秩序号称为秩次(rank)。
54、秩和:
各组秩次的合计称为秩和(ranksum),是非参数检验的基本统计量。
55、直线回归(linearregression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simpleregression)。
55、回归系数(regressioncoefficient)即直线的斜率(slope),在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位。
56、相关系数r:
用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。
57、负担系数:
又称抚养系数或抚养比,是指人口中非劳动年龄人数与劳动年龄人数之比。
58、随机区组设计:
通常将受试对象按性质相同或者相近组成b个区组,每个区组中的受试对象分别随机分配到k个处理组中去。
58、重复测量资料:
是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料。
常用来分析观察指标在不同时间点的变化。
1、流行病学(epidemiology):
是研究人群中疾病和健康状态的分布及其影响因素,并研究如何防治疾病及促进健康的策略与措施的科学。
2、疾病分布:
指疾病在不同人群(人间)、不同地区(空间)、不同时间(时间)中的发生频率与分布现象,是流行病学研究的起点和基础。
3、比(ratio):
也称相对比,是表示两个数相除所得的值,来说明两者的相对水平。
4、构成比(proportion):
说明某一事物内部各组成部分所占的比重或分布。
5、率(rate):
是表示在一定的条件下某现象实际发生的例数与可能发生该现象的总例数之比,来说明单位时间内某现象发生的频率或强度。
6、发病率(incidencerate):
是指一定时期内特定人群中某病新病例出现的频率。
用途:
用来描述疾病的分布,探讨发病因素,提出病因假设和评价仿制措施的效果
7、罹患率(attackrate):
测量新发病例的频率指标。
与发病率的相同之处是分子都是新发病例数,不同之处是罹患率用于衡量小范围、短时间新发病例的频率。
8、患病率(prevalencerate):
是指在特定时间内一定人群中某病新旧病例数所占的比例。
患病率=发病率*病程。
9、感染率(infectionrate):
指在某个时间受检查的人群样本中某病现有感染的人数所占的比率。
10、病残率(disabilityrate):
指某一人群中,在一定期间内病残人群在人群中的发生频率。
死亡率(mortalityrate):
表示一定期间内,一定人群中,死与某病的频率。
是测量人群死亡危险最常用的指标。
11、病死率(fatalityrate):
表示一定时期内患某病的全部病人中因该病而死亡的比例。
多用于病程短的急性病。
12、生存率(survivalrate):
是指患某种病的人经n年的随访,到随访结束时仍存活的病例数占观察病例的比例。
常用于评价某些慢性病的远期疗效。
13、散发(sporadic)是指某病在某地区人群中呈历年的一般发病率水平,病例在人群中散在发生或零星出现,病例之间无明显联系。
用于描述较大范围人群的某病流行强度。
14、爆发(outbreak)是指一个局部地区或集体单位的人群中,短时间内突然发生许多临床症状相似的病人。
15、流行(epidemic)是指某地区、某病在某时间的发病率显著超过该病历年的散发发病率水平。
16、地方性疾病:
在一个地方或一个人群中相对稳定且经常发生,无需自外地输入的疾病
17、移民流行病学(migrantepidemiology):
是通过比较移民人群、移居地当地人群和原居住地人群的某病发病率或死亡率差异,分析该病的发生与遗传因素或环境因素作用的大小。
18、描述性研究(descriptivestudy)是指利用已有的资料或专门调查的资料,包括实验室检查结果,按不同时间、地点或人群(三间分布)的特征进行分组,把疾病或健康状况的分布情况真实地描述出来的方法。
19、现况调查(prevalencesurvey)又称横断面研究,是在特定时点或时期内,对一个特定人群疾病或健康状况及有关因素进行的调查研究,以描述其分布与相关因素的关联的描述性流行病学调查方法
20、普查(census):
是指为了解某病的患病率或健康状况,于特定时间内对特定范围内的全部观察对象进行调查或检查。
21、抽样调查(samplingsurvey)从总体中随机抽取一定量的样本进行调查分析,根据样本信息推断总体特征的一种调查方法。
22、单纯随机抽样(简单随机抽样):
最简单、最基本的抽样方法。
先将所有观察对象逐一编号,然后采用随机数字表或抽签等方式选取一定数量的观察对象组成样本。
23、系统抽样(机械抽样):
先将全部观察对象按一定顺序分成n个相同的部分然后从第一部分随机选第k号观察对象,并以此以相等的间距,从以后的各部分中抽取一个观察单位组成样本。
即按照一定得顺序机械地每隔若干单位抽取一个单位的抽样方法。
24、分层抽样:
将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。
25、整群抽样:
将总体分成若干群组,抽取其中部分群组作为观察单位组成样本
26、无应答偏倚:
指一些研究对象未按要求回答调查内容,而这些调查研究对象在某个或某些研究因素上的暴露情况与应答者存在差异,由此造成的调查结果与真实情况不一致而产生的偏倚
27、回忆偏倚:
指研究对象在回忆过去经历的或发生的事件时,由于记忆准确性和完整性的问题导致研究结果与真实情况不一致所产生的偏倚差。
28、报告偏倚:
指研究对象有意的夸大或缩小某些研究信息而导致的偏倚。
29、筛检:
是用快速的检验、检查或其他方法,从健康人群中发现那些可能患有某病或缺陷,但表面健康的人,与那些无病者鉴别开来,并对可疑病人做进一步诊断和治疗的方法。
30、真实性(效度/准确度):
指所获得的数值与实际值的符合程度。
在筛检试验的评价中,真实性是指待评价筛检试验的测量结果与“金标准”测量结果的吻合程度。
灵敏度=a/(a+c)×100%指一项诊断试验能将实际有病的人正确地判定为阳性(患病)的能力,即真阳性率
漏诊率=c/(a+c)×100%=1-灵敏度又叫假阴性率(第二类错误b),实际有病,但根据诊断标准被确定无病的百分率
特异度=d/(b+d)×100%指一项诊断试验能将实际上未患病的人正确地判定为阴性(未患病)的能力,即真阴性率
误诊率=b/(b+d)×100%=1-特异度又叫假阳性率(第一类错误),实际无病,但根据诊断标准被确定有病的百分率。
正确指数:
正确指数也称约登指数,表示筛检方法发现真正病人与非病人的总能力=1-(漏诊率+误诊率)=(灵敏度+特意度)-1取值范围0—1,越接近1,诊断技术真实性越高。
可靠性:
在相同的情况下,对同一批受试对象进行重复试验获得相同结果的稳定程度。
预测值:
就是应用筛检的结果来估计受检者患病和不患病可能性的大小。
阳性预测值:
筛检出来为阳性者中真正患病的可能性。
阴性预测值:
筛检出来为阴性者中真正未患病的可能性。
似然比:
同时反映灵敏度和特异度的复合指标。
并联试验:
多个实验同时进行,只要有一项结果阳性就判为阳性
串联试验:
用一系列的试验,只有全部结果均为阳性者才判为阳性
31、生态学研究:
以群体为观察和分析单位,探讨人群某种疾病或健康状况的平均水平与某因素在分布上的一致性和数量上的相关性的一种观察性研究。
是描述性研究的一种
32、生态学谬误(生态学偏倚):
(生态学联系与事实不相符)即生态学研究的结果与个体水平上研究的同一疾病与某个因素之间的关系不一致或相悖。
33、暴露:
指研究对象曾经接触过某种待研究的物质,或具备某种待研究的特征。
通常把导致疾病事件增加的暴露因素称为危险因素或致病因素;把导致疾病事件降低的暴露因素称为保护因素。
34、比值比(oddsratio,OR)(优势比):
表示疾病与暴露之间的联系强度大小。
指暴露于某因素发生疾病的危险性是未暴露于某因素的危险性的多少倍。
其数值范围从0到无限大的正数。
35、选择偏倚(selectionbias):
指由于选择研究对象的方法有问题,导致选入的研究对象与未选入的研究对象在某些特征上存在系统差异而引起的误差;
36、信息偏倚:
又称观察偏倚(observationalbias)或测量偏倚(measurementbias),指在收集资料阶段对各比较组所采用的观察或测量方法不一致,使各组所获得的信息存在系统误差。
37、混杂偏倚:
暴露因素与疾病发生的相关程度受到其他因素的歪曲或干扰。
混杂偏倚是在研究的设计阶段未能对混杂因素加以控制和在资料分析时未能进行正确校正所造成的偏倚。
38、混杂:
是指与疾病有关,又与所研究的暴露因素有关的外来因素,掩盖或夸大了所研究的暴露因素与疾病的联系,从而部分或全部地歪曲了两者之间的真实联系
39、匹配:
要求对照在某些非处理因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素干扰.
40、匹配过头:
把不必要的项目引入匹配,企图使病例组和对照组保持一致,就可能徒然丢失信息,增加工作难度,降低研究效率。
41、发病密度:
研究对象在随访期间,用观察人—时数(人—月或人—年数)计算的平均发病率人时:
将人与时间因素结合起来作为率的分母的单位,常用人年。
一个观察对象被观察满一年计为一人年。
42、相对危险度(RR):
是指暴露组与非暴露组中发病率或死亡率之比,表示暴露者易患某病的程度。
43、特异危险度:
也称为归因危险度(AR),是指暴露组与非暴露组中发病率或死亡率之差,表示暴露者中完全由某暴露因素所致的发病率或死亡率。
44、人群归因危险度(PAR):
是指全人群发病率(或死亡率)与非暴露组发病率(或死亡率)之差,一般人群与非暴露人群比较,所增加的疾病发生率的大小。
45、人群归因危险度百分比(PAR%):
表示人群中由于暴露于某因素所致的发病率或死亡率占人群发病率或死亡率的百分比。
它提示在完全控制暴露因素后,人群中某病发病(或死亡)率可能下降的程度。
46、实验流行病学:
将来自同一总体的研究人群随机分为实验组和对照组,研究者对实验组人群施加某种干预措施后,随访并比较两组人群的发病(死亡)情况或健康状况有无差别及差别大小,从而判断干预措施效果的一种前瞻性、实验性研究方法。
47、临床实验:
研究对象是病人,是以个体为单位进行实验分组的实验方法,病人包括住院和未住院的病人。
常用于对某种药物或治疗方法的效果进行检验和评价。
48、现场实验:
也叫人群预防试验,是以尚未患病的个人作为研究对象,给予的干预措施包括生物医学治疗或预防措施,健康教育和行为改变措施,以及生物或社会环境改变措施等。
49、社区实验:
是以不同居民区的人群作为单位进行试验分组的流行病学实验方法,常用于对某种预防措施或方法进行考核或评价。
50、类实验:
如果一项实验研究缺少前瞻、干预、随机、对照这四个基本特征中的一个或几个,叫类实验。
单盲(singleblind):
研究对象不知试验分组情况
双盲试验(doubleblind):
研究对象和给予干预或结局评估的研究人员都不了解试验分组情况,