卫生统计学名词解释.docx
《卫生统计学名词解释.docx》由会员分享,可在线阅读,更多相关《卫生统计学名词解释.docx(6页珍藏版)》请在冰豆网上搜索。
卫生统计学名词解释
卫生统计学名词解释
总体(population):
根据研究目的确定的同质观察单位的观察值全体所构成的集合。
样本(sample):
从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
计量资料:
对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计数资料:
将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
等级资料:
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料
变量:
观察单位或个体的某种属性或标志称为变量
变量值:
对变量进行测量或观察的值称为变量值。
分类变量
变异:
在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
数值变量:
概率:
又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1.
小概率事件:
如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。
频数表:
用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日死亡0,1,2…20个病人的天数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
算术均数:
描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
几何均数:
用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
中位数:
将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,
取位次居中的两个变量的平均值。
极差:
亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
百分位数:
是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学参考值围。
四分位数间距:
是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差:
方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差:
是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
变异系数:
用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV表示。
正态分布:
二项分布:
标准正态变换:
将服从正态分布的原始变量x~n(u,σ),进行变量变换u=(x-u)/σ,这种变换叫标准正态变换。
正常值围:
抽样误差(标准误):
在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。
可信区间:
总体参数所在的围。
正常值围:
医学上常把绝大多数正常人的某指标围称为该指标的参考值围,也叫正常值围。
构成比:
又称构成指标,它表示事物部个组成部分所占的比重或分布。
相对数:
是由两个联系的指标之比,是分类变量常用的描述性统计指标,常用的相对数有率、构成比、相对比。
率的标准化法:
是用于部构成不同的两个或多个率比较的一种方法。
统计描述:
用统计图表或计算统计指标的方法表达一个群体的某项特征,称为统计描述。
假设检验:
是先对总体做出某种假定(检验假设),然后根据样本信息推断其是否成立的一类统计方法。
统计推断:
根据样本的特性对整体的特性做估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
抽样研究:
从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
参数估计:
是指用样本统计量估计总体参数,主要有两种方法:
点估计和区间估计。
统计表:
是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。
统计图:
是以各种几何图形(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料统计描述时一种常用手段。
均方:
均方差(MS)或方差,是由离均差平方和被自由度相除而得。
方差分析:
方差分析(analysisofvariance,ANOVA)就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。
总变异:
样本中全部实验单位差异称为总变异。
其大小可以用全部观察值的均方(方差)表示。
组间变异:
各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。
组变异:
各处理组部观察值大小不等,这种变异称为组变异,可用组均方表示。
完全随机设计:
只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。
随机区组设计:
事先将全部受试对象按自然属性分为若干区组,原则是各区组的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。
然后再将每个区组的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。
非参数检验:
是一种不依赖总体分布类型,也不对总体参数进行统计推断的假设检验。
随机抽样:
是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
等级资料:
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
等级资料又称有序资料。
如患者的治疗结果可分为治愈好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。
参数:
是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:
是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
直线回归:
建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归
回归系数:
即直线的斜率,在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位。
直线相关:
又称简单相关,用于双变量正态分布资料。
有正相关、负相关和零相关等关系。
直线相关的性质可由散点图直观的说明。
相关系数:
又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。
它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
秩相关又称等级相关,是用双变量等级数据作直线相关分析,适用于下列资料:
⑴不服从双变量正态分布而不宜作积差相关分析;⑵总体分布型未知;⑶用等级表示的原始数据。
参数统计:
通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计。
秩次:
变量值按照从小到大顺序所编的秩序号称为秩次。
秩和:
各组秩次的合计称为秩和,是非参数检验的基本统计量。
、
随机抽样:
是指调查者用随机抽样的方法抽取样本,然后以样本统计量推断总体参数的一种研究方法。
常用的随机抽样方法有:
单纯随机抽样、系统抽样、整群抽样和分层抽样。
检验水准:
也称显著性水准,符号位a,是预先规定的概率值,通常取0.05,它是“是否拒绝H0的界限”。
检验效能:
又称检验功效(1-β),它的含义是:
当两总体确实有差别时,按规定的检验水准a,能够发现两总体间差别的能力。
可比性:
是指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。
发病率:
指一定时期,可能发生某病的人群中发生某病新病例数的强度,常用于描述急性病的发病情况。
患病率:
可分为时点患病率与时期患病率,常用于描述在这个时间点或时期是否曾处于患病状态,适用于慢性病或发病时间不易确定的疾病患病情况,时期患病率也可以用于估计就医的需求状况。
某病病死率:
指在某一期间患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可以反映一个医疗单位医疗水平和医疗质量。
某病死亡率:
是一定时期某人群因某病而死亡的频率。
动态数列:
按时问顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势
人口金字塔:
人口金字塔:
是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。
它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。
总和生育率:
假定同时出生的一代妇女,按照某年的年龄别生育水平度过其一生的生育历裎,各年龄别生育率之和乘以年龄组组距,就是这一代妇女平均每人可能生育的子女数。