卫生统计学复习笔记文档格式.docx

资源描述

卫生统计学复习笔记文档格式.docx

《卫生统计学复习笔记文档格式.docx》由会员分享，可在线阅读，更多相关《卫生统计学复习笔记文档格式.docx（15页珍藏版）》请在冰豆网上搜索。

卫生统计学复习笔记文档格式.docx

4）、分析资料：

其目的是计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。

统计分析包括统计描述和统计推断。

前者是用统计指标与统计图（表）等方法对样本资料的数量特征及其分布规律进行描述；

后者是指如何抽样，以及如何用样本信息推断总体特征.进行资料分析时，需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。

统计工作的四个步骤紧密相连、不可分割,任何一步的缺陷,都将影响整个研究结果。

3、基本概念：

1）、同质与变异。

严格地讲，同质是指被研究指标的影响因素完全相同。

但在医学研究中，有些影响因素往往是难以控制的（如遗传、营养等），甚至是未知的。

所以，在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。

例如研究儿童的身高时，要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。

同质基础上的个体差异称为变异。

如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。

事实上,客观世界充满了变异，生物医学领域更是如此。

哪里有变异，哪里就需要统计学。

若所研究的同质群体中所有个体一模一样，只需观察任一个体即可，无须进行统计研究。

2）、总体与样本

任何统计研究都必须首先确定观察单位，亦称个体。

观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。

总体是根据研究目的确定的同质观察单位的全体,或者说，是同质的所有观察单位某种观察值（变量值）的集合。

例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩，观察单位是每个7岁健康男孩，变量是身高,变量值（观察值）是身高测量值，则山东省2002年全体7岁健康男孩的身高值构成一个总体。

它的同质基础是同地区、同年份、同性别、同为健康儿童。

总体又分为有限总体和无限总体。

有限总体是指在某特定的时间与空间范围内，同质研究对象的所有观察单位的某变量值的个数为有限个，如上例；

无限总体是抽象的，无时间和空间的限制,观察单位数是无限的，如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者，同用碘盐防治;

该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果，没有时间和空间范围的限制，因而观察单位数无限，该总体为无限总体。

在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。

样本是按照随机化原则，从总体中抽取的有代表性的部分观察单位的变量值的集合。

如从上例的有限总体（山东省2002年7岁健康男孩）中，按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本.从总体中抽取样本的过程为抽样，抽样方法有多种.抽样研究的目的是用样本信息推断总体特征。

统计学好比是总体与样本间的桥梁，能帮助人们设计与实施如何从总体中科学地抽取样本，使样本中的观察单位数（亦称样本含量）恰当，信息丰富，代表性好；

能帮助人们挖掘样本中的信息，推断总体的规律性。

3）、资料与变量及其分类

总体确定之后，研究者应对每个观察单位的某项特征进行测量或观察，特征称为变量.如“身高”、“体重"

、“性别"

、“血型”、“疗效”等.变量的测定值或观察值称为变量值或观察值，亦称为资料。

按变量的值是定量的还是定性的，可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。

在处理资料之前,首先要分清变量类型。

1）数值变量：

其变量值是定量的，表现为数值大小，可经测量取得数值，多有度量衡单位。

如身高（cm）、体重（kg）、血压（mmHgkPa）、脉搏（次/min）和白细胞计数（×

109/L）等。

这种由数值变量的测量值构成的资料称为数值变量资料，亦称为定量资料.大多数的数值变量为连续型变量，如身高、体重、血压等；

而有的数值变量的测定值只能是正整数，如脉搏、白细胞计数等，在医学统计学中把它们也视为连续型变量。

2）分类变量:

其变量值是定性的，表现为互不相容的类别或属性。

分类变量可分为无序变量和有序变量两类：

（1）无序分类变量是指所分类别或属性之间无程度和顺序的差别。

它又可分为①二项分类，如性别（男、女），药物反应（阴性和阳性）等；

②多项分类，如血型（O、A、B、AB）,职业（工、农、商、学、兵）等。

对于无序分类变量的分析，应先按类别分组，清点各组的观察单位数,编制分类变量的频数表，所得资料为无序分类资料,亦称计数资料。

（2）有序分类变量各类别之间有程度的差别。

如尿糖化验结果按－、±

、＋、＋＋、＋＋＋分类;

疗效按治愈、显效、好转、无效分类。

对于有序分类变量，应先按等级顺序分组，清点各组的观察单位个数，编制有序变量（各等级）的频数表,所得资料称为等级资料。

变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。

例如血红蛋白量（g/L）原属数值变量，若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析；

若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。

有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示，则可按数值变量资料（定量资料）分析。

4、随机事件与概率

医学研究的现象，大多数是随机现象，对随机现象进行实验或观察称为随机试验。

随机试验的各种可能结果的集合称为随机事件，亦称偶然事件，简称事件。

例如用相同治疗方案治疗一批某病的患者，治疗转归可能为治愈、好转、无效、死亡四种结果，对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。

对于随机事件来说，在一次随机试验中，某个随机事件可能发生也可能不发生,但在一定数量的重复试验后，该随机事件的发生情况是有规律可循的.概率是描述随机事件发生的可能性大小的数值，常用P表示。

例如,投掷一枚均匀的硬币，随机事件A表示“正面向上”,用n表示投掷次数；

m表示随机事件A发生的次数；

f表示随机事件A发生的频率（f=m/n），0≤m≤n，0≤f≤1。

用不同的投掷次数n作随机试验，结果如下：

m/n=8/10=0.8，7/20=0。

35，……,249/500=0。

498,501/1000=0.501，10001/2000=0。

5000，由此看出当投掷次数n足够大时,f=m/n→0.5,称P（A）=0。

5，或简写为：

P=0.5.当n足够大时，可以用f估计P。

随机事件概率的大小在0与1之间，即0〈P〈1，常用小数或百分数表示。

P越接近1，表示某事件发生的可能性越大；

P越接近0，表示某事件发生的可能性越小。

P＝1表示事件必然发生，P＝0表示事件不可能发生，它们是确定性的，不是随机事件,但可以把它们看成随机事件的特例.

若随机事件A的概率P（A）≤a，习惯上，当a=0.05时,就称A为小概率事件。

其统计学意义是小概率事件在一次随机试验中不可能发生。

例如，某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万，但大街上仍有行人，这是因为“被撞”事件是小概率事件，所以行人认为自己上街这“一次试验"

中不会发生“被撞”事件。

“小概率"

的标准a是人为规定的,对于可能引起严重后果的事件，如术中大出血等，可规定a=0.01,甚至更小.

误差是指测定结果与真实结果之间的差值。

对任何一个物理量进行的测量都不可能得出一个绝对准确的数值，即用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异，这种测量值和真实值的差异称为误差。

误差的分类

误差分为绝对误差和相对误差。

也可以根据误差的来源分为系统误差（又称偏性）和随机误差（又称机会误差）。

　　1、绝对误差是测量值对真值偏离的绝对大小，因此它的单位与测量值的单位相同。

　　2、相对误差则是绝对误差与真值的比值，因此它是一个百分数。

一般来说，相对误差更能反映测量的可信程度。

相对误差等于测量值减去真值的差的绝对值除以真值，再乘以百分之一百。

　　3、系统误差是由一些固有的因素（如测量方法的缺陷）产生的，理论上总是可以通过一定的手段来消除.如天平的两臂应是等长的，可实际上是不可能完全相等的;

天平配置的相同质量的砝码应是一样的，可实际上它们不可能达到一样。

　　4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差（也称为偶然误差和不定误差）.

第二节疾病统计常用指标

一、疾病统计的意义

疾病统计（morbiditystatistics）从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律，为病因学研究，为防治疾病和评价防治工作效果提供科学依据。

二、疾病统计资料的来源

包括以下三个方面:

1。

疾病报告和报表资料

2。

医疗卫生工作记录

3。

疾病调查资料

三、疾病和死因分类

疾病和死因的分类是按国际疾病和死因分类（internationalclassificationofdiseases,简称ICD）,目前正在使用的版本是ICD－10。

见有关书籍。

四、常用疾病统计指标

反映疾病发生水平的指标

（1）发病率（incidencerate）

（2）患病率（prevalencerate）

2.反映疾病构成情况的指标

反映疾病危害程度和防治效果的指标

（1）某病死亡率:

见死因别死亡率。

（2）某病病死率（casefatality）

（3）治愈率（curerate）

（4）有效率

（5）生存率（survivalrate）：

指病人能活到某一时点的概率。

常用于对慢性病的治疗效果或预后估计。

（五）、残疾统计

残疾的定义及分级

残疾是指在心理、生理、人体结构上，某种组织、功能丧失或者不正常，全部或者部分丧失以正常方式从事某种活动能力的人.分为功能、形态残疾（impairment）、丧失功能残疾（disability）和社会功能残疾（handicap）三个此次。

残疾的常用统计指标

（1）残疾患病率

（2）残疾构成

第一节医学人口统计常用指标

一、医学人口统计资料的来源

1.来源于人口普查资料

2.来源于人口抽样调查资料

来源于人口抽样资料，包括生命时间登记、人口迁移变动登记、户口登记等途径。

二、人口数与人口构成

（一）人口总数

人口总数（Population）一般指一个国家或某一特定时间的人口数,一般采用一年的中点，即7月1日零时为标准时刻统计。

（二）人口构成及其分析

1、基本人口学特征包括年龄、性别、文化、职业等，其中最常用的是性别和年龄,用以描述人口构成情况。

2、人口年龄构成指各年龄组人口在总人口中所占的比例。

在人口年龄构成的基础上，可以导出许多有用的描述人口状况的指标,比如:

（1）人口系数

1）老年（人口）系数：

老年人口系数越大,表明人口中老年人口所占比重越大；

在一定程度上反映人群的健康水平。

2）少年儿童（人口）系数

少年儿童人口系数越大，表明人口中少年人口所占比重越大，人口越年轻。

该指标主要受生育水平的影响。

（2）负担系数又称抚养比或抚养系数，是指人口中非劳动年龄人数与劳动年龄人数之比。

负担系数包括三个指标：

总负担系数=

少年儿童负担系数=

老年负担系数=

（3）老少比:

是划分人口类型的标准之一.

老少比=

3、性别比指男性人口与女性人口的比值，即

性别比=

4、人口金字塔是将人口的性别、年龄分组数据,以年龄（或出生年份）为纵轴,以人口数或年龄构成比为横轴，按左侧为男、右侧为女绘制的直方图，其形如金字塔，故称为人口金字塔。

人口金字塔更形象直观地反映了人口的年龄构成，便于说明和分析人口现状、类型及发展趋势。

三、生育与计划生育统计

（一）、生育与计划生育统计资料的来源

有关原始资料包括人口、出生、死亡、结婚登记、育龄妇女资料等，可向有关部门索取，也可根据需要自行调查取得。

（二）生育与计划生育统计指标

1.反映生育水平的指标

（1）粗出生率（crudebirthrate，简记为CBR）：

粗出生率=

上式中平均人口数的取值，若在人口普查年，可用普查所得的该地该年7月1日零时的人口总数;

在非人口普查年，则用上年末及本年末两个人口数的平均值。

粗出生率的优点在于资料易获得，计算简单，但它的主要缺点是受人口的年龄、性别构成和婚姻状况的影响.粗出生率只能粗略地反映生育水平。

∙总生育率（generalfertilityrate,简记为GFR）：

指某地某年平均每千名妇女的活产数。

总生育率=

总生育率消除了总人口中年龄性别构成不同对生育水平的影响，较粗出生率能更确切地反映生育水平。

但受育龄妇女内部年龄构成的影响。

（3）年龄别生育率（age—specificfertilityrate，简记为ASFR）:

又称年龄组生育率，其算式为：

某年龄组生育率=

年龄别生育率消除了育龄妇女内部年龄构成不同对生育水平的影响。

（4）终生生育率（life—timefertilityrate,简记为LTFR）与总和生育率（totalfertilityrate,简记为TFR）

终生生育率说明一批经历过整个生育期的同龄妇女一生的生育水平，其算式为：

终生生育率=

总和生育率的算式为：

总和生育率=n

测量人口再生育的

统计指标

（1）自然增长率（naturalincreaserate,简记为NIR）：

是粗出生率（CBR）与粗死亡率（CDR）之差，即NIR=CBR-CDR（15.13）

自然增长率容易理解,计算简单，但它受人口的性别、年龄构成不同的影响,只能粗略地估计人口的一般增长趋势，不能用来预测未来人口的发展速度。

（2）粗再生育率（grossreproductionrate,简记为GRR）

粗再生育率是只计算女婴的总和生育率。

（3）净再生育率（netreproductionrate,简记为NRR）

NRR=（15。

14）

式中ASFR为只记女婴的年龄别生育率。

（4）平均世代年数（meanlengthofgeneration,简记为LG）

LG=

上式中NRR的计算前已述及；

分子育龄妇女总人年数的计算见课本表15。

1第（6）栏.

3.反映计划生育工作情况的统计指标

（1）避孕现用率

（2）Pearl怀孕率（Pearlpregnancyrate）:

是评价避孕效果的指标.

（3）累计失败率（cummulativefailurerate）：

是在给定时间内,妇女用某一措施后意外怀孕的人数.能较准确地反映避孕效果.

（4）人工流产率（induceabortionrate）：

反映育龄妇女中人工流产的强度。

（5）人流活产比（ratioofinducedabortionandlivebirth）：

用于间接地反映计划外怀孕情况。

（6）计划生育率：

用于综合说明计划生育的质量。

（7）节育率：

反映计划生育工作质量。

4．与出生有关的其他常用指标

（1）低出生体重百分比（proportionoflowbirthweight）:

反映居民健康水平及孕期保健的情况。

（2）儿童妇女比（child—womenratio）:

是一个间接反映生育水平的指标,其优点在于不需要活产数，在没有生命事件登记的地区常用它间接测量生育水平。

四、人口死亡统计

（一）、人口死亡资料的来源

我国人口死亡资料主要由公安部门负责收集,并按ICD-10中的死因分类填写。

（二）、常用人口死亡统计指标

1．测量死亡水平的指标

（1）粗死亡率（crudedeathrate,CDR）：

具有资料易获得，计算简单的优点，但受人口的年龄、性别构成情况的影响。

K为比例系数，常用/千,/万，或/10万.

（2）年龄别死亡率（age—specificdeathrate，ASDR）：

年龄别死亡率消除了人口的年龄构成不同对死亡水平的影响，不同地区同一年龄组的死亡率可以直接进行比较。

（3）婴儿死亡率（infantmortalityrate，IMR）：

是反映社会卫生状况和婴儿保健工作的重要的指标,不受年龄的影响，可直接比较.

（4）新生儿死亡率（neonatalmortalityrate，NMR）：

是反映妇幼卫生工作质量的重要指标。

（5）围生儿死亡率（perinatalmortality）：

是衡量孕前、孕期、产期、产后保健工作质量的敏感指标之一.

（6）5岁以下儿童死亡率（childmortalityunderage5）:

是综合反映儿童健康水平和变化的主要指标。

‰

（7）孕产妇死亡率（maternalmortalityrate）：

这一指标不仅可以评价妇女保健工作,而且间接反映一个国家的卫生文化水平。

（8）死因别死亡率（cause—specificdeathrate）:

是死因分析的重要指标，反映各类病伤死亡对居民生命的危害程度.

2.反映死因构成及死因顺位的指标

（1）死因构成或相对死亡率（proportionofdyingofaspecificcause）:

反映各种死因的相对重要性.

（2）死因顺位：

是指按各类死因构成比的大小由高到低排列的位次，说明各类死因的相对重要性。

第十二章　统计表和统计图

1．掌握统计表的编制基本原则

2．掌握统计表的编制基本要求

要求

统计表和统计图是统计描述的重要方法。

医学科学研究资料经过整理和计算各种统计指标后，所得结果除了用适当的文字说明外,常将统计资料及其指标以表格列出（称为统计表，statisticaltables），或将统计资料形象化,利用点的位置、线断的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系（称为统计图，statisticalgraph）。

统计表与统计图可以代替冗长的文字叙述，表达清楚,对比鲜明。

一、常用统计表

（一）统计表的结构与编制

1．统计表的结构统计表由标题、标目、线条和数字构成。

如下表所示：

表号标题

横标目名称

纵标目

合计

横标目

数字

合计

2．列表的原则重点突出,简单明了，即一张表一般表达一个中心内容，便于分析比较；

主谓分明，层次清楚，符合逻辑，明确被说明部分（主语）与说明部分（谓语）。

3．编制要求

（1）标题要能概括表的内容，写于表的上端中央，一般应注明时间与地点。

（2）标目标目是表格内的项目。

以横、纵向标目分别说明主语与谓语，文字简明，层次清楚。

横标目列在表的左侧，一般用来表示表中被研究事物的主要标志；

纵标目列在表的上端，一般用来说明横标目的各个统计指标的内容。

标目内容一般应按顺序从小到大排列，小的放在上面，不同时期的资料可按年份、月份先后排列,有助于说明其规律性。

（3）线条线条不易过多，常用3条线表示,谓之“三线图”。

表的上下两条边线可以用较粗的横线，一般省去表内的线条，但合计可用横线隔开。

表的左右两侧的边线可省去，表的左上角一般不用对角线。

（4）数字以阿拉伯数字表示.表内的数字必须正确，小数的位数应一致并对齐,暂缺与无数字分别以“…”、“-"

表示，为“0"

者记作“0"

，不应有空项。

为方便核实与分析，表一般应有合计。

（5）说明一般不列入表内。

必要说明者可标“※”号，于表下加以说明。

（二）统计表的种类

通常按分组标志多少分为简单表与组合表。

∙简单表（simpletable）由一组横标目和一组纵标目组成，如表2-10。

表2-102001年某省不同地区的卫生系统反应性评分比较

地区

调查人数

评分均值

省会城市

333

703。

一般城市

152

507。

县及乡村

971

679。

1456

666.73

∙复合表（combinativetable）是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表，如表2-11.

表2-112001年某省不同地区、性别的卫生系统反应性评分比较

男

女

217

706。

116

698.07

100

517.15

487。

371

669.88

600

684.74

688

659.26

768

673。

二、常用统计图

医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。

∙绘制统计图的基本要求

o根据资料的性质和分析目的决定适当的图形。

o标题应说明资料的内容、时间和地点,一般位于图的下方。

o图的纵、横轴应注明标目及对应单位，尺度应等距或具有规律性，一般自左而右、自上而下、由小到大。

o为使图形美观并便于比较，统计图的长宽比例一般为7：

5，有时为了说明问题也可加以变动。

o比较、说明不同事物时，可用不同颜色或线条表示，并常附图例说明,但不宜过多。

∙常用统计图的适用条件与绘制

1．条图（bargraph）条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关

展开阅读全文