《卫生统计学》考试重点复习资料.docx

资源描述

《卫生统计学》考试重点复习资料.docx

《《卫生统计学》考试重点复习资料.docx》由会员分享，可在线阅读，更多相关《《卫生统计学》考试重点复习资料.docx（13页珍藏版）》请在冰豆网上搜索。

《卫生统计学》考试重点复习资料.docx

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料

08生物技术曾洋and林阳

第一章绪论

名词解释

统计学：

是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。

其目的是通过研究随机事件的局部外在数量特征和数量关系,从而探索事件的总体内在规律性，而随机性的数量化，是通过概率表现出来。

总体：

总体是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体，反之为无限总体。

样本：

从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。

样本应具有代表性。

所谓有代表性的样本，是指用随机抽样方法获得的样本。

抽样：

从研究总体中抽取少量有代表性的个体，称为抽样。

概率：

概率（probability）又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。

0﹤P（A）﹤1。

频率：

在相同的条件下，独立重复做n次试验，事件A出现了m次，则比值m/n称为随机事件A在n次试验中出现的频率（freqency）。

当试验重复很多次时P（A）=m/n。

变量：

表现出个体变异性的任何特征或属性。

随机变量：

随机变量（randomvariable）是指取指不能事先确定的观察结果。

随机变量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。

系统误差：

系统误差（systematicerror）是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计和完善技术措施来消除或使之减少。

随机误差：

随机误差（randomerror）又称偶然误差，是指排除了系统误差后尚存的误差。

它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。

误差变量一般服从正态分布。

随机误差可以通过统计处理来估计。

变异：

在自然状态下，个体间测量结果的差异称为变异（variation）。

变异是生物医学研究领域普遍存在的现象。

严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。

抽样误差：

（消除了系统误差，并将随机测量误差控制在允许范围内）由于个体变异的存在，在抽样过程中产生的样本统计量与总体参数之间的差异。

分布：

随机现象的规律性通过概率来刻画，而随机事件的所有结局及对应概率的排列称为分布。

第二章定量资料的统计描述

名词解释

算术均数：

描述一组数据在数量上的平均水平。

总体均数用μ表示，样本均数用

表示。

几何均数：

用以描述对数正态分布或数据呈倍数变化资料的水平。

记为G。

中位数：

将一组观察值由小到大排列，n为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。

众数：

众数原指总体中出现机会最高的数值。

样本众数则是在样本中出现次数最多的数值。

极差：

亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。

四分位数间距：

是由第3四分位数和第1四分位数相减计算而得，常与中位数一起使用，描述偏态分布资料的分布特征，较极差稳定。

方差：

方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。

标准差：

是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。

变异系数：

用于观察指标单位不同或均数相差较大时两组资料变异程度的比较，用CV表示。

问答题

常见的描述集中趋势的指标有哪些，概念分别是什么？

答：

常见的描述集中趋势的指标有算数均数、几何均数、中位数和众数。

概念见名解。

常见的描述离散趋势的指标有哪些，概念分别是什么？

答：

常见的描述离散趋势的指标有极差、四分位数间距、方差、标准差和变异系数。

概念见名解。

第三章定性资料的统计描述

名词解释

相对数：

是两个有联系的指标之比，是分类变量常用的描述性统计指标，常用相对数有率、构成比、比等。

标准化法：

是常用于内部构成不同的两个或多个率比较的一种方法。

标准化法的基本思想就是指定一个统一“标准”（标准人口构成比或标准人口数），按指定“标准”计算调整率，使之具备可比性以后再比较，以消除由于内部构成不同对总率比较带来的影响。

问答题

常用的相对数指标有哪些？

它们的意义和计算上有何不同？

答：

常用的相对数指标有：

率、构成比和相对比。

意义和计算公式如下：

①

率又称频率指标，说明某现象发生的频率或强度，常以100%、1000‰等表示。

②构成比又称构成指标，说明某一事物内部各组成部分所占的比重或分布。

常以百分数表示。

③比又称相对比，是A、B两个有关指标之比，说明两者的对比水平，常以倍数或百分数表示，其公式为：

相对比=甲指标/乙指标（或100%）

甲乙两个指标可以是绝对数、相对数或平均数等。

应用相对数时应注意哪些问题？

答：

应用相对数时应注意的问题有：

⑴计算相对数的分母一般不宜过小。

⑵分析时不能以构成比代替率。

⑶不能用构成比的动态分析代替率的动态分析。

⑷对观察单位数不等的几个率，不能直接相加求其总率。

⑸在比较相对数时应注意可比性。

⑹对样本率（或构成比）的比较应随机抽样，并做假设检验。

应用标准化法的注意事项有哪些？

答：

应用标准化法时应注意的问题有：

1）标准化法的应用范围很广，其主要目的就是消除混杂因素的影响。

2）标准化后的标准化率，已经不再反反映当时当地的实际水平，它只是表示相互比较的资料间的相对水平。

3）报告比较结果时必须说明所选用的“标准”和理由。

4）两样本标准化率是样本值，存在抽样误差。

当样本含量较小时，还应作假设检验。

第四章统计表和统计图

名词解释

统计表：

将统计资料及其指标以表格形式列出，称为统计表（statisticaltable）。

狭义的统计表只表示统计指标。

统计图：

统计图（statisticalgraph）是将统计指标用几何图形表达，即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

问答题

常用统计图的定义和制图要求。

名称

定义

制图要求

条图

用等宽直条的长短来表示相互独立的各统计指标的数值大小

起点为0的等宽直条，条间距相等，按高低顺序排列。

普通线图

适用于连续性资料。

用线段的升降来表示一事物随另一事物变化的趋势。

纵横两轴均为算术尺度，相邻两点应以折线相连。

图内线条不宜超过3条。

半对数线图

用线段的升降来表示一事物随另一事物变化的速度。

横轴为算术尺度，纵轴为对数尺度。

余同普通线图。

圆图

以圆面积表示事物的全部，用扇形面积表示各部分的比重

以圆面积为100%，将各构成比分别乘以3.6度得圆心角度数后再绘扇形面积。

通常以12点为始边依次绘图。

直方图

用矩形的面积来表示某个连续型变量的频数分布

常以横轴表示连续型变量的组段（要求等距），纵轴表示频数或频率，其尺度从“0”开始，各直条间不留空隙。

散点图

以点的密集程度和趋势表示两种事物间的相关关系

绘制方法同线图，只是点与点之间不连接。

第五章常用概率分布

名词解释

正态分布：

若指标

的频率曲线对应于数学上的正态曲线，则称该指标服从正态分布（normaldistribution）。

通常用记号

表示均数为

，标准差为

的正态分布。

标准正态分布:

均数为0、标准差为1的正态分布被称为标准正态分布（standardnormaldistribution），通常记为

。

问答题

正态概率密度曲线的位置与形状具有哪些特点？

答：

正态概率密度曲线的位置与形状具有以下特点：

1）关于x=μ对称。

2）在x=μ处取得该概率密度函数的最大值，在x=μ±σ处有拐点。

3）曲线下面积为1。

4）μ决定曲线在横轴上的位置，μ增大，曲线沿横轴向右移；反之，μ减小，曲线沿横轴向左移。

5）σ决定曲线的形状，当μ恒定时，σ越大，数据越分散，曲线越“矮胖”；σ越小，数据越集中，曲线越“瘦高”。

第六章参数估计基础

名词解释

抽样误差：

由个体变异产生的，抽样造成的样本统计量与总体参数的差异，称为抽样误差。

标准误及

：

通常将样本统计量的标准差称为标准误。

许多样本均数的标准差

称为均数的标准误，它反映了样本均数间的离散程度，也反映了样本均数与总体均数的差异，说明均数抽样误差的大小。

点估计：

是直接利用样本统计量的一个数值来估计总体参数。

区间统计：

用统计量

和

确定一个有概率意义的区间，以该区间具有较大的可信度包含总体均数。

可信区间：

按预先给定的概率确定的包含未知总体参数的可能范围。

该范围称为总体参数的可信区间。

它的确切含义是：

可信区间包含总体参数的可能性是1-α，而不是总体参数落在该范围的可能性为1-α。

第七章假设检验基础

名词解释

I型和II型错误：

I型错误（typeIerror），指拒绝了实际上成立的H0，这类“弃真”的错误称为I型错误，其概率大小用α表示；II型错误（typeIIerror），指接受了实际上不成立的H0，这类“存伪”的误称为II型错误，其概率大小用β表示。

检验效能：

1-β称为检验效能（poweroftest），它是指当两总体确有差别，按规定的检验水准α所能发现该差异的能力。

问答题

假设检验的基本步骤是什么？

答：

①建立假设、选用单侧或双侧检验、确定检验水准；

②选用适当检验方法，计算统计量；

③确定P值并作出推断结论。

假设检验与区间估计的关系式什么？

答：

①置信区间具有假设检验的主要功能

②置信区间课提供假设检验没有提供的信息。

置信区间在回答差别有无统计学意义的同时，还可以提示差别是否具有实际意义。

③假设检验比置信区间多提供的信息：

假设检验可以报告确切的P值。

应用假设检验需要注意的问题有哪些？

答：

①应用检验方法必须符合其适用条件。

②权衡两类错误的危害以确定α的大小。

③正确理解P值的意义，如果P<α，宜说差异“有统计学意义”。

第八章方差分析

名词解释

总变异：

样本中全部实验单位差异称为总变异。

其大小可以用全部观察值的均方（方差）表示。

组间变异：

各处理组样本均数之间的差异，受处理因素的影响，这种变异称为组间变异，其大小可用组间均方表示。

组内变异：

各处理组内部观察值大小不等，这种变异称为组内变异，可用组内均方表示。

随机区组设计：

事先将全部受试对象按自然属性分为若干区组，原则是各区组内的受试对象的特征相同或相近，且受试对象数与处理因素的水平数相等。

然后再将每个区组内的观察对象随机地分配到各处理组，这种设计叫做随机区组设计。

第九章x2检验

问答题

C列表2 检验的注意事项

1、行×列表中不宜有1/5以上的理论值小于5,也不允许有理论值小于1。

如果发生上述情况，一般有两种处理方法：

⑴增大样本含量，从而期望增大理论值。

⑵将理论值小于5的行和列与性质相近的邻近行或列中的实际频数合并,期望重新计算的理论值增大。

2、当多个样本率（或构成比）比较的2 检验结论有统计学意义，并不能判定任意两组之间的差异有统计学意义，必须用行×列的分割的办法进一步作两两比较。

3、对于有序的分类变量，采用卡方检验，不能考虑数据的有序性质。

第十章基于秩次的非参数检验

名词解释

参数检验：

凡是以特定的总体分布为前提，对未知的总体参数做推断的假设方法。

非参数检验：

不以特定的总体分布为前提，也不针对决定总体分布的几个参数

展开阅读全文