卫生统计学考试复习题及参考答案.docx

资源描述

卫生统计学考试复习题及参考答案.docx

《卫生统计学考试复习题及参考答案.docx》由会员分享，可在线阅读，更多相关《卫生统计学考试复习题及参考答案.docx（22页珍藏版）》请在冰豆网上搜索。

卫生统计学考试复习题及参考答案.docx

卫生统计学考试复习题及参考答案

2007级预防医学-卫生统计学考试复习题及参考答案

一名词解释

1.计量资料：

对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurementdata）。

计量资料亦称定量资料、测量资料。

．其变量值是定量的，表现为数值大小，一般有度量衡单位。

2.计数资料：

将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（countdata）。

计数资料亦称定性资料或分类资料。

其观察值是定性的，表现为互不相容的类别或属性。

3.等级资料：

将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinaldata）。

等级资料又称有序变量。

4.总体：

总体（population）指特定研究对象中所有观察单位的测量值。

5.样本：

从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。

6.抽样误差：

抽样误差（samplingerror）是指样本统计量与总体参数的差别。

在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。

7.频数表：

用来表示一批数据各观察值在不同取值区间出现的频繁程度（频数）。

8.算术均数：

描述一组数据在数量上的平均水平。

总体均数用

表示，样本均数用

表示。

9.中位数：

将一组观察值由小到大排列，位次居中的那个数。

10.极差：

亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。

11.方差：

方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。

12.标准差：

是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。

13.变异系数：

用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14.正态分布：

若资料

的频率曲线对应于数学上的正态曲线，则称该资料服从正态分布。

通常用记号

表示均数为

，标准差为

的正态分布。

15.标准正态分布:

均数为0、标准差为1的正态分布被称为标准正态分布，通常记为

。

16.统计推断：

通过样本指标来说明总体特征，这种通过样本获取有关总体信息的过程称为统计推断。

17.抽样误差：

由个体变异产生的，由于抽样造成的样本统计量与总体参数的差异，称为抽样误差。

18.标准误：

通常将样本统计量的标准差称为标准误。

19.可信区间：

按预先给定的概率确定的包含未知总体参数的可能范围。

20.参数估计：

指用样本统计量估计总体参数。

参数估计有两种方法：

点估计和区间估计。

21.假设检验中P的含义：

指从H0规定的总体随机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。

22.I型和II型错误：

I型错误指拒绝了实际上成立的H0，这类“弃真”的错误称为I型错误，其概率大小用

表示；II型错误，指接受了实际上不成立的H0，这类“存伪”的错误称为II型错误，其概率大小用

表示。

23.检验效能：

称为检验效能，它是指当两总体确有差别，按规定的检验水准

所能发现该差异的能力。

24.检验水准：

是预先规定的，当假设检验结果拒绝H0，接受H1，下“有差别”的结论时犯错误的概率称为检验水准，记为

。

25.方差分析：

就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释。

通过各变异来源的均方与误差均方比值的大小，借助F分布作出统计推断，判断各因素对观测指标有无影响。

26.随机区组设计：

事先将全部受试对象按自然属性分为若干区组，原则是各区组内的受试对象的特征相同或相近，且受试对象数与处理因素的水平数相等。

然后再将每个区组内的观察对象随机地分配到各处理组，这种设计叫做随机区组设计。

27.相对数：

是两个有联系的指标之比，是分类变量常用的描述性统计指标，常用相对数有率、构成比、相对比。

28.标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。

标准化法的基本思想就是选定一个统一“标准”（标准人口构成比或标准人口数），然后按选定“标准”计算调整率，使之具备可比性以后再比较，以消除由于内部构成不同对总率比较带来的影响。

29.二项分布：

若一个随机变量X，它的可能取值是0,1,…,n，且相应的取值概率为

则称此随机变量X服从以

、

为参数的二项分布。

30.Yates校正：

英国统计学家YatesF认为，由于

分布理论上是一连续性分布，而分类资料是间断性的，由此计算出的

值不连续，尤其是自由度为1的四格表，求出的概率P值可能偏小，此时需对

值作连续性校正（correctionofcontinuity），这一校正即所谓的Yates校正（Yates’correction）。

31.非参数统计：

针对某些资料的总体分布难以用某种函数式来表达，或者资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。

由于这类方法不受总体参数的限制，故称非参数统计法（non-parametricstatistics），或称为不拘分布（distribution-freestatistics）的统计分析方法，又称为无分布型式假定（assumptionfreestatistics）的统计分析方法。

32.直线回归：

建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。

直线回归是回归分析中最基本、最简单的一种，故又称简单回归。

33.直线相关:

是用来描述具有直线关系的两变量x、y间的相互关系。

34.相关系数：

又称积差相关系数，以符号r表示样本相关系数，ρ表示总体相关系数。

它是说明具有直线关系的两个变量间，相关关系的密切程度与相关方向的指标。

35.回归系数:

为直线的斜率，其统计学意义是自变量x改变一个单位时，应变量y平均变化

个单位。

36.人口总数：

人口总数（population）是指一个国家或地区在某特定时间点上存活人口的总和。

国际上统计人口数有两种办法：

实际制（defacto）：

即只统计标准时刻某地实际存在的人口数（包括临时在该地的人）。

法定制（dejure）：

只统计某地的常住人口。

37.老年人口系数：

是指65岁及以上老年人口数占总人口数的比重。

。

老年人口系数用于表明一个国家或地区的人口老龄化程度，其大小受社会经济发展水平、生活水平、卫生保健水平等因素的影响。

38.围产儿死亡率：

围产期是指胎儿体重达到1000克及以上、或孕期满28周，至出生后7天以内的时期。

在此期间的死亡称为围产儿死亡。

计算式为：

。

围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标，它不能从出生报告及死亡报告直接计算，需要利用妇产科病例资料分析计算。

39.新生儿死亡率：

新生儿死亡率（neonatalmortalityrate,NMR）指某地平均每千名活产数中未满28天的新生儿死亡数。

计算式：

‰

新生儿死亡在婴儿死亡中占很大的比重。

死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。

40.婴儿死亡率：

指某年平均每千名活产中不满1周岁（婴儿）的死亡数。

计算式为：

‰

41.孕产妇死亡率：

指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活产数之比，常以万分率或十万分率表示，计算式为：

42.死因顺位：

指按各类死因构成比从高到低排列的位次，说明死因的重要性，反映了各种死亡原因导致死亡的严重程度。

43.人口金字塔：

将人口的性别、年龄分组数据，以年龄（或出生年份）为纵轴，以人口数或年龄构成比为横轴，按男左女右绘制的直方图，其形态如金字塔，故称为人口金字塔。

人口金字塔是对人口年龄、性别构成综合反映的特殊统计图，指示了不同时期人口年龄、性别构成的变化情况，是长期人口出生、死亡、迁入、迁出而形成的，反映了历史的痕迹和变动的趋势。

44.灵敏度：

是诊断试验将实际有病的人正确诊断为病人的百分率。

45.特异度：

是诊断试验将实际无病的人正确诊断为非病人的百分率。

46.误诊率：

是诊断试验将实际无病的人错误诊断为病人的百分率。

47.漏诊率：

是诊断试验将实际有病的人错误诊断为非病人的百分率。

48.阳性似然比：

是诊断试验中灵敏度与误诊率的比值，即正确判定病人的概率是错判病人概率的倍数，它反映诊断试验判断正确的概率程度。

LR+的取值范围为（0，∞），其值越大则该试验确诊疾病能力越强。

49.阴性似然比：

是诊断试验中漏诊率与特异度的比值，即错判非病人的概率是正确判定非病人概率的倍数，它反映诊断试验判断错误的概率程度，LR-的取值范围为（0，∞），其值越小则该试验排除疾病的能力越好。

50.Youden指数：

是诊断试验中灵敏度和特异度之和减去基数（1或100%），表示诊断试验发现真正的患者和非患者的总的能力。

Youden指数的取值范围在（-1，1）之间，其值越接近1，诊断价值越大。

51.ROC曲线：

即受试者工作特征曲线，是确定临界点较为理想的一种方法。

它是以不同临界点的同一种试验连续（至少5组）测定的灵敏度为纵坐标，1－特异度（误诊率）为横坐标，标出各工作点，然后将得到的多个工作点连接绘制而成的曲线，

52.统计图：

是将统计指标用几何图形表达，即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

1．D

2．C

3．B

4．B

5．A

6．B

7．A

8．D

9．C

10．C

11．D

12．B

13．D

14．D

15．D

16．C

17．D

18．A

19．A

20．C

21．B

22．D

23．B

24．B

25．D

26．D

27．D

28．A

29．C

30．B

二、单项选择题

1．观察单位为研究中的（）。

A．样本B．全部对象

C．影响因素D．个体

2．总体是由（）。

A．个体组成B．研究对象组成

C．同质个体组成D．研究指标组成

3．抽样的目的是（）。

A．研究样本统计量B．由样本统计量推断总体参数

C．研究典型案例研究误差D．研究总体统计量

4．参数是指（）。

A．参与个体数B．总体的统计指标

C．样本的统计指标D．样本的总和

5．关于随机抽样，下列那一项说法是正确的（）。

A．抽样时应使得总体中的每一个个体都有同等的机会被抽取

B．研究者在抽样时应精心挑选个体，以使样本更能代表总体

C．随机抽样即随意抽取个体

D．为确保样本具有更好的代表性，样本量应越大越好

6．各观察值均加（或减）同一数后（）。

A．均数不变，标准差改变B．均数改变，标准差不变

C．两者均不变D．两者均改变

7．比较身高和体重两组数据变异度大小宜采用（）。

A．变异系数B．方差

C．极差D．标准差

8．以下指标中（）可用来描述计量资料的离散程度。

A．算术均数B．几何均数

C．中位数D．标准差

9．血清学滴度资料最常用来表示其平均水平的指标是（）。

A．算术平均数B．中位数

C．几何均数D．平均数

10．两样本均数的比较，可用（）。

A．方差分析B．t检验

C．两者均可D．方差齐性检验

11．配伍组设计的方差分析中，

配伍等于（）。

A．

总-

误差B．

总-

处理

C．

总-

处理+

误差D．

总-

处理-

误差

12．在均数为

，标准差为

的正态总体中随机抽样，

（）的概率为5%。

A．

B．

C．

13．完全随机设计方差分析的检验假设是（）。

A．各处理组样本均数相等B．各处理组总体均数相等

C．各处理组样本均数不相等D．各处理组总体均数不全相等

14．已知男性的钩虫感染率高于女性。

今欲比较甲乙两乡居民的钩虫感染率，但甲乡人口女多于男，而乙乡男多于女，适当的比较方法是（）。

A．分别进行比较B．两个率比较的χ2检验

C．不具备可比性，不能比较D．对性别进行标准化后再比较

15．率的标准误的计算公式是（）。

A．

B．

　　Ｃ．

　　Ｄ．

16．非参数统计应用条件是（）。

A．总体是正态分布

B．若两组比较，要求两组的总体方差相等

C．不依赖于总体分布

D．要求样本例数很大

17．下述哪些不是非参数统计的特点（）。

A．不受总体分布的限定B．多数非参数统计方法简单，易于掌握

C．适用于等级资料D．检验效能总是低于参数检验

18．设配对设计资料的变量值为X1和X2，则配对资料的秩和检验（）。

A．把X1与X2的差数绝对值从小到大编秩

B．把X1和X2综合从小到大编秩

C．把X1和X2综合按绝对值从小到大编秩

D．把X1与X2的差数从小到大编秩

19．秩和检验和t检验相比，其优点是（）。

A．计算简便，不受分布限制B．公式更为合理

C．检验效能高D．抽样误差小

20．对两样本均数作比较时，已知n1、n2均小于30，总体方差不齐且分布呈偏态，宜用（）。

A．t检验B．u检验

C．秩和检验D．F检验

21．等级资料的比较宜用（）。

A．t检验B．秩和检验

C．F检验D．四格表X2检验

22．两个小样本比较的假设检验，应首先考虑（）。

A．t检验B．秩和检验

C．任选一种检验方法D．资料符合哪种检验的条件

23．对于配对比较的秩和检验，其检验假设为（）。

A．样本的差数应来自均数为0的正态总体

B．样本的差数应来自均数为0的非正态总体

C．样本的差数来自中位数为0的总体

D．样本的差数来自方差齐性和正态分布的总体

24．用最小二乘法确定直线回归方程的原则是各观察点（）。

A．距直线的纵向距离相等

B．距直线的纵向距离的平方和最小

C．与直线的垂直距离相等

D．与直线的垂直距离的平方和最小

25．实验设计的三个基本要素是（）。

A．受试对象、实验效应、观察指标B．随机化、重复、设置对照

C．齐同对比、均衡性、随机化D．处理因素、受试对象、实验效应

26．实验设计的基本原则（）。

A．随机化、盲法、设置对照B．重复、随机化、配对

C．随机化、盲法、配对D．随机化、重复、设置对照

27．实验设计和调查设计的根本区别是（）。

A．实验设计以动物为对象B．调查设计以人为对象

C．实验设计可随机分组D．实验设计可人为设置处理因素

28.标准正态分布的均数与标准差分别为（）。

A．0与1B．1与0C．0与0D．1与1

29．正态分布有两个参数

与

，（）相应的正态曲线的形状越扁平。

A．

越大B．

越小C．

越大D．

越小

30．若X服从以

，

为均数和标准差的正态分布，则X的第95百分位数等于（）。

A．

B．

C．

D．

三、简答题

1.某年级甲班、乙班各有男生50人。

从两个班各抽取10人测量身高，并求其平均身高。

如果甲班的平均身高大于乙班，能否推论甲班所有同学的平均身高大于乙班？

为什么？

不能。

因为，从甲、乙两班分别抽取的10人，测量其身高，得到的分别是甲、乙两班的一个样本。

样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。

既使是按随机化原则进行抽样，由于存在抽样误差，样本均数与总体均数一般很难恰好相等。

因此，不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断，而应通过统计分析，进行统计推断，才能作出判断。

2.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围，也叫正常值范围。

所谓“正常人”不是指完全健康的人，而是指排除了所研究资料的疾病和有关因素的同质人群。

制定参考值范围的一般步骤：

（1）定义“正常人”，不同的资料“正常人”的定义也不同。

（2）选定足够数量的正常人作为研究对象。

（3）用统一和准确的方法测定相应的资料。

（4）根据不同的用途选定适当的百分界限，常用95%。

（5）根据此资料的实际意义，决定用单侧范围还是双侧范围。

（6）根据此资料的分布决定计算方法，常用的计算方法：

正态分布法、百分位数法。

3.假设检验时，当

，则拒绝

，理论依据是什么？

P值系由H0所规定的总体做随机抽样，获得等于及大于（或等于及小于）依据现有样本信息所计算得的检验统计量的概率。

当P

0．05时，说明在H0成立的条件下，得到现有检验结果的概率小于

，因为小概率事件几乎不可能在一次试验中发生，所以拒绝H0。

同时，下“有差别”的结论的同时，我们能够知道可能犯错误的概率不会大于

，也就是说，有了概率保证。

4.t检验和方差分析的应用条件？

t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

5.应用相对数时应注意哪些问题？

应用相对数时应注意的事项有：

⑴计算相对数的分母一般不宜过小。

⑵分析时不能以构成比代替率。

⑶不能用构成比的动态分析代替率的动态分析。

⑷对观察单位数不等的几个率，不能直接相加求其总率。

⑸在比较相对数时应注意可比性。

⑹对样本率（或构成比）的比较应随机抽样，并做假设检验。

6.为什么不能以构成比代率？

请联系实际加以说明。

率和构成比所说明的问题不同，因而绝不能以构成比代率。

构成比只能说明各组成部分的比重或分布，而不能说明某现象发生的频率或强度。

例如：

以男性各年龄组高血压分布为例，50～60岁年龄组的高血压病例占52.24%，所占比重最大，60～岁组则只占到6.74%。

这是因为60～岁以上受检人数少，造成患病数低于50～60岁组，因而构成比相对较低。

但不能认为年龄在50～60岁组的高血压患病率最严重，而60岁以上反而有所减轻。

若要比较高血压的患病率，应该计算患病率指标。

7.应用直线回归和相关分析时应注意哪些问题？

注意以下五个问题

⑴作回归分析和相关分析时要有实际意义，不能把毫无关联的两种现象作回归、相关分析，必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前，应绘制散点图。

但观察点的分布有直线趋势时，才适宜作回归、相关分析。

如果散点图呈明显曲线趋势，应使之直线化再行分析。

散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。

若无充分理由证明超过自变量取值范围外还是直线，应避免外延。

⑷双变量的小样本经t检验只能推断两变量间有无直线关系，而不能推断相关的紧密程度，要推断相关的紧密程度，样本含量必须很大。

⑸相关或回归关系不一定是因果关系，也可能是伴随关系，有相关或回归关系不能证明事物间确有内在联系。

8.统计表有哪些要素构成？

制表的注意事项有哪些？

一般说来，统计表由标题、标目、线条、数字四部分构成（有时附有备注）。

编制统计表的注意事项：

（1）标题概括表的内容，写于表的上方，通常需注明时间与地点。

（2）标目以横、纵标目分别说明主语与谓语，文字简明，层次清楚。

（3）线条不宜过多，通常采用三条半线表示，即顶线、底线、纵标目下的横隔线及合计上的半条线。

（4）表内一律采用阿拉伯数字。

同一指标小数点位数要一致，数次要对齐。

表内不留空格。

（5）备注不要列于表内，如有必要，可在表内用“*”号标记，并在表外加以说明。

9.调查设计包含哪些内容？

一个完整的调查设计应包括以下内容：

确定明确的调查目的；确定调查对象和观察单位；确定调查方法；确定调查指标和变量；确定调查工具和设计调查表；确定样本含量；调查员的选择和培训；调查的组织计划；涉及伦理道德方面问题的处理。

10.实验设计的基本内容和步骤。

（1）建立研究假设：

在选题时应当考虑题目的科学性、新颖性、可行性以及所选课题是否是当前社会需要解决的主要问题。

根据研究目的确定本研究需要解决的主要问题及相应的辅助问题。

（2）明确研究范围：

审慎考虑规定适当的纳入标准和排除标准，选择适宜本次实验的受试对象。

（3）确立处理因素：

分清处理因素和非处理因素，并注意处理因素的标准化。

（4）明确观察指标：

选用客观性较强，易于量化，灵敏性和特异性均较高的指标。

（5）控制误差和偏倚：

采取各种有效措施控制误差（error）和偏倚（bias），使处理措施的效果能够真正的体现出来。

11.诊断试验的设计主要包括哪些程序和内容？

（1）确定金标准：

诊断试验的金标准是指目前公认的最可靠、最准确、最好的诊断方法，也称标准诊断方法，用来衡量新的诊断试验是否符合真实情况。

临床上常用的金标准有组织病理学检查（活检、尸检）、手术发现、影像诊断（CT、核磁共振、彩色B超）、细菌培养以及长期随访所得的结论。

（2）选择研究对象：

诊断试验的研究对象应包括两组：

一组是用金标准确定为有某病的病例组，另一组是用金标准证实为无该病的患者或人群，作为对照组。

病例组应包括各种病例，如症状典型和非典型的，病程早、中、晚期的，病情轻、中、重型的，年龄不同层次的等，以便能反映该病的全部特征。

对照组应包括确实无本病而患有易与本病相混淆疾病的病例，这样的对照才具有临床鉴别诊断价值。

（3）同步盲法测试：

经金标准确定的病例与对照两组中的受试者同步接受新诊断试验方法的测定，将测定结果与金标准判定的结果进行比较，计算新诊断试验与金标准符合和差异程度的统计学指标，再根据这些指标对新诊断试验进行评价。

在试验操作的全过程和判定试验结果时，采用盲法（尽可能用双盲法）是保证诊断试验结果真实可靠的关键，即观察者（和受试者）不能预先知道何为金标准确定的病例或对照，以免发生人为偏差，过高或过低估计新诊断试验与金标准的符合程度。

四、分析计算题

1.假定正常成年女性红细胞数

近似服从均值为4.18，标准差为0.29的正态分布。

令X代表随机抽取的一名正常成年女性的红细胞数，求：

（1）变量X落在区间（4.00，4.50）内的概率；

（2）正常成年女性的红细胞数95%参考值范围。

解：

（1）根据题意，变量X近似服从正态分布，求变量X落在区间（4.00，4.50）内的概率，即是求此区间内正态曲线下的面积问题，因此，可以把变量

进行标准化变换后，借助标准正态分布表求其面积，具体做法如下：

变量

落在区间（4.00,4.50）内的概率为0.5967。

（2）因为正常成年女性红细胞数近似服从正态分布，可以直接用正态分布法求参考值范围，又因该资料过高、过低都不正常，所以应求双侧参考值范围，具体做法如下：

下限为：

上限为：

95%的正常成年女性红细胞数所在的范围是

2．某医生研究脑缺氧对脑组织中生化指标的影响，将出生状况相近的乳猪按出生体重配成7对；随机接受两种处理，一组设为对照组，一组设为脑缺氧模型组，实验结果见表1第

（1）、

（2）、（3）栏。

试比较两组猪脑组织钙泵的含量有无差别。

表1两组乳猪脑组织钙泵含量（g/g）

乳猪号

（1）

对照组

（2）

试验组

（3）

差值d

（4）=

（2）-（3）

0.3550

0.2755

0.0795

0.2000

0.2545

-0.0545

0.3130

0.1800

0.1330

0.3630

0.3230

0.0400

0.3544

0.3113

0.043

展开阅读全文