卫生统计学赵耐青习题答案.docx
《卫生统计学赵耐青习题答案.docx》由会员分享,可在线阅读,更多相关《卫生统计学赵耐青习题答案.docx(147页珍藏版)》请在冰豆网上搜索。
卫生统计学赵耐青习题答案
习题答案
第一章
一、就是非题
1、家庭中子女数就是离散型的定量变量。
答:
对。
2、同质个体之间的变异称为个体变异。
答:
对。
3、学校对某个课程进行1次考试,可以理解为对学生掌握该课程知识的一次随机抽样。
答:
对。
4、某医生用某个新药治疗了100名牛皮癣患者,其中55个人有效,则该药的有效率为
55%。
答:
错。
只能说该样本有效率为55%或称用此药总体有效率的样本估计值为55%。
5、已知在某个人群中,糖尿病的患病率为8%,则可以认为在该人群中,随机抽一个对象,
其患糖尿病的概率为8%。
答:
对,人群的患病率称为总体患病率。
在该人群中随机抽取一个对象,每个对象均有相
同的机会被抽中,抽到就是糖尿病患者的概率为8%。
二、选择题
1、下列属于连续型变量的就是A。
A血压B职业C性别D民族
2、某高校欲了解大学新生心理健康状况,随机选取了1000例大学新生调查,这1000例大
学生新生调查问卷就是A。
A一份随机样本B研究总体C目标总体D个体
3、某研究用X表示儿童在一年中患感冒的次数,共收集了1000人,请问:
儿童在一年中
患感冒次数的资料属于C。
A连续型资料B有序分类资料C不具有分类的离散型资料D以上均不对
4、下列描述中,不正确的就是D。
A总体中的个体具有同质性
B总体中的个体大同小异
C总体中的个体在同质的基础上有变异
D如果个体间有变异那它们肯定不就是来自同一总体
5.用某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查的研究结果得
到该药的降糖有效率为85%的结论,请问降糖有效率就是指D。
A每治疗100个糖尿病患者,正好有85个人降糖有效,15个人降糖无效
B每个接受该药物治疗的糖尿病患者,降糖有效的机会为85%
C接受该药物治疗的糖尿病人群中,降糖有效的比例为85%
D根据该研究的入选标准所规定的糖尿病患者人群中,估计该药降糖有效的比例为
85%
三、简答题
1、某医生收治200名患者,随机分成2组,每组100人。
一组用A药,另一组用B药。
经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议
下列说法就是否正确,为什么?
a)A药组的疗效高于B药组。
b)A药的疗效高于B药。
答:
a)正确,因为就两组样本而言,的确A组疗效高于B组。
b)不正确,因为样本的结果存在抽样误差,因此有可能人群的A药疗效高于B药,也
可能人群的两药的疗效相同甚至人群B药的疗效高于A药,
2、某校同一年级的A班与B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成
绩:
A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法就是否正确,为
什么?
a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
b)可以称A班的数学平均水平低于B班。
答:
a)正确,因为此处将A班与B班作为研究总体,故不存在抽样误差。
b)不正确,因为这一次数学平均成绩只就是两班数学成绩总体中的两个样本,样本的差异
可能仅仅由抽样误差造成。
3、在某个治疗儿童哮喘的激素喷雾剂新药的临床试验中,研究者收集了300名哮喘儿童患
者,随机分为试验组与对照组,试验组在哮喘缓解期内采用激素喷雾剂,在哮喘发作期
内采用激素喷雾剂+扩展气管药;对照组在哮喘缓解期不使用任何药物,在哮喘发作期
内采用扩展气管药物。
通过治疗3个月,以肺功能检查中的第1秒用力呼吸率
(FEV1/FRC1)作为主要有效性评价指标,评价两种治疗方案的有效性与安全性。
请阐
述这个研究中的总体与总体均数就是什么?
答:
试验组的研究总体就是接受试验组治疗方案的全体哮喘儿童患者在治疗3个月时的
FEV1/FRC1值的全体。
对照组的研究总体就是接受对照组治疗方案的全体哮喘儿童患者
在治疗3个月时的FEV1/FRC1值的全体。
试验组对应的总体均数就是接受试验组治疗方案的全体哮喘儿童患者在治疗3个月时的
FEV1/FRC1的平均值;对照组对应的总体均数就是接受对照组治疗方案的全体哮喘儿童
患者在治疗3个月时的FEV1/FRC1的平均值。
4、请简述什么就是小概率事件?
对于一次随机抽样,能否认为小概率事件就是不可能发生的?
答:
在统计学中,如果随机事件发生的概率小于或等于0、05,则通常可以认为就是一个小
概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概率事件在一次随机
抽样中不会发生,这就就是小概率事件原理。
小概率事件原理就是统计学检验的基础。
5、变量的类型有哪几种?
请举例说明,各有什么特点?
答:
(1)连续型变量,可以一个区间中任意取值的变量,即在忽略测量精度的情况下,
连续型变量在理论上可以取到区间中的任意一个值,并且通常含有测量单位。
观察连续型变
量所得到的数据资料称为计量资料(measurementdata)。
如例1-1中的身高变量就就是连续型变
量,身高资料为计量资料。
、
(2)离散型变量,变量的取值范围就是有限个值或者为一个数
列。
离散型变量的取值情况可以分为具有分类性质的资料与不具有分类性质的资料,表示分
类情况的离散型变量亦称分类变量(categoricalvariable)。
观察分类变量所得到的资料称为分
类资料(categoricaldata)。
分类资料可以分为二分类资料与多分类资料,而多分类资料又分成
无序分类资料与有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料
(nominaldata)如血型可以分为A、B、AB与O型,有序多分类资料(ordinaldata)如病情指
标分为无症状、轻度、中度与重度。
第二章
一、就是非题
1.不论数据呈何种分布,都可以用算术均数与中位数表示其平均水平。
答:
错。
只有资料满足正态或近似正态分布时计算算术均数就是比较有统计学意义的。
2.在一组变量值中少数几个变量值比大多数变量值大几百倍,一般不宜用算术均数表示其
平均水平。
答:
对,可以采用中位数表示。
3.只要单位相同,用s与用CV来表示两组资料的离散程度,结论就是完全一样的。
答:
错,标准差S就是绝对误差的一种度量,变异系数CV就是相对误差的一种度量,对于两组
资料离散程度的比较,即使两组资料的度量单位相同,也完全有可能出现两个指标的结论就是
不同的。
在实际应用时,选择离散程度的指标时,考虑其结果就是否有研究背景意义。
例如:
一组资料为成人的身高观察值,另一组资料为2岁幼儿的身高观察值,虽然可以用标准差S
比较两组的离散程度,也不能认为这就是错误的,但根本没有研究背景意义,相反选择变异系
数CV比较两组资料的相对变异程度,这就有一定的研究背景意义。
4.描述200人血压的分布,应绘制频数图。
答:
对。
5、算术均数与中位数均不容易受极值的影响。
答:
错。
算术均数比中位数容易受到极值的影响。
二、选择题
1.中位数就是表示变量值A的指标。
A.平均水平
B.变化范围
C.频数分布
D.相互间差别大小
2.对于最小组段无确定下限值与(或)最大组段无确定上限值的频数分布表资料,宜用下
列哪些指标进行统计描述?
C____
A中位数,极差B中位数,四分位数间距
C中位数,四分位数范围D中位数,标准差
3.描述年龄(分8组)与疗效(有效率)的关系,应绘制A。
A.线图B、圆图C、直方图D、百分条图
4、为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为D。
A频数B频率C频率密度(频率/组距)D都可以
三、简答与分析题
1.100名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。
表2-12100名成年健康女子血清总蛋白含量(g/L)
73、574、378、878、070、480、584、368、869、771、2
72、079、575、678、872、072、072、775、074、371、2
68、075、075、074、375、865、067、378、871、269、7
73、573、575、864、375、880、381、672、074、373、5
68、075、872、076、570、471、267、368、875、070、4
74、370、479、574、376、577、681、276、572、075、0
72、773、576、574、765、076、569、773、575、472、7
72、767、273、570、477、268、874、372、767、367、3
74、375、879、572、773、573、572、075、081、674、3
70、473、573、576、572、777、280、570、475、076、5
答:
制作频数表如下:
_____________________________________________________________________
组段频数百分比累积频数累积百分比
____________________________________________________________________
64~33、0033、00
66~55、0088、00
68~88、001616、00
70~1111、002727、00
72~2525、005252、00
74~2424、007676、00
76~1010、008686、00
78~77、009393、00
80~66、009999、00
84~11、00100100、00
变量例数均数标准差最小值最大值中位数25百分位数75百分位数
x10073、73、92564、384、373、571、275、8
2.某医师测得300名正常人尿汞值(ng/L)如表2-15,试描述资料。
表2-13300名正常人尿汞值(ng/L)
尿汞例数累计例数累计百分数(%)
0~494916、3
4~277625、3
8~5813444、7
12~5018461、3
16~4522976、3
20~2225183、7
24~1626789、0
28~1027792、3
32~728494、7
36~528996、3
40~529498、0
44~029498、0
48~329799、0
52~029799、0
56~229999、7
60~1300100、0
合计300——
答:
根据资料给出统计描述的指标如下:
例数均数标准差最小值最大值
1615、05349、014262
3.对于同一的非负样本资料,其算数均数一定大于等于几何均数。
答:
根据初等数学中的不等式12
12
nn
n
aaaaaa
n
+++
≥,可以得到算数均数一定大于
等于几何均数。
4.常用的描述集中趋势的指标有哪些,并简述其适用条件。
答:
(1)算术均数:
适用对称分布,特别就是正态或近似正态分布的数值变量资料。
(2)几何均数:
适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数
正态分布)的资料,以及等比数列资料。
(3)中位数:
适用各种类型的资料,尤其以下情况:
A资料分布呈明显偏态;B资料一端或两端存在不确定数值(开口资料或无界资料);C
资料分布不明。
第三章
一、就是非题
1、二项分布越接近Poisson分布时,也越接近正态分布。
答:
错。
当二项分布的π不太接近0或者1,随着n的增大,nπ与n(1−π)均较大时,
二项分布的X的逐渐近似正态分布;n较大,π较小,二项分布的X近似总体均数为
μ=nπ的Poisson分布,只有n较大、π较小并且nπ较大时,二项分布的X既近似
Poisson分布又近似正态分布,其本质就是当n较大、π较小时二项分布的X所近似的
Poisson分布在其总体均数μ=nπ较大时逼近正态分布。
2、从同一新生儿总体(无限总体)中随机抽样200人,其中新生儿窒息人数服从二项
分布。
答:
对。
因为可以假定每个新生发生窒息的概率π就是相同的并且相互独立,对于随机抽
取200人,新生儿窒息人数X服从二项分布B(n,π)。
3、在n趋向无穷大、总体比例π趋向于0,且nπ保持常数时的二项分布的极限分布就是
Poisson分布。
答:
对。
这就是二项分布的性质。
4、某一放射物体,以一分钟为单位的放射性计数为50,40,30,30,10,如果以5分
钟为时间单位,其标准差为160
5。
答:
错。
设iX服从总体均数为μ的Poisson分布,i=1,2,3,4,5,并且相互独立。
根据
Poisson分布的可加性,12345X+X+X+X+X服从总体均数为5μ,___________其总体方差为
5μ,本题5分钟的总体方差5μ的估计值为50+40+30+30+10=160,所以其标准
差为160。
5、一个放射性物体一分钟脉冲数为20次,另一个放射性物体一分钟脉冲数为50次。
假定两种放射性物体的脉冲性质相同,并且两种放射性物体发生脉冲就是相互独立的,
则这两种物体混合后,其一分钟脉冲数的总体均数估计值为70次。
答:
对。
根据Poisson分布的可加性,这两种物体混合后的发生的脉冲数为12X+X,混
合后一分钟脉冲数的总体均数估计值为20+50=70次。
6、一个放射性物体平均每分钟脉冲数为5次(可以认为服从Poisson分布),用X表示
连续观察20分钟的脉冲数,则X也服从Poisson分布。
答:
对,这就是Poisson分布的可加性。
7、一个放射性物体平均每分钟脉冲数为5次(可以认为服从Poisson分布),用X表示
连续观察20分钟的脉冲数,则X的总体均数与总体方差均为100次。
答:
对。
Poisson分布的可加性原理。
8、用X表示某个放射性物体的每分钟脉冲数,其平均每分钟脉冲数为5次(可以认为
服从Poisson分布),用Y表示连续观察20分钟的脉冲数,则可以认为Y近似服从正
态分布,但不能认为X近似服从正态分布。
答:
对。
因为Y的总体均数为100,当μ比较小的时候,Poisson分布就是一个偏态的分布,
但就是当μ增大时,Poisson分布会逐渐趋于对称。
二、选择题
1、理论上,二项分布就是一种B。
A连续性分布B离散分布
C均匀分布D标准正态分布
2、在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。
C
A总体率π越大B样本率P越大
C总体率π越接近0、5D总体率π越小
3、医学上认为人的尿氟浓度以偏高为不正常,若正常人的尿氟浓度X呈对数正态分
布,Y=lgX,G为X的几何均数,尿氟浓度的95%参考值范围的界值计算公式就是A。
Alg1(1、64)Y−Y+SB+1、96XGSC+1、64XGSDlg1(1、96)Y−Y+S
4、设1210X,X,,X均服从B(4,0、01),并且1210X,X,,X相互独立。
令
1210Y=X+X++X,则D
AY近似服从二项分布BY近似服从Poisson分布
CY近似服从正态分布DY~B(40,0、01)
5、设1210X,X,,X均服从Poisson(2、2),并且1210X,X,,X相互独立。
令
1210Y=(X+X++X)/10,则C
AY近似服从B(10,0、22)BY服从Poisson(22)分布
CY近似服从正态分布DY服从Poisson(2、2)分布
三、简答题
1、如果X的总体均数为μ,总体标准差为σ,令Y=a+bX,则可以证明:
Y的总体均
数为a+bμ,标准差为bσ。
如果X服从μ=40的Poisson分布,请问:
Y=X/2的总体
均数与标准差就是多少?
答:
总体均数=20,总体标准差=40/2。
2、设X服从μ=40的Poisson分布,请问:
Y=X/2就是否服从Poisson分布?
为什么?
答:
不就是的。
因为Y=X/2的总体均数=20,不等于总体方差10。
3、设X服从μ=40的Poisson分布,可以认为X近似服从正态分布。
令Y=X/10,
试问:
就是否可以认为Y也近似服从正态分布?
答:
正态分布的随机变量乘以一个非0常数仍服从正态分布,所以可以认为Y也近似
服从正态分布。
4、设X服从均数为μ的Poisson分布。
请利用两个概率之比:
P(X+1)/P(X),证明:
当x<μ−1时,概率P(X)随着X增大而增加;当X>μ时,概率P(X)随着X增大
而减小。
答:
1
(1)/()()/[]/
(1)
(1)!
!
xx
PXxPXxeex
xx
μμμμ
μ
+
=+==−−=+
+
显然,当
x<μ−1时,对应x+1<μ,由此得到1
x1
μ
>
+
所以P(X=x+1)/P(X=x)>1,
说明概率P(X)随着X增大而增加;当X>μ时,则
(1)/()1
1
PXxPXx
xx
μμ
=+==<<
+
说明当X>μ时,概率P(X)随着X增大而减
小。
5、已知某饮用水的合格标准就是每升水的大肠杆菌数≤2个,如果随机抽取1升饮用水,
检测出大肠杆菌数的95%参考值范围就是多少?
(提示考虑合格标准的总体均数最大值
为2个/L,求95%参考值范围)。
答:
由于合格标准的总体均数最大值为2个/L,对于正常而言,大肠杆菌数越少越好,
所以这就是单侧参考值范围。
即求满足累计概率的不等式2
00
(|2)20、95
!
XXk
kk
Pke
k
μ−
==
Σ==Σ≤
的最大X的解。
X0123456
P(X)0、1353350、2706710、2706710、1804470、0902240、0360890、01203
0
()
X
k
Pk
=Σ
0、1353350、4060060、6766760、8571230、9473470、9834360、995466
根据上述计算得到X的95%参考值范围就是X<5个/L。
?
第四章
一、就是非题
1、设X的总体均数为μ,则样本均数X的总体均数也为μ。
答:
对。
经随机抽样得到的样本均数X的总体均数也为μ。
2、设X的总体方差为σ2,则样本均数X的总体方差也为σ2。
答:
错。
经随机抽样后得到的样本均数X的总体方差为σ2/n。
3、设随机变量1,,nX…X均服从B(1,π),n很大时,则
1
1n
i
i
XX
n=
=Σ近似服从
N(π,π(1−π)/n)
答:
对。
4、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了1000人,检测了每个人血
铅浓度。
虽然血铅检浓度一般呈非正态分布,但由于该研究样本量很大,可以认为这些
血铅浓度近似服从正态分布。
答:
错。
血铅浓度的分布与样本量就是否很大无关,如果样本量充分大时,血铅浓度的样本均
数的分布近似正态分布。
5、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了1000人,检测了每个人血
铅浓度,计算这1000人的血铅平均浓度。
对于现有的1000人的血铅浓度资料,可以认
为该资料的样本均数近似服从正态分布。
答:
错。
样本均数的概率分布就是指随机抽样前将要随机抽取的样本,其样本均数近似服从
某个概率分布,样本量很大时,样本均数逼近正态分布。
对于这个资料而言,这就是已经完成
随机抽样的资料,这个资料的样本均数只就是一个数,不存在服从哪种分布的问题。
6、某研究者做了一个儿童血铅浓度的流行病学调查,已知血铅测量值非正态分布,计划调
查1000人,并将计算1000人的血铅浓度的样本均数,由于该研究样本量很大,可以认
为随机抽样所获得血铅浓度的样本均数将近似服从正态分布。
答:
对。
如果从某个均数为μ,标准差为σ的非正态分布的总体中抽样,只要样本量足够大,
则样本均数X的分布也将近似于正态分布N(μ,σ2/n)。
二、选择题
1、以下方法中唯一可行的减小抽样误差的方法就是___B____。
A、减少个体变异B、增加样本量
C、设立对照D、严格贯彻随机抽样的原则
2、XS表示____C____。
A、总体均数的离散程度B、总体标准差的离散程度
C、样本均数的离散程度D、样本标准差的离散程度
3、设连续性随机变量X的总体均数为μ,从X总体中反复随机抽样,随样本量n增大,
X
X
S
−μ
将趋于____D____。
A、X的原始分布B、正态分布
C、均数的抽样分布D、标准正态分布
4、在均数为μ,标准差为σ的正态总体中随机抽样,理论上|X−μ|≥____B____的可能性
为5%。
A、1、96σB1、96XσC、0、05/2,vtSD1、96XS
5、下面关于标准误的四种说法中,哪一种就是不正确____C____。
A、标准误就是样本统计量的标准差
B、标准误反映了样本统计量的变异
C、标准误反映了总体参数的变异
D、标准误反映了抽样误差的大小
6、变量X偏离正态分布,只要样本量足够大,样本均数___C_____。
A、偏离正态分布B、服从F分布
C、近似正态分布D、服从t分布
三、简答题
1、样本均数的抽样误差定义就是什么?
答:
样本均数的抽样误差就是指样本均数与总体均数间的差异,但同时可以表现为从同一总体
中多次随机抽样所得的样本均数间的差异,通常用样本均数的标准误度量平均的抽样误差大
小。
2、估计样本均数的平均抽样误差的统计量就是什么?
答:
就是样本均数的标准差,即样本均