13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D)
A分别按x1和x2从小到大编秩
B把x1和x2综合从小到大编秩
C把x1和x2综合按绝对值从小到大编秩
D把x1和x2的差数按绝对值从小到大编秩
14、四个样本率作比较,χ2>χ20.05,ν可认为(A)
A各总体率不同或不全相同B各总体率均不相同
C各样本率均不相同D各样本率不同或不全相同
15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
该资料宜选用的统计方法为(A)
A.四格表检验B.四格表校正检验Ct检验DU检验
16、为调查我国城市女婴出生体重:
北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D)
A南方和北方女婴出生体重的差别无统计学意义
B南方和北方女婴出生体重差别很大
C由于P值太小,南方和北方女婴出生体重差别无意义
D南方和北方女婴出生体重差别有统计学意义但无实际意义。
17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(A)
A两个样本率的差别B两个样本率的标准误
C两个总体率的差别D两个总体率的标准差
18.下列指标不属于相对数的是(D)
A率B构成比C比D百分位数
19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:
(D)
表1盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效
组别
治愈
显效
进步
无效
合计
左西替利嗪片组
49
8
5
2
64
西替利嗪片组
44
10
9
3
66
A.检验 B.成组t检验 C.u检验 D.秩和检验
20、下列哪种说法是错误的(B)
A计算相对数尤其是率时应有足够的观察单位或观察次数
B分析大样本数据时可以构成比代替率
C应分别将分子和分母合计求合计率或平均率
D样本率或构成比的比较应作假设检验
二、填空题(20分)
1、现有若干名儿童健康检查一览表的部分检测指标,见表2
表2某年某地儿童健康检查部分检测结果
编号
性别
年龄(周岁)
身高(cm)
坐高(cm)
血型
表面抗原
肝大
1
男
7
116.7
66.3
A
+
++
2
女
8
120.0
68.3
AB
-
-
3
女
10
126.8
71.5
O
-
+
4
男
9
123.7
70.0
A
-
-
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
问:
①上述变量中能形成计数资料的指标有性别、血型、表抗
②计量资料的指标有年龄、身高、体重
③等级资料的指标有肝大
④对于身高或坐高指标,在进行统计描述时宜计算均数和标准差表示其集中趋势和离散趋势。
⑤对于血型指标宜计算构成比表示各种血型的构成
⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数比较的t检验
⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有卡方检验
2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为341.48/10万
3、临床上安排试验设计时,应考虑的三个基本原则是对照随机重复
三、简答题(20分)
1、描述集中趋势的指标有哪些其适用范围有何异同(5分)
均数:
正态或近似正态分布
几何均数:
等比数列或对数正态分布资料
中位数:
资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。
2、何谓假设检验?
可以举例说明。
(5分)
首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)
由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)
区别点
标准差
标准误
意义
个体差异大小
抽样误差大小
计算公式
与n的关系
n↑S→σ
n↑→0
用途
与均数结合可制定参考值范围
与均数结合可计算总体均数的可信区间
四、计算分析题10分*2=20
1、请将下列数据编制成合格的统计分析表。
试
验
组
对照组
庆大霉素(8万单位/10毫升)
新洁尔灭(0.1%)
生理盐水冲洗服四
环素3天
生理盐水
冲洗
总例数
感染例数
百分比
30
1
3.3%
30
3
10%
30
5
16.7%
30
8
26.7%
表1四种脐带消毒方法效果比较
组别
总例数
感染例数
百分比,%
庆大霉素(8万单位/10毫升)
30
1
3.3
新洁尔灭(0.1%)
30
3
10
生理盐水冲洗服四环素3天
30
5
16.7
生理盐水冲洗
30
8
26.7
2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。
某医院门诊沙眼病人年龄构成比
年龄组(岁)
0-
10-
20-
30-
40-
50-
60-
70-
计
沙眼人数
47
198
330
198
128
80
38
8
1027
沙眼百分比(%)
4.6
19.3
32.1
19.3
12.4
7.8
3.7
0.8
100.0
问以上结论是否合理说明理由。
要达到作者的目的,应计算什么相对数指标
答:
不合理。
沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。
应计算患病率,即患者数与该年龄段总人口数之比。
医学统计学试题
(二)
第二套试卷及参考答案
一、最佳选择题(40分)
1.均数是表示变量值_A_水平的指标。
(A)平均(B)变化范围(C)频数分布(D)相互间差别大小
2.原始数据同乘以一个不等于0的常数后_D_。
(A)均数不变、标准差变(B)均数、标准差均不变
(C)均数变、标准差不变(D)均数、标准差均变
3.描述正态或近似正态分布资料特征的是__B____。
(A)中位数、四分位间距(B)均数、标准差
(C)中位数、标准差(D)几何均数、全距
4.描述偏态分布资料特征的是_A__。
(A)中位数、四分位间距(B)均数、标准差
(C)中位数、标准差(D)几何均数、全距
5.均数与标准差计算的数值A。
(A)均数可以是负数,标准差不可以(B)均数不可以是负数,标准差可以
(C)两者都可以是负数(D)两者都不可以是负数
6、比较身高和体重两组资料的变异度大小宜采用___C___。
(A)极差(B)标准差(C)变异系数(D)四分位间距
7.说明某事物内部各组成部分所占比例应选_B___。
(A)率(B)构成比(C)相对比(D)标准差
8.来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。
(A)S(B)R(C)CV(D)
9.已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显着性意义,若用t检验,则自由度应该是C
(A)5(B)28(C)29(D)4
10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为A
(A)95%(B)49.5%(C)99%(D)97%
11.两样本均数间的差别的假设检验时,查t界值表的自由度为C
(A)n-1
(B)(r-1)(c-1)
(C)n1+n2-2
(D)1
12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是A
(A)总体中个体值存在差别(B)样本中个体值存在差别
(C)样本只含总体的一部分(D)总体均数不等于0
13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小B
(A)α=0.05(B)α=0.20(C)α=0.01(D)α=0.10
14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制C。
(A)线图(B)条图(C)半对数线图(D)圆图
15.构成比用来C
(A)反映某现象发生的强度
(B)表示两个同类指标的比
(C)反映某事物内部各部分占全部的比重
(D)表示某一现象在时间顺序的排列
16.某医院的资料计算各种疾病所占的比例,该指标为D
(A)发病率(B)患病率(C)相对比(D)构成比
17.等级资料的比较宜用C
(A)t检验(B)检验
(C)秩和检验(D)方差分析
18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于C
(A)T11(B)T12(C)T21(D)T22
19.四格表校正x2检验公式适用于D
(A)n<40,T>5(B)n<40,1(C)n>40,T<5(D)n>40,120.同一双变量资料,进行直线相关与回归分析,有B
(A)r>0,b<0(B)r>0,b>0(C)r<0,b>0(D)r=b
二、填空题12分
1、统计资料按其性质不同,通常将资料分为(计量、计数、等级)三种类型。
2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为(统计描述)与(统计推断)两个阶段。
3、计量资料,随着样本例数的增大,S逐渐趋向于(σ),逐渐趋向于(0)。
4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料的变异度。
5、(相关分析)侧重于考察变量之间相关关系密切程度,(回归分析)则侧重于考察变量之间数量变化规律。
6、对某地一年级12名女大学生体重(x:
单位kg)与肺活量(y:
单位L)的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:
=0.000419+0.058826X,这意味着体重每增加1kg,肺活量平均增加(0.058826L);且两者之间为(正)相关。
三、名词解释13分
1.参数和统计量
2.概率
3.计数资料
4.回归系数
答案见书本相应的位置
四、简答题15分
1.抽样研究中如何才能控制或减小抽样误差
答:
合理的抽样设计,增大样本含量。
2、何谓抽样误差为什么说抽样误差在抽样研究中是不可避免的
答:
由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异
因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的
3.能否说假设检验的p值越小,比较的两个总体指标间差异越大为什么
答:
不能,因为P值的大小与总体指标间差异大小不完全等同。
P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
五、计算分析题
1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
年份
病例数
存活数
住院期死亡总数
急性期死亡数
住院期总病死率(%)
急性期病死率(%)
1964
17
9
8
7
47.1
41.2
1965
13
8
5
4
38.5
30.8
1966
15
8
7
6
46.7
40.0
1967
15
9
6
6
40.0
40.0
1968
12
8
4
4
33.3
33.3
合计
72
42
30
27
41.7
37.5
修改表:
某年某地1964-1968年某病住院期与急性期病死率比较
年份
病例数
住院期
急性期
死亡总数
总病死率(%)
死亡数
病死率(%)
1964
17
8
47.1
7
41.2
1965
13
5
38.5
4
30.8
1966
15
7
46.7
6
40.0
1967
15
6
40.0
6
40.0
1968
12
4
33.3
4
33.3
合计
72
30
41.7
27
37.5
2、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可)
表1某新药临床试验部分指标
医院代码
性别
身高
体重
疗效
组别
1
1
175.00
63.00
3
0
1
2
157.00
54.00
2
0
1
1
178.00
67.00
2
1
1
2
165.00
50.00
3
0
.
2
162.00
51.00
4
0
.
2
156.00
48.00
2
1
.
1
176.00
62.00
2
1
.
1
184.00
72.00
2
0
5
1
168.00
65.00
2
0
5
2
166.00
46.00
2
1
分析:
两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t检验或u检验。
两组疗效比较可用秩和检验。
第三套试卷及参考答案
一、选择题20分
1.7人血清滴度分别为1:
2,1:
4,1:
8,1:
16,1:
32,1:
64,1:
128,则平均滴度为__C__
A.1:
12.4B.1:
8C.1:
16D.1:
8~1:
16
2.比较身高和体重两组数据变异度大小宜采用___A___
A.变异系数B.方差C.极差D.标准差
3.下列关于个体变异说法不正确的是__C__
A.个体变异是生物体固有的。
B.个体变异是有规律的。
C.增加样本含量,可以减小个体变异。
D.指标的分布类型反映的是个体的分布规律。
4.实验设计的原则是__C___
A.对照、随机、均衡B.随机、重复、均衡
C.对照、重复、随机D.随机、重复、齐同
5.说明某现象发生强度的指标为__B____
A.平均数B.率C.构成比D.相对比
6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的R*C表后,其卡方值的自由度为__C_
A.8B.1C.3D.跟样本含量有关
7.假设检验中的第一类错误是指_A__所犯的错误。
A.拒绝了实际上成立的H0B.不拒绝实际上成立的H0
C.拒绝了实际上不成立的H0D.不拒绝实际上不成立的H0
8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高__D___
A.B.C.D.
9.两样本均数的t检验对资料的要求是_D___
A.正态性、独立性、方差齐性B.资料具有代表性
C.为定量资料D.以上均对
10.四个率的比较的卡方检验,P值小于0.01,则结论为_D__
A.四个总体率均不相等;B.四个样本率均不相等;
C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不全相等。
二、名词解释10分
1.相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率;
答案:
见书上相应的地方
三、填空题10分
1、常用的四种概率抽样方法有:
单纯随机抽样,机械抽样(系统抽样),分层抽样,整群抽样
2、统计推断的内容主要包括参数估计和假设检验。
3、临床观察7名某病患者,其潜伏期(天)各为:
3,7,9,5,6,9,16,则其全距为13天。
4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:
⑴有效⑵无效⑶有效(4)有效……⒇无效,这种资料属于何种类型资料计数资料。
5、实验研究的基本要素是:
处理因素、受试对象、实验效应
四、简答题20分
1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次
答:
这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。
2某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。
答:
一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。
3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义
答:
表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95%
表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L)
4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。
为什么
答:
没有这个规律。
相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。
五、分析计算题40分
1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:
磅)。
男婴x1
7.3
7.9
7.9
8.0
9.3
7.8
6.5
7.6
6.6
8.4
6.7
7.5
女婴x2
7.1
7.9
6.4
6.6
8.0
6.0
7.2
6.8
7.8
5.3
6.6
7.3
(1)该资料是数值变量资料还是分类资料?
数值变量资料
(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?
成组t检验
(3)经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。
试写出假设检验的全过程并下结论。
答:
H0:
白种人男婴与女婴的出生体重是相同的即μ1=μ2
H1:
μ1≠μ2α=0.05
t=2.16ν=22t>t0.05/2,22=2.07p<0.05
在α=0.05水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴。
2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。
疗法
治疗人数
治愈人数
未愈人数
治愈率(%)
甲
33
26
7
78.79
乙
38
36
2
94.74
合计
71
62
9
87.32
(1)请计算最小的理论数。
Tmin=9*33/71=4.18
(2)若要比较两疗法治愈率是否相等,请问用何种检验方法?
四格表校正卡方检验
(3)已知检验统计量为2.92,请下结论。
因χ2=2.92<3.84,P>0.05
结论:
在α=0.05水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。
3比较缺氧条件下猫和兔的生存时间(时间:
分)
猫
兔
生存时间
秩次
生存时间
秩次
25
5.5
14
1
34
10
15
2
38
11
16
3
40
12
18
4
41
13
25
5.5
42
14
26
7
45
15
28
8
30
9
(1)该资料属于什么试验