统计学平时作业2.docx
《统计学平时作业2.docx》由会员分享,可在线阅读,更多相关《统计学平时作业2.docx(13页珍藏版)》请在冰豆网上搜索。
![统计学平时作业2.docx](https://file1.bdocx.com/fileroot1/2022-11/30/ffe82cad-d9e6-4a7b-ada9-03a074399dd0/ffe82cad-d9e6-4a7b-ada9-03a074399dd01.gif)
统计学平时作业2
统计学平时作业2
医学统计
第一套试卷
一、选择题(40分)
1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(b)
a条图b百分条图或圆图c线图d直方图
2、均数和标准差可全面描述(d)资料的特征
a所有分布形式b负偏态分布c正偏态分布 d正态分布和近似正态分布
3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(a)
a用该市五岁男孩的身高的95%或99%正常值范围来评价
b用身高差别的假设检验来评价
c用身高均数的95%或99%的可信区间来评价
d不能作评价
4、比较身高与体重两组数据变异大小宜采用(a)
a变异系数b方差c标准差d四分位间距
5、产生均数有抽样误差的根本原因是(a)
a.个体差异b.群体差异c.样本均数不同d.总体均数不同
6.男性吸烟率是女性的10倍,该指标为(a)
(a)相对比(b)构成比(c)定基比(d)率
7、统计推断的内容为(d)
a.用样本指标估计相应的总体指标b.检验统计上的“检验假设”
c.a和b均不是d.a和b均是
8、两样本均数比较用t检验,其目的是检验(b)
a两样本均数是否不同b两总体均数是否不同
c两个总体均数是否相同d两个样本均数是否相同
9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(d)
(a) n1+n2
(b) n1+n2–1
(c) n1+n2+1
(d) n1+n2-2
10、标准误反映(a)
a抽样误差的大小b总体参数的波动大小
c重复实验准确度的高低d数据的离散程度
11、最小二乘法是指各实测点到回归直线的(c)
a垂直距离的平方和最小 b垂直距离最小
c纵向距离的平方和最小 d纵向距离最小
12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?
(c)
atr>tbbtrbctr=tbd二者大小关系不能肯定
13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(d)
a分别按x1和x2从小到大编秩
b把x1和x2综合从小到大编秩
c把x1和x2综合按绝对值从小到大编秩
d把x1和x2的差数按绝对值从小到大编秩
14、四个样本率作比较,χ2>χ20.05,ν可认为(a)
a各总体率不同或不全相同b各总体率均不相同
c各样本率均不相同d各样本率不同或不全相同
15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
该资料宜选用的统计方法为(b)
a.四格表检验b.四格表校正检验ct检验du检验
16、为调查我国城市女婴出生体重:
北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(d)
a南方和北方女婴出生体重的差别无统计学意义
b南方和北方女婴出生体重差别很大
c由于p值太小,南方和北方女婴出生体重差别无意义
d南方和北方女婴出生体重差别有统计学意义但无实际意义。
17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(c)
a两个样本率的差别b两个样本率的标准误
c两个总体率的差别d两个总体率的标准差
18.下列指标不属于相对数的是(c)
a率b构成比c比d百分位数
19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:
(d)
表1盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效
组别
治愈
显效
进步
无效
合计
左西替利嗪片组
49
8
5
2
64
西替利嗪片组
44
10
9
3
66
a.检验 b.成组t检验 c.u检验 d.秩和检验
20、下列哪种说法是错误的(b)
a计算相对数尤其是率时应有足够的观察单位或观察次数
b分析大样本数据时可以构成比代替率
c应分别将分子和分母合计求合计率或平均率
d样本率或构成比的比较应作假设检验
二、填空题(20分)
1、现有若干名儿童健康检查一览表的部分检测指标,见表2
表2某年某地儿童健康检查部分检测结果
编号
性别
年龄(周岁)
身高(cm)
坐高(cm)
血型
表面抗原
肝大
1
男
7
116.7
66.3
a
+
++
2
女
8
120.0
68.3
ab
-
-
3
女
10
126.8
71.5
o
-
+
4
男
9
123.7
70.0
a
-
-
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
问:
①上述变量中能形成计数资料的指标有
②计量资料的指标有
③等级资料的指标有
④对于身高或坐高指标,在进行统计描述时宜计算和表示其集中趋势和离散趋势。
⑤对于血型指标宜计算表示各种血型的构成
⑥若要分析不同性别身高有无不同,宜选用的统计方法有
⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有
2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为
3、临床上安排试验设计时,应考虑的三个基本原则是
三、简答题(20分)
1、描述集中趋势的指标有哪些?
其适用范围有何异同?
(5分)
2、何谓假设检验?
可以举例说明。
(5分)
3、请你谈谈对假设检验结论的认识。
(5分)
4、请你谈谈标准差和标准误的异同点。
(5分)
四、计算分析题10分*2=20
1、请将下列数据编制成合格的统计分析表。
试
验
组
对照组
庆大霉素(8万单位/10毫升)
新洁尔灭(0.1%)
生理盐水冲洗服四
环素3天
生理盐水
冲洗
总例数
感染例数
百分比
30
1
3.3%
30
3
10%
30
5
16.7%
30
8
26.7%
2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。
某医院门诊沙眼病人年龄构成比
年龄组(岁)
0-
10-
20-
30-
40-
50-
60-
70-
计
沙眼人数
47
198
330
198
128
80
38
8
1027
沙眼百分比(%)
4.6
19.3
32.1
19.3
12.4
7.8
3.7
0.8
100.0
问以上结论是否合理?
说明理由。
要达到作者的目的,应计算什么相对数指标?
第二套试卷
一、最佳选择题(40分)
1.均数是表示变量值_a_水平的指标。
(a)平均(b)变化范围(c)频数分布(d)相互间差别大小
2.原始数据同乘以一个不等于0的常数后_d_。
(a)均数不变、标准差变(b)均数、标准差均不变
(c)均数变、标准差不变(d)均数、标准差均变
3.描述正态或近似正态分布资料特征的是__b____。
(a)中位数、四分位间距(b)均数、标准差
(c)中位数、标准差(d)几何均数、全距
4.描述偏态分布资料特征的是_a__。
(a)中位数、四分位间距(b)均数、标准差
(c)中位数、标准差(d)几何均数、全距
5.均数与标准差计算的数值a。
(a)均数可以是负数,标准差不可以(b)均数不可以是负数,标准差可以
(c)两者都可以是负数(d)两者都不可以是负数
6、比较身高和体重两组资料的变异度大小宜采用__c____。
(a)极差(b)标准差(c)变异系数(d)四分位间距
7.说明某事物内部各组成部分所占比例应选_b___。
(a)率(b)构成比(c)相对比(d)标准差
8.来自同一总体的两个样本中,_d_小的那个样本均数估计总体均数时更精确。
(a)s(b)r(c)cv(d)标准误
9.已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是c
(a)5(b)28(c)29(d)4
10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为a
(a)95%(b)49.5%(c)99%(d)97%
11.两样本均数间的差别的假设检验时,查t界值表的自由度为c
(a)n-1
(b)(r-1)(c-1)
(c)n1+n2-2
(d)1
12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是b
(a)总体中个体值存在差别(b)样本中个体值存在差别
(c)样本只含总体的一部分(d)总体均数不等于0
13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小b
(a)α=0.05(b)α=0.20(c)α=0.01(d)α=0.10
14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制c。
(a)线图(b)条图(c)半对数线图(d)圆图
15.构成比用来c
(a)反映某现象发生的强度
(b)表示两个同类指标的比
(c)反映某事物内部各部分占全部的比重
(d)表示某一现象在时间顺序的排列
16.某医院的资料计算各种疾病所占的比例,该指标为d
(a)发病率(b)患病率(c)相对比(d)构成比
17.等级资料的比较宜用c
(a)t检验(b)检验
(c)秩和检验(d)方差分析
18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于c
(a)t11(b)t12(c)t21(d)t22
19.四格表校正x2检验公式适用于a
(a)n<40,t>5(b)n<40,1
(c)n>40,t<5(d)n>40,1
20.同一双变量资料,进行直线相关与回归分析,有b
(a)r>0,b<0(b)r>0,b>0(c)r<0,b>0(d)r=b
二、填空题12分
1、统计资料按其性质不同,通常将资料分为()三种类型。
2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为()和()两个阶段。
3、计量资料,随着样本例数的增大,s逐渐趋向于(),逐渐趋向于()。
4、变异系数常用于比较()或()情况下两组资料的变异度。
5、()侧重于考察变量之间相关关系密切程度,()则侧重于考察变量之间数量变化规律。
6、对某地一年级12名女大学生体重(x:
单位kg)与肺活量(y:
单位l)的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:
?
=0.000419+0.058826x,这意味着体重每增加1kg,肺活量平均增加();且两者之间为()相关。
三、名词解释13分
1.参数和统计量
2.概率
3.计数资料
4.回归系数
四、简答题15分
1. 抽样研究中如何才能控制或减小抽样误差?
2、何谓抽样误差?
为什么说抽样误差在抽样研究中是不可避免的?
3.能否说假设检验的p值越小,比较的两个总体指标间差异越大?
为什么?
五、计算分析题
1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
年份
病例数
存活数
住院期死亡总数
急性期死亡数
住院期总病死率(%)
急性期病死率(%)
1964
17
9
8
7
47.1
41.2
1965
13
8
5
4
38.5
30.8
1966
15
8
7
6
46.7
40.0
1967
15
9
6
6
40.0
40.0
1968
12
8
4
4
33.3
33.3
合计
72
42
30
27
41.7
37.5
2、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可)
表1某新药临床试验部分指标
医院代码
性别
身高
体重
疗效
组别
1
1
175.00
63.00
3
0
1
2
157.00
54.00
2
0
1
1
178.00
67.00
2
1
1
2
165.00
50.00
3
0
.
2
162.00
51.00
4
0
.
2
156.00
48.00
2
1
.
1
176.00
62.00
2
1
.
1
184.00
72.00
2
0
5
1
168.00
65.00
2
0
5
2
166.00
46.00
2
1
第三套试卷
一、选择题20分
1.7人血清滴度分别为1:
2,1:
4,1:
8,1:
16,1:
32,1:
64,1:
128,则平均滴度为__c__
a.1:
12.4b.1:
8c.1:
16d.1:
8~1:
16
2.比较身高和体重两组数据变异度大小宜采用___a___
a.变异系数b.方差c.极差d.标准差
3.下列关于个体变异说法不正确的是__c__
a.个体变异是生物体固有的。
b.个体变异是有规律的。
c.增加样本含量,可以减小个体变异。
d.指标的分布类型反映的是个体的分布规律。
4.实验设计的原则是__c___
a.对照、随机、均衡b.随机、重复、均衡
c.对照、重复、随机d.随机、重复、齐同
5.说明某现象发生强度的指标为__b___
a.平均数b.率c.构成比d.相对比
6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的r*c表后,其卡方值的自由度为__c_
a.8b.1c.3d.跟样本含量有关
7.假设检验中的第一类错误是指_a__所犯的错误。
a.拒绝了实际上成立的h0b.不拒绝实际上成立的h0
c.拒绝了实际上不成立的h0d.不拒绝实际上不成立的h0
8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高_____
a.b.c.d.
9.两样本均数的t检验对资料的要求是__a__
a.正态性、独立性、方差齐性b.资料具有代表性
c.为定量资料d.以上均对
10.四个率的比较的卡方检验,p值小于0.01,则结论为_d__
a.四个总体率均不相等;b.四个样本率均不相等;
c.四个总体率之间肯定不等或不全相等;d.四个总体率之间不等或不全相等。
二、名词解释10分
1.相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率;
三、填空题10分
1、常用的四种概率抽样方法有:
()
2、统计推断的内容主要包括()和()。
3、临床观察7名某病患者,其潜伏期(天)各为:
3,7,9,5,6,9,16,则其全距为()。
4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:
⑴有效⑵无效⑶有效(4)有效……⒇无效,这种资料属于何种类型资料()。
5、实验研究的基本要素是:
()
四、简答题20分
1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?
2某医生用某药治疗10例小儿支气管哮喘,治愈8例,能否给出“该药对小儿支气管哮喘的治愈率为80%,值得推广”的结论?
为什么?
3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/l),表示什么意义?
该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/l),又说明了什么含义?
4.对同一组资料,如果相关分析算出的r较大,能否认为回归分析算出的b也较大。
为什么?
五、分析计算题40分
1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:
磅)。
男婴x1
7.3
7.9
7.9
8.0
9.3
7.8
6.5
7.6
6.6
8.4
6.7
7.5
女婴x2
7.1
7.9
6.4
6.6
8.0
6.0
7.2
6.8
7.8
5.3
6.6
7.3
(1)该资料是数值变量资料还是分类资料?
(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?
(3)经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。
试写出假设检验的全过程并下结论。
2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。
疗法
治疗人数
治愈人数
未愈人数
治愈率(%)
甲
33
26
7
78.79
乙
38
36
2
94.74
合计
71
62
9
87.32
(1)请计算最小的理论频数。
(2)若要比较两疗法治愈率是否相等,请问用何种检验方法?
(3)已知检验统计量为2.92(若0.05水平的检验界值为3.84),请下结论。
3比较缺氧条件下猫和兔的生存时间(时间:
分)
猫
兔
生存时间
秩次
生存时间
秩次
25
14
34
15
38
16
40
18
41
25
42
26
45
28
30
(1)该资料属于什么试验设计?
(2)请对资料进行编秩;
(3)该资料总秩和为多少?
各组秩和又为多少?
(4)请用文字写出该资料的检验假设(即h0)。
4.请完成以下空白并进行描述性分析。
年龄(岁)
人口数
死亡总数
恶性肿瘤死亡数
恶性肿瘤死亡占总死亡的%
恶性肿瘤死亡率(1/10万)
年龄别死亡率(‰)
0-
82920
()
4
2.90
()
()
20-
()
63
()
19.05
25.73
()
40-
28161
172
42
()
()
()
60-
()
()
32
()
()
()
合计
167090
715
90
12.59
()
()