医学统计学课后答案解析.docx
《医学统计学课后答案解析.docx》由会员分享,可在线阅读,更多相关《医学统计学课后答案解析.docx(17页珍藏版)》请在冰豆网上搜索。
医学统计学课后答案解析
第二章
1.答:
在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。
几何均数:
有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometricmean)。
几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数和百分位数:
中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。
理论上数据集中有一半数比中位数小,另一半比中位数大。
中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。
所谓“开口”资料,是指数据的一端或者两端有不确定值。
百分位数(percentile)是一种位置指标,以PX表示,一个百分位数PX将全部观察值分为两个部分,理论上有X%的观察值比PX小,有(100-X)%观察值比PX大。
故百分位数是一个界值,也是分布数列的一百等份分割值。
显然,中位数即是P50分位数。
即中位数是一特定的百分位数。
常用于制定偏态分布资料的正常值范围。
2.答:
常用来描述数据离散程度的指标有:
极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。
极差大,说明资料的离散程度大。
用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。
其缺点是:
1.不灵敏;2.不稳定。
四分位数间距(inter-quartilerange)就是上四分位数与下四分位数之差,即:
Q=QU-QL,其间包含了全部观察值的一半。
所以四分位数间距又可看成中间一半观察值的极差。
其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。
常用于描述偏态分布资料的离散程度。
极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。
方差(variance)和标准差(standarddeviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。
变异系数(coefficientofvariance,CV)亦称离散系数(coefficientofdispersion),为标准差与均数之比,常用百分数表示。
变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。
3.答:
常用的相对数指标有:
比,构成比和率。
比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。
其计算公式为
率(rate)又称频率指标,用以说明某现象发生的频率或强度。
常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。
计算公式为:
构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:
4.答:
当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或低估总率。
在这种情况下,直接进行两个总率的比较,会产生错误的结论。
此时,必须首先设法消除这种内部构成上的差别,才能进行比较。
统计学上将这种方法称为率的标准化(standardizationmethodofrate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率。
5
(1)编制频数分布表并绘制频数分布图,简述这组数据的分布特征;
组段
频数
频率(%)
;累计频数(%)
组中值
108
3
111~
10
114~
22
117~
38
120~
20
123`
18
15
126~
7
129~132
2
100
合计
120
100
(2)计算中位数、均数、几何均数,用何者表示这组数据的集中位置好
答:
=
=
用均数较好.
(3)计算极差、标准差,用何者表示这组数据的离散趋势好
答:
极差:
四分位数间距:
标准差:
用标准差表示较好.
6.答:
本例频数分布为偏态分布,长尾拖向x轴正方向,故为正偏态。
适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。
名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。
试计算平均滴度。
抗体滴度
1:
4
1:
8
1:
16
1:
32
1:
64
1:
128
1:
256
1:
512
人数
1
5
6
2
7
10
4
5
几何均数:
exp((ln(4)+5×ln(8)+16×ln(16)+2×ln(32)+7×ln(64)+10×ln(128)+4×ln(256)+5×ln(512))/40)
=128
8.答:
此医生的分析是不正确的,原因在于:
首先明确率的定义:
发病率的分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病人数是人次数;分母为“同时期平均人口数”,而按率的定义应为“同时期暴露总人数
该单位抽样检查2839名职工,其中高血压患者中,男性是178例,女性是49例,共227例,可以计算高血压患者占接受检查所有职工的构成比为%
至于40岁以上的患者占接受检查总人数的%,也是构成比;60岁以上者占接受检查总人数的%也是构成比,不能与发病率混为一谈。
关于高血压与性别有关的结论也不妥。
因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消除内部构成比的差异,即就是率的标准化,然后比较。
第三章
1正态分布与标准正态分布的区别:
正态分布是一簇单峰分布的曲线,μ和σ可以有任意取值;标准正态分布是一条单峰曲线,μ和σ有固定的值,μ=0,σ=1。
2u=(x-μ)/σ=(μ-σ-μ)/σ=-1
查标准正态分布表,得Φ(-1)=,所以小于μ-σ者所占的比例为%。
3医学参考值范围的含义:
是根据正常人的数据估计绝大多数正常人某项指标所在的范围。
选定同质的正常人作为研究对象。
所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。
确定原则:
①选定同质的正常人群作为研究对象
②控制检测误差
③判断是否分组
④单、双侧问题
⑤选择百分界值
⑥确定可疑范围
方法:
①正态分布法:
适用于服从正态分布或近似正态分布的资料
②百分位数法:
适用于不服从正态分布的资料
③对数正态分布法:
适用于对数正态分布的资料
4如果资料服从正态分布,那么双侧95%正常值范围为μ±σ;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。
51人以下的概率:
P(x≤1)=P(0)+P
(1)==
8人以上的概率:
P(X≥8)=P(8)+P(9)+P(10)==×105
6二项分布的应用条件:
①观察单位只能有互相对立的两种结果之一。
②已知发生某一结果的概率π不变,其对立结果的概率则为1-π
③n次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。
7二项分布和正态分布之间的关系:
随着n的增大,二项分布逐渐逼近正态分布。
当nπ较大时,二项分布B(n,π)近似正态分布。
举例:
病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。
第四章
1
标准差
标准误
不同:
意义上:
描述一组变量值的离散程度
描述样本均数的离散称度
应用上:
1、标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好。
1、标准误越小,说明样本均数和总体均数的差异越小,用样本均数估计总体均数的可靠性越大。
2、
估计变量值的分布范围。
2、用
估计总体均数的可信区间。
与n的关系:
n越大,标准差越稳定
n越大,标准误越小
相同:
1、都是描述变异度的统计指标
2、
与
成正比,与
成反比;
3、n一定时,同一组资料,标准差越大,标准误也越大。
2α水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯Ⅰ型错误的最大风险,是事前概率;P值是指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。
标明以多大的误差拒绝H0,是事后概率。
3①配对设计的差值的总体均数的可信区间表达公式:
两均数差值的总体均数的可信区间表达公式:
②可以用可信区间回答假设检验的问题。
可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。
例如:
样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数,即可推断该样本是否来自已知均数的总体;用假设检验的方法,先假设样本均数代表的总体均数等于某已知的总体均数,再判断样本提供的信息是否支持这种假设。
4拒绝实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误;不拒绝实际上是不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误。
第一类错误的概率用α表示,第二类错误的概率用β表示。
α越大,β越小;反之,α越小,β越大。
拒绝H0,只可能犯第一类错误,不可能犯第二类错误;不拒绝H0,只可能犯第二类错误,不可能犯第一类错误。
由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。
5t检验的应用条件:
独立性、正态性、方差齐性。
u检验的应用条件:
适用于大样本资料。
t检验和u检验的关系:
随自由度的增加,t分布逐渐趋向于标准正态分布。
因此u检验是t检验的一种近似检验方法。
当自由度大于50时,近似程度比较满意。
6假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。
假设检验应注意的问题:
1要有严密的抽样研究计划:
要保证样本是从同质总体中随机抽取,除了对比的因素外,其他影响结果的因素应一致。
2选用的假设检验方法应符合应用条件。
3结论不能绝对化。
4正确理解差别有无显著性的统计意义:
差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。
⑤统计学意义与其他专业上的意义不同。
7H0:
矽肺患者的血红蛋白与健康人相同,即μ=μ0
H1:
矽肺患者的血红蛋白与健康人不同,即μ≠μ0
α=
t==
ν=10-1=9,,9=8H0:
新药与常规药物的疗效没有差别,即μ1=μ2
H1:
新药与常规药物的疗效不同,即μ1≠μ2
α=
=
ν=n1+n2-2=20-2=18,,18=,不拒绝H0,差别无统计学意义,尚不能认为新药与常规药物的疗效不同。
9⑴甲药:
H0:
甲药无效,即μd=0
H1:
甲药有效,即μd
0
α=
=
ν=10-1=9,,9=乙药:
H0:
乙药无效,即μd=0
H1:
乙药有效,即μd
0
α=
=
ν=10-1=9,,9=⑵H0:
甲乙两药的疗效没有差别,即μ1=μ2
H1:
甲乙两药的疗效有差别,即μ1≠μ2
=
ν=n1+n2-2=20-2=18,,18=>t,p>,不拒绝H0,差别无统计学意义,可以认为甲乙两药的疗效没有差别。
第六章
1不满足正态近似条件,所以采用直接计算概率法。
H0:
加维生素C的治愈率与不加相同,即π=π0=
H1:
加维生素C的治愈率高于不加维生素C,即π>π0
α=
P(X≤8)=1-P(X≥9)=1-P(X=9)-P(X=10)=1-C109****=>
不拒绝H0,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。
2满足正态近似条件,采用正态近似法。
H0:
经健康教育后的高血压患病率与以前相同,即π=π0=
H1:
经健康教育后的高血压患病率比以前降低,即π<π0
单侧α=
u>,单侧=
p<,拒绝H0,接受H1,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。
3①建立检验假设和确定检验水准
H0:
男女大学生HBV感染对其心理影响相同,即π1=π2
H1:
男女大学生HBV感染对其心理影响不同,即π1≠π2
检验水准α=
②计算检验统计量
χ2=(ad-bd)2*n/(a+b)(c+d)(a+c)(b+d)
=(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=
ν=1
③确定p值
查χ2届值表,得p<
④统计推断
按α=水准,拒绝HO,接受H1,差别有统计学意义,可以认为HBV感染对不同性别的大学生在心理行为方面的影响不同。
4①建立检验假设和确定检验水准
H0:
两组的治愈率相等,即π1=π2
H1:
两组的治愈率不等,即π1≠π2
检验水准α=
②Fisher精确概率法
序号
治愈人数
未愈人数
缓解率p1与p2
|p1-p2|
概率P(i)
1
17
0
2
13
2
16
1
3
12
3
15
2
4
11
4
14
3
5
10
5
13
4
6
9
6
12
5
7
8
7
11
6
8
7
8
10
7
9
6
9
9
8
10
5
10
8
9
11
4
11
7
10
12
3
12
6
11
13
2
13
5
12
14
1
14
4
13
15
0
P(i)=>
③统计推断
按α=水准,不拒绝H0,差别无统计学意义,尚不能认为两组治愈率有差别。
5①建立检验假设和确定检验水准
H0:
治疗三种类型病人的有效率相同,即π1=π2=π3
H1:
治疗三种类型病人的有效率不等或不全相等。
检验水准α=
②计算检验统计量
=286*(712+272+1042+422+242+182-1)=
199*9887*98199*14687*146199*4287*42
③确定p值
查χ2界值表,得p>
④统计推断
按α=水准,不拒绝H0,拒绝H1,差别无统计学意义,尚不能认为治疗三种类型病人的有效率有差别。
6①建立检验假设和确定检验水准
H0:
该三种人群有相同的血型分布,即π1=π2=π3
H1:
该三种人群的血型分布不等或不全相等。
检验水准α=
②计算检验统计量
=9312*(6792+1342+……+4352-1)=
3720*1883788*1883546*6522
③确定p值
查χ2界值表,得p<
④统计推断
按α=水准,拒绝H0,接受H1,差别有统计学意义,可以认为三种人群的血型分布不等或不全相等。
7①建立检验假设和确定检验水准
H0:
两种检验方法的结果相同,即总体B=C
H1:
两种检验方法的结果不同,即总体B≠C
检验水准α=
②计算检验统计量
=
③确定p值
查χ2界值表,得p>
④统计推断
按α=水准,不拒绝H0,差别无统计学意义,尚不能认为两种免疫学方法的阳性率有差别。
第八章
1答:
适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。
2答:
属于非参数检验。
因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。
但本题即使n1>10,n2-n1>10时采用的是u检验,但它比较的是分布而不是参数,所以它还是属于非差数检验。
3答:
有序分类资料可做秩和检验、等级相关分析。
4答:
(一)建立检验假设
H0:
两种药的治疗效果总体分布相同;
H1:
两种药的治疗效果总体分布不同;
α=;
(二)编秩和求秩和T
两组治疗心绞痛疗效比较
疗效
(1)
人数
合计
(4)
秩次
范围
(5)
平均
秩次
(6)
秩和
缓释片
(2)
普通片
(3)
缓释片
(7)
普通片
(8)
显效
有效
无效
加重
62
18
5
3
35
31
14
4
97
49
19
7
1-97
98-146
147-165
166-172
49
122
156
169
3038
2196
780
507
1715
3782
2184
676
合计
n1=88
n2=84
172
6521
8357
(三)计算检验统计量T
由于n1>n2,则取n2组的秩和为T,故检验统计量T=T2=8357。
(四)确定P值,做出推断结论
由于n2>10,T分布已接近均数为n1(N+1)/2,方差为n1n2(N+1)/12的正态分布,按书上式()()求出uc=
uc>,P<,按α=水准拒绝H0,接受H1,差异有统计学意义。
可以认为缓释片和普通片治疗心绞痛的疗效有差别。
5答:
(一)建立检验假设
H0:
治疗前后HCG值的总体分布相同;
H1:
治疗前后HCG值的总体分布不同;
α=;
(二)计算检验统计量T
肿瘤患者灌注治疗前后HCG值
病例号
(1)
治疗前
(2)
治疗后
(3)
差值
(4)
秩次
(5)
1
2
3
4
5
6
7
8
1280000
75500
12450
1500000
10000
9700
15588
4223
210000
3300
2210
93
2500
1203
4825
914
1070000
72200
10240
1499907
7500
8497
10763
3309
7
6
4
8
2
3
5
1
T+=36T-=0
本例T+=36,T-=0,任取T+或(T-)作为检验统计量T,本例取T+=36。
(三)确定P值,做出推断结论
由于n<50,查附表9,T界值表。
本例n=8,T=36,查附表9,得α=时的T界值为5-31,T在双侧界值范围外,故P<。
按α=水准拒绝H0,接受H1,差异有统计学意义。
可以认为肿瘤患者灌注治疗前后HCG值有差别。
6答:
(一)建立检验假设
H0:
三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;
H1三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同;
α=;
(二)计算检验统计量T
卵巢功能异常患者血清中促黄体素的含量
卵巢发育不良
(1)
秩次
(2)
丘脑性闭经
(3)
秩次
(4)
垂体性闭经
(5)
秩次
(6)
24
23
22
21
20
19
18
17
10
6
1
14
2
13
5
16
9
3
4
15
Ri
ni
164
8
65
8
71
8
按书上式()求出H=
(三)确定P值,做出推断结论
由于k=3,每组例数ni=9,查附表11,H界值表得P<。
按α=水准拒绝H0,接受H1,差异有统计学意义。
可以认为三种卵巢功能异常患者血清中促黄体素的含量有差别。
7答:
(一)建立检验假设
H0:
针刺三个穴位的镇痛效果的总体分布相同;
H1:
针刺三个穴位的镇痛效果的总体分布不全相同或全不相同;
α=;
(二)计算检验统计量T
针刺三个穴位的镇痛效果
镇痛效果
各穴位的观察频数
合计
(4)
秩次
范围
(5)
平均
秩次
(6)
各穴位的观察频数
合谷足三里扶突
(1)
(2)(3)
合谷足三里扶突
(1)
(2)(3)
+
++
+++
++++
38
44
12
24
53
29
28
16
47
23
19
33
138
96
59
73
1-138
139-234
235-293
294-366
264
330
2641
8206
3168
7920
7392
5280
5016
10890
合计
118
126
122
366
21935
21764
23462
按书上式()求出H=
(三)确定P值,做出推断结论
由于k=3,每组例数ni>9,已超出附表11的范围,故按v=k-1=2,查附表8,χ2界值表,得P>。
按α=水准不拒绝H0,差异无统计学意义。
故尚不能认为针刺不同穴位的镇痛效果有差别。
8答:
(一)建立检验假设
H0:
慢性胃炎病人服药前后胃痛疼痛次数的总体分布相同;
H1:
慢性胃炎病人服药前后胃痛疼痛次数的总体分布不全相同或全不相同;
α=;
(二)计算检验统计量T
慢性胃炎病人服药前后胃痛疼痛次数
患者编号
治疗前
治疗后两周
治疗后四周
治疗后六周
1
2
3
4
5
6
2(