医学统计学第七版课后答案及解析Word格式.docx
《医学统计学第七版课后答案及解析Word格式.docx》由会员分享,可在线阅读,更多相关《医学统计学第七版课后答案及解析Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或低估总率。
在这种情况下,直接进行两个总率的比较,会产生错误的结论。
此时,必须首先设法消除这种内部构成上的差别,才能进行比较。
统计学上将这种方法称为率的标准化(standardizationmethodofrate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率。
5
1)编制频数分布表并绘制频数分布图,简述这组数据的分布特征;
组段
频数
频率(%)
;
累计频数(%)
组中值
108
3
2.5
109.5
111~
10
8.33
10.83
112.5
114~
22
18.33
29.17
115.5
117~
38
31.67
60.83
118.5
120~
20
16.67
77.5
121.5
123`
18
15
92.5
124.5
126~
7
5.83
98.33
126.5
129~132
2
1.67
100
129.5
合计
120
(2)计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?
答:
X3109.510112.522115.538118.520121.518124.57126.52139.5/120
=119.4135
Xglg1lg3109.5lg10112.5lg22115.5lg38118.5lg20121.5lg18124.5lg7126.5lg2139.5/120=119.25125
Md116.63
用均数较好.
(3)计算极差、标准差,用何者表示这组数据的离散趋势好?
极差:
22.62
四分位数间距:
5.915标准差:
4.380736
用标准差表示较好.
6.答:
本例频数分布为偏态分布,长尾拖向x轴正方向,故为正偏态。
适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。
7.40名麻疹易感儿童接种麻疹疫苗后一
个月,
血凝抑制抗体滴度如下表。
试计算平
均滴度。
抗体滴度1:
4
1:
8
16
321:
641:
128
2561:
512
人数1
6
2710
45
几何
均
数
:
exp((ln(4)+5×
ln(8)+16×
ln(16)+2
×
ln(32)+7
ln(64)+10×
ln(128)+4
ln(256)+5
ln(512))/40)
=128
观察结果不会影响到其他观察单位的结果。
7二项分布和正态分布之间的关系:
随着n的增大,二项分布逐渐逼近正态分布。
当nπ较大时,二项分布B(n,π)近似正态分布。
举例:
病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;
某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。
第四章
1
标准差
标准误
不同:
意义上:
描述一组变量值的离散程
度
描述样本均数的离散称度
应用上:
1、标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好。
1、标准误越小,说明样本均数和总体均数的差异越小,用样本均数估计总体均数的可靠性越大。
2、xus估计变量值的分布范围。
2、用xtsx估计总体均数的可信区间。
与n的关系:
n越大,标准差越稳定
n越大,标准误越小
相同:
1、都是描述变异度的统计指标
2、xxx与x成正比,与n成反比;
3、n一定时,同一组资料,标准差越大,标准误也越大。
α水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯Ⅰ型错误的最大风险,是事前概率;
P值是指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。
标明以多大的误差拒绝H0,是事后概率。
3①配对设计的差值的总体均数的可信区间表达公式:
dt,n1sd
2可以用可信区间回答假设检验的问题。
可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。
例如:
样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数,即可推断该样本是否来自已知均数的总体;
用假设检验的方法,先假设样本均数代表的总体均数等于某已知的总体均数,再判断样本提供的信息是否支持这种假设。
拒绝实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误;
不拒绝
实际上是不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误。
第一类错误的概率用α表示,第二类错误的概率用β表示。
α越大,β越小;
反之,α越小,β越大。
拒绝H0,只可能犯第一类错误,不可能犯第二类错误;
不拒绝H0,只可能犯第二类
错误,不可能犯第一类错误。
由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。
5t检验的应用条件:
独立性、正态性、方差齐性。
u检验的应用条件:
适用于大样本资料。
t检验和u检验的关系:
随自由度的增加,t分布逐渐趋向于标准正态分布。
因此u检验是t检验的一种近似检验方法。
当自由度大于50时,近似程度比较满意。
6假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。
假设检验应注意的问题:
1要有严密的抽样研究计划:
要保证样本是从同质总体中随机抽取,除了对比的因素外,其他影响结果的因素应一致。
2选用的假设检验方法应符合应用条件。
3结论不能绝对化。
4正确理解差别有无显著性的统计意义:
差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说它们有较大差别;
差别无统计学意义或无显著性,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。
5统计学意义与其他专业上的意义不同。
=μ0
μ≠μ0
H0:
矽肺患者的血红蛋白与健康人相同,即
H1:
矽肺患者的血红蛋白与健康人不同,即α=0.05
ν=n1+n2-2=20-2=18,t0.05,18=2.101<
t,p>
0.05,不拒绝H0,差别无统计学意义,尚不能认为新药与常规药物的疗效不同。
1不满足正态近似条件,所以采用直接计算概率法
H0:
加维生素C的治愈率与不加相同,即π=π0=0.6
H1:
加维生素C的治愈率高于不加维生素C,即π>
π0α=0.05
P(X≤8)=1-P(X≥9)=1-P(X=9)-P(X=10)=1-C109*0.69*0.41-C1010*0.610*0.40=0.9536>
0.05不拒绝H0,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。
2满足正态近似条件,采用正态近似法。
经健康教育后的高血压患病率与以前相同,即π=π0=0.6
经健康教育后的高血压患病率比以前降低,即π<
π0
单侧α=0.05
u>
u0.05,单侧=1.64
p<
0.05,拒绝H0,接受H1,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。
3①建立检验假设和确定检验水准
男女大学生HBV感染对其心理影响相同,即π1=π2
男女大学生HBV感染对其心理影响不同,即π1≠π2
检验水准α=0.05
2计算检验统计量
χ2=(ad-bd)2*n/(a+b)(c+d)(a+c)(b+d)=(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651
ν=1
3确定p值
查χ2届值表,得p<
0.05
4统计推断
按α=0.05水准,拒绝HO,接受H1,差别有统计学意义,可以认为HBV感染对不同性别的大学生在心理行为方面的影响不同。
4①建立检验假设和确定检验水准
两组的治愈率相等,即π1=π2
两组的治愈率不等,即π1≠π2
②Fisher精确概率法
P(i)=0.280>
3统计推断
按α=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为两组治愈率有差别。
5①建立检验假设和确定检验水准
治疗三种类型病人的有效率相同,即π1=π2=π3
治疗三种类型病人的有效率不等或不全相等。
检验水准α=0.05
②计算检验统计量
AiTi
n
Ti
199*9887*98199*14687*146199*4287*42
③确定p值
查χ2界值表,得p>
按α=0.05水准,不拒绝H0,拒绝H1,差别无统计学意义,尚不能认为治疗三种类型病人的有效率有差别。
6①建立检验假设和确定检验水准
该三种人群有相同的血型分布,即π1=π2=π3
该三种人群的血型分布不等或不全相等。
2AiTi2A2
2iin1
iTinRnC
22
=9312*(6792+1342+⋯⋯
+4352
-1
)=71.180
3720*1883788*1883546*6522
③确定p值
查χ2界值表,得p<
按α=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为三种人群的血型分布不等或不全相等。
第八章
1答:
适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。
2答:
属于非参数检验。
因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。
但本题即使n1>
10,n2-n1>
10时采用的是u检验,但它比较的是分布而不是参数,所以它还是属于非差数检验。
3答:
有序分类资料可做秩和检验、等级相关分析。
4答:
(一)建立检验假设H0:
两种药的治疗效果总体分布相同;
两种药的治疗效果总体分布不同;
α=0.05;
(二)编秩和求秩和T
两组治疗心绞痛疗效比较
人数
秩次
平均
秩和
疗效
缓释片普通片
范围
缓释片
普通片
(1)
(2)(3)
(4)
(5)
(6)
(7)
(8)
显效
62
35
97
1-97
49
3038
1715
有效
31
98-146
122
2196
3782
无效
14
19
147-165
156
780
2184
加重
166-172
169
507
676
n1=88
n2=84
172
6521
8357
(三)计算检验统计量T由于n1>
n2,则取n2组的秩和为T,故检验统计量T=T2=8357。
(四)确定P值,做出推断结论
由于n2>
10,T分布已接近均数为n1(N+1)/2,方差为n1n2(N+1)/12的正态分布,按书上式(8.3)(8.4)求出uc=3.7439
uc>
2.56,P<
0.01,按α=0.05水准拒绝H0,接受H1,差异有统计学意义。
可以认为缓释片和普通片治疗心绞痛的疗效有差别。
5答:
治疗前后HCG值的总体分布相同;
治疗前后HCG值的总体分布不同;
(二)计算检验统计量T
肿瘤患者灌注治疗前后HCG值
病例号
治疗前
治疗后
差值
(2)
(3)
1280000
210000
1070000
75500
3300
72200
12450
2210
10240
1500000
93
1499907
10000
2500
7500
9700
1203
8497
15588
4825
10763
4223
914
3309
T+=36T-=0
本例T+=36,T-=0,任取T+或(T-)作为检验统计量T,本例取T+=36。
(三)确定P值,做出推断结论
由于n<
50,查附表9,T界值表。
本例n=8,T=36,查附表9,得α=0.05时的T界值为5-31,T在双侧界值范围外,故P<
0.05。
按α=0.05水准拒绝H0,接受H1,差异有统计学意义。
可以认为肿瘤患者灌注治疗前后HCG值有差别。
6答:
三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;
H1三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同;
卵巢功能异常患者血清中促黄体素的含量
卵巢发育不良
丘脑性闭经
垂体性闭经
44.10
24
6.71
4.59
7.5
42.50
23
3.32
2.75
40.50
11.14
38.31
21
5.98
9
35.76
10.51
1.90
35.12
9.45
11.5
2.10
33.60
1.74
31.38
17
10.21
13
10.86
Ri
164
65
71
ni
按书上式(8.5)求出H=15.4184
(三)确定P值,做出推断结论
由于k=3,每组例数ni=9,查附表11,H界值表得P<
0.01。
按α=0.05水准拒
绝H0,接受H1,差异有统计学意义。
可以认为三种卵巢功能异常患者血清中促黄体素的含量有差别。
7答:
针刺三个穴位的镇痛效果的总体分布相同;
针刺三个穴位的镇痛效果的总体分布不全相同或全不相同;
针刺三个穴位的镇痛效果
镇痛效果
各穴位的观察频数
秩次范围
平均秩次
合谷
足三里
(2)(
扶突
3)
+
53
47
138
1-138
69.5
2641
3683.5
3266.5
++
44
29
96
139-234
186.5
8206
5408.5
4289.5
+++
12
28
59
235-293
264
3168
7392
5016
++++
33
73
294-366
330
7920
5280
10890
118
126
366
21935
21764
23462
按书上式(8.5)求出H=2.4143
由于k=3,每组例数ni>
9,已超出附表11的范围,故按v=k-1=2,查附表8,χ2界值表,得P>
0.05。
按α=0.05水准不拒绝H0,差异无统计学意义。
故尚不能认为针刺不同穴位的镇痛效果有差别。
第三章
1正态分布与标准正态分布的区别:
正态分布是一簇单峰分布的曲线,μ和σ可以有任意取值;
标准正态分布是一条单峰曲线,μ和σ有固定的值,μ=0,σ=1。
2u=(x-μ)/σ=(μ-σ-μ)/σ=-1
查标准正态分布表,得Φ(-1)=0.1587,所以小于μ-σ者所占的比例为15.87%。
3医学参考值范围的含义:
是根据正常人的数据估计绝大多数正常人某项指标所在的范围。
选定同质的正常人作为研究对象。
所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。
确定原则:
①选定同质的正常人群作为研究对象
2控制检测误差
3判断是否分组
4单、双侧问题
5选择百分界值
6确定可疑范围方法:
①正态分布法:
适用于服从正态分布或近似正态分布的资料②百分位数法:
适用于不服从正态分布的资料③对数正态分布法:
适用于对数正态分布的资料
4如果资料服从正态分布,那么双侧95%正常值范围为μ±
1.96σ;
如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。
0010119
51人以下的概率:
P(x≤1)=P(0)+P
(1)=C1000.200.810+C10*10.210.89=0.375
8人以上的概率:
P(X≥8)=P(8)+P(9)+P(10)=C1080.280.82+C1090.290.81+C10100.21040.80=7.79×
1056*
6二项分布的应用条件:
①观察单位只能有互相对立的两种结果之一。
2已知发生某一结果的概率π不变,其对立结果的概率则为1-π
3n次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的