医学统计学课后答案解析.docx

资源描述

医学统计学课后答案解析.docx

《医学统计学课后答案解析.docx》由会员分享，可在线阅读，更多相关《医学统计学课后答案解析.docx（19页珍藏版）》请在冰豆网上搜索。

医学统计学课后答案解析.docx

医学统计学课后答案解析

第二章

1•答：

在统计学中用来描述集中趋势的指标体系是平均数，包括算术均数，几何均数，中位数。

均数反映了一组观察值的平均水平，适用于单峰对称或近似单峰对称分布资料的平均水平的描述。

几何均数：

有些医学资料，如抗体的滴度，细菌计数等，其频数分布呈明显偏态，各观察值之间呈倍数变化（等比关系），此时不宜用算术均数描述其集中位置，而应该使用几何均数（geometricmean）。

几何均数一般用G表示，适用于各变量值之间成倍数关系，分布呈偏态，但经过对数变换后成单峰对称分布的资料。

中位数和百分位数：

中位数（median）就是将一组观察值按升序或降序排列，位次居中的数，常用M表

示。

理论上数据集中有一半数比中位数小，另一半比中位数大。

中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述，也适用于开口资料的描述。

所谓开口”资料，

是指数据的一端或者两端有不确定值。

百分位数（percentile）是一种位置指标，以Px表示，一个百分位数Px将全部观察值分为两个部分，理论上有X%的观察值比Px小，有（100-X）%观察值比Px大。

故百分位数是一个界值，也是分布数列的一百等份分割值。

显然，中位数即是P50分位数。

即中位数是一特定的百分位数。

常用于制定偏态分布资料的正常值范围。

2•答：

常用来描述数据离散程度的指标有：

极差、四分位数间距、标准差、方差、

及变异系数，尤以方差和标准差最为常用。

极差（range,记为R）,又称全距，是指一组数据中最大值与最小值之差。

极差大，说明资料的离散程度大。

用极差反映离散程度的大小，简单明了，故得到广泛采用，如用以说明传染病、食物中毒等的最短、最长潜伏期等。

其缺点是：

1•不灵敏；2•不稳定。

四分位数间距（inter-quartilerange）就是上四分位数与下四分位数之差，即：

Qu—Ql,其间包含了全部观察值的一半。

所以四分位数间距又可看成中间一半观察值的极差。

其意义与极差相似，数值大，说明变异度大；反之，说明变异度小。

常用于描述偏态分布资料的离散程度。

极差和四分位数间距均没有利用所研究资料的全部信息，因此仍然不足以完整地反

映资料的离散程度。

方差（variance）和标准差（standarddeviation）由于利用了所有的信息，而得到了广泛应用，常用于描述正态分布资料的离散程度。

变异系数（coefficientofvariance,CV）亦称离散系数（coefficientofdispersion）,为标准差与均数之比，常用百分数表示。

变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。

3•答：

常用的相对数指标有：

比，构成比和率。

比（ratio）,又称相对比，是A、B两个有关指标之比，说明A为B的若干倍或百分之几，它是对比的最简单形式。

其计算公式为比二A/B

率（rate）又称频率指标，用以说明某现象发生的频率或强度。

常以百分率（%）、千分

率（%。

）、万分率（1/万）、十万分率（1/10万）等表示。

计算公式为：

率实际发生某现象的观察单位数比例基数（K）

可能发生某现象的观察单位总数

构成比（proportion）又称构成指标，它说明一种事物内部各组成部分所占的比重或

分布，常以百分数表示，其计算公式为：

100%

,缶“某一组成部分的观察单位数

构成比

同一事物内各组成部分的观察单位总数

4.答：

当比较两类事物的总率时，如果此两同类事物的内部构成，特别是某项能影响指标水平的重要特征在构成上不同，往往会高估或低估总率。

在这种情况下，直接进行两个总率的比较，会产生错误的结论。

此时，必须首先设法消除这种内部构成上的差别，才能进行比较。

统计学上将这种方法称为率的标准化（standardization

methodofrate），即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法，调整后的率为标准化率，简称为标化率。

（1）编制频数分布表并绘制频数分布图，简述这组数据的分布特征;

组段

频数

频率（%）

；累计频

数（%）

组中值

108

2.5

109.5

111~

8.33

10.83

112.5

114~

18.33

29.17

115.5

117~

31.67

60.83

118.5

120~

16.67

77.5

121.5

123'

92.5

124.5

126~

5.83

98.33

126.5

129~132

1.67

100

129.5

合计

120

100

（2）计算中位数、均数、几何均数，用何者表示这组数据的集中位置好？

答:

X3109.510112.522115.538118.520121.518124.57126.52139.5/120

=119.4135

Xglglg3109.5lg10112.5Ig22115.5lg38118.5Ig20121.5lg18124.5lg7126.5Ig2139.5/120

=119.25125

Md116.63用均数较好.

（3）计算极差、标准差，用何者表示这组数据的离散趋势好?

答:

极差：

22.62

四分位数间距：

5.915

标准差：

4.380736

用标准差表示较好

6•答：

本例频数分布为偏态分布，长尾拖向x轴正方向，故为正偏态。

适宜用中位数

表示其平均水平，中位数为4,四分位数间距为4。

7.40名麻疹易感儿童接种麻疹疫苗后一个月，血凝抑制抗体滴度如下表。

试计算平均滴度。

抗体滴度人数

41:

128

2561:

512

几

何

均

数

exp（（ln（4）+5ln（8）+16恫（16）+21联32）+71联64）+101畝128）+41联256）+51^512））/40）=128

8.答：

此医生的分析是不正确的，原因在于:

实际发生某现象的观察单位数

可能发生某现象的观察单位总数

发病率的分子为某时期内发病人数”，而被观察对象某时期内可能发病多次，所以发病人数是人次数；分母为同时期平均人口数”，而按率的定义应为同时期暴露总人数

该单位抽样检查2839名职工，其中高血压患者中，男性是178例，女性是49例,

共227例，可以计算高血压患者占接受检查所有职工的构成比为7.995773%

至于40岁以上的患者占接受检查总人数的90.3%，也是构成比；60岁以上者占接受检

查总人数的10.2%也是构成比，不能与发病率混为一谈。

关于高血压与性别有关的结论也不妥。

因为在接受检查人群中的男女内部构成比是不同的，要进行比较首先要设法消除内部构成比的差异，即就是率的标准化，然后比较。

第三章

1正态分布与标准正态分布的区别：

正态分布是一簇单峰分布的曲线，口和厅可以有任意取值；标准正态分布是一条单峰

曲线，口和6有固定的值，口=0（T=12u=（x-口）/（T二（p^）/c-*=

查标准正态分布表，得①-1）=0.1587,所以小于片c者所占的比例为15.87%

3医学参考值范围的含义：

是根据正常人的数据估计绝大多数正常人某项指标所在的范围。

选定同质的正常人作为研究对象。

所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。

确定原则：

①选定同质的正常人群作为研究对象

2控制检测误差

3判断是否分组

4单、双侧问题

5选择百分界值

6确定可疑范围

方法：

①正态分布法：

适用于服从正态分布或近似正态分布的资料

2百分位数法：

适用于不服从正态分布的资料

3对数正态分布法：

适用于对数正态分布的资料

4如果资料服从正态分布，那么双侧95%正常值范围为口土1.96如果资料不服从正态

分布，那么双侧95%正常值范围就不能用正态分布来做。

51人以下的概率：

P（x<1）=P（O）+P

（1）=C00O.2°O.810+Cio1O.21O.89=0.375

8人以上的概率：

P（X>8）=P（8）+P（9）+P（1O）=Co8O.28O.82+C1o9O.29O.81+C1o1OO.21OO.8°=7.79X05

6二项分布的应用条件：

1观察单位只能有互相对立的两种结果之一。

2已知发生某一结果的概率n不变，其对立结果的概率则为1-n

3n次试验在相同的条件下进行，且各观察单位的结果互相独立，即每个观察单位的观察结果不会影响到其他观察单位的结果。

7二项分布和正态分布之间的关系：

随着n的增大，二项分布逐渐逼近正态分布。

当nn

较大时，二项分布B（n,冗近似正态分布。

举例：

病人的治愈与不治愈，理化检验结果的阴性与阳性，个体的发病与不发病等属

于二项分布资料；某地区12岁男孩的身高，某学校同年级女生的体重等属于正态分布。

第四章

标准差

标准误

不同：

意义上：

描述一组变量值的离散程度

描述样本均数的离散称度

应用上：

1、标准差越小，说明变量值围绕均值分布越紧密，均数的代表性越好。

1、标准误越小，说明样本均数和总体均数的差异越小，用样本均数估计总体均数的可靠性越大。

2、xus估计变量值的分布范围。

2、用xtSx估计总体均数的可信区间。

与n的关系：

n越大，标准差越稳疋

n越大，标准误越小

相同：

1、都是描述变异度的统计指标

3、n—定时，同一组资料，标准差越大，标准误也越大

2a水准是在假设检验之前确定的，说明按不超过多大的误差为条件作结论，是犯I型错误的最大风险，是事前概率；P值是指由H。

所规定的总体作随机抽样，获得等于大

于现有样本获得的检验统计量值得概率。

标明以多大的误差拒绝Ho,是事后概率。

3①配对设计的差值的总体均数的可信区间表达公式：

dt,n1Sr

ni1sin21911

n1n22n1m

2可以用可信区间回答假设检验的问题。

可信区间估计与假设检验时统计学中两种重

要的、独特的思维方式，它们在原理上相通，均基于抽样误差理论，只是考虑问题的角度不同。

例如：

样本均数与总体均数的比较，用可信区间的估计方法，观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数，即可推断该样本是否来自已知均

数的总体；用假设检验的方法，先假设样本均数代表的总体均数等于某已知的总体均数，再判断样本提供的信息是否支持这种假设。

第一类错误的概率

用a表示，第二类错误的概率用

卩表示。

a越大，卩越小；反之,

a越小，卩越大。

Ho,只可能犯第二

4拒绝实际上成立的Ho,这类弃真”的错误称为I型错误或第一类错误；不拒绝实

际上是不成立的H。

，这类存伪”的错误称为□型错误或第二类错误

拒绝Ho,只可能犯第一类错误，不可能犯第二类错误；不拒绝类错误，不可能犯第一类错误

由于假设检验中可能犯第一类错误或第二类错误，所以结论不能绝对化

5t检验的应用条件：

独立性、正态性、方差齐性。

u检验的应用条件：

适用于大样本资料。

t检验和U检验的关系：

随自由度的增加，t分布逐渐趋向于标准正态分布。

因此U

检验是t检验的一种近似检验方法。

当自由度大于50时，近似程度比较满意。

6假设检验的意义就是分辨所研究的样本是否分别属于不同的总体，并对总体做出适当

的结论。

假设检验应注意的问题：

1要有严密的抽样研究计划：

要保证样本是从同质总体中随机抽取，除了对比的因

素外，其他影响结果的因素应一致。

2选用的假设检验方法应符合应用条件。

3结论不能绝对化。

4正确理解差别有无显著性的统计意义：

差别有统计意义或有显著性，指我们有很大的把握认为原假设不成立，并非是说它们有较大差别；差别无统计学意义或无显著性，我们只是认为以很大的把握拒绝原假设的理由还不够充分，并不意味着我们很相信它。

5统计学意义与其他专业上的意义不同。

7Ho：

矽肺患者的血红蛋白与健康人相同，即口=qi

H仁矽肺患者的血红蛋白与健康人不同，即口为口

t=In

_|12.5914.02|

1.63/Jl0

2.7743

v=10-1=9,t0.05,9=2.262

，接受Hi,为矽肺患者的血红蛋白与健康人不同。

差别有统计学意义，可以认

a=0.05

v=n+n2-2=20-2=18,t°.05,18=2.101vt,p>0.05，不拒绝H°,差别无统计学意义，尚不能认为新药与常规药物的疗效不同。

9⑴甲药:

H0：

甲药无效，即pd=0

H仁甲药有效，即pd0

a=0.05

td=5.2372

-n

v=101=9,t0.05,9=2.262

，接受H1,差别有统计学意义，可以认为甲药有效。

乙药：

H0：

乙药无效，即p=0

H1:

乙药有效，即p0

a=0.05td=5.3033

-；'n

v=101=9,t0.05,9=2.262

⑵H0：

甲乙两药的疗效没有差别，即p=p

H仁甲乙两药的疗效有差别，即

vni+n2-2=20-2=18,to.o5,i8=2.1O1>t,p>0.05，不拒绝Ho,差别无统计学意义，可以认为甲乙两药的疗效没有差别。

1不满足正态近似条件，所以采用直接计算概率法。

Ho：

加维生素C的治愈率与不加相同，即n=0=0.6

H1:

加维生素C的治愈率高于不加维生素C,即n>n

a=0.05

P（XW8）=1P（X\9）=1P（X=9）-P（X=10）=1-C109*0.69*0.41-C1010*0.610*0.40=0.9536>0.05

不拒绝H。

，差别无统计学意义，可以认为加维生素C的治愈率与不加相同。

2满足正态近似条件，采用正态近似法。

H0：

经健康教育后的高血压患病率与以前相同，即n=0=0.6

H1:

经健康教育后的高血压患病率比以前降低，即n

单侧a=0.05

4.9453536

u>U0.05,单侧=1.64

p<0.05,拒绝H°,接受H1，差别有统计学意义，可以认为经健康教育后的高血压患病率与以前有差别。

3①建立检验假设和确定检验水准

H0：

男女大学生HBV感染对其心理影响相同，即n=n

H1:

男女大学生HBV感染对其心理影响不同，即

检验水准a=0.05

2计算检验统计量

X=（ad-bd）2*n/（a+b）（c+d）（a+c）（b+d）=（250*213-246*320）/（250+320）（246+213）（250+246）（320+213）=9.651

v=1

3确定p值

查X届值表，得p<0.05

4统计推断

按a=0.05水准，拒绝Ho,接受H1，差别有统计学意义，可以认为HBV感染对不同

性别的大学生在心理行为方面的影响不同。

4①建立检验假设和确定检验水准

H0：

两组的治愈率相等，即冗=疋

Hi:

两组的治愈率不等，即nMn

检验水准a=0.05

②Fisher精确概率法

骨口.序号

治愈人数

未愈人数

缓解率p1与

|p1-p2|

概率P（i）

1.000

0.867

0.133

0.941

0.741

0.200

0.882

0.615

0.267

0.824

0.491

0.333

0.765

0.365

0.400

0.706

0.239

0.467

0.647

0.114

0.533

0.588

0.012

0.600

0.529

0.138

0.667

0.471

0.262

0.733

0.412

0.388

0.800

0.353

0.514

0.867

0.294

0.639

0.933

0.235

0.765

1.000

P（i）=0.280>0.05

③统计推断

按a=0.05水准，不拒绝Ho，差别无统计学意义，尚不能认为两组治愈率有差别

5①建立检验假设和确定检验水准

Ho:

治疗三种类型病人的有效率相同，即ni=n2=n3

Hi:

治疗三种类型病人的有效率不等或不全相等。

检验水准a=005

②计算检验统计量

2AiTi

nRnC

；286*（712

+272+1042

+422+242

+182

-1）=3.6389

199*98

87*98199*146

87*146199*42

87*42

③确定p值

查X界值表，

得p>0.05

④统计推断

按a=0.05水准，不拒绝Ho,拒绝Hi，差别无统计学意义，尚不能认为治疗三种类型病人的有效率有差别。

6①建立检验假设和确定检验水准

Ho：

该三种人群有相同的血型分布，即n=n=n

Hi:

该三种人群的血型分布不等或不全相等。

检验水准a=0.05

②计算检验统计量

nRnc

=9312*（6792+1342+……+4352-1）=71.180

3720*1883788*1883546*6522

3确定p值

查X界值表，得p<0.05

4统计推断

按a=0.05水准，拒绝H。

，接受H1,差别有统计学意义，可以认为三种人群的血型分布不等或不全相等。

7①建立检验假设和确定检验水准

H0：

两种检验方法的结果相同，即总体B=C

H1：

两种检验方法的结果不同，即总体B^C

检验水准a=0.05

②计算检验统计量

=1.1364

③确定p值

查X界值表，得p>0.05

4统计推断

按a=0.0冰准，不拒绝H。

，差别无统计学意义，尚不能认为两种免疫学方法的阳性

率有差别。

第八章

1答：

适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不

明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。

2答：

属于非参数检验。

因为参数检验针对的是总体变量服从某种分布，即具有某个已知的函数形式，而其中的参数是未知的，统计分析的目的就是对这些未知参数进行估计或检验。

但本题即使ni>10，n2—ni>10时采用的是u检验，但它比较的是分布而不是参数，所以它还是属于非差数检验。

3答：

有序分类资料可做秩和检验、等级相关分析。

4答：

（一）建立检验假设

Ho:

两种药的治疗效果总体分布相同;Hi:

两种药的治疗效果总体分布不同;

a=0.05;

（2）编秩和求秩和T

两组治疗心绞痛疗效比较

疗效

（1）

人数

合计

（4）

秩次范围

（5）

平均秩次

（6）

秩和

缓释片

（2）

普通片

（3）

缓释片

（7）

普通片

（8）

显效

1—97

3038

1715

有效

98—146

122

2196

3782

无效

147—165

156

780

2184

加重

166—172

169

507

676

合计

ni=88

n2=84

172

6521

8357

（3）计算检验统计量T

由于ni>n2,则取n2组的秩和为T，故检验统计量T=T2=8357。

（4）确定P值，做出推断结论

由于n2>10,T分布已接近均数为ni（N+1）/2，方差为nin2（N+1）/12的正态分布，按书上式（8.3）（8.4）求出Uc=3.7439

uc>2.56,P<0.01,按a=0.05水准拒绝Ho,接受Hi,差异有统计学意义。

可以认为缓释片和普通片治疗心绞痛的疗效有差别。

5答：

（一）建立检验假设

H0：

治疗前后HCG值的总体分布相同；

Hi：

治疗前后HCG值的总体分布不同；

a=0.05;

（二）计算检验统计量T

肿瘤患者灌注治疗前后HCG值

病例号

治疗前

治疗后

差值

秩次

（1）

（2）

（3）

（4）

（5）

1280000

210000

1070000

75500

3300

72200

12450

2210

10240

1500000

1499907

10000

2500

7500

9700

1203

8497

15588

4825

10763

4223

914

3309

T+=36T-=0

本例T+=36，「二0,任取T+或（T—）作为检验统计量T,本例取T+=36。

（三）确定P值，做出推断结论

由于n<50，查附表9，T界值表。

本例n=8,T=36,查附表9,得a=0.05时的T界值为5—31,T在双侧界值范围外，故PV0.05。

按a=0.05水准拒绝H。

，接受Hi，差异有统计学意义。

可以认为肿瘤患者灌注治疗前后HCG值有差别。

6答：

（一）建立检验假设

H0：

三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同；

Hi三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同；

a=0.05;

（二）计算检验统计量T

卵巢功能异常患者血清中促黄体素的含量

卵巢发育不良

秩次

丘脑性闭经

秩次

垂体性闭经

秩次

（1）

（2）

展开阅读全文