统计学复习题全面.docx
《统计学复习题全面.docx》由会员分享,可在线阅读,更多相关《统计学复习题全面.docx(90页珍藏版)》请在冰豆网上搜索。
统计学复习题全面
一、两组计量资料比较(20分)
题干由试题和相关SPSS分析结果组成
1、根据资料选择正确的统计检验方法;
2、请写出假设检验步骤:
检验假设,检验水准,根据SPSS结果选择正确的统计量值和P值、并作出结果判断。
3、说明:
正态性检验提供K-S检验结果;方差齐性检验提供Levene’s检验结果。
正态性检验和方差齐性检验不必列出检验步骤,作出判断即可。
可能包括的内容:
●配对设计的两样本均数比较的t检验
●成组设计的两样本均数比较的t检验
●成组设计的两样本均数比较的近似t检验
●配对设计的两样本比较的符号秩和检验
●成组设计的两样本比较的秩和检验
举例:
例2.17某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。
X1:
3.145.837.354.624.055.084.984.224.352.352.892.165.555.944.405.353.804.12
X2:
4.127.893.246.363.486.744.677.384.954.085.344.276.544.625.925.18
【答案】jszb
1、此资料是计量资料,研究设计为完全随机设计(又称成组设计);
2、根据正态性单样本K-S检验结果:
P值分别为0.992、0.987,均大于0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:
F=0.225、P=0.638,P>0.05,因此两样本总体方差齐性;
4、根据以上三点,统计方法选用成组设计两样本t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:
u1=u2,即两组的总体均数相同
H1:
u1≠u2,即两组的总体均数不同
α=0.05
(2)计算检验统计量t值:
ν=18+16-2=32
t=-1.818
(3)确定P值,做出统计推断:
P=0.078>0.05
根据α=0.05的检验水准,不拒绝H0,差异无统计学意义。
因此尚不能认为慢性支气管炎患者和健康人尿17酮类固醇排出量有差别。
【06真题】
一、某医院外科用两种手术治疗肝癌患者18例,患者采用随机方法分配到不同手术组,每例手术后生存月数如下表,问两种手术方法的术后生存月数有无差别?
(20分)
甲法2344556810
乙法589111212131519
要求:
请写出上述题目假设检验过程:
检验假设、检验水准、统计检验方法、检验统计量值和P值,并作出结果判断(正态性检验和方差齐性检验不必列出检验步骤,作出判断即可)
【答案】jszb
1、此资料是计量资料,研究设计为完全随机设计(又称成组设计);
2、根据正态性单样本K-S检验结果:
P值分别为0.855、0.995,均大于0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:
F=1.161、P=0.297,P>0.05,因此两样本总体方差齐性;
4、根据以上三点,统计方法选用成组设计两样本t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:
u1=u2,即两组的总体均数相同;H1:
u1≠u2,即两组的总体均数不同;α=0.05
(2)计算检验统计量t值:
ν=9+9-2=16t=-3.986
(3)确定P值,做出统计推断:
P=0.001<0.05
根据α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。
因此认为两种手术方法的术后生存月数有差别。
配对设计t检验【答案模板】jszb
1、此资料是计量资料,研究设计为配对设计;
2、根据正态性单样本K-S检验结果:
P值分别为?
,大于0.1,因此差值服从正态分布;
3、根据以上两点,统计方法选用配对设计两样本t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:
ud=0,即两组的总体均数相同;H1:
ud≠0,即两组的总体均数不同;α=0.05
(2)计算检验统计量t值:
ν=n-1=?
t=?
(3)确定P值,做出统计推断:
P=?
<0.05根据α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。
因此认为两种?
有差别。
P=?
>0.05根据α=0.05的检验水准,不拒绝H0,差异无统计学意义。
因此尚不能认为两种?
有差别。
【05真题】【04真题】
一、随机抽样调查了某地绣品厂和蓄电池厂工人各10名,测定其血中锌卟啉含量(µg/100ml)如下表。
问这两个工厂工人血中锌卟啉含量有无差别?
(20分)某地绣品厂和蓄电池厂工人血中锌卟啉含量(µg/100ml)结果
绣品厂12.142.90.00.011.125.00.026.39.125.0
蓄电池厂72.575.328.360.070.573.160.020.020.032.6
要求:
请写出上述题目假设检验过程:
检验假设、检验水准、统计检验方法、检验统计量值和P值,并作出结果判断(正态性检验和方差齐性检验不必列出检验步骤,作出判断即可)。
SPSS软件有关分析结果见附页。
【答案1近似t检验】jszb
1、此资料是计量资料,研究设计为完全随机设计(又称成组设计);
2、根据正态性单样本K-S检验结果:
P值分别为0.886、0.575,均大于0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:
F7.454、P=0.014,P<0.05,因此两样本总体方差不齐;
4、根据以上三点,统计方法选用成组设计两样近似t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:
u1=u2,即两组的总体均数相同
H1:
u1≠u2,即两组的总体均数不相同
α=0.05
(2)计算检验统计量t值:
t=-4.013
ν=14.960
(3)确定P值,做出统计推断:
P=0.001<0.05
根据α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。
因此认为两个工厂工人血中锌卟啉含量有差别。
【答案2】成组设计秩和检验jszb
1、此资料是计量资料,研究设计为完全随机设计(又称成组设计);
2、根据正态性单样本K-S检验结果:
P值分别为0.886、0.575,均大于0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:
F7.454、P=0.014,P<0.05,因此两样本总体方差不齐;
4、根据以上三点,统计方法选用两独立样本比较的Wilcoxon符号秩和检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:
两个工厂工人血中锌卟啉含量总体分布相同;
H1:
两个工厂工人血中锌卟啉含量总体分布不同;
α=0.05
(2)计算检验统计量T值:
①统一编秩;②求秩和;③确定统计量T值。
T=65或145
n1=10
n2-n1=0
(3)确定P值,做出统计推断:
查T界值表得P<0.005
根据α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。
因此认为两个工厂工人血中锌卟啉含量有差别。
配对设计秩和检验【答案模板】jszb
1、此资料是计量资料,研究设计为配对设计;
2、根据正态性单样本K-S检验结果:
P值分别为?
,小于0.1,因此差值不服从正态分布;
3、根据以上两点,统计方法选用配对秩和检验,既Wilcoxon符号秩和检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
(2)计算检验统计量T值:
①求差值D;②编秩;③求秩和;④确定统计量T值。
(3)确定P值,做出统计推断:
【知识点解析】Jszb
【正态性检验】
1、图示法:
概率图(P-Pplot)、分位数图(Q-Qplot)
2、计算法:
偏度系数γ1;峰度系数γ2
3、K-S检验:
属于单样本非参数检验
K-S检验(Kolmogorov-Smirnov检验):
一般作为小样本的正态性检验方法
K-S检验:
检验频数分布的正态性检验
单样本K-S检验的原假设是:
样本来自得总体与指定的理论分布无显著差异
SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,包括:
卡方检验、二项分布检验、K-S检验、变量值随机性检验
二、单样本K-S检验
单样本K-S检验(1-sampleK-Stest)是以两位苏联数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的。
K-S检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。
设
是一个n次观察的随机样本观察值的累积概率分布函数,即经验分布函数;
是一个特定的累积概率分布函数,即理论分布函数。
定义
,显然若对每一个x值来说,
与
十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。
K-S检验主要考察的是绝对差数
中那个最大的偏差,即利用下面的统计量作出判断。
(8.2)
K-S检验的步骤为:
1.提出假设:
,
2.计算各个D,找出统计量
3.查找临界值:
根据给定的显著性水平α和样本数据个数n,查《单样本K-S检验统计量表》可以得到临界值
(单样本K-S检验统计量表见附录六)。
4.作出判定:
若
≥
,则在α水平上,拒绝
;若
<
,则不能拒绝
;
【例8.3】随机抽取100名生产线上的工人,调查他们的日产量,资料情况如下表,判断生产线上工人的日产量是否为正态分布?
(α=0.05)
工人日产量
500以下
500-540
540-580
580-620
620-640
640以上
合计
组中值
480
520
560
600
640
680
—
人数
6
23
27
19
15
10
100
【解】
:
服从正态分布,
:
不服从正态分布。
根据所给的资料,借助Excel进行相关的计算,见图8.2:
图8.2
统计量的计算表
查表得
,
由于
=0.0430<
,所以,不能拒绝
,即生产线上工人的日产量服从正态分布。
(1)完全随机设计的两样本均数比较(两独立样本t检验)
【IndependentSampleT】又称成组t检验
(2)配对设计的两样本均数比较例【PairedSampleTtest】配对样本的t检验
完全随机设计(两独立样本)的秩和检验
配对设计的秩和检验
问题:
若方差不齐,将如何处理?
(1)采用适当的变量变换,使达到方差齐性;
(2)采用秩和检验;
(3)采用近似法tˊ检验:
①Cochran&Cox法
②Satterthwaite法
二、两样本率比较(X2检验或确切概率法)(20分)
题干由试题和相关SPSS分析结果组成
1、根据资料选择正确的统计检验方法;
2、列出计算表;
3、请写出假设检验步骤:
检验假设,检验水准,列出计算公式,根据SPSS结果选择正确的统计量值和P值、并作出结果判断。
1、成组设计四格表资料2检验
四格表χ2检验的条件:
n:
为总例数;A:
为(所有各各中的)实际数;T:
为(所有各各中的)理论数。
n,T。
可先求四格表中最小的理论数。
(1)T5,而且n40---------直接用2检验
(2)1T5,而且n40------校正2检验
(3)T1或n40-----------确切概率法
注意:
上述条件是以理论数为依据,而非实际数
检验的适用条件及四格表专用公式:
表3.5两种药物治疗十二指肠球部溃疡效果
处理愈合未愈合合计愈合率(%)
呋喃硝胺组
甲氰咪胍组
合计
54(48.22)8(13.78)6287.10
44(49.78)20(14.22)6468.75
982812677.78
四格表χ2检验——Pearsonχ2
某医学院随机抽查四年级和五年级学生的近视眼患病情况如下表,问两个年级的近视眼患病率有无差别?
四年级和五年级学生的近视眼患病率比较
年级
检查人数
近视人数
近视率(%)
四年级
28
2
7.14
五年级
14
5
35.71
四年级和五年级学生的近视眼患病患病率比较计算表
年级
近视人数
无近视人数
合计
四年级
2
26
28
五年级
5
9
14
合计
7
35
42
四格表校正χ2检验
例:
某防疫站观察当地的一个污水排放口,在高温季节和低温季节水样的伤寒菌检出情况,资料如下表,问两个季节污水的伤寒菌检出率有无差别?
高低温季节污水中伤寒菌的检出率
季节气温
阳性水样数
阴性水样数
合计
阳性率(%)
高
1(4)
11(8)
12
8.33
低
7(4)
5(8)
12
58.33
合计
8
16
24
33.33
四格表确切概率法:
表3.5两种药物治疗十二指肠球部溃疡效果
处理愈合未愈合合计愈合率(%)
呋喃硝胺组
甲氰咪胍组
合计
54(48.22)8(13.78)6287.10
44(49.78)20(14.22)6468.75
982812677.78
2、配对设计四格表资料2检验
已确诊肝癌患者100人,每个患者分别用甲、乙两法检测AFP,结果如下表。
问甲、乙两法AFP阳性检出率有无差别?
甲、乙两法AFP阳性检出情况
甲法
乙法
合计
+
-
+
60
20
80
-
10
10
20
合计
70
30
100
【04真题】
2、研究盐酸丁咯地尔改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照得结果如下表。
问盐酸丁咯地尔是否具有改善缺血组织的皮肤微循环作用?
(15分)
盐酸丁咯地尔改善缺血组织的皮肤微循环状况
处理
例数
改善数
改善率(%)
盐酸丁咯地尔组
20
15
75.00
安慰剂组
16
2
12.50
要求:
请写出上述题目假设检验过程:
检验假设、检验水准、计算表、统计检验方法、检验统计量值和P值,并作出结果判断。
【06真题】五、某医院收治了186例重症乙型脑炎患者,随机分成两组,分别用同样的方法治疗,但其中一组加一定量的人工牛黄,治疗结果如下所示,问加人工牛黄是否增加该方剂的疗效?
(20分)
要求:
请写出上述题目假设检验过程:
检验假设、检验水准、计算表、检验统计量的计算公式、检验统计量值和P值,并作出结果判断。
【05真题】
五、为观察药物A、B治疗某病的疗效,某医生将100例该病患者随机分成两组,一组40人,服A药;另一组60人,服B药。
结果发现:
服A药的40人中有30人治愈;服B药的60人中有11人治愈。
问A、B两药对该病的疗效有无差别?
(20分)
要求:
请写出上述题目假设检验过程:
检验假设、检验水准、计算表、统计检验方法、检验统计量值和P值,并作出结果判断。
【答案】jszb
1、此资料是按服A、B药疗效(治愈、未治愈)分类的二分类资料,即计数资料。
2、将100例该病患者随机分成两组,属于完全随机设计方案。
2、3、该资料的目的是通过两样本率的比较来推断它们分别代表的两总体率有无差别,是成组设计两样本率比较,因此,统计方法选用成组设计四格表资料2检验(Chi-SquareTest)。
4、列出计算表:
处理
治愈
未治愈
合计
治愈率(%)
A药
30(16.4)a
10(23.6)b
40(a+b)
75.0
B药
11(24.6)c
49(35.4)d
60(c+d)
18.3
合计
41(a+c)
59(b+d)
100(n)
41.0
5、假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:
A药和B药的治愈率相同,即π1=π2=41.0%
H1:
A药和B药的治愈率不同,即π1≠π2
α=0.05
(2)计算检验统计量2值:
理论数(T)值的计算:
依据公式
计算T值,并添入计算表中;
由于总例数n=100;最小T值=16.4;
满足T5,而且n40条件,因此直接用2检验
ν=(2-1)(2-1)=1
(3)确定P值,做出统计推断:
根据SPSS软件有关分析结果,2=10.550,ν=1
P=0.001<0.05
根据α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。
因此认为A药和B药的治愈率有差别。
【知识点解析】Jszb
1、成组设计四格表资料2检验
2、配对设计四格表资料2检验
三、方差分析(15分)
提供某一实验资料,可能有如下要求:
1.指出该实验属何种设计(方差分析);
2.按照题义,把总变异分成几个部分,并说明各部分的意义。
并计算各部分的自由度。
3.提供SPSS的方差分析表,作出正确的结论。
4.若方差分析结果有统计学意义,进一步比较的方法选择。
表5.1三种方案治疗后血红蛋白增加量(g/L)
A
B
C
24
20
20
36
18
11
25
17
6
14
10
3
26
19
0
34
24
-1
23
4
5
SS总=SS组间+SS组内
表5.3三种方法治疗后血红蛋白增加量(g/L)
区组
A疗法
B疗法
C疗法
1
16
18
18
2
15
16
20
3
19
27
35
4
13
13
23
5
11
14
17
6
10
8
12
7
5
3
8
8
-2
-2
3
SS总=SS处理+SS配伍+SS误差
表5.612名病人用A、B两法治疗的血压下降(kPa)
阶段
病
人
编
号
1
2
3
4
5
6
7
8
9
10
11
12
Ⅰ
B
B
A
B
A
A
A
A
B
B
B
A
3.07
1.33
4.40
1.87
3.20
3.73
4.13
1.07
1.07
2.27
3.47
2.40
Ⅱ
A
A
B
A
B
B
B
B
A
A
A
B
2.80
1.47
3.73
3.60
2.67
1.60
2.67
1.73
1.47
1.87
3.47
1.73
合计
5.87
2.80
8.13
5.47
5.87
5.33
6.80
2.80
2.54
4.14
6.94
4.13
SS总=SS阶段+SS疗法+SS个体+SS误差
表5.12A、B两药治疗后病人红细胞增加数(1012/L)
A药
B药
A+B药
不用药
1.3
0.9
2.1
0.8
1.2
1.1
2.2
0.9
1.1
1.0
2.0
0.7
SS总=SSA+SSB+SSAB+SS误差
随机区组设计资料的方差分析表:
【06真题】
二、研究酵解作用对血糖浓度的影响,某医生从8名健康人中抽取了血液并制备成血滤液。
每一个受试者的血滤液又分成4份,然后随机把4份血滤液分别放置0、45、90、135分钟测定其中血糖浓度。
(15分)
问:
1、指出该实验属何种设计
2、按照题义,把总变异分成几个部分,并说明各部分的意义
3、欲分析放置不同时间的血滤液所含血糖浓度间总的来讲有无变化,经计算,得检验统计量值为77.31,请确定P值,并作出判断。
4、若进一步作两两比较,以“放置0分”组为共同对照,宜选择何检验方法?
【答案】jszb77页
1、该实验属于随机区组设计;
2、总变异(SS总)可以分解为三个部分:
处理组间变异(SS处理)、区组间变异(SS区组)和误差(SS误差):
SS总:
反应所有观察值之间的变异;
SS处理:
由处理因素的不同水平作用和随机误差产生的变异;
SS区组:
由不同区组作用和随机误差产生的变异;
SS误差:
完全由随机误差产生的变异
3、假设检验过程如下:
(1)建立假设检验,确立检验水准:
对于处理间:
H0:
四个不同时间血糖浓度的总体均数相等,即μ1=μ2=μ3=μ4
H1:
四个总体均数不等或不全相等
对于区组间:
H0:
八个区组的总体均数相等,即μ1=μ2=……μ8
H1:
八个区组的总体均数不等或不全相等
检验水准均取α=0.05
(2)计算检验统计量F值:
F处理=MS处理/MS误差=0.9681/0.0125=77.31
F区组=MS区组/MS误差=0.3569/0.0125=28.552
V总=N-1=32-1=31
V处理=k-1=4-1=3
V区组=b-1=8-1=7
V误差=(k-1)(b-1)=3×7=21
推断处理间的差别,按v1=3,v2=21查F界值表,得F0.005(3,21)=3.07,F0.01(3,21)=4.87,P<0.01;
推断区组间的差别,按v1=7,v2=21查F界值表,得F0.05(7,21)=2.49,F0.01(7,21)=3.64,P<0.01。
(3)确定P值,做出统计推断:
按α=0.05检验水准皆拒绝H0,接受H1,可认为放置时间长短会影响血糖浓度且不同受试者的血糖浓度亦有差别。
但尚不能认为任两个不同放置时间的血糖浓度总体均数皆有差别,必要时可进一步作两两比较的q检验。
C=(ΣX)2/N=(169.56)2/32=898.45605
SS总=ΣX2-C=904.1214-898.45605=5.66535
V总=N-1=32-1=31
V处理=k-1=4-1=3
V区组=b-1=8-1=7
V误差=(k-1)(b-1)=3×7=21
SS误差=SS总-SS处理-SS区组=5.66535-2.90438-2.49800=0.26297
MS处理=SS处理/v处理=2.90438/3=0.9681
MS区组=SS区组/v区组=2.49800/7=0.3569
MS误差=SS误差/v误差=0.26297/21=0.0125
【05真题】
六、为研究雌激素对子宫发育的作用,用四个种系的未成年雌性大白鼠各3只,每只按一定剂量注射雌激素,至一定时间取出子宫并称重,结果如下表所示:
(15分)
问:
1.上述试验属何种试验设计?
按照题义,把总变异分成哪几个部分?
并说明各部分的意义。
SPSS计算结果,作出正确