研究生统计与科研方法复习补.docx
《研究生统计与科研方法复习补.docx》由会员分享,可在线阅读,更多相关《研究生统计与科研方法复习补.docx(23页珍藏版)》请在冰豆网上搜索。
![研究生统计与科研方法复习补.docx](https://file1.bdocx.com/fileroot1/2023-4/18/37d4501a-e770-431b-8690-ee68af65fa4c/37d4501a-e770-431b-8690-ee68af65fa4c1.gif)
研究生统计与科研方法复习补
一、选择题
略
二、简答题
1.医学参考值范围与区间估计的区别与作用分别是什么?
2.以样本均数与总体均数比较为例说明区间估计与假设检验区别与联系。
3.线性相关与回归的区别与联系。
4.t检验与方差分析的区别与联系?
5.某医生在一个有1000名员工的企业,随机调查了200名员工,其中50人患有职业病,其中男40人、女10人,得相对数是80%与20%,由此得结论男性更易患职业病。
此结论是否正确?
请陈述理由。
6.参数检验与非参数检验的区别?
7.计算相对数的注意事项是什么?
8.两样本均数比较时为什么要做统计检验?
9.假设检验的两类错误是什么?
其含义是什么?
如何控制?
10.将18名原发性血小板减少症患者按年龄相近的原则配为6个区组,每个区组中的3名患者随机分配到A、B、C三个治疗组中,治疗后测定血小板变
化量。
经初步计算,
据的方差分析表。
SS总
180,SS治疗组
120,SS误差
10。
试列出该实验数
11.以t检验和秩和检验为例,说明参数检验与非参数检验的优缺点。
12.某研究者调查了40名腔隙性脑梗塞患者,其中20例单发,20例多发,记录了与脑梗塞是否多发的可能有关的危险因素情况,其中吸烟量定义如下;
不吸烟=0,<10支/天=1,>=10支=3。
数据见下表
40名腔隙性脑梗塞患者的调查数据
性别
吸烟量
患糖尿病
胆固醇
甘油三脂
低密脂蛋白
高密脂蛋白
单发多发
x1
x2
x3
x4
x5
x6
x7
y
0
1
1
5.65
2.34
3.61
1.98
0
1
3
0
6.23
3.89
2.11
.99
0
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
1
2
1
4.14
.92
2.61
1.23
1
0
0
0
5.09
2.41
2.96
1.03
1
问:
1)说明吸烟量、低密脂蛋白、单发多发、胆固醇、患糖尿病等指标的变量类型?
2)假设低密脂蛋白、高密脂蛋白服从正态分布,胆固醇、甘油三脂服从偏态分布,问用什么方法检验单发与多发在高密脂蛋白、吸烟量、性别三个指标上的差异?
3)用什么方法分析脑梗塞是否是影响多发的可能有关因素?
4)用什么方法分析影响低密脂蛋白多少的有关因素?
5)用什么方法分析低密脂蛋白与甘油三脂之间的关联?
13.某研究者调查了80名65岁以上的老人,调查数据资料如下表,其中吸烟量定义如下;不吸烟=0,<10支/天=1,>=10支=2。
80名糖尿病患者的调查数据
性别
吸烟量
患糖尿病
胆固醇
甘油三脂
低密脂蛋白
高密脂蛋白
饮酒否
x1
x2
x3
x4
x5
x6
x7
x8
0
1
1
5.65
2.34
3.61
1.98
0
1
3
0
6.23
3.89
2.11
.99
0
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
1
2
1
4.14
.92
2.61
1.23
1
0
0
0
5.09
2.41
2.96
1.03
1
问:
1)说明吸烟量、低密脂蛋白、饮酒否、胆固醇四个指标的变量类型?
2)假设低密脂蛋白、高密脂蛋白服从正态分布,胆固醇、甘油三脂服从偏态分布,问用什么方法检验患糖尿病与不患糖尿病人在低密脂蛋白、吸烟量、饮酒上的差异?
3)用什么方法分析是否患糖尿病的可能有关因素?
4)用什么方法分析影响低密脂蛋白多少的有关因素?
5)用什么方法分析高密脂蛋白与甘油三脂之间的关联?
13.某研究者收集了60名呼吸道疾病患者,随机分两组。
其中30例服用新药,30例服用常规药物,记录了WBC及与其可能有关的因素情况,经半个月治疗后,再测这些患者的WBC,数据见下表。
(本题共20分)
其中:
吸烟量定义(不吸烟=0,<20支/天=1,>=20支=2)
药物定义(药物=1为新药药物=0为常规药物)饮酒否饮酒否=1为饮酒饮酒否=0为不饮酒
60名呼吸道疾病患者的实验数据
药物吸烟量
x1x2
饮酒否
x3
N(中性)
x4
PLT
x5
治疗前WBC
x6
治疗后WBC
y
0
1
1
75.65
22.34
10.8
8.2
1
2
0
46.23
33.89
11.1
8.6
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
┇
1
2
1
54.14
29.92
10.5
9.1
0
0
0
65.09
32.41
9.9
7.2
问:
1)说明吸烟量、WBC、饮酒否三个指标的变量类型?
2)假设N(中性)、治疗后WBC服从正态分布,治疗前WBC、PLT服从偏态分布,问用什么方法进行如下分析:
①不同用药组N(中性)的差异?
写出检验公式。
②新药组在治疗前WBC与治疗后WBC上的差异?
写出检验公式。
③描述PLT与治疗后WBC的最佳统计指标分别是?
3)用什么方法分析影响治疗后WBC高低的可能有关因素?
4)用什么方法分析两种药物的治疗疗效?
写出检验公式。
三、随机化题
1.用下列随机排列表,将26名门诊病人随机分配到A、B两个实验组,请写出分组过程与结果。
30个自然数的随机排列
0123456789
0
20
12
05
03
26
21
17
09
24
19
10
14
06
22
11
28
29
27
30
08
02
20
15
18
01
25
16
04
07
13
10
23
2.用下列随机排列表,将27名门诊病人随机分配到A、B、C三个实验组,请写出分组过程与结果。
30个自然数的随机排列
0
1
2
3
4
5
6
7
8
9
0
20
12
05
03
26
21
17
09
24
19
10
14
06
22
11
28
29
27
30
08
02
20
15
18
01
25
16
04
07
13
10
23
3.用下列随机排列表,将28只老鼠随机分配到实验组(A)与对照组(B)中,请写出分组过程与结果。
(10分)
30个自然数的随机排列
0
1
2
3
4
5
6
7
8
9
0
20
12
05
03
26
21
17
09
24
19
10
14
06
22
11
28
29
27
30
08
02
20
15
18
01
25
16
04
07
13
10
23
四、计算结果分析题。
(一)某医师为研究A、B两药的疗效,随机将门诊病人40名分成两组,分别记录两个观察指标的值,结果如下:
A组B组
吞噬率退热时间吞噬率退热时间
46257636
56307740
┇┇┇┇
751488864
某统计师采用SPSS软件进行了分析,分析结果如下,根据所给结果回答如下问题。
1.A、B两组两个指标是否均服从正态分布?
并说明理由?
2.给出A、B两组两个指标的统计描述。
3.A、B两组两个指标是否具有差异?
并说明理由?
4.两个指标是否具有相关性?
请给出统计描述,并说明理由?
组别=A药组别=B药
Statisticsa
退热时间吞噬率
Statisticsa
退热时间吞噬率
N
Valid
20
20
N
Valid
20
20
Missing
0
0
Missing
0
0
Mean46.3000
67.3500
Mean
72.4500
69.0000
Skewness3.023
.489
Skewness
2.346
.824
Std.ErrorofSkewness
.512
.512
Std.ErrorofSkewness
.512
.512
Kurtosis
10.102
1.494
Kurtosis
4.770
.269
Std.ErrorofKurtosis
.992
.992
Std.ErrorofKurtosis
.992
.992
Percentiles
25
32.7500
61.7500
Percentiles
25
45.0000
60.5000
50
39.0000
67.0000
50
56.0000
69.5000
75
46.0000
71.0000
75
63.0000
75.0000
a.组别=A药
a.组别=B药
IndependentSamplesTest
Levene'sTestforEqualityofVariances
t-testforEqualityofMeans
F
Sig.
t
df
Sig.(2-tailed)
退热时间
Equalvariancesassumed
3.810
.058
-1.901
38
.065
吞噬率
Equalvariancesnotassumed
EqualvariancesassumedEqualvariancesnotassumed
-1.90128.067.068
1.412.242-.45038.655
-.45035.778.655
ExactSig.
[2*(1-tailedSig.)]
TestStatisticsb
Mann-WhitneyU
83.000
191.500
WilcoxonW
293.000
401.500
Z
-3.168
-.230
Asymp.Sig.(2-tailed)
.002
.818
退热时间吞噬率
aa
.001.820
退热时间
吞噬率
Correlations
退热时间吞噬率
a.
PearsonCorrelation
1
.033
Sig.(2-tailed)
.
.840
N
40
40
PearsonCorrelation
.033
1
Sig.(2-tailed)
.840
.
N
40
40
Notcorrectedforties.
b.GroupingVariable:
组别
Spearman'srho
退热时间
Correlations
CorrelationCoefficient
退热时间
1.000
吞噬率
.219
Sig.(2-tailed)
.
.175
N
40
40
吞噬率
CorrelationCoefficient
.219
1.000
Sig.(2-tailed)
.175
.
N
40
40
(二)某医师为研究A、B、C两药的疗效,随机将门诊病人60名分成两组,分别记录两个观察指标(吞噬率、退热时间)的值,结果如下:
吞噬率
A组
退热时间
吞噬率
B组
退热时间
吞噬率
C组
退热时间
46
25
76
36
56
26
56
30
77
40
67
42
┇
┇
┇
┇
┇
┇
75
148
88
64
88
54
某统计师采用SPSS软件进行了分析,分析结果如下,根据所给结果回答如下问题。
1.A、B、C三组两个指标是否均服从正态分布?
并说明理由?
2.给出A、B、C三组两个指标的统计描述结果。
(用正确的统计表表达)。
3.A、B、C三组两个指标是否具有差异?
并说明理由?
4.A组两个指标是否具有相关性?
请给出统计分析结果,并说明理由?
Statistics
退热时间
A药
吞噬率
退热时间
B药
吞噬率
退热时间
C药
吞噬率
NValid
20
20
20
20
20
20
Missing
0
0
0
0
0
0
Mean
46.3000
67.3500
74.9500
69.0000
41.6500
63.7500
Std.Deviation
27.68640
10.04870
54.07254
12.96148
28.92690
16.04886
Skewness
3.023
.489
2.329
.824
3.337
-.128
Std.Errorof
.512
.512
.512
.512
.512
.512
Skewness
Kurtosis
10.102
1.494
4.747
.269
13.024
-.427
Std.Errorof
Kurtosis
.992
.992
.992
.992
.992
.992
Minimum
25.00
46.00
36.00
52.00
16.00
34.00
Maximum
148.00
91.00
240.00
98.00
154.00
91.00
Percentiles25
32.7500
61.7500
48.5000
60.5000
26.5000
53.2500
50
39.0000
67.0000
57.5000
69.5000
36.5000
67.0000
7546.000071.000064.000075.000045.000073.2500
TestofHomogeneityofVariances
Levene
Statistic
df1
df2
Sig.
退热时间
2.953
2
57
.060
吞噬率
2.810
2
57
.105
Sumof
Squares
df
MeanSquare
F
Sig.
BetweenGroups
13008.90
26504.450
4.310
.018
WithinGroups
86015.70
571509.047
Total
99024.60
59
BetweenGroups
288.300
2144.150
.821
.445
WithinGroups
10004.30
57175.514
Total
10292.60
59
ANOVA
退热时间
吞噬率
NParTestsKruskal-WallisTest
退热时间
吞噬率
组别A药B药
3.00
TotalA药B药3.00
Total
Ranks
NMeanRank2025.83
2044.00
2021.68
60
2031.20
2032.70
2027.60
60
TestStatisticsa,b
Chi-Squaredf
Asymp.Sig.
退热时间吞噬率
18.530.905
22
.000.636
a.KruskalWallisTest
b.GroupingVariable:
组别
Correlations
组别
A药退热时间
吞噬率
退热时间吞噬率
PearsonCorrelation
1
.563**
Sig.(2-tailed)
.
.010
N
20
20
PearsonCorrelation
.563**
1
Sig.(2-tailed)
.010
.
N
20
20
**.
Correlationissignificantatthe0.01level(2-tailed).
Correlations
组别
A药Spearman'srho
退热时间
吞噬率
退热时间吞噬率
CorrelationCoefficient
1.000
.680**
Sig.(2-tailed)
.
.001
N
20
20
CorrelationCoefficient
.680**
1.000
Sig.(2-tailed)
.001
.
N
20
20
**.Correlationissignificantatthe0.01level(2-tailed).
(三)某医师为研究A、B、C三药的疗效,随机将门诊病人60名分成三组,分别记录两个观察指标载脂蛋白(mg/dl)、胆固醇的值(mmol/L),结果如下:
A组B组C组
载脂蛋白胆固醇载脂蛋白胆固醇载脂蛋白胆固醇
85.75.2496.04.89144.05.00
105.25.28124.55.12117.04.85
┇┇┇┇┇┇
109.55.45105.15.16110.04.78
某统计师采用SPSS软件进行了分析,分析结果如下,根据所给结果回答如下问题。
1.A、B、C三组两个指标是否均服从正态分布?
并说明理由?
2.给出A、B、C三组两个指标的统计描述(用正确的统计表表达)。
3.A、B、C三组两个指标是否具有差异?
并说明理由?
4.B组两个指标是否具有相关性?
请给出统计描述,并说明理由?
A组
载脂蛋白
胆固醇
B
载脂蛋白
组
胆固醇
C
载脂蛋白
组
胆固醇
NValid
20
20
20
20
20
20
Missing
0
0
0
0
0
0
Mean
85.75
5.50
96.99
5.10
121.05
5.00
Std.Deviation
20.49
0.32
15.74
0.11
20.55
0.14
Skewness
1.31
0.91
1.26
-0.76
1.15
0.12
Std.ErrorofSkewness
0.51
0.51
0.51
0.51
0.51
0.51
Kurtosis
1.79
-0.76
0.74
-0.52
0.74
-1.10
Std.ErrorofKurtosis
0.99
0.99
0.99
0.99
0.99
0.99
Minimum
55.30
5.19
77.20
4.89
93.00
4.78
Maximum
139.60
6.10
134.50
5.26
169.00
5.21
Percentiles25
75.05
5.25
86.25
4.99
109.25
4.89
50
83.00
5.31
94.40
5.14
116.00
4.98
75
89.50
5.75
96.48
5.19
123.25
5.10
Oneway
ANOVA
SumofSquares
df
MeanSquare
F
Sig.
载脂蛋白
BetweenGroups
13008.741
2
6504.371
17.903
.000
WithinGroups
20708.978
57
363.315
Total
33717.719
59
胆固醇
BetweenGroups
2.773
2
1.386
30.472
.000
WithinGroups
2.593
57
.045
Total
5.366
59
Kruskal-WallisTest
group
Ranks
NMeanRankTestStatisticsa,b
载脂蛋白
A
20
17.53
B
20
29.23
载脂蛋白
胆固醇
C
20
44.75
Chi-Square
24.480
39.113
胆固醇
TotalA
60
2049.70
df
Asymp.Sig.
22
.000.000
B
C
Total
2025.50
2016.30
60
a.
KruskalWallisTest
b.GroupingVariable:
group
group
Correlations
载脂蛋白胆固醇
group
Correlations
载脂蛋白胆固醇
B载脂蛋白
Pears