SPSS课堂练习.docx
《SPSS课堂练习.docx》由会员分享,可在线阅读,更多相关《SPSS课堂练习.docx(16页珍藏版)》请在冰豆网上搜索。
SPSS课堂练习
SPSS课程第三次课堂练习
1、对职工数据.sav和追加职工.sav进行纵向合并练习。
2、对职工数据.sav和职工奖金.sav进行横向合并练习。
3、排序练习
职工数据.sav中,按年龄作为主排序变量、收入作为第二排序变量排序。
商品房购房意愿调查中,按月住房开销作为主排序变量,买房需求作为第二排序变量。
4、变量计算练习
职工数据.sav中,要求:
职称1至4工资分别上浮40%、30%、20%、10%。
5、商品房购房意愿调查数据集中,选取50%的数据,并按月开支变量进行升序排序。
第四次课练习
一、分类汇总练习
1、职工数据.sav中,按职称对工资进行分类汇总,报告基本工资。
2、商品房购房意愿调查数据集中,按居住类型进行分类汇总,报告平均开销及其标准差。
2、数据分组练习
1、职工数据.sav中,按年龄进行单变量值分组。
2、职工数据.sav中,按收入进行不等距的组距分组。
3、商品房购房意愿调查数据集中,对与月住房相关的支出进行四分位数、十分位分组练习。
三、利用spss进行计数、加权设置、数据拆分和数据转置练习。
四、
年级
性别
英语
数学
语文
2
女
92.0
75.0
79.0
3
女
87.0
94.0
68.0
3
男
87.0
84.0
82.0
1
男
82.0
86.0
73.0
2
男
81.0
89.0
94.0
3
女
90.0
92.0
85.0
1
男
98.0
78.0
70.0
2
男
96.0
67.0
84.0
1
女
92.0
89.0
78.0
练习
(1)以“年级”为参数做升序排列。
(2)生成“平均成绩=(英语+语文+数学)/3”,并以“平均成绩”为参数做降序排列。
(3)对语文成绩重新赋值。
85分以上为“1”(优秀),75分以上为“2”(良好),75分以下为“3”(合格)。
五、10名学生的两门考试成绩如下,请按各50%的比例计算总分。
序号(xu)
教育统计学(tj)
心理学研究方法(ff)
总分
1
78
69
2
65
92
3
85
86
4
72
76
5
68
94
6
82
89
7
63
70
8
87
75
9
80
93
10
77
82
第五次练习
一、频数分析练习
1、商品房购房意愿调查数据集中,报告买房需求进行频数分布表和相应图形。
2、在职工数据.sav中,对基本工资分布进行分组。
报告类似于p67页的频数分布表。
3、某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下。
患者:
0.84,1.05,1.20,1.20,1.39,1.53,1.67,1.80,1.87,2.07,2.11
健康人:
0.54,0.64,0.64,0.75,0.76,0.81,1.16,1.20,1.34,1.35,1.48,1.56,1.87
⑴试建立数据库文件。
⑵进行频数分布分析。
⑶进行分组分析。
二、描述统计量
1、商品房购房意愿调查数据集中,报告不同户籍的人收入的各项统计指标。
2、类似进行重抽样自举练习。
3、10名15岁中学生身高、体重数据如下:
编号
1
2
3
4
5
6
7
8
9
10
性别
男
男
男
男
男
女
女
女
女
女
身高(cm)
166.0
189.0
170.0
165.1
172.0
159.4
171.3
158.0
158.6
169.0
体重(kg)
57.0
58.5
51.0
58.0
55.0
44.7
45.4
44.3
42.8
51.5
回答:
1男生体重指数的均数?
标准差?
2女生体重体重指数的均数?
标准差?
第六次练习
一、交叉分组练习
1、利用商品房购买意向调查数据,进行交叉分组下的频数分析。
2、利用是否购买数据分析,收入与购买意向是否相关?
3、将126例十二指肠球部溃疡病人随机分为两组。
甲药组治疗62人,54人有效;乙药组治疗64人,44人有效。
问两种药物的治疗效果有无差别?
(1)SPSS数据工作表
group
effect
fre
1
1
54
1
2
8
2
1
44
2
2
20
(2)选用SPSS过程:
Weightcases;AnalyzeDescriptiveStatisticsCrosstabs。
(3)SPSS的结果与解释(包括检验方法、统计量、P值和统计推断):
经2检验,2=6.13,P=0.013。
可认为两种药物的治疗效果有差别,
即甲药有效率(87.1%)高于乙药(68.8%)。
4、某医师研究物理疗法、药物疗法和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表3。
问三种疗法的有效率有无差别?
表3三种疗法治疗周围性面神经麻痹的疗效
分组
治疗例数
有效例数
有效率(%)
物理疗法
206
199
96.6
药物疗法
182
164
90.1
外用膏药
144
118
81.9
(1)SPSS数据工作表
group
effect
fre
1
1
199
1
2
7
2
1
164
2
2
18
3
1
118
3
2
26
(2)选用SPSS过程:
Weightcases;AnalyzeDescriptiveStatisticsCrosstabs。
(3)SPSS的结果与解释(包括检验方法、统计量、P值和统计推断):
经2检验,2=21.04,P=0.000。
可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。
二、利用商品房购买意向调查数据,对付款方式的多选项进行频数分析
三、利用商品房购买意向调查数据,进行多选项交叉列联表分析。
第七次练习
1、10名15岁中学生身高体重数据如下:
表10名15岁中学生身高体重数据
编号
1
2
3
4
5
6
7
8
9
10
性别
男
男
男
男
男
女
女
女
女
女
身高(cm)
166.0
169.0
170.0
165.1
172.0
159.4
161.3
158.0
158.6
169.0
体重(kg)
57.0
58.5
51.0
58.0
55.0
44.7
45.4
44.3
42.8
51.5
体重指数(BMI)=体重(kg)/身高(m)2,即体重(kg)除以身高(m)的平方。
完成下列任务:
(1)建立spss数据文件,并保存名为shgao.sav文件
(2)报告男生、女生体重指数的分类统计表。
【均数为(kg/m2);标准差为:
(kg/m2)】
参考:
用Compute过程bmi=kg/(cm/100)**2;Mean,性别为分组变量
2、某集团公司将进行薪酬改革,目前员工的工资表如下(表1)。
为了了解来自不同下属公司、不同工作性质的员工收入状况,及对工资态度。
以便为决策者制定合理的薪酬体系提供科学依据,请分析以下问题:
1.数据文件描述:
变量名、变量类型、值标签。
2.不同工作性质员工的工资的平均值、标准差;3.运用多维交叉表分析,判断不同工作性质的员工与工资态度是否存在相关性?
第八次练习
1、
【数据集8.1】
2、
小时?
【数据集8.2】
2.两独立样本的t检验
某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?
患者:
0.841.051.201.201.391.531.671.801.872.072.11
健康人:
0.540.640.640.750.760.811.161.201.341.351.481.561.87
3.【匹配样本】现有10名男生进行观察能力的训练,训练前后各进行一次测验,结果如下表所示。
序号
训练后
训练前
1
95
76
2
70
74
3
90
80
4
66
52
5
80
63
6
78
62
7
89
82
8
84
85
9
70
64
10
73
72
4、【匹配样本】某医院分别用A、B两种血红蛋白测定仪器检测了16名健康男青年的血红蛋白含量(g/L),检测结果见下表。
问:
两种血红蛋白测定仪器的检测结果是否有差别。
编号
仪器A
仪器B
(1)
(2)
(3)
1
113
140
2
125
150
3
126
138
4
130
120
5
150
140
6
145
145
7
135
135
8
105
115
9
128
135
10
135
130
11
100
120
12
130
133
13
110
147
14
115
125
15
120
114
16
155
165
4、【单样本的t检验】
某研究者检测了某山区16名健康成年男性的血红蛋白含量(g/L),检测结果见下表。
问:
该山区健康成年男性的血红蛋白含量与一般健康成年男性血红蛋白含量的总体均数132g/L是否有差别。
编号
血红蛋白含量(g/L)
1
145
2
150
3
138
4
126
5
140
6
145
7
135
8
115
9
135
10
130
11
120
12
133
13
147
14
125
15
114
16
165
解答:
单样本T-test
Analyze-compare-one_sampleTtest(testvalue填比较值132).P=0.364大于0.05,无差别。
第九次练习
复习参数检验
1、利用居民储蓄调查数据,从中随机选取80%的样本,分析城镇和农村人口的存款额是否一致?
2、将14只大白鼠随机分为两组,一组做成白血病模型组,一组为正常鼠,然后测量两组鼠脾脏DNA含量(mg/g),问正常鼠和白血病鼠脾脏中DNA含量是否不同?
表8白血病模型鼠和正常鼠脾脏中DNA含量(mg/g)
白血病组
12.3
13.2
13.7
15.2
15.4
15.8
16.9
正常组
10.8
11.6
12.3
12.7
13.5
13.5
14.8
单因素方差分析
1、
2、用四种不同的饲料喂养大白鼠,每组4只,然后测其肝重占体重的比值(肝/体重比值,%),数据如下。
试比较四组均数间有无差异?
表14四组资料的肝重占体重比值(%)的测定结果
A饲料
B饲料
C饲料
D饲料
2.62
2.82
2.91
3.92
2.23
2.76
3.02
3.00
2.36
2.43
3.28
3.32
2.40
2.73
3.18
3.04
(1)SPSS数据工作表
group
dna
1
2.62
1
2.23
…
…
4
3.32
4
3.04
(2)选用SPSS过程:
AnalyzeComparemeansOneWayANOVA
(3)SPSS的结果与解释(包括检验方法、统计量、P值和统计推断):
经完全随机设计资料的方差分析,F=10.24,P=0.001。
可认为四种不同饲料喂养大白鼠肝/体比值的均数不同。
经多个样本均数间两两比较的SNK检验,按=0.05水准,可认为C与D饲料肝/体比值的均数高于A与B饲料,但尚不能认为A与B饲料,C与D饲料肝/体比值的均数不同。
3、某单位欲研究3种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一配伍组的3只小白鼠分别用3种药物抑癌,共5个配伍组。
实验结果得瘤重(克)如下。
试比较3种药物的抑癌作用有无差别?
表15三种药物的抑癌作用(瘤重:
克)
配伍组
A
B
C
1
0.80
0.36
0.28
2
0.74
0.50
0.36
3
0.31
0.20
0.25
4
0.48
0.18
0.22
5
0.76
0.26
0.30
(1)SPSS数据工作表
配伍组
药物
瘤重
1
1
0.80
2
1
0.74
3
1
0.31
4
1
0.48
5
1
0.76
…
…
…
1
3
0.28
2
3
0.36
3
3
0.25
4
3
0.22
5
3
0.30
(2)选用SPSS过程:
AnalyzeGeneralLinearModelUnivariate
(3)SPSS的结果与解释(包括检验方法、统计量、P值和统计推断):
A、B、C三种药物的瘤重均数(克)分别为:
0.62,0.30和0.28。
经随机区组设计资料的方差分析,F=16.43,P=0.001。
可认为3种药物的抑癌作用有差别。
经多个样本均数间两两比较的SNK检验,按=0.05水准,可认为B和C药的抑抑癌作用大于A药,但还不能认为B和C药的抑癌作用有差别。
第十次练习
1、多因素方差分析
4名工人操作3台机器,1天的日产量数据见下表,试问机器之间、工人之间在日产量上是否有差异?
工人
1
2
3
4
机器
1
50
47
47
53
2
63
54
57
58
3
52
42
41
48
双因素方差分析。
因变量:
日产量;自变量:
机器(3个水平),工人(4个水平)
2、单因素方差分析
测得男子排球、体操、游泳三个项目运动员的纵跳成绩(单位:
厘米).
试检验运动项目对纵跳成绩有无显著性影响,即不同运动项目运动员平均纵跳成绩之间的差异有无显著意义(单因素方差分析)
排球
体操
游泳
1
78
65
69
2
75
63
62
3
73
65
66
4
78
65
67
5
76
67
68
6
62
70
7
68
结论:
经方差齐性检验p=0.784各项目方差齐性。
经方差分析F=33.894p=0.000各项目间差异显著,可以进一步作多重比较。
经多重比较:
排球与体操,排球与游泳均差异显著。
体操与游泳差异不显著。
排球运动员纵跳成绩最好。
第十一次练习
1、对10例肺癌病人和12例矽肺(硅沉着病)0期工人用X线片测量肺门横径右侧距RD值(cm),结果见表。
问:
肺癌病人的RD值是否与矽肺0期工人的RD值不同。
表17肺癌病人与矽肺0期工人的RD值(cm)
矽肺0期工人
肺癌病人
3.23
2.78
3.50
3.23
4.04
4.20
4.15
4.87
4.28
5.12
4.34
6.21
4.47
7.18
4.64
8.05
4.75
8.56
4.82
9.60
4.95
5.10
(1)选用SPSS过程:
AnalyzeNonparametricTest2IndependentSamples。
(2)SPSS的结果与解释(包括检验方法、统计量、P值和统计推断):
经两个独立样本比较的Wilcoxon秩和检验,Z=1.75,P=0.080。
尚不能认为肺癌病人与矽肺0期工人的RD值不同。
2、随机抽取3个班级的学生,得到21个学生成绩样本,如表10-7所示,问3个班级学生总体成绩是否存在显著差异?
3个班级学生成绩
学生成绩
所属班级
学生成绩
所属班级
60.00
1
90.00
2
70.00
1
96.00
2
71.00
1
70.00
2
80.00
1
85.00
3
75.00
1
92.00
3
65.00
1
97.00
3
90.00
1
96.00
3
80.00
2
88.00
3
85.00
2
89.00
3
81.00
2
80.00
3
83.00
2
3、【两配对样本的非参数检验】
对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表。
问两法所得结果有无差别?
表12份血清用原法和新法测血清谷-丙转氨酶(nmol·S-1/L)结果的比较
编号
原法
新法
1
60
80
2
142
152
3
195
243
4
80
82
5
242
240
6
220
220
7
190
205
8
25
38
9
212
243
10
38
44
11
236
200
12
95
100
(1)选用SPSS过程:
AnalyzeNonparametricTest2RelatedSamples。
(2)SPSS的结果与解释(包括检验方法、统计量、P值和统计推断):
经配对样本比较的Wilcoxon符号秩和检验,Z=1.91,P=0.056。
还不能认为两法测谷-丙转氨酶结果有差别。
相关性分析
3、为研究学生的平时作文成绩x与高考作文成绩y的关系,随机抽取10名考生,数据见下表,试进行相关分析。
序号
1
2
3
4
5
6
7
8
9
10
x
80
78
90
92
82
72
90
84
64
76
y
29
24
30
32
28
25
27
30
15
25
相关分析:
Analyze-Correlate-Bivariate
回归分析
某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)。
估计尿肌酐含量(
)对其年龄(
)的回归方程。
表208名正常儿童的年龄
(岁)与尿肌酐含量
(mmol/24h)
编号
1
2
3
4
5
6
7
8
年龄X
13
11
9
6
8
10
12
7
尿肌酐含量Y
3.54
3.01
3.09
2.48
2.56
3.36
3.18
2.65
(1)SPSS数据工作表
x
y
13
3.54
11
3.01
…
…
12
3.18
7
2.65
(2)选用SPSS过程:
AnalyzeRegressionLinear。
(3)SPSS的结果与解释
(1)以尿肌酐含量为应变量Y,年龄为自变量X建立直线回归方程:
。
(2)计算回归系数b,并进行假设检验:
b=0.139,t=4.58,P=0.004。
(3)总体回归系数的95%可信区间:
(0.065,0.214)
(4)相关系数r=0.882;决定系数R2=0.778。