SPSS实验报告.docx
《SPSS实验报告.docx》由会员分享,可在线阅读,更多相关《SPSS实验报告.docx(55页珍藏版)》请在冰豆网上搜索。
SPSS实验报告
实验课程
SPSS统计分析
上课时间
2014学年1学期17周(2014年12月29—31日)
学生姓名
XXX
学号
XXX
班级
XXXX
所在学院
XXXX
上课地点
XXX
指导教师
XXX
描述性统计分析
一、实验目的
1.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2.学习描述性统计分析及其在SPSS中的实现,内容具体包括基本描述性统计量的定义及计算﹑频率分析﹑描述性分析﹑探索性分析﹑交叉表分析等。
3.复习权重等前章的知识。
二﹑实验内容
题目一
打开数据文件“data4-5.sav”,完成以下统计分析:
(1)计算各科成绩的描述统计量:
平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值;
(2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩的分段:
90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签设为:
1-优,2-良,3-中,4-及格,5-不及格。
分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。
1.解决问题的原理
因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。
2.实验步骤
针对第一问
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data4-8.sav”导入。
第2步文件拆分
菜单选择:
“数据→拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确定。
第3步描述分析设置:
(1)选择菜单:
“分析→描述统计→描述”,
打开“描述性”对话框,将“成绩””加入到“变量”列表框中。
打开“选项”对话框,选中如下图中的各项。
点击“继续”按钮。
(4)回到“描述性”对话框,点击确定。
针对第二问
第1步频率分析设置:
(1)选择菜单:
“分析→描述统计→频率”,
(2)打开“频率(F)”对话框,点击“合计”。
再点击“继续”按钮.
(3)打开“图表”对话框,选中“条形”
复选框,点击“继续”按钮。
(4)回到“频率(F)”对话框,点击确定。
(5)重复步骤
(1)
(2)把步骤(3)改成打开“图表”对话框,选中“饼图”
复选框,点击“继续”按钮。
再回到“频率(F)”对话框,点击确定。
三、实验结果及分析
描述统计量
科目
N
全距
极小值
极大值
均值
标准差
方差
语文
成绩
15
79
19
98
67.87
21.738
472.552
有效的N(列表状态)
15
数学
成绩
15
71
24
95
55.87
24.348
592.838
有效的N(列表状态)
15
英语
成绩
15
76
15
91
57.80
22.697
515.171
有效的N(列表状态)
15
统计量
成绩
语文
N
有效
15
缺失
0
均值
67.87
中值
73.00
众数
60a
标准差
21.738
方差
472.552
极小值
19
极大值
98
百分位数
25
60.00
50
73.00
75
83.00
数学
N
有效
15
缺失
0
均值
55.87
中值
49.00
众数
37
标准差
24.348
方差
592.838
极小值
24
极大值
95
百分位数
25
36.00
50
49.00
75
81.00
英语
N
有效
15
缺失
0
均值
57.80
中值
56.00
众数
56
标准差
22.697
方差
515.171
极小值
15
极大值
91
百分位数
25
34.00
50
56.00
75
78.00
a.存在多个众数。
显示最小值
成绩段
科目
频率
百分比
有效百分比
累积百分比
语文
有效
优
3
20.0
20.0
20.0
良
1
6.7
6.7
26.7
中
4
26.7
26.7
53.3
及格
4
26.7
26.7
80.0
不及格
3
20.0
20.0
100.0
合计
15
100.0
100.0
数学
有效
优
1
6.7
6.7
6.7
良
3
20.0
20.0
26.7
中
2
13.3
13.3
40.0
不及格
9
60.0
60.0
100.0
合计
15
100.0
100.0
英语
有效
优
2
13.3
13.3
13.3
良
1
6.7
6.7
20.0
中
2
13.3
13.3
33.3
及格
2
13.3
13.3
46.7
不及格
8
53.3
53.3
100.0
合计
15
100.0
100.0
语文成绩的平均成绩为67.87,中位数是73、众数60、标准差21.738、方差472.552、极差98-19=79、最大值98和最小值19;
各分数段人数:
语文90~100为3,80~89为1,70~79为4,60~69为4,60分以下为3,
数学90~100为1,80~89为3,70~79为2,60~69为0,60分以下为9,
英语90~100为2,80~89为1,70~79为2,60~69为2,60分以下为9,
生成条形图和饼图如截图所示
题目二
1.打开数据文件“data4-6.sav”,完成以下统计分析:
(1)对身高进行考察,分析四分位数、计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图;
(2)考察身高、体重和胸围的正态性。
针对第一问
1.解决问题的原理探索性分析
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data4-9.sav”导入。
第2步探索分析设置:
(1)选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“身高”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;
(3)打开“探索:
图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。
打开“探索:
选项”,选中“按列表排除个案”选项
针对第二问
与第一问的方法相似也可用探索性分析
第1步探索分析设置:
(1)选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“体重”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;
(3)打开“探索:
图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。
打开“探索:
选项”,选中“按列表排除个案”选项
第2步探索分析设置:
(1)选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“胸围”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;
(3)打开“探索:
图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。
打开“探索:
选项”,选中“按列表排除个案”选项
3.结果及分析
从上的茎叶图可以更加详细地分析身高数据。
从上的箱图可以分析变量“身高”的四分位数。
从上的Q-Q图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。
题目三
表4.22是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。
(用交叉列联表分析,参见数据文件:
data4-10.sav。
)
1.解决问题的原理:
运用交叉表分析
2.实验内容
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data4-10.sav”导入。
第2步加权设置:
菜单选择:
“数据→加权个案”,打开“加权个案”对话框,如图设置。
第3步交叉表分析设置:
(1)选择菜单:
“分析→描述统计→交叉表”,打开“交叉表”对话框,将“是否吸烟”及“是否换气管炎”字段分别加入“行(s)”及“列(c)”列表框中。
(2)打开“统计量”对话框,选中“卡方”选项。
(3)打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都是缺省设置。
3实验结果及分析
是否吸烟*是否患气管炎Crosstabulation
Count
是否患气管炎
Total
患病
健康
是否吸烟
是
43
162
205
否
13
121
134
Total
56
283
339
Chi-SquareTests
Value
df
Asymp.Sig.(2-sided)
ExactSig.(2-sided)
ExactSig.(1-sided)
PearsonChi-Square
7.469a
1
.006
ContinuityCorrectionb
6.674
1
.010
LikelihoodRatio
7.925
1
.005
Fisher'sExactTest
.007
.004
Linear-by-LinearAssociation
7.447
1
.006
NofValidCases
339
a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis22.14.
b.Computedonlyfora2x2table
综上所示,各种检验方法显著水平都远小于0.05,所以有理由拒绝“实验准备与评价结果是独立的”假设,即认为实验准备这一评价指标与评价结果是相关的。
三、实验心得与体会
通过本章例子学习描述性统计分析及其在SPSS中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。
深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于SPSS提供的图形功能来分析把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到了重要作用。
参数估计与假设检验
一、实验目的
4.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2.
表5.20某班学生数学成绩
序号
成绩
序号
成绩
序号
成绩
1
63
10
94
19
70
2
99
11
98
20
65
3
81
12
73
21
84
4
77
13
89
22
84
5
68
14
98
23
95
6
79
15
77
24
61
7
80
16
67
25
69
8
63
17
69
26
73
9
87
18
81
27
60
通过样本提供的信息来对总体信息进行估计和推断,如参数估计和假设检验等,从样本的观察或试验结果的特征对总体的特征进行估计和推断。
二、实验内容
题目一
表5.20是某班学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70分之间是否有显著性差异。
(参见数据文件:
data5-16.sav。
)
1.解决问题的原理:
单样本T检验
2.实验步骤
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data4-16.sav”导入。
第2步单样本T检验分析设置
(1)选择菜单“分析→比较均值→单样本T检验(S)”,打开“单样本T检验”对话框,将变量“成绩”移入“检验变量”列表框,并输入检验值70。
(2)“单样本T检验:
选项”对话框,设置置信区间为95%(缺省为95%),故此处可不设置,及默认。
3.实验结果及分析
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
成绩
27
77.93
12.111
2.331
One-SampleTest
TestValue=70
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
成绩
3.400
26
.002
7.926
3.13
12.72
可得到,当置信区间为95%时,显著水平为0.05,从表中可以看出,双尾检测概率P值为0.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。
题目二
在某次测试中,随机抽取男女学生的成绩各10名,数据如下:
男:
99795989798999828085
女:
88545623756573508065
假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异。
(参见数据文件:
data5-17.sav。
)
1.解决问题的原理:
独立样本T检验
2.实验步骤
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data5-17.sav”导入。
第2步独立样本T检验设置:
(1)选择菜单“选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“成绩”作为要进行T检验的变量,将“性别”字段作为分组变量,定义分组变量的两个分组分别为“1”和“2”。
(2)打开“独立样本T检验:
选项”对话框,具体选项内容及设置与单样本T检验相同,即默认形式,不更改。
GroupStatistics
性别
N
Mean
Std.Deviation
Std.ErrorMean
成绩
男
10
84.0000
11.52774
3.64539
女
10
62.9000
18.45385
5.83562
上表中是独立样本T检验的均值检验结果。
显著水平为0.05,从表中可以看出T统计量的概率P小于0.05,故拒绝原假设,所以男女得分有显著性差异。
题目三
某医疗机构为研究某种减肥药的疗效,对16位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重,数据如表5.21所示。
假设体重近似服从正态分布,试分析服药前后,体重是否有显著变化。
(参见数据文件:
data5-18.sav。
)
表5.21服药前后的体重变化
体重
服药前
198237233179219169222167199233179158157216257151
服药后
192225226172214161210161193226173154143206249140
1.解决问题的原理:
配对样本T检验
2.实验步骤
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data5-18.sav”导入。
第2步配对样本T检验设置:
选择菜单“分析→比较均值→配对样本T检验”,弹出“配对样本T检验”对话框
选中“服药前体重”将其拉入“Variable1”,将“服药后体重”拉入“variable2”字段。
打开“选项”对话框,默认不更改。
3.实验结果及分析
PairedSamplesStatistics
Mean
N
Std.Deviation
Std.ErrorMean
Pair1
服药前体重
198.38
16
33.472
8.368
服药后体重
190.31
16
33.508
8.377
PairedSamplesCorrelations
N
Correlation
Sig.
Pair1
服药前体重&服药后体重
16
.996
.000
在显著水平为0.05时,概率P值明显小于0.05,拒绝原假设,可以认为减肥药前后的体重有明显的线性关系。
从截图第三个和第四个是配对样本T检验的最终结果,可以看出,在显著水平为0.05,由于概率P值明显小于0.05,拒绝原假设,故可以认为服药前后,体重有显著变化。
题目四
某农民想了解两品种的小麦Ⅰ、Ⅱ产量是否有显著区别,其产量数据如表5.24所示,分别在显著性水平0.05和0.01下检验两品种产量是否有显著性差异。
(数据来源:
M.R.斯皮格尔,《统计学(第3版)》,科学出版社;参见数据文件:
data5-23.sav。
)
表5.24两种小麦的产量数据
小麦1
15.9
15.3
16.4
14.9
15.3
16
14.6
15.3
14.5
16.6
16
小麦2
16.4
16.8
17.1
16.9
18
16
18.1
17.2
15.4
1.解决问题的原理:
独立样本非参数检验
2.实验步骤
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data5-23.sav”导入。
第2步分析
由于是两种小麦,可以认为是两组独立样本,但行使里程数不知道服从何种分布,可以用两独立样本的费参数检验进行分析。
第3步进行独立样本的非参数检验设置
(1)选择“分析→非参数检验→独立样本”,打开“非参数检验:
两个或更多独立样本”对话框,设置如下:
显著性水平=0.05
显著性水平=0.01
所以当显著性水平=0.05时,用二样本时拒绝原假设。
当显著性水平=0.01时,不拒绝原假设。
题目五
为研究长跑运动对增强普通高校学生心脏功能的效果,对某校15名男生进行测试,经过5个月的长跑锻炼后看其晨脉是否减少。
锻炼前后的晨脉数据如表5.25所示。
表5.25长跑锻炼前后晨脉变化表
锻炼前
70
76
56
63
63
56
58
60
65
65
75
66
56
59
70
锻炼后
48
54
60
64
48
55
54
45
51
48
56
48
64
50
54
试问锻炼前后的晨脉在显著性水平0.05下有无显著性差异。
(数据来源:
卢纹岱,《SPSSforWindows统计分析(第3版)》,电子工业出版社;参见数据文件:
data5-24.sav。
)
1.解决问题的原理:
相关样本的非参数检验。
2.实验步骤
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data5-24.sav”导入。
第2步进行相关样本的非参数检验设置
(1)通过“分析-非参数检验-相关样本”,打开“非参数检验”对话框
3.实验结果及分析
显著性水平=0.05时,拒绝原假设。
即长跑锻炼前后晨麦无显著性差异。
三、实验心得及体会
通过本章的学习以及实例分析的操作,学会了如何用T检验解决两样本间均值比较的问题,可以解决例如两类物品是否存在区别的问题。
对数据的分析有了进一步的认识和技能的掌握有了很大的提高。
相关分析
一、实验目的
5.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2.利用分析多个性质不同的SPSS变量,从而分析总体的多个特征,并分析这些特征的联系。
相关分析是比较简单的多元分析,使用多元分析方法,能快速发现总体特征之间的关系,并检验这些特征的显著性。
以此广泛用于生物学、经济学等各个领域。
二、实验内容
题目一
K.K.Smith在烟草杂交繁殖的花上收集到如表7.21所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。
(数据来源:
苏金明,《统计软件SPSS系列应用实践篇》,电子工业出版社;参见数据文件:
data7-9.sav。
)
表7.21K.K.Smith所调查的长度资料
花瓣长
49
44
32
42
32
53
36
39
37
45
41
48
45
39
40
34
37
35
花枝长
27
24
12
22
13
29
14
20
16
21
22
25
23
18
20
15
20
13
花萼长
19
16
12
17
10
19
15
14
15
21
14
22
22
15
14
15
15
16
1.解决问题的原理:
两变量相关分析
2..实验步骤
第1步打开数据
菜单选择:
“文件→打开→数据”,将“data7-9.sav”导入。
第2步两变量的相关性分析
(1)选择菜单“分析→相关→双变量”,打开如图所示的对话框,将变量移入“变量”框中;“相关系数”选择Pearson;在“显著性检验”中选择“双侧检验”
3.实验结果及分析
DescriptiveStatistics
Mean
Std.Deviation
N
花枝长
19.67
5.029
18
花萼长
16.17
3.294
18
花瓣长
40.44
5.973
18
Correlations
花枝长
花萼长
花瓣长
花枝长
PearsonCorrelation
1
.678**
.955**
Sig.(2-tailed)
.002
.000
SumofSquaresandCross-products
430.000
191.000
487.667
Covariance
25.294
11.235
28.686
N
18
18
18
花萼长
PearsonCorrelation
.678**
1
.797**
Sig.(2-tailed)
.002
.000
SumofSquaresandCross-products
191.000
184.500
266.667
Covariance
11.235
10.853
15.686
N
18
18
18
花瓣长
PearsonCorrelation
.955**
.797**
1
Sig.(2-tailed)
.000
.000
SumofSquaresandCross-products
487.667