SPSS实验报告册.docx
《SPSS实验报告册.docx》由会员分享,可在线阅读,更多相关《SPSS实验报告册.docx(31页珍藏版)》请在冰豆网上搜索。
SPSS实验报告册
(此文档为word格式,下载后您可任意编辑修改!
)
《SPSS统计软件应用》
实验报告册
20-20学年第学期
班级:
学号:
姓名:
授课教师:
实验教师:
实验学时:
实验组号:
目录
实验一SPSS的数据管理3
实验二描述性统计分析5
实验三均值检验6
实验四相关分析7
实验五因子分析8
实验六聚类分析11
实验七回归分析13
实验八判别分析14
实验一SPSS的数据管理
一、实验目的
1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;
2.掌握SPSS的数据管理功能。
二、实验内容及步骤:
1、定义spss数据结构。
下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。
练习:
创建数据文件的结构,即数据文件的变量和定义变量的属性。
表1大学教师基本情况调查表
问题
备选答案
1姓名
2性别
3年龄
4学历
5工作年月
6职称
7本年度教学工作量(课时)
4
(1)专科
(2)本科(3)硕士(4)博士(5)博士后
6
(1)助教
(2)讲师(3)副教授(4)教授
7
(1)0~120
(2)120~240(3)240~320(4)320~480(5)480以上
8本年度公开发表论文数
9本年度您的科研经费总额(万元)
10.您认为学校对科研人员每年的科研成果要求是否合理
(1)合理
(2)不合理(3)无所谓
11您最常用的全文期刊数据库的名称(多选,限选2个)
(1)cnki
(2)万方(3)SpringerLink(4)EBSCO
12您对学校科研管理部门的工作是否满意
(1)非常满意
(2)满意(3)一般(4)不满意
实验内容:
1.定义spss数据结构。
下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。
练习:
创建数据文件的结构,即数据文件的变量和定义变量的属性。
实验步骤:
(1)、打开定义变量的界面启动SPSS,进入主界面,单击图6-2所示的屏幕左下角的“VariableView”选项卡,打开定义变量的表格。
(2)、输入变量名,符合变量的命名规则在“Name”列的第一个单元格输入第一个变量名,如:
“xm”。
(3)、确定变量类型,单击“Type”列的第一个单元格,如图6-3所示,SPSS的默认变量类型为数值型。
单击数值型变量后的“···”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他的变量类型。
(4)、设置字段值
(5)、依次按要求输入完毕即可
实验结果:
实验分析:
本实验,主要是按照要求一步一步来设置条件即可完满完成实验。
2、高校提前录取名单的确定
某高校今年对部分考生采取单独出题、提前录取的招生模式。
现有20名来自国内不同省市的考生报考该校,7个录取名额。
见数据文件compute.sav.该校制定了如下录取原则:
(1)文化课成绩由数学、语文、英语和综合四门成绩组成。
文化课成绩制定最低录取分数线:
400分。
(2)个人档案中若有“不良记录”,不予录取。
(3)对西部考生和少数民族考生,给予加分优惠。
少数民族考生加20分,西部考生加10分。
(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。
(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。
练习:
利用spss软件,综合利用所学,给出成绩排名的操作步骤。
实验内容:
2.高校提前录取名单的确定
某高校今年对部分考生采取单独出题、提前录取的招生模式。
现有20名来自国内不同省市的考生报考该校,7个录取名额。
见数据文件compute.sav.练习:
利用spss软件,综合利用所学,给出成绩排名的操作步骤。
实验步骤:
(1)
计算文化课总成绩:
打开数据文件compute.sav.变量计算 transform->compute,在弹出的compute variable对话框中,定义变量zcj, type&label中的label值设为“文化课总成绩”,numberic expression设置“语文+数学+英语+综合”,单击ok按钮。
(2)
筛选出400分以上并且没有不良记录的学生:
date-select case ,在弹出的对话框中选择if condition is satisfied 单选按钮并单击if 按钮,在弹出的select case :
if 对话框中,设置不良记录=0 & zcj>=400的判断条件,单击continue,选择deleted单选按钮,最后单击ok 。
(3)
计算西部考生和少数名族加分项:
transform->compute,target variable选择zcj。
if 条件中设置“名族=2 or 名族=3 or 民族=4”,numberic expression中zcj+20;If 条件中设置“名族=5” numberic expression中设置zcj+10
(4)
计算最综成绩,并排序:
transform->compute,numberic expression ,zcj奖项*10. 选择“Data→Sort Cases”命令,弹出“Sort Cases”对话框,把“zcj”变量选入“Sort by”中,并在Sort Order中选择“Ascending(降序)”选项,将学生成绩按升序排列,单击“OK”按钮。
实验结果:
选取综合成绩升序排列后的前七名即可,如图所示:
录取的分别是艾甫尔513分、孙悦婷495分、张囯欣471分、果冻样462分、杨乐451分、高超438分、易仲勃434分。
实验分析:
本实验,主要是按照要求一步一步来设置条件,最后边计算有点难,就是算加分。
首先要解决不留空的,不然最后没法求和。
根据结果选出符合要求的即可。
三、实验小结:
实验中遇到的问题及解决办法、心得体会等等...
本实验,第一小题,主要考察我们创建数据文件的结构,即数据文件的变量和定义变量的属性。
老师上课时给我们演示很到位,在老师的详细讲解下,我熟悉了spss软件界面,以及一些主要组成部分,但是里面的一些具体参数还不太清楚,不过常用主要属性都掌握了,没有太大问题。
第二小问,问题就相当大了,先是选择不小于400分的,经常排除不了,后来在同学的帮助下克服了。
然后在加分部分比较难,最开始先符合一个加一个,但是后来发现不是,经过反复尝试,把需要加分的先列出来,最后汇总,但是没加粉的,我没计算,导致最后求和时,不能加,因为有的是空字符,而不是数字0,后来又经改进,把没有加分的同学,在相对加分位置是-表示,最后才完满完成实验。
实验二描述性统计分析
一、实验目的
利用SPSS进行描述性统计分析。
要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。
二、实验内容及步骤
1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。
给出操作步骤和分析结果。
1)打开数据文件descriptives.sav,选“数据”菜单的“选择个案”命令项,弹出对话框。
选择“如果条件满足”单选按纽,点击“如果”钮,弹出对话框,输入条件:
班级=1单击“继续”按纽。
在“输出”栏选择“过滤掉未选定的个案”项 ,单击“确定”按钮。
2)在主菜单栏单击“分析”,在出现的下拉菜单里移动鼠标至“描述性统计”项上,在出现的次菜单里单击“描述性”项,打开对话框。
从左则的源变量框里选择年龄、体重、身高三个变量进入“变量”框里。
单击“选项”钮,弹出“选项”对话框,选中 均值 Std.deviation 标准差 最小值 方差 最大值 范围复选框,单击“继续”按钮,单击“确定”按钮。
3)2、3班操作类似,只需将条件改为“班级=2”、“班级=3”即可
一班
二班
。
三班:
2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别
三、练习题:
1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。
给出操作步骤和分析结果。
分析:
1班年龄的最大值,最小值,平均数最小,方差和标准差最大;体重的极差,最大值,最小值,平均数,方差,标准差都最小;身高的极差,最大值,最小值,平均数,方差,标准差都最小。
2班年龄的最大值,最小值,平均数居中,方差和标准差最小;体重的极差,最大值,最小值,平均数,方差,标准差都居中;身高的极差,最大值,最小值,平均数,方差,标准差都居中
3班年龄的最大值,最小值,平均数最大,方差和标准差居中;体重的极差,最大值,最小值,平均数,方差,标准差都最大;身高的极差,最大值,最小值,平均数,方差,标准差都最大。
2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别
处理
愈合
未愈合
合计
呋喃硝胺
54
8
62
甲氰咪胍
44
20
64
合计
98
28
126
(提示:
由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量――行变量、列变量和指示每个格子中频数的变量,然后用WeightCases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。
假设三个变量分别名为R、C和W,则数据集结构和命令如下):
R
C
W
1.00
1.00
54.00
1.00
2.00
44.00
2.00
1.00
8.00
2.00
2.00
20.00
分析:
卡方检验统计量的p值=0.013<0.05,拒绝原假设,呋喃硝胺治疗十二指肠溃疡有显著性影响。
4、实验小结:
实验中遇到的问题及解决办法、心得体会等等...
1、通过本次实验,使我较好地掌握了利用SPSS进行描述性统计分析的方法,学会了频数分布(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。
2、频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
3、Descriptives过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,其功能和频数分布过程类似,主要以计算数值型单变量的统计量为主。
实验三均值检验
一、实验目的
学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
二、实验内容及步骤
1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。
公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。
共4台机器,每台机器抽取16支产品。
见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。
步骤:
(1)打开数据文件ttest1.sav,选择菜单“Analyze→Compare Means→One-Sample T Test”。
弹出“One-Sample T Test”对话框。
(2)在对话框左侧的变量列表中选择变量“制动闸直径”进入“Test Variable(s)” 框;在“Test Value” 编辑框中输入过去的平均生产直径值322 选择Options,置信水平90%,单击contiue-ok
2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。
数据如下:
男:
82.0080.0085.0085.0078.0087.0082.00
女:
75.0076.0080.0077.0080.0077.0073.00
比较在置信度为95%的情况下男女生得分是否有显著差别。
步骤:
(1) 建立表结构并输入数据
(2)选择菜单“Analyze→Compare Means→Independent-samples T Test”项,弹出“Independent- samples T Test”对话框。
从对话框左侧的变量列表中选x,进入“Test Variable(s)”框,选择变量“group”,进入“Grouping Variable”框,点击“Define Groups”钮弹出“Define Groups”定义框,在Group 1中输入1,在Group 2中输入2。
(3)单击ok输出结果:
3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。
为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。
见数据文件ptest.sav.
步骤:
打开数据文件ptest.sav. 选择菜单“Analyze→Compare Means→Paired-samples T Test”项,弹出“Paired - samples T Test”对话框。
从对话框左侧的变量列表中选择变量进入Variables框。
单击ok输出结果:
三、练习题:
1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。
公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。
共4台机器,每台机器抽取16支产品。
见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。
P值=0.295>0.1,接受原假设,即机器生产的产品均值和322在90%的置信水平下是没有显著差异。
2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。
数据如下:
男:
82.0080.0085.0085.0078.0087.0082.00
女:
75.0076.0080.0077.0080.0077.0073.00
比较在置信度为95%的情况下男女生得分是否有显著差别。
Levene检验中sig=0.445>0.05说明总体方差相等,t统计量检验自由n1+n2-2 ,p值=0.002<0.05,在置信度为95%的情况下男女生得分有显著差别。
3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。
为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。
见数据文件ptest.sav.
体重水平的P值=0.249>0.05、甘油三酯的水平的p值均小于0.05,使用该药之前和之后的体没有显著性变化,而甘油三酯的水平有显著性变化。
四、实验小结:
实验中遇到的问题及解决办法、心得体会等等...
1、学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
2、在分析问题前要判断是单样本T测验还是双样本T测验,在第一遍的实验过程中由于我没有分清楚这个问题导致了试压结果错误。
实验四相关分析
一、实验目的
学习利用SPSS进行相关分析、偏相关分析、距离分析。
2、实验内容及实验步骤
1、打开数据文件correlate1.sav,要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。
选择菜单“Analyze→Correlate→Bivariate”,在对话框左侧的变量列表中选price,fuel efficiency使之进入“Variables”框,输出结果如图所示:
2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。
选相似性测度。
进行结果解释。
选择菜单“Analyze→Correlate→Distance”,在对话框左侧的变量列表中选变量身高、体重和肺活量进入“Variables” 框。
在“Compute Distances”框中选择“Between variables”,作变量之间的距离相关分析。
在“Measure”栏中选择“Similarities”相似性测距。
输出结果如图所示
3、打开数据文件distance.sav,文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。
要求对10只叶片进行距离分析。
用Euclideandistance。
进行结果解释。
三练习题:
1、打开数据文件correlate1.sav,要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。
两变量之间的相关系数r=-0.492,呈负的低度线性相关,在T的双尾检验中p值<0.05,拒绝假设H0,汽车价格和汽车的燃油效率之间有显著线性相关关系。
2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。
选相似性测度。
进行结果解释。
身高、体重、肺活量彼此之间都存在中度的线性关系
3、打开数据文件distance.sav,文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。
要求对10只叶片进行距离分析。
用Euclideandistance。
进行结果解释。
第一次测量与第二次测量和第一次测量与第三次测量之间的差异程度接近,第二次测量与第三次测量的差异程度较大。
四实验小结:
实验中遇到的问题及解决办法、心得体会等等...
1、通过对这一实验的学习,我学会了利用SPSS进行相关分析、偏相关分析、距离分析。
2、距离相关分析是对观测量之间和变量之间相似或不相似的程度的一种测量。
距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。
实验五因子分析
一、实验目的:
运用因子分析方法分析数据
二、内容:
1.SPSS操作
2.因子分析
三、案例背景:
现有24名同学身高、体重、坐高、胸围、肩宽、盆骨宽此6项数据,有没有可能用更少的数据说明每位同学的身体状况?
实验步骤:
1.按Analyze→Data Reduction→Factor顺序单击菜单项,打开因子分析主对话框。
2.选PoliticalEconomy、Calculus1 、ComputerCulture、Microeconomics 、Algebra 、Calculus2和VB为分析变量送到右边的Variables栏中。
3.在主对话框中单击Extraction按钮,相应的对话框中:
1)Method菜单中选Principle components项,使用主成分分析方法。
2)Analyz栏中选Correlation matrix项,分析相关矩阵。
3)Extract栏中选择Number of factors 2
4)Display栏中选择Unrotated factor solution,显示未旋转的因子结果。
同样选择Scree plot,要求作出特征值的散点图。
5)Maximum iteration convagence 25,结束迭代的判据为到达最大迭代次数25.
4.主对话框中单击Score按钮。
在相应的对话框中选择Save as variables ,并在Method栏中选择Rregression,要求通过回归方法计算因子得分并把因子得分作为变量保存到数据文件中。
5.单击Descriptives按钮,在对话框Statistics栏内选择Initial solution选项。
6.在主对话框中单击OK按钮执行运算。
四、练习
下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。
X1
X2
X3
X4
X5
X6
X7
3.76
8.59
6.22
7.57
9.03
5.51
3.27
8.74
9.64
9.73
8.59
7.12
4.69
5.51
1.66
5.90
9.84
8.39
4.94
7.23
9.46
9.55
4.94
8.21
9.41
3.66
4.99
6.14
7.28
7.08
3.98
0.62
7.00
9.49
1.33
2.98
5.49
3.01
1.34
1.61
5.76
9.27
4.92
4.38
2.30
7.31
5.35
4.52
3.08
6.44
0.54
1.34
4.52
7.07
2.59
1.30
0.44
3.31
1.03
1.00
1.17
3.68
2.17
1.27
1.57
1.55
1.51
2.54
1.03
1.77
1.04
4.25
4.50
2.42
5.11
5.28
10.02
9.84
12.66
11.76
6.92
3.36
11.68
13.57
9.87
9.17
9.72
5.98
5.81
2.80
8.84
13.60
10.05
6.68
7.79
12.00
11.74
8.07
9.10
12.50
9.77
7.50
2.17
1.79
4.54
5.33
7.63
3.53
13.13
9.87
7.85
2.64
2.76
4.57
1.78
5.40
9.02
3.96
6.49
4.39
11.58
2.77
1.79
3.75
2.45
13.74
10.16
2.73
2.10
6.22
7.30
8.84
4.76
18.52
11.06
9.91
3.43
3.55
5.38
2.09
7.50
12.67
5.24
9.06
5.37
16.18
3.51
2.10
4.66
3.10
4.78
2.13
1.09
0.82
1.28
2.40
8.39
1.12
2.35
3.70
2.62
1.19
2.01
3.43
3.72
1.97
1.75
1.43
2.81
2.27
2.42
1.05
1.29
1.72
0.91
分析:
系统首先输出各变量的均数与标准差,并显示共有25例观察单位进入分析;接着输出相关系数矩阵,经Bartlett检验表明:
Bartlett值 = 326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。
Kaiser-Meyer-Olkin Measure of Sampling Adequacy
是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。
今 KMO值 = 0.32122,偏小,意味着因子分析的结果可能不能接受。
使用主成分分析法得到2个因子,因子矩阵如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。
如本例变量X7与第一因子的值为-0.88644,与第二因子的值为0.21921,可见其与第一因子更近,与第二因子更远。
或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。
下面显示经正交旋转后的因子负荷矩阵和因子转换矩阵。
旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替