SPSS操作实验手册.docx
《SPSS操作实验手册.docx》由会员分享,可在线阅读,更多相关《SPSS操作实验手册.docx(28页珍藏版)》请在冰豆网上搜索。
SPSS操作实验手册
SPSS实验操作指导手册(2015版)
2.SPSS数据整理
2.1SPSS数据文件的建立
SPSS数据文件的建立可以利用【File(文件)】菜单中的命令来实现。
具体来说,SPSS提供了四种创建数据文件的方法:
●新建数据文件【File(文件)】→【New(新建)】→【Data(数据)】命令;
●直接打开已有数据文件【File(文件)】→【Open(打开)】→【Data(数据)】命令;
●使用数据库查询;
【File(文件)】→【OpenDatabase(打开数据库)】→【NewQuery(新建查询)】命令,弹出【DatabaseWizard(数据库向导)】对话框
●从文本向导导入数据文件。
【File(文件)】→【ReadTextData(打开文本数据)】命令,弹出【OpenData(打开数据)】对话框
实例分析:
股票指数的导入
文件2-1.xls是上证指数从2007年1月4日至2008年10月16日的数据资料,包括了开盘价、当日最高价、当日最低价和收盘价等选项,请将该数据导入至SPSS中。
2.2SPSS数据文件的属性
一个完整的SPSS文件结构包括变量名称、变量类型、变量名标签、变量值标签等内容。
注意:
SPSS数据文件中的一列数据称为一个变量,每个变量都应有一个变量名。
SPSS数据文件中的一行数据称为一条个案或观测量(Case)
2.2.1实例分析:
员工满意度调查表的数据属性设计
1.实例内容
为了提高员工的工作积极性,完善公司各方面管理制度,并达到有的放矢的目的,某公司决定对本公司员工进行不记名调查,希望了解员工对公司的满意情况。
请根据该公司设计的员工满意度调查题目(行政人事管理部分)的特点,设计该调查表数据在SPSS的数据属性。
2.实例操作
具体步骤如下文件(2-2.sav.)
Step01:
打开SPSS中的DataView窗口,录入或导入原始调查数据。
Step02:
选择菜单栏中的【File(文件)】→【Save(保存)】命令,保存数据文件,以免丢失。
Step03:
单击SPSS中的【VariableView(变量视图)】选项卡,按窗口提示进行数据属性的定义,如变量名称、标签、标签值等。
2.3SPSS数据文件的整理
【Data(数据)】菜单中的命令主要用于实现数据文件的整理功能。
2.3.1观测量排序:
地区生产总值分析
1.操作详解
Step01:
打开观测量排序对话框【File(文件)】→【Data(数据)】→【SortCases(排序个案)】命令
Step02:
选择排序变量
Step03:
选择排序类型
Step04:
单击【OK】按钮,此时操作结束。
2.实例内容:
地区生产总值分析
数据2-3.sav列出了2005年我国部分省份的地区生产总值及第一产业、第二产业和第三产业的生产总值,请根据这些数据分析不同省份经济发展状况的差异性。
2.3.2数据的转置:
国家财政分项目收入
1.操作详解
Step01:
打开转置对话框
【File(文件)】→Data(数据)】→【Transpose(转置)】命令
Step02:
选择转置变量
Step03:
新变量命名
Step04:
单击【OK】按钮,操作结束。
注意:
数据文件转置后,数据属性的定义都会丢失,因此用户要慎重选择本功能。
2.实例内容:
国家财政分项目收入数据(2-4.sav)
2.3.3文件合并:
固定资产投资
【data(数据)】→【MergeFiles(合并文件)】菜单中有两个命令选项:
【AddCases(添加个案)】和【AddVariables(添加变量)】。
1.观测量合并的SPSS操作详解
Step01:
打开观测量合并对话框
【File(文件)】→【Data(数据)】→【MergeFiles(合并文件)】→【AddCases(添加个案)】命令
Step02:
选择合并文件
点选【AnexternalSPSSStatisticsdatafile(外部SPSSStatistics数据文件)】单选钮,同时单击【Browse】按钮,选中需要合并的文件,并指定文件路径,然后单击【Continue】按钮。
Step03:
选择合并方法。
Step04:
单击【OK】按钮,操作结束。
2.变量合并的SPSS操作详解
Step01:
打开变量合并对话框。
Step02:
选择合并文件。
Step03:
选择合并方法。
Step04:
单击【OK】按钮,操作结束。
3.实例内容:
固定资产投资文件的合并
已知2-5-1.sav、2-5-2.sav和2-5-3.sav中的数据是北京、天津、河北等省市在2005年部分行业的固定投资额(亿元)数据,请完成以下问题。
问题一:
将2-5-1.sav和2-5-2.sav的数据文件纵向合并(观测量合并)。
问题二:
将2-5-1.sav和2-5-3.sav的数据文件横向合并(变量合并)。
2.3.4数据分类汇总:
城乡居民储蓄存款
对数据进行分类汇总就是按指定的分类变量值对所有的观测量进行分组,对每组观测量的变量求描述统计量,并生成分组数据文件。
例如,将一个工厂的数据资料,按照该工厂的各个部门进行分组,并统计各个部门的人员年龄均值、方差等,这些工作就属于数据分类汇总的范畴。
1.数据分类汇总的SPSS操作详解
Step01:
打开数据汇总对话框
【File(文件)】→【Data(数据)】→【Aggregate(分类汇总)】命令
Step02:
选择分类变量;Step03:
选择汇总变量
Step04:
选择汇总函数;Step05:
添加变量标签
Step06:
选择汇总结果保存方式
Step07:
大规模数据的排序选择
Step08:
完成上述操作后,单击【OK】按钮,操作结束
2.实例内容:
城乡居民人民币储蓄存款
我国部分省份2004年度城乡居民的人民币储蓄存款金额(年底余额,单位:
亿元)
2.3.5数据文件的拆分Split
1.数据分类汇总的SPSS操作详解
Step01:
打开数据拆分对话框
【File(文件)】→【Data(数据)】→【SplitFile(拆分文件)】命令
Step02:
选择数据拆分方式。
Step03:
选择拆分变量。
Step04:
单击【OK】按钮,操作结束。
2.实例内容:
分行业职工平均工资
2005年我国部分按细行业划分的职工平均工资,请根据不同的行业类型,对原始数据进行拆分,数据详见2-7.sav。
2.3.6选择数据:
城市设施水平
1.操作详解
Step01:
打开数据选择对话框
【File(文件)】→【Data(数据)】→【SelectCases(选择个案)】命令
Step02:
选择数据选择方式
单击【If】按钮——单击【Sample】按钮——单击【Range】按钮
Step03:
选择输出方式
Step04:
单击【OK】按钮,操作结束
2.实例内容:
城市设施水平
数据文件2-8.sav中是2006年我国部分地区城市设施水平指标,包括城市用水普及率、城市燃气普及率等。
请根据这些原始数据,按照以下条件选择数据。
条件一:
选择城市用水普及率和城市燃气普及率都大于90%的地区。
条件二:
随机选取10个地区。
条件二属于随机选择的问题,因此需要点选【Randomsamplesofcases(随机个案样本)】单选钮,同时在弹出的【SelectCases:
RandomSample(选择个案:
随机样本)】对话框的“Exactlycasesformthefiirstcases”文本框中分别输入10和31,表示从31个观测量中选择10个观测量。
最后,单击【Continue】按钮返回主对话框,随机选取的样本结果如下页所示。
2.3.7数据加权:
蔬菜的平均价格
权重是数据分析中的一个重要概念,它是一个相对的概念。
权重的大小描述了该指标在整体评价中的相对重要程度。
在数据处理中,常需要对数据进行加权处理。
1.数据加权的SPSS操作详解
Step01:
打开数据加权对话框
【File(文件)】→【Data(数据)】→【Weightcases(加权个案)】命令
2.实例内容:
蔬菜的平均价格
某经销商希望掌握菜市场的蔬菜销销售的平均价格,收集数据见数据文件2-9.sav。
现请利用这些数据,求出这些蔬菜的平均价格。
Step1:
以蔬菜的销售量为权重计算各种蔬菜销售的平均价格更为合适。
选择“销售量”变量作为权重变量,将其放入【FrequenciesVariable(频率变量)】列表框中
Step02:
选择变量是否加权,用户首先选择是否对观测量进行加权。
Step03:
单击【OK】按钮,操作结束。
2.4SPSS数据的计算和变换
2.4.1变量计算:
国内生产总值的产业构成
1.SPSS操作详解
【File(文件)】→【Transform转换】→【Compute(计算)】命令
Step02:
定义新变量及其类型
在【TargetVariable(目标变量)】文本框中用户需要定义目标函数名,它可以是一个新变量名,也可以是已经定义的变量名。
Step03:
输入计算表达式
Step04:
条件样本选择
2.实例内容:
国内生产总值的产业构成
数据文件2-10.sav为我国1978-2005年国内生产总值、第一产业国内生产总值、第二产业国内生产总值和第三产业国内生产总值,请分析不同产业所占国内生产总值的变动情况。
Step01:
打开对话框
Step02:
定义第一产业比重变量
Step03:
计算第一产业生产总值所占比重
Step04:
完成操作
2.4.2变量重新赋值:
空气质量等级划分
SPSS的【Transform(转换)】菜单中有【RecodeintoSameVariable(重新编码为相同变量)】和【RecodeintoDifferentVariable(重新编码为不同变量)】两个命令可以实现重新赋值功能。
1.SPSS操作详解
Step01:
打开重新赋值对话框
【File(文件)】→【Transform(转换)】→【RecodeintoDifferentVariable】
Step02:
选择重新赋值变量和输出变量
Step03:
设置重新赋值规则
Step04:
选择样本赋值
Step05:
最后单击【OK】按钮,此时操作结束
2.实例内容:
空气质量等级的划分
我国部分城市2005年空气质量的指标数据(见数据文件2-11.sav),请利用这个规则对不同城市的空气质量等级进行划分。
2.4.3变量值计数:
消费价格指数的上涨项目
1.SPSS操作详解
Step01:
打开重新赋值对话框
【File(文件)】→【Transform(转换)】→【CountValueswithinCases(对个案内的值计数)】命令
Step02:
输入目标计数变量
Step03:
选择计数变量
Step04:
设置计数规则
Step05:
选择样本计数
Step06:
最后单击【OK】按钮,此时操作结束
2.实例内容:
消费价格指数的上涨项目
我国城市和农村居民消费价格分类指数数据见数据文件2-12.sav。
由于不同产品的价格涨跌不同,请找出城市和农村居民消费价格指数都较去年上涨超过1%的项目。
3.SPSS描述性统计分析
【DescriptiveStatistics】菜单中。
最常用的是列在最前面的四个过程。
●Frequencies:
产生频数表。
●Descriptives:
进行基本的统计描述分析。
●Explore:
探索性分析。
●Crosstabs:
列联表分析。
3.1SPSS在频数分析中的应用
3.1.2频数分析的SPSS操作详解
Step01:
打开主窗口
选择菜单栏中的【Analyze(分析)】→【DescriptiveStatistics(描述性统计)】→【Frequencies(频率)】命令
Step02:
选择分析变量
Step03:
输出频数分析表
勾选【Displayfrequencytables(显示频率表格)】复选框
Step04:
其他基本统计分析
还可以单击【Statistics(统计量)】和【Charts(图表)】等按钮
Step05:
输出格式选择
单击【Format】按钮
Step06:
完成操作
单击【OK】按钮,结束操作,SPSS软件自动输出结果。
3.1.3实例图文分析:
产品的销售量(见数据文件3-1.sav)
假设某公司每周大约卖出2000万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。
假设下面给出的销售数字(单位:
百万)代表近期公司该产品每周的销售数据。
利用频数分析你能得到什么有助于生产及销售的信息?
24181826242316182120212419191422212627
15191720201922231623211519212022152419
3.2SPSS在描述统计分析中的应用
3.2.2描述统计分析的SPSS操作详解
Step01:
打开主窗口
【Analyze(分析)】→【DescriptiveStatistics(描述性统计)】→【Descriptives(描述)】命令
Step02:
选择分析变量
Step03:
计算基本描述性统计量
Step04:
保存标准化变量
勾选【Savestandardizedvaluesasvariables(保存标准化变量值)】复选框
Step05:
完成操作
单击【OK】按钮,结束操作,SPSS软件自动输出结果。
3.2.3实例图文分析:
奥斯卡获奖者的年龄(见数据文件3-2.sav)
请你分析不同性别演员获得奥斯卡奖的年龄差异性。
男演员:
323736325153336135455539763742403260385648484043624342444156394631474560
女演员:
504435802628412161384933743033413135414237263434352661603424303731273934
3.3SPSS在探索性分析中的应用
1.使用目的:
探索性数据分析(ExplorataryDataAnalysis,简称EDA)的基本思想是从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大致情况,也可以为进一步结合模型的研究提供线索,为传统的统计推断提供良好的基础和减少盲目性。
2.主要内容:
检查数据是否有错、获得数据分布特征、对数据的初步观察,发现一些内在规律。
3.3.2探索性分析的SPSS操作详解
SPSS中的Explore过程用于计算指定变量的探索性统计量和有关的图形。
它既可以对观测量整体分析,也可以进行分组分析。
从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。
Step01打开主窗口
【Analyze(分析)】→【DescriptiveStatistics(描述性统计)】→【Explore(探索)】命令
Step02选择分析变量
Step03选取分组变量
Step04选择标签值
Step05选择输出类型
Step06描述性统计量结果输出
Step07统计图形结果输出
Step08选择缺失值的处理方式
Step09操作完成
3.3.3实例图文分析:
中国南北城市的温度差异
Step01:
打开对话框
打开数据文件3-3.sav,其中增加变量“地域”表示所在城市的区域位置,“1”表示南方城市,“2”表示北方城市。
选择菜单栏中的【Analyze(分析)】→【DescriptiveStatistics(描述性统计)】→【Explore(探索)】命令,弹出【Explore(探索)】对话框。
3.4SPSS在列联表分析中的应用
3.4.2列联表分析的SPSS操作详解
Step01打开主窗口
选择菜单栏中的【Analyze(分析)】→【DescriptiveStatistics(描述性统计)】→【Crosstabs(列联表)】命令
Step02选择行、列变量
Step03选择层变量
Step04列联表输出格式的选择
Step05行、列变量相关程度的度量
Step06选择列联表单元格的输出类型
Step07选择列联表单元格的输出排列顺序
Step08完成操作
3.4.3实例图文分析:
大学生身体素质调查
在一次上海大学生身体素质的实际调查中,选择了部分大专院校的学生进行实际问卷调查,收集的数据见3-4.sav。
调查内容主要包括:
性别、出生日期、身高、体重、血型、教育背景、学科、男女身高级别和男女体重级别等内容。
请根据调查数据分析下面问题:
(1)进行“性别”和“体重级别”双因素交叉作用下的列联表分析,并研究“性别”对“体重级别”有无显著性影响。
(2)进行“教育背景”和“身高级别”双因素交叉作用下的列联表分析,并研究“教育背景”对“身高级别”有无显著性影响。
4.SPSS的均值比较过程
SPSS主要有以下模块实现均值比较过程。
●One-SampleTTest:
单样本t检验。
●Independent-SampleTTest:
两个独立样本均值的t检验。
●Paired-SampleTTest:
两个配对样本均值的t检验。
4.1SPSS在单样本t检验的应用
单样本t检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在明显的差异。
它是对总体均值的假设检验。
如果概率P值小于或等于显著性水平,则拒绝零假设;
如果概率P值大于显著性水平,则接受零假设。
4.1.2单样本t检验的SPSS操作详解
Step01:
打开单样本t检验对话框
【Analyze(分析)】→【CompareMeans(比较均值)】→【One-SampleTTest(单样本T检验)】命令
Step02:
选择检验变量
Step03:
选择样本检验值
Step04:
其他选项设置
Step05:
单击【OK】按钮结束操作,SPSS软件自动输出结果
4.1.3实例图文分析:
交通通勤时间(见数据文件4-1.sav)
1.实例内容
根据一份公共交通调查报告显示,对于那些在一个城市乘车上下班的人来说,平均通勤时间为19分钟,其人数总量为100万—300万。
假设一个研究者居住在一个人口为240万的城市里,想通过验证以确定通勤时间是否和其他城市平均水平是否一致。
他随机选取了26名通勤者作为样本,收集的数据如下所示。
假设通勤时间服从正态分布,这位研究者能得到什么结论?
19162023232413192316171514
27172318182018181823191928
2.实例操作(略)
4.2SPSS在两独立样本t检验的应用
4.2.2两独立样本t检验的SPSS操作步骤
Step01:
打开两独立样本t检验对话框。
【Analyze(分析)】→【CompareMeans(比较均值)】→【Independent-SamplesTTest(独立样本T检验)】命令
Step02:
选择检验变量
Step03:
选择分组变量
Step04:
定义组别名称
Step05:
单击【OK】按钮,结束操作,SPSS软件自动输出相关结果
4.2.3实例图文分析:
机场等级分数比较(见数据文件4-3.sav)
1.实例内容
国际航空运输协会(TheInternationalAirTransportAssociation)对商务旅游人员进行了一项调查,以便确定多个国际机场的等级分数。
最高可能分数是10分,分数越高说明其等级也越高。
假设有一个由50名商务旅行人员组成的简单随机样本,要求这些人给迈阿密机场打分。
另外有一个由50名商务旅行人员组成的样本,要求这些人给洛杉矶机场打分。
这两个组人员打出的等级分数如表4-5所示。
请你判断迈阿密机场和洛杉矶机场的等级评分是否相同?
4.3SPSS在两配对样本t检验的应用
在现实中,总体或样本之间不仅仅表现为独立的关系,很多情况下,总体之间存在着一定的相关性。
当分析这些相关总体之间的均值关系时,就涉及到两配对样本的t检验。
配对样本主要包括下列一些情况:
(1)同一实验对象处理前后的数据。
例如对患肝病的病人实施某种药物治疗后,检验病人在服药前后的差异性。
(2)同一实验对象两个部位的数据。
例如研究汽车左右轮胎耐磨性有无显著差异。
(3)同一样品用两种方法检验的结果。
例如对人造纤维在60度和80度的水中分别作实验,检验温度对这种材料缩水率的影响性。
(4)配对的两个实验对象分别接受不同处理后的数据。
例如对双胞胎兄弟实施不同的教育方案,检验他们在学习能力上的差异性。
进行配对样本检验时,通常要满足以下三个要求。
(1)两组样本的样本容量要相同;
(2)两组样本的观察值顺序不能随意调换,要保持一一对应关系;
(3)样本来自的总体要服从正态分布。
4.3.2两配对样本t检验的SPSS操作详解
Step01:
打开两配对样本t检验对话框
【Analyze(分析)】→【CompareMeans(比较均值)】→【Paired-SamplesTTest(配对样本T检验)】命令
Step02:
选择配对变量
Step03:
其他选项选择
Step04:
单击图【OK】按钮,结束操作,SPSS软件自动输出结果
4.3.3实例图文分析:
看电视和读书的时间(见数据文件4-5.sav)
1.实例内容
“每月读书俱乐部”的成员进行了一项调查,以确信其成员用于看电视的时间是否比读书的时间多。
假定抽取15个人组成的样本,得到了下列有关他们每周观看电视的小时数和每周读书时间的小时数的数据,见表4-11所示。
你能够得到结论:
“每月读书俱乐部”的成员每周观看电视的时间比读书的时间更好吗?
表4-11每天观看电视和读书时间(单位:
小时)
被调查者
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
看电视时间
10
14
16
18
15
14
10
12
4
8
16
5
8
19
11
读书时间
6
16
8
10
10
8
14
14
7
8
5
10
3
10
6
5.SPSS的方差分析
多个总体均值是否相等的假设检验问题了,所采用的方法是方差分析。
方差分析中有以下几个重要概念:
因素、水平、单元、元素、交互作用
5.1.2方差分析的基本思想
表5-1某公司产品销售方式所对应的销售量
序号
销售方式
1
2
3
4
5
水平均值
方式一
77
86
81
88
83
83
方式二
95
92
78
96
89
90
方式三
71
76
68
81
74
74
方式四
80
84
79
70
82
79