SPSS实验指导书.docx
《SPSS实验指导书.docx》由会员分享,可在线阅读,更多相关《SPSS实验指导书.docx(11页珍藏版)》请在冰豆网上搜索。
SPSS实验指导书
SPSS实验指导书
SPSS统计分析软件概述
SPSS(StatisticalPackagefortheSocialScience)社会科学统计软件包;SPSS(StatisticalProductandServiceSolutions)统计产品与服务解决方案。
20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,并于1975年在芝加哥成立了研发和经营SPSS软件的SPSS公司。
随着微型计算机和操作系统的发展,SPSS公司相继推出了17个版本。
SPSS使用基础(安装和启动略)
SPSS有两个基本窗口,分别是数据编辑窗口(DataEditor)和结果输出窗口(Viewer)。
数据编辑窗口(DataEditor)
是SPSS的主程序窗口,在软件启动时自动打开,直到退出。
运行时只能打开一个数据编辑窗口,关闭该窗口意味着退出。
该窗口的主要功能:
定义SPSS数据的结构、录入编辑和管理待分析的数据。
SPSS的所有统计分析功能都是针对该窗口中的数据的。
这些数据通常以SPSS数据文件的形式保存在计算机磁盘上,其文件扩展名为.sav。
数据编辑窗口由窗口主菜单、工具栏、数据编辑区、系统状态显示区组成。
1、窗口主菜单
窗口主菜单将SPSS常用的数据编辑、加工和分析的功能列了出来。
2、工具栏
将一些常用的功能以图形按钮的形式组织在工具栏,使操作更加快捷和方便。
3、数据编辑区
显示和管理SPSS数据结构和数据内容的区域。
(数据视图和变量视图)
4、系统状态显示区
显示系统的当前运行状态。
SPSS结果输出窗口(Viewer)
该窗口的主要功能是显示管理SPSS统计分析结果、报表及图形,允许同时创建或打开多个输出窗口。
SPSS统计分析的所有输出结果都显示在该窗口中。
输出结果通常以SPSS输出文件的形式保存在计算机的磁盘上,其文件扩展名为.spo。
SPSS的数据编辑窗口是专门负责输入和管理待分析数据的,而输出窗口则负责接收和管理统计分析的结果。
数据的输入和结果的输出是在不同窗口中进行的,这点与Excel等其他有统计分析功能的软件有较大的不同。
利用SPSS进行数据分析的基本步骤
1、SPSS数据的准备阶段(定义数据结构,录入和修改数据)
2、SPSS数据的加工整理阶段(数据的预处理)
3、SPSS数据的分析阶段(选择正确的统计分析方法对数据进行分析和建模)
4、SPSS分析结果的阅读和解释(对分析结果结合背景知识作出合理解释)
实验一、SPSS数据文件的建立和管理
一、实验目的
建立完整、高品质的数据,为数据分析打下良好的数据基础。
二、实验要求
要求根据统计调查阶段取得的调查问卷,建立SPSS文件并进行相应的管理。
三、实验内容
1、描述SPSS数据的结构
2、录入编辑SPSS的数据内容
◆涉及操作路径介绍
1.1SPSS数据的结构和定义方法
建立数据文件的第一步是定义变量。
在数据编辑窗口左下角激活(VariableView)变量定义窗口,如下图
在数据窗口中,用户定义数据变量名称、数据类型、宽度、小数位等信息。
1.1.1变量名(Name)
变量名是变量访问和分析的唯一标志。
起名规则:
不多于8个字符组
成,不区分大小写,允许汉字作为变量名,汉字总数不能超过4个;变量名不能与SPSS内部特有的具有特定含义的保留字相同,如all,by,not,and,or等;默认变量名为VARn。
为方便记忆,变量名最好与其代表的数据含义相对应。
1.1.2数据类型(Type)、宽度(Width)、小数位宽(Decimals)
标准型(Numeric):
默认列宽为8位,小数位宽为2位;
科学记数法型(ScientificNotation):
120记为1.2E+02;
逗号型(Comma):
逗号型数据其整数部分从个位开始每3位以逗号分割;圆点型(Dot):
圆点型数据其整数部分从个位开始每3位以一个圆点分割,
以逗号作为整数和小数部分的分隔符;
美元符号型(Dollar):
表示货币数据,数据前附加美元符号$;
日期型(Date):
多种显示格式;
字符型(String):
不能够进行算术运算,并区分大小写字母,字符型数据在
命令处理过程中应用一对双引号引起来。
width指定数据字符占据的总个数(包括小数点和小数位)。
Decimal指定小数位。
1.1.3变量名标签(Label)
对变量名含义的进一步解释说明。
1.1.4变量值标签(Values)
对变量取值的含义进行解释说明,对定类型和定序型数据尤为重要。
例如,对性别变量,用1表示男性,用2表示女性,添加值标签后可以简化输入。
1.1.5缺失数据(Missing)
数据中明显错误或明显不合理的数据以及漏填的数据都可看作缺失数据。
●【discretemissingvalues】:
1~3个特定的离散值
●【rangeplusoneoptionaldiscretemissingvalue】:
在一个连续的闭区间内并同时附加一个区间以外的离散值
1.1.6计量尺度(Measure)
定距型数据(Scale):
连续或离散数值型数据;
定序型数据(Ordinal):
具有内在固有大小或高低顺序,如职称有初、中、高级;年龄有老、中、青等;
定类型数据(Nominal):
没有内在固有大小或高低顺序
1.2数据的录入与编辑
1.2.1数据的录入
与excel基本类似。
1.2.2数据的编辑
●数据的定位:
按个案号码【Data】→【gotocase】
按变量值【Edit】→【Find】
●插入一条个案:
【Data】→【InsertCase】
●插入一个新变量:
【Data】→【InsertVariable】
●数据的移动、复制和删除:
同excel
1.2.3数据的保存
可保存成Spss、Excel、dbf文件等。
【File】→【Save】/【Saveas】
1.2.4数据文件合并
大型数据库在录入时可将数据库进行拆分,由多个人员分别录入,之后合并,提高录入效率。
●纵向合并数据文件:
将数据库进行首尾对接
【Data】→【MergeFile】→【AddCases】
●横向合并数据文件:
将数据库进行左右对接
【Data】→【MergeFile】→【AddVariables】
实验二、SPSS数据的预处理
一、实验目的
通过数据预处理的相关命令,掌握数据分析前对数据进行的转换处理、数据抽样、选取变量以及缺失值的处理等。
二、实验要求
在数据文件建立的基础上,要求熟练操作相关的预处理命令并加以运用。
三、实验内容
1.根据样本数据库(75页14题),按完成加工定额,以组距为20%编制等距数列,计算各组工人数、工资总额和平均工资,分析:
工人完成加工定额和计件工资之间的相互关系(绘制散点图)。
散点图:
【Graphs】→【Scatter】。
本题用到的命令:
统计分组,分类汇总等
2.依据定额完成情况计发基本奖金:
基本奖金等于月工资减去500,之后,依据完成定额6个不同情况分别将以上计算结果上浮1%,2%,3%,4%,5%,6%。
3.依据定额完成的不同情况,对完成定额任务的计发绩效奖金。
绩效奖金等于月工资除以10,之后,依据完成定额6个不同情况分别将以上计算结果上浮1%,2%,3%,4%,5%,6%。
以上两题用到的命令:
变量计算
4.应用加权处理,完成163页11题。
◆相关操作路径介绍
2.1数据的排序
便于浏览数据、了解数据取值情况(极大值、极小值、异常值)初步把握数据取值离散程度。
操作过程:
1、【Data】→【SortCases】
2、指定主排序变量到【Sortby】框中,并选择【Sortorder】指定该变量排
序规则。
3、如果是多重排序,还要依次指定第二、第三排序变量以及相应排序规则。
2.2变量计算
主要是在原有数据的基础上,根据用户给出的算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。
变量计算涉及以下概念:
1、SPSS算术表达式
由常量、变量、算术运算符、圆括号、函数等组成的式子。
算术运算符按优先次序乘方、乘除、加减。
可通过圆括号改变原有计算顺序。
在同一算术表达式中的常量及变量,数据类型应该一致。
2、SPSS条件表达式
简单条件表达式:
由关系运算符(,=,,=,=,~=不等于)、常量、
变量以及算术表达式组成。
复合条件表达式:
由逻辑运算符、圆括号和简单条件表达式组成。
其中逻辑运算
符优先次序NOT→AND→OR,可通过圆括号改变这种运算顺序
3、SPSS函数:
可到网上下载。
操作步骤:
(1)【Transform】→【Compute】
(2)在【NumericExpression】给出算术表达式和函数
(3)在【Target】框中输入存放计算结果的变量名。
该变量可以是一个新变量,也可以是一个已经存在的变量。
前者系统会自动创建,后者则提问用户是否以计算出的新值覆盖原有旧值。
(4)如果仅对符合一定条件的个案计算产生变量,选择if按钮,选择【includeifcasesatisfiescondition】。
2.3数据选取
从已收集到的总体中抽取部分数据参与分析。
操作步骤:
1、选择菜单【Data】→【SelectCases】
2、在Select框中选择抽样方法:
(1)按指定条件选取(Ifconditionissatisfied);
(2)随机选取(Randomsampleofcases):
包括近似选取和精确选取。
(3)选取某一区域内的样本(Basedontimeorcaserange);
(4)通过过滤变量选取(Usefiltervariable):
指定一变量作为过滤变量,变量值为非0或非系统缺失值的个案将被选中。
2.5分类汇总
按照某分类进行分类汇总计算。
如希望了解来自不同地区的大学生在消费支出上是否存在较大差距,可以对大学生按籍贯进行分类,然后分别计算不同籍贯学生的平均消费支出进行比较。
操作步骤:
1、选择菜单【Data】→【Aggregate】;
2、指定分类变量到【BreakVariable(s)】框中,指定汇总变量到【AggregateVariable(s)】框中。
3、按Function按钮指定对汇总变量计算哪些统计量。
4、指定将分类汇总结果保存到何处。
有两种选择:
【Createnewdatafile】表示将结果生成到系统默认的名为aggr.sav的SPSS数据文件中,可以按File按钮重新指定文件名;【Replaceworkingdatafile】表示将分类汇总结果覆盖数据编辑窗口中的数据。
5、按NameLabel按钮重新指定结果文件中的变量名或加变量名标签。
6、如果希望在结果文件中保存各分类组的个案数,则选择【Savenumberofcaseinbreakgroupasvariable】选项。
2.6数据分组
根据统计分析的需要,将数据按照某种标准重新划分为不同的组别,针对定距型数据。
如分析被调查者月均消费支出的分布特征,可进行组距式分组。
操作步骤:
1、选择菜单【Transform】→【Recode】→【IntoDifferentVariables】(【IntoSame】会覆盖掉原有变量值)
2、选择分组变量到【NumericVariable-Output】框中。
3、在【OutputVariable】框中的【Name】后输入存放分组结果的变量名,并按Change按钮确认。
也可在【Label】后输入相应的变量名标签。
4、按OldandNewvalues按钮进行分组区间定义。
应根据分析要求逐个定义各分组区间。
5、如果仅对符合一定条件的个案分组,则按IF按钮并输入条件表达式。
6、察看分组效果【Analyze】→【DescriptiveStatistics】→【Frequencies】选择频数分析变量到【Variable(s)】中。
2.7加权处理
如计算加权平均数,或者进行综合评价:
如春晚调查,10%的观众打了5分,25%打4分,65%打3分等。
操作步骤:
1、选择菜单【Data】→【WeightCases】
2、选择【Weightcasesby】选项,并选择某变量作为加权变量到【Frequercy】框中。
操作完毕后,状态栏中有已经加权的提示信息。
练习141页【例6-7】查看加权效果,计算平均指标或变异度指标,使用命令
【Analyze】→【DescriptiveStatistics】→【Descriptives】,选择要计算的统计量。
2.8数据拆分
根据指定变量对数据进行分组。
数据拆分后将对后面的分析一直起作用,直到取消拆分。
【Data】→【SplitFile】
2.9SPSS变量集
是一种通过减少变量显示个数而简化变量选择操作的方式。
先定义变量集,再使用变量集。
指定使用某个变量集后,在进行数据处理或分析时,窗口仅显示正被使用的变量集中的变量。
定义【Utilities】→【DefineSets】
使用【Utilities】→【UseSets】
实验三、SPSS基本统计分析
一、实验目的
通过基本统计分析,掌握数据的基本统计特征,把握数据的总体分布形态。
为后续的数据建模提供指导和参考。
二、实验要求
在实验二的基础上,要求结合数据库,应用基本统计分析的方法,以数值计算和图形绘制为手段,多方位(多变量)展示调查问题的特征,形成统计报告。
三、实验内容
根据调研形成的数据库,应用相关的数据预处理命令和频数分析,写作统计报告。
要求对定序和定类变量做频数分析,对定距型变量计算基本描述统计量。
具体要求如下:
1、单变量频数分析选择至少三个变量,绘制频数分析表、图,并配合文字说明;
2、双变量频数分析至少选择一对变量,绘制交叉列联表、图,并配合文字说明;
3、选择至少一个定距型变量,计算基本描述统计量,并结合数据含义进行解释;
以上操作可以视情况使用前面所学的数据拆分、分类汇总命令,深入分析问题。
◆相关操作路径介绍
3.1频数分析
频数即变量值落在某个区间(或某个类别)中的次数。
通过频数分析,能够了解变量取值的状况,把握数据的分布特征。
频数分析有两个基本任务:
编制频数分布表和绘制统计图。
【Analyze】→【DescriptiveStatistics】→【Frequencies】选择若干频数分析变量到【Variable(s)】中。
3.2交叉分组
练习涉及两个或两个以上的变量的频数分析。
【Analyze】→【DescriptiveStatistics】→【Crosstabs】,按Cells按钮选中
【Percentages】选项中行百分比和列百分比及totals.
3.3计算基本描述统计量
若要对定距型数据的分布特征有更为精确的认识,需计算基本统计量,包括:
1、刻画集中趋势的描述统计量(平均指标)
2、刻画离散程度的描述统计量(变异度指标)
3、刻画分布形态的描述统计量(偏度峰度)
【Analyze】→【DescriptiveStatistics】→【Descriptives】练习130页11题;
实验四、SPSS的相关、回归和预测
一、实验目的
掌握变量之间的序列关系和相关关系,应用时间序列和相关回归进行分析预测。
二、实验要求
要求根据有关数据库,熟悉相关、回归分析和预测的操作方法,掌握时间数列的各种预测方法。
三、实验内容
(一)SPSS的时间序列分析
根据时间数列,对现象未来发展趋势进行分析和预测。
1、回归预测法(时间序列最小二乘法部分)
步骤:
(1)绘制时间序列图【Graphs】→【Sequence】
(2)【Analyze】→【Regression】→【CurveEstimation】
【SaveVariables】框:
【Prdictedvalues】表示保存预测值;【Residuals】表示保存参差;【Predictionintervals】表示保存预测值默认95%置信区间的上限和下限值。
(3)【PrdictCase】框:
【Predictfromestimationperiodthroughlastcase】表示计算当前所有样本期内的预测值;【Predictthrough】表示计算指定样本期内的预测值,指定样本期在【Observation】框后输入。
练习本章节例题【例11-5】及344页课后习题13/14/15
2、移动平均法
【Transform】-【Creattimeseries】,function中选择相应的方法,按照移动平均值与原时间序列在时间位置上的对应关系不同,移动平均法可分为前移动平均(Priormovingaverage)和中心移动平均(Centeredmovingaverage)。
【Priormovingaverage】计算当前值以前若干期的平均值;
【Centeredmovingaverage】是指以当前值为中心,计算前后若干期的平均值。
练习本章节例题【例11-2】及344页课后习题10,体会
(1)两种移动平均的区别
(2)不同的移动步长,对原数列的修匀效果(结合图形)。
3、指数平滑法
【Analyze】-【Timeseries】-【exponentialsmoothing】-【Simple】Simple法基本过程:
1.首先定义变量、输入数据,至少要有一个变量
2.指定需要进行指数平滑处理的变量。
3.“Parameters”参数设定,选定指数平滑中的参数,误差修正权数α
(General(Alpha))的取值在默认状态下为0.1,当α=1时,预测值等于最新的观测值。
单击GridSearch选项,如不加改动,可让程序自动计算α从0.1到1的10个指数平滑结果,并将误差平方和最小的平滑结果暂时存放在数据库中,当然,在这里可重新设置α的开始值,以后每次的增加值及终止值。
在本程序中,确定InitialValues初始值栏中的选择有两种方式,选择Automatic项,初始值用自动方式生成,程序自动取时间序列的总平均值为初始值:
选择Custom项,可手工输入初始值及趋势值。
单击“Save”,最后单击“OK”并执行。
本章例题315页【例11-3】:
采用指数平滑法,取加权系数a=0.8进行计算,初始值为42.95。
选择
【Analyze】→【Timeseries】→【exponentialsmoothing】→选择汽车产量为变量→【Models】选Simple→【Parameters】按钮→α给定0.8→初始值给42.95(最先3个值的平均),趋势值给180左右(根据最后一个值确定)。
绘制时间序列图【Graphs】→【Sequence】
练习344页课后习题11
(二)绘制散点图
散点图将数据以点的形式画在直角平面上,可以直观地发现变量间的统计关系以及它们的强弱程度和数据对的可能走向。
步骤:
(1)、选择菜单
【Graphs】→【Scatter】
(2)、选择散点图的类型。
SPSS提供了四种类型的散点图
(3)、根据所选择的散点图类型,按Define对散点图作具体定义。
4.1.1简单散点图
表示一对变量间统计关系的散点图。
应定义的选项:
●指定某个变量为散点图的纵轴变量,选入【YAxis】框中
●指定某个变量为散点图的横轴变量,选入【XAxis】框中
●可指定作为分组的变量到【SetMarkersby】框中,表示按该变量的不同取值将样本数据分成若干组,并在一张图上分别以不同颜色绘制若干个散点图。
该项可省略。
4.1.2重叠散点图
表示多对变量间统计关系的散点图。
●两个变量为一对,指定绘制哪些变量间的散点图。
其中,前一个变量为纵轴变量,后一个变量为横轴变量。
并可通过SwapPair按钮进行横纵轴变量的调换。
4.1.3矩阵散点图
以方形矩阵的形式分别显示多对变量间的统计关系。
4.1.4三维散点图
以立体图的形式展现三对变量间的统计关系。
(三)计算相关系数
步骤:
(1)、选择菜单
【Analyze】→【Correlate】→【Bivariate】
(2)、选择参加计算相关系数的变量到【Variables】框中。
(3)、在【CorrelationCoefficients】框中选择计算哪种相关系数。
(4)、在【TestofSignificance】框中选择输出相关系数检验的双尾概率P值还是单尾。
(5)、选中【Flagsignificanceofcorrelation】选项,表示分析结果中还会输出星号标记,以表明变量间的相关性是否显著;不选中,则不输出星号标记。
(四)SPSS的回归分析
步骤:
(1)、选择菜单
【Analyze】→【Regression】→【CurveEstimation】
若为一元线性回归,则【Analyze】→【Regression】→【Linear】
(2)、选择被解释变量到【Dependent】框中
(3)、选择解释变量到【Independent】,可以是相关因素变量,也可以是时间变量
(4)、在【Models】中选择几种模型
(5)、选择【PlotModels】选项绘制回归线;选择【DisplayANOVAtable】输出各个模型的方差分析表和各回归系数显著性检验结果。
以判定系数Rsq.为主要依据选择其中的最优模型。