spss课件第02章.ppt
《spss课件第02章.ppt》由会员分享,可在线阅读,更多相关《spss课件第02章.ppt(55页珍藏版)》请在冰豆网上搜索。
![spss课件第02章.ppt](https://file1.bdocx.com/fileroot1/2022-10/19/3d4ae25f-aa3c-48ee-a9c8-14d3aa90ea6f/3d4ae25f-aa3c-48ee-a9c8-14d3aa90ea6f1.gif)
数据分析技术&SPSS16.0第二章数据的组织1数据分析技术&SPSS16.0主要内容主要内容2.1SPSS数据文件概述数据文件概述2.2SPSS数据文件的建立数据文件的建立2.3从其他数据文件导入数据从其他数据文件导入数据2.4SPSS数据文件的合并数据文件的合并2.5SPSS数据的预处理数据的预处理2数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.1几个基本概念几个基本概念表表2-1人员编号性别部门体检日期体重健康状况1女通信学院08/10/200455好2女计算机学院08/10/200446好3女外语学院08/10/200450一般4男通信学院08/10/200456差5男管理学院08/11/200451差6男光电学院08/11/200453好7女光电学院08/11/200450一般8男通信学院08/12/200450好9女计算机学院08/12/200445一般10男管理学院08/13/200456好变量个案样本变量值3数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.2统计数据的度量尺度统计数据的度量尺度观测数据:
数据:
是在自然的未被控制的条件下是在自然的未被控制的条件下观测到的数据。
到的数据。
如社会商品零售额、消费价格指数、汽车销售额、如社会商品零售额、消费价格指数、汽车销售额、降雨量等。
降雨量等。
实验数据:
数据:
是通是通过抽抽样调查,从研究,从研究对象全体中象全体中选取一部分取一部分个体个体组成成样本,本,对样本的本的观测所得到的数据。
所得到的数据。
数量的度量:
数量的度量:
度量尺度(由低度量尺度(由低级向高向高级划分):
划分):
名名义尺度尺度定序尺度定序尺度间隔尺度隔尺度4数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.2统计数据的度量尺度统计数据的度量尺度1、名、名义尺度(尺度(Norminal)即定即定类尺度,它尺度,它仅仅是一种是一种标志,用于区分志,用于区分变量量的不同的不同值,类别数据之数据之间没有次序关系。
没有次序关系。
如:
人口的性别、商品的名称、身份证、商店类如:
人口的性别、商品的名称、身份证、商店类型等。
型等。
特点:
特点:
仅测度了事物之度了事物之间的的类别差差所有所有类的地位相等,可以随意排序的地位相等,可以随意排序计量量结果可以且只能果可以且只能计算每一算每一类各元素出各元素出现的的频率率符合符合穷尽和互斥原尽和互斥原则变量取量取值可以是数可以是数值型,也可以是字符型型,也可以是字符型5数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.2统计数据的度量尺度统计数据的度量尺度2、定序尺度(、定序尺度(Ordinal)是是对事物之事物之间等等级或或顺序差序差别的一种的一种测度。
度。
如:
考如:
考试成成绩(优、良、中、差)、人的身高等、良、中、差)、人的身高等级(高、中、矮)、学(高、中、矮)、学历等等级(博士、(博士、硕士、学士)士、学士)等。
等。
特点:
特点:
可以可以测度度类别差,差,还可以可以测度次序差度次序差但无法但无法测出数据之出数据之间的准确差的准确差值计量量结果只能排序,不能果只能排序,不能进行算行算术四四则运算运算变量取量取值可以是数可以是数值型、也可以是字符型型、也可以是字符型6数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.2统计数据的度量尺度统计数据的度量尺度3、间隔尺度(隔尺度(Scale)间隔尺度是指隔尺度是指变量的取量的取值是是连续的区的区间。
分。
分为两两类。
1)定距尺度()定距尺度(Interval),是),是对事物事物类别或次序之或次序之间间距的距的测度。
度。
如:
如:
100分制考试的成绩、重量、温度等。
分制考试的成绩、重量、温度等。
特点:
可区分不同类型并排序,且可准确指出类别之间的特点:
可区分不同类型并排序,且可准确指出类别之间的差距,并可以进行加减运算。
差距,并可以进行加减运算。
7数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.2统计数据的度量尺度统计数据的度量尺度3、间隔尺度(隔尺度(Scale)间隔尺度是指隔尺度是指变量的取量的取值是是连续的区的区间。
分。
分为两两类。
2)定比尺度()定比尺度(Ratio),是指能),是指能够测度度值之之间比比值的的一种一种计量尺度。
量尺度。
如:
员工的月收入、企业产值等。
如:
员工的月收入、企业产值等。
特点:
特点:
其区间属于同一阶层;其区间属于同一阶层;计量结果也表现为数值;计量结果也表现为数值;具有其它三类测量尺度的所有优秀,同时要计算两个测量具有其它三类测量尺度的所有优秀,同时要计算两个测量值之间比值的特点。
值之间比值的特点。
可以进行可以进行+、-、*、/等延伸运算。
等延伸运算。
8数据分析技术&SPSS16.02.1SPSS数据文件概述数据文件概述2.1.2统计数据的度量尺度统计数据的度量尺度说明:
说明:
说明:
说明:
不同的度量尺度的统计数据在SPSS的数据文件中,对应不同的变量数据类型。
名义尺度名义尺度-数值型、字符型数值型、字符型定序尺度定序尺度-数值型、字符型数值型、字符型间隔尺度间隔尺度-数值型数值型9数据分析技术&SPSS16.0主要内容主要内容2.1SPSS数据文件概述数据文件概述2.2SPSS数据文件的建立数据文件的建立2.3从其他数据文件导入数据从其他数据文件导入数据2.4SPSS数据文件的合并数据文件的合并2.5SPSS数据的预处理数据的预处理10数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立SPSS数据文件的建立包括两个方面,首先进行数据的结构定义,其次录入数据。
2.2.1)数据的结构定义)数据的结构定义结构定义包括:
变量名(Name)、变量类型(Type)、变量宽度(Width)、小数位数(Decimals)、变量名标签(Label)、变量值标签(Values)、缺失值(Missing)、列宽(Columns)、对齐方式(Align)、变量的度量尺度(Measure)图2.111数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义变量名(Name)命名规则:
变量名长度可多达64位建议控制在8位之内且尽量避免中文中文说明可以放在Label栏中加以说明首字符应以英文字母开头,后面可以跟除了!
、?
、*之外的字母或数字下划线、圆点不能为变量名的最后一个字符变量名必须唯一且不区分大小写字母允许汉字作为变量名,汉字总数一般不超过4个变量名不能与SPSS的保留字相同:
all、by、eq、ge、gt、leIt、ne、not、or、to、with系统不区分变量名的大小写12数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义变量类型(Type)表2-2英文名英文名中文名中文名说明明Numeric标准数准数值型型变量量默默认总长度度8位,小数位位,小数位2位。
位。
Comma带逗号的数逗号的数值型型变量量默默认总长度度8位,小数位位,小数位2位,其位,其值在在显示示时整整数部分从右至左每三位用一个逗号做分隔符。
数部分从右至左每三位用一个逗号做分隔符。
Dot带圆点的数点的数值型型变量量默默认总长度度8位,小数位位,小数位2位,其位,其值在在显示示时整整数部分从右至左每三位用一个数部分从右至左每三位用一个圆点做分隔符。
点做分隔符。
Scientificnotation科学科学记数法数数法数值型型变量量默默认总长度度8位,小数位位,小数位2位,位,变量量值可以有指可以有指数部分也可以没有。
指数部分用数部分也可以没有。
指数部分用E或或D表示且表示且可可带正正负号。
号。
Date日期型日期型变量量既可表示日期又可表示既可表示日期又可表示时间,用,用户可根据可根据实际情况自行情况自行选择。
Dollar美元符号型数美元符号型数值变量量主要用来表示主要用来表示货币数据,在数据前附加美元符数据,在数据前附加美元符号号$。
Customcurrency自定自定义数数值型型变量量用用户可以自定可以自定义变量量类型,但是此型,但是此项一般不用。
一般不用。
String字符型字符型变量量默默认总长度度为8位。
位。
13数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义变量宽度(Width)设置变量宽度。
一般无需调整,直接采取默认值。
它的大小可通过Width栏后边的微调按钮调整小数位数(Decimals)若变量类型为数值型,则可设置变量的小数位数,其他类型的变量则不能设置。
小数位数默认为两位变量名标签(Label)考虑到与老版本的兼容问题,变量名最好限制为8位以内,并且尽量避免中文,这就有可能不能完全描述清楚变量的信息,此时就可在标签中对变量名做进一步的说明。
利用Label栏,不仅可以对变量详细说明,而且还可以采用中文,大大方便了用户对变量的理解。
14数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义变量值标签(Values)变量值标签是对变量的可能取值附加的进一步说明,标签内容最多可以有120个字符,通常仅对类型或分类变量的取值指定值标签例如,将变量Departmt定义为数值型变量时,可以按照表2-3中所规定它的值和值标签,具体定义方法见图2.2。
变量值变量值标签1通信学院2计算机学院3管理学院4光电学院5外语学院表2-3图2.215数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义缺失值(Missing)SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。
例:
调查表中某栏没填写数据(缺失)学生年龄为60岁(数据不完整)16数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义缺失值(Missing)处理方法(3种):
NoMissingValues:
不指定缺失值Discretemissingvalues:
离散型缺失值,对数值型或字符型变量,用指定1-3个特定的离散值Rangeplusoneoptionaldiscretemissingvalue,对数值型变量,缺失值定义为一个连续的闭区间以内,外加一个离散值。
17数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.1数据的结构定义数据的结构定义列宽(Columns)定义变量在数据窗口中显示的宽度。
对齐方式(Align)定义变量值显示的对齐方式,默认为左对齐。
变量的度量尺度(Measure)(见2.1.2)根据统计数据的类型定义度量尺度,度量尺度在数据分析中的作用不是很明显,但是如果用户要进行交互式绘图就必须定义好度量尺度。
18数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.2数据的录入数据的录入录入数据的一般方法逐行录入(TAB键)逐列录入(回车键)从Word或Excel中直接复制粘贴到数据文件中连续粘贴相同值19数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.2数据的录入数据的录入录入带有变量值标签的数据输入定义了变量值标签的数据时,可以直接输入变量值,也可以通过下拉列框的形式输入,如图2.3所示。
图2.320数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.2数据的录入数据的录入实例P26-2721数据分析技术&SPSS16.02.2SPSS数据文件的建立数据文件的建立2.2.3数据的编辑数据的编辑数据定位按编号行或变量列定位按变量值查找定位变量、观测量的插入与删除插入、删除一行(个案)插入、删除一个列(变