SPSS数据分析基础精品PPT课件.pptx

上传人:zf 文档编号:30870871 上传时间:2024-09-12 格式:PPTX 页数:166 大小:1.86MB
下载 相关 举报
SPSS数据分析基础精品PPT课件.pptx_第1页
第1页 / 共166页
SPSS数据分析基础精品PPT课件.pptx_第2页
第2页 / 共166页
SPSS数据分析基础精品PPT课件.pptx_第3页
第3页 / 共166页
SPSS数据分析基础精品PPT课件.pptx_第4页
第4页 / 共166页
SPSS数据分析基础精品PPT课件.pptx_第5页
第5页 / 共166页
点击查看更多>>
下载资源
资源描述

SPSS数据分析基础精品PPT课件.pptx

《SPSS数据分析基础精品PPT课件.pptx》由会员分享,可在线阅读,更多相关《SPSS数据分析基础精品PPT课件.pptx(166页珍藏版)》请在冰豆网上搜索。

SPSS数据分析基础精品PPT课件.pptx

数据统计分析数据统计分析数据统计分析数据统计分析SPSSSPSS实战入门实战入门实战入门实战入门第一天课程第一天课程课程目标课程目标1.了解基本的统计思想和分析方法2.了解SPSS软件的特点3.掌握SPSS的基本操作4.能够应用SPSS进行基本的统计分析5.可以有效的对SPSS进行进一步的自学6.SPSS数据分析的流程课程安排课程安排第一第一讲数据分析概述统计学的思想与概念第二第二讲SPSS概述SPSS操作实践第三第三讲应用案例简介第四第四讲SPSS数据分析可视化第五第五讲实践中的SPSS数据分析方法方差分析第六第六讲SPSS回归模型SPSS多元线性回归SPSSLogistic回归第七第七讲SPSS因子分析SPSS主成分分析第八第八讲SPSS聚类分析SPSS决策树第九第九讲SPSS时间序列第一第一第一第一讲讲数据分析概述数据分析概述数据分析概述数据分析概述在当今世界,企业怎样搜集、管理、利用数据和信息,并迅速作出决策和反应将是能否在激烈竞争的全球一体化市场经济中能否生存和成败的关键之举。

企业需要可靠的决策,可靠的决策来自于系统地定义问题,收集数据,比较和分析数据,结合研究设计,并从数据中得到结论。

企业研究是一个系统性的研究过程,提供解决管理问题的信息,作为决策基础。

用系统化的方法采集数据并基于这些数据做出决定的过程,对于建立可靠的决策,从而帮助管理者了解企业的各项问题,提供知识与技术来面对变化快速的环境大量数据和信息匮乏的矛盾大量数据和信息匮乏的矛盾大量数据和信息匮乏的矛盾大量数据和信息匮乏的矛盾从数据中提取信息不是数据库自动能够解决的从数据中提取信息不是数据库自动能够解决的从数据中提取信息不是数据库自动能够解决的从数据中提取信息不是数据库自动能够解决的数据分析数据分析数据分析数据分析统计学统计学统计学统计学数据的科学数据的科学数据的科学数据的科学统计学:

随机性与规律性统计学:

随机性与规律性统计学:

随机性与规律性统计学:

随机性与规律性统计工具统计工具统计工具统计工具利用统计学原理利用统计学原理利用统计学原理利用统计学原理服务于数据分析服务于数据分析服务于数据分析服务于数据分析第一第一第一第一讲讲数据分析概述数据分析概述数据分析概述数据分析概述统计学的本学的本质当我们不能预测一件事情的结果时,随机性就和这件事情联系起来了.(危险来临,喜从天降)通过看上去随机的现象进行统计分析,我们开始了解这个世界.什么时候需要数据分析什么时候需要数据分析?

商业问题商业问题数据问题数据问题!

商业问题商业问题解决方案解决方案把商业问题转化为数据问题数据分析及分析结果把数据结果转化为商业解决方案实际中的中的问题(企企业)v当当你你买买了了一一只只手手表表时时,被被告告知知一一年年内内可可以以免免费费保保修修。

你你想想过过厂厂家家为为什什么么说说一一年年而而不不说说三三个个月月或或两两年年呢呢?

显显然然:

说说多多了了,厂厂家家会会损损失失;说说少少了了,会会失失去去竞竞争争,也也是损失。

到底这个保修期是怎样决定的呢?

是损失。

到底这个保修期是怎样决定的呢?

v在在同同一一年年级级中中,同同样样一一门门课课程程可可能能由由一一些些不不同同教教师师讲讲授授。

教教师师讲讲课课方方式式当当然然不不一一样样,考考试试题题目目也也不不一一定定相同。

那么如何比较不同班级的成绩呢?

相同。

那么如何比较不同班级的成绩呢?

vCEO的的收收入入是是一一个个非非常常敏敏感感的的问问题题,到到底底和和一一个个企企业业的的资资产产价价值值有有怎怎样样的的关关系系,如如何何制制订订才才会会比比较较公公平平?

不不同同的的机机构构得得出出不不同同的的结结果果;各各自自都都说说自自己己是是客客观观、公公正正和和有有道道理理的的。

到到底底如如何何理理解解这这些些不不同同的的结结果果呢呢?

实际中的中的问题(政府政府)v信用评价体系v影响到低体重早产儿的社会和制度因素是什么?

v收入支出比平衡问题?

v社会安全保障与房地产定价策略问题?

数据的价值和利用数据的价值和利用数据无处不在数据包含的信息很多,但是数据中的信息往往是分散的,单个数据很难直接被应用起来统计学就是把数据转化为信息的科学统计学统计学统计统计学学学学(Statistics)(Statistics)是一个系是一个系统统搜集数据并基于数据搜集数据并基于数据做出决定的做出决定的过过程程.它是指它是指导导人人们们正确地正确地认识认识客客观观世界的研究世界的研究方法方法,是研究受到随机影响的数据的一是研究受到随机影响的数据的一门门学科。

学科。

基本特点基本特点基本特点基本特点:

1)1)是一个在随机是一个在随机现现象中象中寻寻找找规规律性的科学律性的科学;2)2)由描述和推断两部分方法构成由描述和推断两部分方法构成;3)3)是科学地度量是科学地度量问题问题,收集收集问题问题,表示表示问题问题和分析和分析问题问题的的研究方法研究方法.运用统计的领域包括运用统计的领域包括v精算精算v农业农业v动物学动物学v人类学人类学v考古学考古学v审计学审计学v晶体学晶体学v人口统计学人口统计学v牙医学牙医学v生态学生态学v经济计量学经济计量学v教育学教育学v选举预测和策划选举预测和策划v工程工程v流行病学流行病学n金融金融n水产渔业研究水产渔业研究n遗传学遗传学n地理学地理学n地质学地质学n历史研究历史研究n人类遗传学人类遗传学n水文学水文学n工业工业n法律法律n语言学语言学n文学文学n劳动力计划劳动力计划n管理科学管理科学n市场营销学市场营销学n医学诊断医学诊断n气象学气象学n军事科学军事科学n核材料安全管理核材料安全管理n眼科学眼科学n制药学制药学n物理学物理学n政治学政治学n心理学心理学n心理物理学心理物理学n质量控制质量控制n宗教研究宗教研究n社会学社会学n调查抽样调查抽样n分类学分类学n气象改善气象改善n搏采,等等搏采,等等.数据分析过程数据分析过程原始数据、原始数据、二手数据二手数据确定研究目标、范围确定研究目标、范围选择研究方案选择研究方案选择数据收集方式和分选择数据收集方式和分析技术析技术分析评估所需样本量分析评估所需样本量建立项目预算建立项目预算描描述述性性统统计计分分析析推推断断性性统统计计分分析析人人工工智智能能等等数数据据挖挖掘掘特特有有的的算算法法计计分分析析清理数据使之适合于分析应用清理数据使之适合于分析应用对数据进行变换对数据进行变换评估数据质量,填充缺失数据评估数据质量,填充缺失数据对表格、图形进行编辑对表格、图形进行编辑用用wordword、excelexcel、texttext、htmlhtml展示数据展示数据数据分析数据分析数据管理数据管理数据收集数据收集计划计划结果发布结果发布数据理解数据理解描述统计为什么不够?

数据的数据的层次性:

次性:

律律师的困惑的困惑辛普森悖论(SimpsonsParadox)亦有人译为辛普森诡论,为英国统计学家E.H.辛普森E.H.Simpson于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

例题:

一所美国高校的两个学院,分别是法学院和商学院,新学期招生。

人们怀疑这两个学院有性别歧视。

法学院商学院申请性别法学院商学院女男录取率总体和体和样本本1.总体体(population)研究对象的全体,其中的每一个元素称为个体分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的2.样本本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本量(size)参数和参数和统计量量1.参数参数(parameter)研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()、总体的协差阵()等总体参数通常用希腊字母表示2.统计量量(statistic)根据样本数据计算出来的一个量所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)、样本的协差阵等样本统计量通常用小写英文字母来表示变量量(Variable)1.说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据;2.变量可以分为分类变量(categoricalvariable):

说明事物类别的一个名称顺序变量(rankvariable):

说明事物有序类别的一个名称数值型变量(metricvariable):

说明事物数字特征的一个名称离散变量:

取有限个值连续变量:

可以取无穷多个值统计中的几个基本概念中的几个基本概念平均数平均数平均数平均数标准差标准差标准差标准差比例比例比例比例参数参数pp统计量统计量xxss总体总体总体总体样本样本样本样本点估点估计(PointEstimator)置信区置信区间(IntervalConfidence)假假设检验(HypothesisTest)理理念念v统计模型的严格数学表达很复杂、繁琐,但是其背后的思想往往很简单v做为信息时代的管理者,要理解管理的科学性,科学的基础是测量,没有测量谈不到深入的和恰当的管理制度的建立.v统计学只是一个工具,SPSS更是工具的工具,不要指望它能够“自动”解决你面临的商业问题.v要注意统计学方法的适用条件,滥用统计学会造成“严重”的负效果.第二讲第二讲SPSS概述概述vSPSS:

StatisticalPackageforSocialScienceStatisticalProductandServiceSolutionsvSPSS的的发展:

展:

60年代:

美国斯坦福大学三位研究生研制年代:

美国斯坦福大学三位研究生研制70年代:

年代:

SPSS总部成立于芝加哥,推出部成立于芝加哥,推出SPSSX中小型机中小型机版版80年代:

年代:

SPSS公司(公司(SPSS/PC+微机版微机版13)90年代:

年代:

SPSS公司(公司(SPSSWINDOWS版版511)SPSSSPSS软件的特点件的特点v功能强大;v兼容性好;v容易使用;v企业级统计分析解决方案;v结果的权威性.统计软件统计软件vSPSS:

这这是是一一个个很很受受欢欢迎迎的的统统计计软软件件;它它容容易易操操作作,输输出出漂漂亮亮,功功能能齐齐全全,价价格格合合理理。

它它也也有有自自己己的的程程序序语语言言,但但基基本本上上已已经经“傻瓜化傻瓜化”。

它对于非专业统计工作者是很好的选择。

它对于非专业统计工作者是很好的选择。

vExcel:

它它严严格格说说来来并并不不是是专专业业统统计计软软件件,但但作作为为数数据据表表格格软软件件,必必然然有有一一定定统统计计计计算算功功能能。

而而且且凡凡是是有有MicrosoftOffice的的计计算算机机,基基本本上上都都装装有有Excel。

但但要要注注意意,有有时时在在装装Office时时没没有有装装数数据据分分析析的的功功能能,那那就就必必须须装装了了才才行行。

当当然然,画画图图功功能能是是都都具具备备的的。

对对于于简简单单分分析析,Excel还还算算方方便便,但但随随着着问问题题的的深深入入,Excel就就不不那那么么“傻傻瓜瓜”,需需要要使使用用函函数数,甚甚至至根根本本没没有有相相应应的的方方法法了了。

多多数数专专门门一一些些的的统统计计推推断断问问题题还还需需要要其其他他专专门门的的统统计计软件来处理。

软件来处理。

SPSSSPSS软件基本介绍软件基本介绍1、SPSS的基本构成:

11个模块2、SPSS五个窗口的基本功能3、应用SPSS执行统计分析的几种方法4、SPSS的四种结果5、SPSS无处不在的Help6、SPSS五种结果保存方式SPSSClient/ServerSPSSClient/ServerSPSSBase-基础模块SPSSAdvanced-多元方差分析、生存分析SPSSRegression-回归SPSSTrends-时间序列SPSSCategories-分类数据分析SPSSConjoint-正交设计和分析SPSSTables-表格展示数据SPSSMaps-地图展示数据SPSSMissingValueAnalysis-缺失值分析SPSSExactTestAnalysis-精确检验SPSSComplexSamples-复杂抽样SPSS模块与过程模块与过程读/录入数据数据整理描述统计数据分析图表展示结果编辑结果报告AdvancedCategoriesConjointRegressionTrendsExactTestComplexSampleMissingValueBaseTableMapSPSSSPSS操作界面操作界面-五个窗口五个窗口1.DataEditor-数据编辑窗口DataViewVariableView2.SyntaxEditor-程序编辑窗口3.Viewer-结果管理窗口4.DraftViewer-草稿结果窗口5.Script-脚本编辑窗口v完全窗口菜单方式:

所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者.SPSS的结果的结果SPSS的四种的四种结果果文本格式的文本格式的结果果表格表格结果果标准准图结果果交互交互图结果果SPSS的结果保存方式的结果保存方式vSPSSSPSS结果文件格式果文件格式vHtmlHtml格式格式vWordWord格式格式vTextText格式格式vExcelExcel格式格式v图形:

形:

jpgjpg、pctpct练习:

将练习:

将savetype.sposavetype.spo打开,将其中打开,将其中的的对象以不同的格式保存。

对象以不同的格式保存。

SPSSSPSS的帮助系统的帮助系统v帮助菜单TopicsTutorialCaseStudiesStatisticsCoachCommandSyntaxGuidev对话框帮助v无处不在的Whatsthis?

第三第三讲讲SPSS操作实践操作实践1.SPSS数据文件的数据文件的创建与保存建与保存2.利用利用SPSS整理数据整理数据3.数据抽数据抽样方法方法4.利用利用SPSS展展现数据:

数据:

专业的的报表和表和图形形5.利用利用SPSS分析数据分析数据3.1SPSS数据文件数据文件SPSS数据文件是一种有数据文件是一种有结构的数据文件。

构的数据文件。

年级性别问题1问题n11.4222.311文件结构数据个案case变量名变量lSPSS数据文件一般只能通过数据文件一般只能通过SPSS软件打开软件打开SPSS数据文件的特点数据文件的特点v原始数据文件格式:

原始数据文件格式:

数据文件中的一列数据文件中的一列为一个一个变量,每个量,每个变量有一个唯量有一个唯一的存取一的存取标志:

志:

变量名量名数据文件中的一行数据文件中的一行为一个个案(一个个案(case)v汇总数据文件格式:

数据文件格式:

男男女女高价值客户高价值客户1023低价值客户低价值客户1220SPSS数据文件的数据文件的结构构

(一)

(一)变量名量名(Variablename):

变量名是量名是变量存取的唯一量存取的唯一标志。

志。

起名起名规则:

v不多于不多于64个字符个字符组成成v不区分大小写不区分大小写v允允许汉字作字作为变量名量名v默默认变量名量名为VARn,如:

,如:

var00001SPSS数据数据访问(一一)打开数据文件打开数据文件菜菜单选项:

File-Open-.sav(二二)数据定位数据定位v按个案号按个案号码定位定位菜菜单:

Data-Gotocase-输入入样本号本号v按按值定位定位光光标定位到某列定位到某列变量上量上-Edit-Find.SPSS数据的数据的编辑(三三)插入和插入和删除一个个案除一个个案v插入:

插入:

data-insertcasev删除:

除:

选定待定待删行,鼠行,鼠标右右键找到找到Cut(四四)插入和插入和删除一个除一个变量量v插入:

插入:

光光标定位到某列定位到某列变量上量上-Data-InsertVariable(插到某列前插到某列前)或鼠或鼠标右右键v删除:

除:

选定列,鼠定列,鼠标右右键Cut项SPSS数据数据编辑(五五)数据移数据移动、复制和、复制和删除除v定定义源数据源数据块v鼠鼠标右右键:

cutcopyclearv确定目确定目标单元元v鼠鼠标右右键:

pasteSPSS数据的数据的录入入v录入入时应注意:

注意:

黑框确定当前数据黑框确定当前数据单元。

元。

录入入带有有变量量值标签的数据:

手工的数据:

手工输入代入代码,屏幕,屏幕显示示变量量值标签。

SPSS数据的保存数据的保存v数据保存:

操作保存格式:

(1)*.sav:

SPSS数据文件(默认)。

(2)*.dbf:

dbase数据文件。

(3)*.xls:

Excel工作表文件。

注意:

有些信息会丢失练习2:

1.将文件telenew.sav导出到mydocumentsmyspsscredittele1.xls2.将文件telen.txt导入到spss窗口,另存为mydocumentsmyspsscredittele2.savSPSS变量定量定义v变量的类型变量的类型(type)type)和显示宽度和显示宽度(width)(width)v变量名标签变量名标签(Variablelabel)(Variablelabel)v变量值标签变量值标签(Valuelabel)(Valuelabel)v变量列格式变量列格式(ColumnFormat)ColumnFormat)v缺失值缺失值(MissingValues)MissingValues)v变量计量尺度变量计量尺度(Measurement)Measurement)v利用变量视图查看变量定义的情况利用变量视图查看变量定义的情况一个基本的分析例一个基本的分析例题v例例:

xuelin.sav要求要求

(1)数据的基本描述数据的基本描述过程程descriptive

(2)数据的分布数据的分布histogram(3)基本的比基本的比较推推论t检验(4)保存保存结果果为*.spo文件,文件,*.html文件文件(5)使用拆分文件使用拆分文件进行分行分类比比较(6)使用使用筛选变量量进行数据的初步探索行数据的初步探索两个两个总体均体均值之差的之差的检验(12、22未知且相等未知且相等,小小样本本)vH0:

11-22=0vH1:

11-220v=0.05vn1=12,n2=14v临界界值(s):

检验统计量检验统计量检验统计量检验统计量:

决策决策决策决策:

结论结论结论结论:

在在=0.05=0.05的水平上拒绝的水平上拒绝HH00有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异ZZ001.961.96-1.96-1.96.025.025拒绝拒绝HH00拒绝拒绝HH00.025.0252.用用SPSS加工和整理数据加工和整理数据数据文件的整理个案排序、个案选取、文件合并、文件转置数据加工变量计算、产生计数变量数据分组自动分组、手工分组数据文件的其他处理功能指定加权变量、SPSS变量集的定义和使用2.用用SPSS加工和整理数加工和整理数据据v数据清理:

检查录入错误、清除不合理数据、定义或弥补缺失值变量重新编码(Recode)生成新变量(Compute)按关键变量对记录排序(Sort)按关键变量对记录分组(Aggregate)变量和记录之间转置(Transpose)数据合并与拆分(Merge/Split)对记录加权(Weight)2.1变量重新编码Recode过程(xuelin.sav)xuelinlevel=0,xuelin=210,1xuelin12,xuelinsortcasesv注意:

(1)Ascending:

升序、Descending:

降序。

(2)多重排序,选择变量名的次序很关键。

练习:

对xuelin.sav分别按照血磷浓度和年龄进行排序。

2.42.4按关按关按关按关键变键变量量量量对记录对记录分分分分组组(Aggregate)(Aggregate)

(1)含义:

按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;将计算结果生成到一新文件中,即:

在新文件中对应分类变量的每一个分类值产生一个个案。

原始数据按性别变量汇总数据

(2)菜单选项:

data-aggregate(3)说明:

v多重分组时,变量名的选择顺序。

v生成的新文件名默认为:

aggr.sav。

可修改。

v生成的新变量名默认为原变量名后加_1。

可修改。

v可以在新文件中存贮个分组个案数.2.52.5变变量和量和量和量和记录记录之之之之间转间转置置置置(Transpose)(Transpose)目的:

将数据文件行列互换,即:

将个案转为变量,变量转为个案.转置前转置后2.5变量和量和记录之之间转置置Restructure过程程2.62.6数据合并与拆分数据合并与拆分数据合并与拆分数据合并与拆分(Merge/Split)(Merge/Split)v目的:

将两个SPSS数据文件合并到一个数据文件中。

v文件合并的方式:

纵向合并横向合并

(一)纵向数据合并

(1)含义含义:

将磁盘上的一个SPSS数据文件追加追加到当前dataeditor窗口中的数据文件中。

(2)前提前提:

两个SPSS数据文件应可以合并的内容可以合并的内容,且最好有相同的相同的变量名和变量类型。

(3)菜单选项菜单选项:

data-mergefile-addcases

(二)横向数据合并

(1)含含义:

将磁盘上的一个SPSS数据文件中的若干个变量增加到当前dataeditor窗口的数据文件中。

(2)前提前提:

a.两个数据文件必必须有一个共同的变量名为关键字段-合并的依据;b.两个数据文件应事先按关键字段升序排序。

(二)横向数据合并(3)菜菜单选项:

data-mergefile-addvariable(4)选项说明明:

mathcasesonkeyvariablesinsortedfiles:

以关键字作为合并标志。

Bothfilesprovidecases:

合并后的文件的数据由两个文件共同提供。

Externalfileiskeyedtable:

以dataeditor的数据为基础。

Workingdatafileiskeyedtable:

以磁盘文件的数据为基础。

2.72.7对记录对记录加加加加权权(Weight)(Weight)

(1)含义:

指定某一变量为加权变量。

如:

商品平均价格

(2)菜单选项:

data-weightcase(3)说明如果取消加权变量应重新定义:

data-weightcasedonotweightcases(4)举例:

打开文件average.savv课课堂堂堂堂练习练习:

针对针对Employeedata.savEmployeedata.sav进进行行行行以下思考与以下思考与以下思考与以下思考与练习练习:

v(11)生成)生成)生成)生成变变量表示量表示量表示量表示员员工的年工的年工的年工的年龄龄;v(22)按照性)按照性)按照性)按照性别别分分分分类计类计算平均工算平均工算平均工算平均工资资;v(33)将薪水分成不同的)将薪水分成不同的)将薪水分成不同的)将薪水分成不同的级别级别:

“高高高高4”“4”“中中中中高高高高3”“3”“中下中下中下中下2”“2”“下下下下1”;1”;第一第一问第二第二问3.抽抽样数据数据v随机数抽样v等距抽样(*)v分层抽样(*)v整群抽样(*)v在抽样方案设计部分提供了详细的向导,便于用户使用v模块功能抽样方案设计:

在原始数据集中生成抽样子集抽样数据描述:

基于抽样设计文件进行相应数据的统计描述例题:

在文件newcar.sav中的数据随机选择70%数据定义筛选变量,使用frequency过程进行筛选前后结果观察。

练习:

对练习:

对练习:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 预防医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1