SPSS 11完全版新功能探秘.docx

上传人:b****8 文档编号:10152994 上传时间:2023-02-08 格式:DOCX 页数:16 大小:616.08KB
下载 相关 举报
SPSS 11完全版新功能探秘.docx_第1页
第1页 / 共16页
SPSS 11完全版新功能探秘.docx_第2页
第2页 / 共16页
SPSS 11完全版新功能探秘.docx_第3页
第3页 / 共16页
SPSS 11完全版新功能探秘.docx_第4页
第4页 / 共16页
SPSS 11完全版新功能探秘.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

SPSS 11完全版新功能探秘.docx

《SPSS 11完全版新功能探秘.docx》由会员分享,可在线阅读,更多相关《SPSS 11完全版新功能探秘.docx(16页珍藏版)》请在冰豆网上搜索。

SPSS 11完全版新功能探秘.docx

SPSS11完全版新功能探秘

SPSS 11完全版新功能探秘

SPSS是最受广大科研工作者欢迎的统计软件之一,其名称原意为“StatisticalPackagefortheSocialSciences”,即“社会科学统计软件包”。

但是,随着产品服务领域的扩大和服务深度的增加,现在英文全称已更改为“StatisticalProductandServicesolutions”,意为“统计产品与服务解决方案”。

近期,SPSS11.0在数月的开发之后终于正式推出,这是SPSS在战略转向之后推出的第一个版本。

那么,和以前相比,这个最新版本又有哪些新增功能和特点呢?

本文将对SPSS11.0版的新特性加以全面介绍,以帮助大家更好的使用这一统计分析的新工具。

1.1 概况

  SPSS11.0版一共由十个模块组成,其中SPSSBase为基本模块,其余九个模块为AdvancedModels、RegressionModels、Tables、Trends、Categories、Conjoint、ExactTests、MissingValueAnalysis和Maps,分别用于完成某一方面的统计分析功能,他们均需要挂接在Base上运行。

除此之外,SPSS11.0完全版还包括SPSSSmartViewer和SPSSReportWriter两个软件,他们并未整合进来,但功能上完全是SPSS的辅助软件。

前者用于浏览SPSS的分析结果,后者则专门用于结果报告的撰写。

除此之外的之外,SPSS公司的许多软件还要挂接在SPSS上运行,比如专门作通径分析和结构方程模型的AMOS,进行专业的时间序列分析的Decisiontime&Whatif,他们在安装好后均会加入analyses菜单中。

哇,看来SPSS软件在SPSS公司产品线中的地位真的是很高呀!

(好了,我就知道这些,没有除此之外的之外的之外了)

SPSS11.0版的界面

SPSSSmartViewer11.0版的界面

  从软件的基本情况看,11.0版主要有以下的改进:

  1.变量定义视图的改进:

SPSS从10.0版起对数据管理界面作了较大的改进,用户反应很好,因此11.0版中的操作界面和10.0版完全相同,无需重新学习。

但是,该界面实际上在许多细节上都作了更新,使用上更加顺畅。

如以前在10.0版中如果设置小数位数超过数据宽度,系统将会陷入死循环,现在则会自动进行更正,或自动填充入默认值。

10版中可能会陷入死循环,现在则会自动进行更正的情况

  2.运算速度的大大提高:

相对较慢的运算速度一向是SPSS的软肋,根据非官方高手提供的信息,这是因为SPSS一直到10版都沿用的是4.0版时使用的Fortran语言计算内核。

而在11.0版中,SPSS的运算内核终于被进行了全面的改写,因此现在计算速度有了极大的提高,根据SPSS官方提供的资料,针对不同的统计分析方法,其运算速度和10.1版相比提高了5~500倍。

因时间所限,笔者未能进行全面的评测,仅就方差分析模型等几个较为耗时的常用模块进行了比较,结果运算速度平均比10.0版提高了4~9倍。

对于这一问题,我将随后进行专门的评测。

   3.分布式运算:

SPSS从10.0版起就开始引入分布式计算的设计思路,现在11.0版更是充分的体现了这一思想。

单机版软件的概念实际上已被取消,取而代之的是客户终端(Client)。

即每一台机器都被看成是客户终端,用户可在本机上进行数据处理,也可随时在网络上的各台SPSSServer间进行切换,从而共享SPSS服务器版(SPSSSever)强大的数据处理能力。

大家如果弄不明白,想想Win2000Server和Win2000professional间的关系就知道是怎么回事了。

  4.对结果输出的改进:

SPSS11的结果输出乍看上去没有什么变化,实际上也作了不小的改进,输出更加美观、合理。

如以前概率值被显示为0或1的情况,现在可能被显示为N/A等,表明无法计算。

同时还加强了对结果格式的编辑能力,如现在对于小数值的科学计数法可以选择在输出结果中不作显示。

另外,分析结果也对网络提供了全面支持,现在不仅可以将结果文件导出(Export)为HTML格式的网页阅读,更可以存为XML格式,供用户生成交互式网页使用。

在文件菜单中还提供了Email功能,可直接将结果以电子邮件附件的方式发送出去。

新增的XML格式

对数线性模型中更合理的P值输出

  5.全新的自学模块:

自学模块(Tutorial)一直是SPSS的一个重要内容,用于帮助初学者快速入门。

在SPSS11.0版中,Tutorial已经做了全面的更新,成为了一套独立的网页教程,内容更加丰富,使用上也更加方便。

     

10版和11版中自学模块的差异,两者均在显示如何将结果表格输出到Word中去

  6.对WindowsXP的完全兼容:

由于SPSS11.0版的开发时间早于WindowsXP,其最早的11.00版本虽能在XP下运行,但可能存在兼容问题。

为此SPSS已经推出了11.01升级包,这一最新版本经过了严格测试,和XP完全兼容,用户升级到该版本后就可以同时享受WindowXP的娱乐功能和SPSS11的强大统计分析能力,这无疑是广大用户的福音。

1.2 数据管理与文件管理

  增强的数据接口:

11.0版的数据接口有了较大的加强,除新增加了对几种数据结构的支持外,其新特性主要表现在以下几方面:

  1.提供了对SAS数据文件的全面支持。

SPSS从10.05版起就提供了直接读入SAS数据文件的功能,但当时只能使用程序方式读入,使用上非常不方便。

现在,11.0版中将该功能直接在打开文件对话框中提供,所支持的SAS数据文件类型也大大增加,用户只需选择菜单就可直接读入SAS6~8版全部格式的数据文件(便携格式,6版的sd2格式,7、8版的短格式和长格式),这无疑大大方便了广大用户。

 

打开文件对话框

  2.更强大的数据库向导:

在11.0版中的数据库向导被大大增强了,提供了对SQL语言更为完善的支持,现在用户可以将分类的字符型变量值自动的重编码为数值型变量(以原来的变量值做为变量标签),还可以运用基本的或者是无关的(primary/foreign)的关键词自动合并表格,甚至于在一个很大的数据库中做随机抽样。

  3.文本向导:

文本向导也进行了改进,现在可以读入那些包含诸如“1,000”、“2,000”等限定词的CSV格式的文本数据库。

  4.只保存某些变量:

当保存文件时,用户可以选择只存储数据集中的某些变量,而将其他变量丢弃。

这在文件中有许多临时变量时非常有用。

保存文件时的变量选择框

  5.数据结构重建:

当所使用的为重复测量数据时,根据所拟合的分析模型,用户往往需要将数据按长型或短型格式排列,并且可能需要在两种格式间进行转换。

在10.0版中,这必须要编程操作,非常的麻烦。

而11.0版中提供了Resturcture对话框,可按ID变量的取值直接将多条记录整合成一条记录或者将一条记录分拆成几条记录。

功能和大小都非常夸张的Resturcture对话框向导

  6.更强的数据保护功能:

11.0版对数据文件提供了完善的保护机制,现在当进行某些危险操作(如行列转置、数据结构重建)时,原数据文件自动变为只读属性,直至新数据文件正确生成后才被替换。

同时SPSS还提供了自动存盘功能,当对数据的编辑次数超过默认值时(系统默认为20,可更改),文件就会自动存盘。

1.3 Base模块新增的统计分析功能

  1.比率统计:

这一新增功能用来对两个连续性变量的相对比进行描述,他可以计算出一系列非常专业的相对比描述指标,包括离散系数、方差、价格关联微分(price-relateddifferential)、平均绝对离差(averageabsolutedeviation)等。

ratio主对话框

统计量子对话框

  2.OLAP(OLAPCubes):

11.0版中的OLAP(在线分析处理)功能更加强大,现在已可以计算一组变量的各类别之间或者不同变量之间的差异和百分比差异,从而能更加准确和高效的对数据进行描述。

  3.单因素方差分析:

除给出标准的方差分析结果外,SPSS11还新提供了两种稳健估计方法:

Brown-Forsythe检验和Welch检验(实际上是三种,另一种在编程方式提供),他们都可以在正态性、方差齐等条件被违反时使用,结合原本就提供的四种方差不齐时的两两比较方法,使得分析结果对数据的适应性更强,从而可以帮助用户做出正确的判断。

单因素方差分析中新增的稳健统计量

  4.新的聚类函数:

在聚类函数列表中增加了中位数,使得聚类分析的适用范围更广,分析时的选择更多。

  5.更多的数学函数:

SPSS11.0版中的函数又增加了对反高斯分布、半正态分布、StudentRange分布和史氏化最大模数四种概率分布的支持,使得他支持的概率分布达到25种。

同时新增了PDF族函数和NPDF函数,用于计算当给定概率函数值指定分布函数的点概率密度值。

1.4 其他模块的新增功能

  1.线性混合模型:

哎呀,可总算加上去了!

笔者认为这是SPSS11在统计分析功能上最为重要的更新,该模型就是多水平模型(Multilevelmodel)中最常用的一种。

这一新的模型使得SPSS的分析能力从固定效应扩展到了随机效应,可以在数据存在组内聚集性时对固定效应参数进行更准确的估计,对变异的影响因素(随机效应)加以研究,并且可以对重复测量资料的分析及规律探讨。

它实际上包括了许多常用的模型,包括随机区组设计(RandomizedCompleteBlocksDesign)、裂区设计(Split-PlotDesign)、随机效应模型、个体生长发育模型、基于时依协变量的重复测量分析(RepeatedMeasuresAnalysiswithtime-dependentcovariate)模型等。

多水平模型虽然以前国内也有人在用,不过相当多的人都在乱用,包括统计学术杂志上发的论文也是如此(恕不点名)!

现在借助SPSS简单易用的操作界面,线性混合模型必然会在国内得到迅速而广泛的应用。

那些狐假虎威,借夸张的统计模型吓吓外行的人这下可惨了!

混合线性模型预定义框

混合线性模型主对话框

  2.多类结果的Logisitic回归:

这一模型现在可以计算预测的应答概率,预测的应答类别,对应于预测的应答类别的概率以及实际上应答类别的概率。

  3.分类数据回归:

11.0版中的这一功能在重新设计之后功能更加强大,分析结果更加详尽,也更加易用。

  4.改善的统计地图:

SPSS在10.0版中就提供了统计地图模块,但当时地图数据的中国部分非常简单,对国内用户而言并不实用。

为此11.0版中的中国地图进行了全面的更新,在边界线的绘制上更正了以前的错误,其中的城市数量也从数十个上升到了数百个,无疑已经具备了非常好的实用价值。

10版里华东地区的统计地图

11版里华东地区的统计地图

11版里将上海周边地区放大,可以看到城市已标到了县级

1.5 闪光点、缺陷、期望及其他

  作为国际知名的统计软件,SPSS近年来的进步非常引人注目,版本更新非常的迅速。

较之以往的版本,SPSS11.0拥有了更强的易用性、更多的算法以及更实用的新功能,操作界面也更加的友好,特别值得一提的是他对许多原理和计算上都极为复杂的统计分析方法都为用户提供了简单易用的对话框界面,从而可以更好地满足用户的要求,为各行业不同的使用者服务。

总而言之,SPSS11.0是统计分析软件中不可多得的分析利器。

  但是,这一版本仍然存在着若干令人遗憾之处:

作为统计软件,统计设计能力不足是其目前最大的缺陷,同时神经网络、树结构模型等最尖端的统计分析方法也未能被纳入这一版本中。

以前我也不理解这是为什么,后来长大了才明白,这主要是由于SPSS公司的产品线非常的长(仅我知道的就有十五六种),SPSS软件本身更多的是针对中、低端用户、科研统计分析,对于高端商业用户,则以专门用于数据挖掘的Clementine、Answertree为主打软件,如此上的产品线,使得许多专用功能和高级功能都有专门的软件产品,如统计设计和样本量计算由SamplePower软件实现,而神经网络、树结构模型等则在专门用于数据挖掘的Clementine中实现,从而使得SPSS始终缺少这些方面的功能。

而SAS则不同,他是将全部的功能都放在了统一的SAS平台上,自然看上去功能要强大许多。

话虽然此,但我觉得这样做其实弊大于利(无论对产品宣传、用户学习和违法商人盗版都是如此)。

至少SamplePower等可以整合进来嘛,还有ReportWriter,为什么不就做成一个模块呢?

希望SPSS12版中能将这些功能统一起来,在一个界面中一并提供,对于数据挖掘的专用模型,至少也提供一些最基础的方法,好歹安慰安慰我们这些用户,也使SPSS的功能更加全面。

专门用于数据挖掘的Answertree

SPSS公司界面极为豪华,而功能比界面更加豪华的数据挖掘专用产品Clementine

  还有一个不得不说的问题是11.0的中文版,其实10.0繁体中文版早就有了,但简体的却迟迟没有推出,难道在技术上有困难?

当然不是。

我听到的一件事情也许能对此事做一个非常精辟的解释:

我的一个朋友认识了Adobe中国公司的人,于是就义正词严的向他指出:

你们的photoshop对中文的支持也太差了,怎么不做的好一点?

闻听此言,那位仁兄拍案而起,问道:

你估计中国有多少人用photoshop?

大概几百万吧。

朋友答道。

此公又问:

那你知道我们每年在国内销售多少套?

就一百多套,我们凭什么要把对中文的支持作的那么好?

  那么,能否盼着国内能编制出界面友好、功能强大,能够真正与SPSS等国外统计软件相抗衡的软件?

十年之内,痴人说梦,至少我这样认为。

以前我也一直希望能够如此,也真正的在朝这方面努力,曾经全力编制的一个统计软件包已完工了95%,但最终放弃了。

因为经过评估,我觉得象当时这样手工作坊式的效果是很差的,不仅事倍功半,而且没有太多的前途,就是做出来也对不起观众。

多的例子不举,90年代初编制出来,现在许多防疫站都在使用的某著名国产统计软件竟然连计算出的95%个体参考值范围都是错的;以某全国学会名义编制,现在在全国各大药学院和制药公司进行药代、药动学统计分析时广泛使用的某统计软件,进行交叉设计的方差分析,算出来的离均差平方和(SS)竟然可以为负的11.6!

老兄,这可是平方和呀,拜托拿出点专业精神好不好!

  也许十年以后,那些从国外大型公司跳槽出来的创业者们,能够以真正国际化、真正一流水准、真正商业化操作(谁说商业化不好!

)的精神,拿出真正像样的国产统计软件来。

但也只是也许,我现在希望做的,就是帮助大家真正学会如何使用SPSS、SAS、Stata这些真正权威、严肃的统计软件,另外再将那些真正的垃圾教材曝曝光,免得大家走弯路而已。

也许,做这件事情,要比大张旗鼓的编新软件要更为重要。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 文学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1