ch01 SAS概述Word文档下载推荐.docx
《ch01 SAS概述Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《ch01 SAS概述Word文档下载推荐.docx(14页珍藏版)》请在冰豆网上搜索。
SPSS作为三大统计软件,其统计分析功能和另外两个软件相比任有一定欠缺。
虽然如此,SPSSforWindows由于其操作简单,已经在我国的社会科学、自然科学的各个领域发挥了巨大作用。
该软件还可以应用于经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。
●BMDP
BMDP第一版诞生于1961年,1968年BMDP公司发行,是最早的综合专业统计分析软件,与SAS、SPSS被并称为三大统计软件包,在国际上影响很大,客户达1万户以上,它方法全面、灵活,早期曾有很多独具特色的分析方法。
但是今非昔比,由于BMDP发展路途不畅,从1991年的7.0版以后就没有新版本,最后被SPSS公司收购,网址也只留余一孤独背景,不复存在,而且SPSS公司在开发与推广BMDP统计软件方面的积极性也不大。
尽管如此,BMDP统计软件作为一方霸主,在国外仍然影响巨大,国外许多大学的统计学网站均对其关照有加,著名大学统计学系开设的多变量分析课程当中就有BMDP软件的教学内容,
●S-plus
S-PLUS基于S语言,并由MathSoft公司的统计科学部进一步完善。
作为统计学家及一般研究人员的通用方法工具箱,S-PLUS强调演示图形、探索性数据分析、统计方法、开发新统计工具的计算方法,以及可扩展性。
S-plus有微机版本和工作站版本,它是一个商业软件,可以直接用来进行标准的统计分析得到所需结果,但是它的主要的特点是它可以交互地从各个方面去发现数据中的信息,并可以很容易地实现一个新的统计方法。
S语言是由AT&
T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。
它的丰富的数据类型(向量、数组、列表、对象等)特别有利于实现新的统计算法,其交互式运行方式及强大的图形及交互图形功能使得我们可以方便的探索数据。
目前S语言的实现版本主要就是S-PLUS。
●其它统计软件还有Excel、Eviews、Statistica、Minitab、Stata/Transfer等
参考网页:
1.1.2SAS系统的主要模块功能简介
SAS系统包含了众多的不同的模块,可完成不同的任务,主要模块有:
●SAS/BASE(基础)——初步的统计分析;
●SAS/STAT(统计)——广泛的统计分析;
●SAS/QC(质量控制)——质量管理方面的专门分析计算;
●SAS/OR(规划)——运筹决策方面的专门分析计算;
●SAS/ETS(预测)——计量经济的时间序列方面的专门分析计算;
●SAS/IML(矩阵运算)——提供了交互矩阵语言;
●SAS/GRAPH(图形)——提供了许多产生图形过程并支持众多图形设备;
●SAS/ACCESS(外部数据库接口)——提供了与大多数流行数据库管理系统的方便接口并自身也能进行数据管理;
●SAS/ASSIST(面向任务的通用菜单驱动界面)——方便用户以菜单方式进行操作;
●SAS/FSP(数据处理交互式菜单系统)
●SAS/AF(面向对象编程的应用开发工具)
1.1.3SAS软件安装方法及启动(自学)
请事先安装一种虚拟光驱软件,如webclient,因为安装过程中导入setup或Disk1,Disk2,…等几个光盘的路径时,需事先用虚拟光驱软件加载。
然后按照“SAS9.1.3安装与破解收藏说明”中的讲解步骤进行,CSDN博客:
安装好后的windows程序菜单会显示如下:
1.1.4SAS主要窗口及功能
点击windows“开始”菜单:
程序→SAS→SAS9.1(中文),启动SAS系统SAS9.1中文版。
SAS系统的工作界面如图,在一个主窗口中包含若干个子窗口,并有菜单栏、工具栏等。
各主要窗口介绍如下:
(1)日志(Log)窗口:
是记录程序运行情况。
程序行——用黑色显示;
提示——蓝色显示;
警告——用绿色显示;
错误——用红色显示。
Log窗口的内容保存时的文件扩展名为“.log”的纯文本文件。
(2)程序编辑器窗口:
是类似于windows中的记事本一样的文字编辑器,分两种:
增强型编辑器(Editor),它能利用彩色分出程序的各部分,可展开或折叠程序段;
用虚线隔开程序的各段,可记录宏。
另一种是适用于所有SAS平台的普通的程序编辑器(ProgramEditor),它拥有所有文本编辑器类似的文本编辑功能。
这两种编辑器窗口都能输入SAS程序,并能将程序提交给SAS系统运行。
程序编辑器中的内容被保存时,文件的后缀名为“.sas”。
(3)输出(Output)窗口:
是隐含在主背景窗口中,用来显示SAS过程所输出的结果。
只有在SAS程序运行无误后,该窗口会自动显示结果。
输出窗口中的内容被保存时,文件的后缀名为“.lst”。
(4)资源管理器(Explorer)窗口:
类似于windows资源管理器,是管理、访问数据的中心,这些数据包括目录、数据集、逻辑库和主机文件数据。
(5)结果(Result)窗口:
管理所提交的SAS程序的输出结果,所有输出结果按照目录树的结构依次排列,可对结果进行查看、存储、显示、删除等操作。
(6)功能键窗口(补充)
在SAS软件中,一些键或组合已经被赋予特定功能,这就是功能键。
可以通过下列方式打开功能键窗口:
工具=>
选项=>
功能键
或者在命令行中输入KEYS的命令,
或者按F9(系统默认设置)。
建议记住常用的功能键:
:
F5_wpgm,F6_log,F7_output,F8_submit
1.1.5简单运行样例(P3)
【例1.1】假设有一个班学生的数学成绩和语文成绩,数学满分为100,语文满分为120,希望计算学生的平均分数(按百分制)并按此排名。
解决步骤:
(1)在编辑器窗口输入程序如下,并保存为prg1.1.sas:
(2)运行程序。
点击工具栏中的图标
或菜单栏:
运行(Run)→提交(Submit),调试正确上面程序,运行后日志窗口会出现如下内容:
1title'
95级学生成绩排名'
;
2datac9501;
3inputname$1-10sex$mathchinese;
4avg=math*0.5+chinese/120*100*0.5;
5cards;
NOTE:
数据集WORK.C9501有5个观测和5个变量。
“DATA语句”所用时间(总处理时间):
实际时间0.03秒
CPU时间0.03秒
11run;
12
13procprint;
14run;
从数据集WORK.C9501读取了5个观测。
“PROCEDUREPRINT”所用时间(总处理时间):
实际时间0.01秒
CPU时间0.01秒
15
16procsortdata=c9501;
17bydescendingavg;
18run;
“PROCEDURESORT”所用时间(总处理时间):
19
20procprint;
21run;
实际时间0.00秒
CPU时间0.00秒
(3)输出窗口会出现两页内容,如下:
95级学生成绩排名1
2009年09月05日星期六下午11时13分42秒
Obsnamesexmathchineseavg
1李明男929886.8333
2张红艺女8910688.6667
3王思明男869080.5000
4张聪男9810994.4167
5刘颖女8011085.8333
95级学生成绩排名2
1张聪男9810994.4167
3李明男929886.8333
4刘颖女8011085.8333
5王思明男869080.5000
由此例可知SAS程序的一些特点:
●SAS程序由语句组成,语句用分号“;
”结束;
●SAS程序中一般不区分大小写(字符串和数据中要区分);
●SAS程序由数据步和过程步构成,分别以data语句和proc语句开始,以run语句结束。
1.2SAS基本概念
1.2.1SAS数据集(SASDataset)
SAS中容纳数据的文件称为数据集,是由若干行和若干列组成的一个表格。
数据集的每一行称作一个观测(Observation),每一列称作一个变量(Variable).各列可取不同类型的值,如整数值、浮点值、时间值、字符串或货币值。
如上节中例1.1数据集c9501有5个变量,5期观测,分别为姓名、性别、数学成绩、语文成绩和平均分。
name
sex
math
Chinese
avg
张聪
男
98
109
94.4167
张红艺
女
89
106
88.6667
李明
92
86.8333
刘颖
80
110
85.8333
王思明
86
90
80.5000
数据集要有名字,变量要有名字,命名遵循以下原则:
●由英文字母、数字和下划线组成;
●第一个字符必须是字母或下划线;
●名字最多用32个字符,大小写字母不区分。
1.2.2SAS数据库(也叫逻辑库,SASLibrary)
1.概念
SAS数据集是一种表格形式(Table)的最重要的数据文件,另外一种是SAS目录(Catalog),用来存放系统设置、图像、声音等,它们是不能表示成行列结构的表格形式的数据。
多个SAS数据集和SAS目录的放在一起的集合称为SAS逻辑库。
每个逻辑库有一个库名,命名同样遵循以上原则,但库名不得超过8个字符。
2.创建逻辑库
一个SAS逻辑库实际上对应磁盘上的一个子目录,使用libname语句可以将逻辑库与子目录联系起来,格式为:
libname逻辑库名‘路径’
如想把D盘事先已建立的文件夹mysasfile与一个逻辑库名mylib对应起来,语句为
Libnamemylib“D:
\mysasfile”;
注:
直接利用工具栏中的图标
,来打开“新建逻辑库”窗口,如下图:
3.临时库与永久库
有三个预定义的SAS逻辑库:
WORK、SASUSER和SASHELP。
●WORK逻辑库为临时库,存放临时文件,当退出SAS系统时,这些文件会被自动删除。
●SASUSER逻辑库为永久库,存放用户个人设置的文件
●SASHELP逻辑库为永久库,存放与SAS帮助系统、例子有关的文件。
●永久库退出SAS系统时,包含的文件不会被删除。
4临时文件与永久文件
●临时文件存放在临时逻辑库中;
永久文件存放在永久逻辑库中。
●一般把中间结果或练习使用的数据集作为临时数据集保存,而以后需要再用的数据集可存为永久数据集。
●临时数据集可用单水平名或两水平名,如work.c9501和c9501是一样的;
永久数据集必须用两水平名,前一部分为库名,后一部分为数据集名,中间用小数点连接,如mylib.c9501.
对永久数据集,创建时需用两水平名,引用时也必须用两水平名,否则是指向的是完全不同的临时数据集。
【例2】将例1中数据集c9501改为永久数据集,存放在子目录D:
\mysasfile中,其它不变。
(1)在D盘建立一个新文件夹mysasfile;
(2)在编辑器窗口输入程序如下,调试正确后输出结果与例1相同。
1.2.3SAS资源管理器(SASExplorer)
功能:
管理、访问SAS中的数据文件、逻辑库等资源的中心
打开方式:
点击主菜单“查看”→“资源管理器”,或点击工具栏
,显示如下窗口:
不需编程,也可直接利用资源管理器建立逻辑库和数据集,如下例。
【例3】对例1中的数据,在资源管理器中建立永久性数据集c9502,并存放在逻辑库mylib中,要求库名mylib对应D盘文件夹mysasfile。
解:
(1)在D盘建立一个新文件夹mysasfile(如果已有此文件夹,此步可略);
(2)点击主菜单“查看”→“资源管理器”,或点击工具栏
,打开资源管理器的窗口,查看是否有逻辑库mylib,如果有,则先删除;
如果没有,则进行下一步创建新库。
(3)在资源管理器的左侧树形结构图中选中“逻辑库”,然后用主菜单“文件”→“新建”,打开“新建逻辑库”窗口,输入逻辑库名mylib和路径D:
\mysasfile即可创建逻辑库mylib(如果逻辑库mylib已有,此步可略,或先删除该库再建立).
(4)在资源管理器中选择逻辑库mylib,然后用主菜单“文件”→“新建”,打开“mylib中的新成员”窗口,选中图中的“表”,并点击“确定”按钮,打开“VIEWTABLE(New):
Untitled”表格窗口,如下:
(5)选中第一列列名“A”,并单击右键菜单中的“ColumnAttributes…”,在“ColumnAttributes”窗口中定义新的变量名(name)和属性(宽度为10,字符串型),如下图,并点击“Apply”按钮,可看到表格中的第一列名改为姓名(其它是变量的标签值)。
(6)其它变量名类似定义,定义完后点击“Close”按钮关闭“ColumnAttributes”窗口,回到数据表窗口中,并输入各列数据如下:
(7)点击主菜单“文件”→“保存”,打开“另存为”窗口,选择左侧的逻辑库mylib,并在下边“成员名”外输入c9502,点击“保存”按钮。
【Try】大家可试一下删除逻辑库和删除数据集有什么不同。
提示:
右键菜单中有“新建”、“删除”选项。
【作业】在个人电脑上安装SAS系统,熟悉该系统。