1、两级命名方式 逻辑库名.文件名在进人SAS系统时,系统会自动地指定一些逻辑库供用户使用: Sashelp:该数据文件夹中的文件是SAS系统在运作时会使用到的系统文件,对环境的数据设置都会存放在此。用户不要修改该数据文件夹中的文件数据。Sasuser: SAS系统会设置Sasuser数据文件夹路径。 若用户没有设置其他路径,则Sasuser指定的路径或文件每次都相同,该路径下的数据文件是永久存在的。如果有SAS数据文件要存储时,用户无需在自己的程序代码中设置任何的数据文件夹名称,便可以使用Sasuser数据文件夹来存储SAS数据文件。物理位置:c:Documents and settings.M
2、y DocumentsMy Sas FilesV8Work:进入SAS系统时会设置Work数据文件夹路径,当用户产生暂时性的SAS数据文件时,会放在该路径下;当离开SAS系统时,SAS系统便会将该路径清除,不会将数据存储下来。若SAS系统并非正常结束,则必须以手动的方式由用户自行删除该路径下的数据。从上面看出,SAS文件分为临时文件和永久文件:临时文件在退出SAS系统时自动被删除,永久文件在退出SAS系统时不自动被删除。所以,我们把作为中间结果使用的数据集或练习用的数据集作为临时数据集保存,而需要以后再用的数据集则可以保存为永久数据集。2-2 使用浏览器(explorer)管理SAS库及其成员
3、1查看逻辑库的属性2查看SAS逻辑库和它包含的SAS文件(a:一般形式;b:结构图形式,toggle tree)3复制一个文件4对文件重命名5设定一个新的逻辑库。2-3 SAS数据集1. 数据集包含的内容数据集的数据部分:可以看作由若干行和若干列组成的表格,类似于一个矩阵,数据表的一行称为一个观测,一列称为一个变量.只要存储设备许可,SAS数据集中观测个数和变量个数不加限制。数据集的描述部分:数据集的名称;创建数据集的日期和时间; 观测的个数;变量的个数等.SAS数据集有两种表示形式: SAS数据文件(data file):同时存储数据值和描述信息,类型是dataSAS数据视图(data vi
4、ew):数据视图只有描述部分没有数据部分,但描述部分包含了足够的信息,足以确保找到保存在其它文件中的数据,即数据视图包含访问数据的逻辑;数据视图减少了维护费用,如果改变了数据视图对应的源数据文件中的数据,数据视图将随着改变。而数据文件没有此功能。数据视图的类型是view。数据视图可以象数据文件一样被调用。数据视图可由SQL(),ACCESS(4.4.2),DATA step 均可产生数据视图。Data test;input a b$;cards;1 A012 B013 A02;run;proc print data=test;proc contents data=test ;结果:(数据部分)
5、The SAS System 16:19 Thursday, April 29, 2008 1133 Obs a b 1 1 A01 2 2 B01 3 3 A02The CONTENTS Procedure(描述部分) Data Set Name: WORK.TEST Observations: 3 Member Type: DATA Variables: 2 Engine: V8 Indexes: 0 Created: 21:56 Thursday, April 29, 1993 Observation Length: 16 Last Modified:56 Thursday, April
6、 29, 1993 Deleted Observations: Protection: Compressed: NO Data Set Type: Sorted: Label: -Engine/Host Dependent Information- Data Set Page Size: 4096 Number of Data Set Pages: 1 First Data Page: Max Obs per Page: 252 Obs in First Data Page: Number of Data Set Repairs: File Name: C:DOCUME1111LOCALS1T
7、empSAS Temporary Files_TD1620test.sas7bdat Release Created: 8.0202M0 Host Created: WIN_PRO -Alphabetic List of Variables and Attributes- # Variable Type Len Pos 1 a Num 8 0 2 b Char 8 8也可在explorerwork右击testProperties查看描述部分2SAS数据集命名规则 长度可以是1-32个字符.3. SAS常量和变量SAS常量:主要有数值型、字符型两种,并且还提供了用于表达日期、时间的数据类型。例如
8、 l 数值型:12,7.5,2.5E10 l 字符型:Beijing,Li Ming李明l 日期型:13JUL1998d l 时间型:14:20tl 日期时间型:13JUL1998:20:32dt 数值型常数可以用整数、定点实数、科学计数法实数表示。字符型常数为两边用单撇号或两边用双撇号包围的若干字符。日期型常数是在表示日期的字符串后加一个字母d(大小写均 可),中间没有空格。时间型常数是在表示时间的字符串后加一个字母t。日期时间型常数 在表示日期时间的字符串后加字母dt。 因为SAS是一种数据处理语言,而实际数据中经常会遇到缺失值,比如没有观测到 数值,被访问人不肯回答,等等。SAS中用一个
9、单独的小数点来表示缺失值常量SAS变量:SAS系统规定变量的命名必须遵循以下规则:SAS变量不区分大小写. 变量类型:数值型和字符型。日期、时间等变量存为数值型。SAS的数值型变量可以存储任意整数、定点实数、浮点实数,一般不关心其区别。.字符串类型的遗漏值(Missing Value)是NULL,数字类型的遗漏值是“”。变量长度:存储该变量所用的字节数。缺省值是8。变量的输入格式:确定将某种形式的数据如何读入为标准的SAS数据.例如在表示金额的记录中常用类似于$1,234的写法,它表示两个特殊字符,一个$符号和一个逗号,作为金额记录它表示美元1234元.在机器内部为了对金额进行计算必须将它记为
10、一个数1234. 为此在读入时可以用一个输入格式自动地只读入移去美元符号和逗号之后的数值,然后将其村为标准的数值.变量的输出格式:确定将数据以某种特殊格式输出。.在机器内部为了对金额进行计算必须将它记为一个数1234. 为此在读出时可以用一个输出格式自动地加上美元符号和逗号.变量的标签:对变量的描述,是长度不超过256个字符的字符串,区分大小写,也可以是中文字符。2-4 输入和输出格式SAS最常用的输入输出格式:字符型 数值型 日期时间型 用户自定义型各种输入输出格式的一般写作形式: 格式名.$:变量为字符型;w:格式的宽度;为了得到各种输入格式和输出格式的说明,可以按照以下操作查阅在线帮助.
11、 HelpSas System Help, 在索引选项下键入informats,然后选择Informats and Formats: Index即可.1. w.d:数值变量的宽度与精度;w.d说明:1. 当数据以浮点方式表示或包含小数点时, d不起作用;2. 当读入的数据是整数时, d指隐含的小数位数,即将读入整数除以10的d次方;3. 对于负数,要求负号为数据的第一个字符,且与其他数字间不留空格.4. 由于d的复杂性,建议编程时直接采用w.或不用格式data a;Obs as 1 1.123 2 11.234 3 -0.012 4 -1.234 5 12.340 input as 5.3 ;
12、1123 11234 -12 -12345 12.345 proc print;2. $charw.:如果需要完全原样地输入字符型数据(包括头尾空格、单独的小数点),可以用有格式输入,即在字符型变量名和$符后加上一个输入格式如CHAR10.表示读入10个字符,并保留读入字符串前的空格符。$w.:如果需要完全原样地输入字符型数据(包括头尾空格、单独的小数点),可以用有格式输入,即在字符型变量名和$符后加上一个输入格式如10.表示读入10个字符,并删除读入字符串前的空格符。Obs aaa1 1.1232 0.0123 12.34564 6input aaa $char10.;1.1230.01212.3456 6 Commaw.(d):数据一般以包含逗号、空格、-、$的字符串形式出现在卡片或外部数据文件中;读入时系统可自动去掉这些符号。1 12345.672 123.453 123.454 1234.565 -1234.566 6.23input aaa comma10.2;$123,456,789,0123,4-5123,4 512345
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1