同济医学院-《SAS》课件-求基本统计量过程优质PPT.ppt
《同济医学院-《SAS》课件-求基本统计量过程优质PPT.ppt》由会员分享,可在线阅读,更多相关《同济医学院-《SAS》课件-求基本统计量过程优质PPT.ppt(25页珍藏版)》请在冰豆网上搜索。
FREQ变量变量;
ID变量变量;
BY变量变量;
OUTPUT选择项;
选择项;
33语句说明:
语句说明:
11、PROCMEANSPROCMEANS语句语句PROCMEANSPROCMEANS;
11)选择项包括)选择项包括:
DATA=SASDATA=SAS数据集数据集指明需做指明需做MEANSMEANS分析的分析的SASSAS数据集名。
数据集名。
ALPHA=nALPHA=n指定计算可信限的指定计算可信限的值,缺省值,缺省=0.05=0.05。
NOPRINTNOPRINT不打印统计值,仅建立一个新数据集。
不打印统计值,仅建立一个新数据集。
MAXDEC=nMAXDEC=n输出结果取输出结果取nn位小数,缺省值为位小数,缺省值为77。
VARDEF=DFVARDEF=DF计算方差时的除数是自由度(计算方差时的除数是自由度(N-1N-1)。
)。
=N=N计算方差时的除数是观测数。
计算方差时的除数是观测数。
PROCMEANSPROCMEANS;
NN无缺省值的观察数无缺省值的观察数MEANMEAN均值均值STDSTD标准差标准差MINMIN最小值最小值MAXMAX最大值最大值RANGERANGE极差极差SUMSUM所有不缺省项变量值的和所有不缺省项变量值的和VARVAR方差方差USSUSS未修正的平方和未修正的平方和CSSCSS修正的平方和修正的平方和CVCV变异系数变异系数22)统计关键字选择项)统计关键字选择项STDERRSTDERR标准误标准误TT总体均值为总体均值为00的学生的学生tt值值PRTtPRTt值的最大绝对值的概率值的最大绝对值的概率SKEWNESSSKEWNESS偏度偏度KURTOSISKURTOSIS峰度峰度CLMCLM上下可信限值上下可信限值LCLMLCLM可信限下限值可信限下限值UCLMUCLM可信限上限值可信限上限值2)2)统计关键字选择项统计关键字选择项3)缺省时,自动地为每个数值型变量输出五个统计量:
缺省时,自动地为每个数值型变量输出五个统计量:
N、MIN、MAX、MEAN、STD。
22、主要语句、主要语句
(1)VAR语语句句:
指指明明需需要要计计算算均均数数等等统统计计量量的的变变量量。
如如果果求求多多个个变变量量的的统统计计量量,多多个个变变量量之之间间用用空空格格分分开开,列列于于VAR之之后后。
如如果果不不加加此此语语句句,则则MEANS过过程程对对数数据据集中所有数值型变量进行计算;
集中所有数值型变量进行计算;
(2)FREQ语句:
指明频数处理变量语句:
指明频数处理变量(3)ID语句:
输出的数据集包含该语句所指的变量语句:
输出的数据集包含该语句所指的变量(4)BY语语句句:
指指明明用用以以分分组组统统计计的的变变量量。
使使用用BY语语句之前,数据集一定按句之前,数据集一定按BY语句中的变量排过序。
语句中的变量排过序。
(5)OUTPUT语语句句:
产产生生包包含含有有基基本本统统计计值值的的数数据据集集OUTPUTOUTPUT语句语句OUTPUTOUTOUTPUTOUTSASSAS数据集数据集统计关键字统计关键字=变量名清单;
变量名清单;
功能:
将功能:
将MEANSMEANS过程产生的统计值输出到一个新的过程产生的统计值输出到一个新的SASSAS数据集。
数据集。
OUTOUTSASSAS数据集数据集指定计算结果放入新的数据集里。
指定计算结果放入新的数据集里。
统计关键变量名清单统计关键变量名清单指明新数据集中想要的统计指明新数据集中想要的统计项,并给包含这些统计项的变量起名,这些名字将作为统项,并给包含这些统计项的变量起名,这些名字将作为统计值在新数据集中使用。
统计关键字为计值在新数据集中使用。
统计关键字为的任意统计量,变量名清单为的任意统计量,变量名清单为VARVAR语句中的变量名,可语句中的变量名,可以取一个,也可以取多个。
以取一个,也可以取多个。
需需要要注注意意的的是是,LCLM,UCLMLCLM,UCLM(同同时时指指定定输输出出为为双双侧侧;
如如只只选选一一个个,输输出出单单侧侧可可信信区区间间)可可以以重重新新对对统统计计量量命名,也可用原名;
命名,也可用原名;
格式格式n=nmean=meanprt=pn=nmean=meanprt=p例例1:
PROCSORTDATA=CLASS1;
BYSEX;
PROCMEANSDATA=CLASS1;
VARHEIGHT;
RUN;
OUTPUTOUT=NEWMEAN=MEANHEIGHT;
Datagmean;
Inputx;
Y=log10(x);
Cards;
2530323428Procmeansnoprint;
Vary;
Outputout=gmean1mean=y1;
Datagmean2;
Setgmean1;
X1=10*y1;
Procprint;
Varx1;
Run;
例例2例例16-216-2某地区某地区19531953至至19571957年人口的自然增长率为年人口的自然增长率为2525、3030、3232、3434、2828,求平均增长率。
,求平均增长率。
二二UNIVARIATEUNIVARIATE过程过程1.格格式式:
PROCUNIVARIATEdata=SAS数数据据集集normalplot;
OUTPUTOUT=datasetkeyword=name;
2功能:
求数据集中某(些)变量均数(求数据集中某(些)变量均数(mean)百)百分位数(分位数(percentiles)、极值()、极值(extremes)等)等基本统计量。
与基本统计量。
与MEANS过程的区别在于它可以过程的区别在于它可以计算更多的反应数据分布的统计量。
计算更多的反应数据分布的统计量。
Normal:
用于正态性检验。
Plot:
给出干叶图、箱式图及正态概率图,给出干叶图、箱式图及正态概率图,检验数据是否服从正态分布。
检验数据是否服从正态分布。
例例2:
测定测定30名正常男子血浆中性脂肪含名正常男子血浆中性脂肪含量量(mg/lwml)的结果如下:
的结果如下:
163219313169281264124942241452851072694166622491361001994079423512012856080217252165107Libnameb“c:
zfhl”;
datab.blood;
inputx;
cards;
163219313169281264124942241452851072694166622491361001994079423512012856080217252165107;
procprint;
run;
procunivariatenormalplot;
varx;
5.125.134.584.314.094.414.334.584.245.454.324.845.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.045.145.464.664.204.915.145.254.894.794.905.094.045.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.694.164.585.353.715.274.525.214.374.804.753.865.69例例33某地随机抽取正常成年男子某地随机抽取正常成年男子120120名,其红细胞数名,其红细胞数如下,试作该批样本的频数表。
如下,试作该批样本的频数表。
三三FREQFREQ过程过程