sas编程习题与实例应用.docx
《sas编程习题与实例应用.docx》由会员分享,可在线阅读,更多相关《sas编程习题与实例应用.docx(22页珍藏版)》请在冰豆网上搜索。
sas编程习题与实例应用
一、数据集整理与SAS基本编程
1、试用产生标准正态分布函数的随机函数normal(seed)产生均值为170,方差为64的正态随机数100个,并计算其常规统计量(均值、标准差、变异系数、偏度和峰度)。
datadate1;
mu=170;
sigma=8;
doi=1to100;
y=mu+sigma*RANNOR(0);
output;
end;
run;
procmeansdata=data1meanstdcvstderrskewness;
vary;
outputout=result;
run;
2、设已知数据集class中有5个变量:
name,sex,age,height和weight,请编写程序新建数据集class1,其中class1只包含name,sex,age三个变量,且把name重命名为id。
dataclass;
inputname$sex$ageheighweigh;
cards;
小明男1516050
;
run;
dataclass1;
setclass;
keepnamesexage;
renamename=id;
run;
procprintdata=class1;
run;
3、SAS的逻辑库可分为永久库和临时库两种,请编写一段程序直接建立永久库sasuser中的下例数据集,并按降序排序。
数据名tong:
2013201623191916
dataSasuser.tong;
inputx@@;
cards;
2013201623191916
;
run;
procsortdata=Sasuser.tong;
bydescendingx;
run;
procprintdata=Sasuser.tong;
run;
4、设已知数据集data1和数据集data2
number
province
1
Hebei
3
Zhejiang
5
Gansu
number
city
2
Chengdu
4
Nanjing
请编写程序串接data1和data2,且分组变量为number。
datadata1;
inputnumberprovince$;
cards;
1Hebei
3Zhejiang
5Gansu
;
run;
datadata2;
inputnumbercity$;
cards;
2Chengdu
4Nanjing
;
run;
datadata;
setdata1data2;
bynumber;
run;
procprintdata=data;
run;
二、描述统计
1、下表记录了某超市一个月内每天的营业额(千元),现用SAS过程做描述统计,请根据给出的结果回答以下问题:
日期
营业额
日期
营业额
日期
营业额
日期
营业额
日期
营业额
1
6.14
7
14.76
13
42.41
19
11.13
25
33.87
2
48.35
8
39.18
14
30.21
20
1.07
26
20.09
3
0.95
9
36.87
15
15.62
21
17.12
27
34.73
4
18.61
10
15.64
16
40.47
22
8.33
28
43.86
5
37.89
11
30.44
17
8.81
23
8.59
29
7.56
6
3.48
12
23.38
18
2.5
24
4.08
30
23.44
(1)、该超市一个月内的平均营业额,哪天最大、最小?
(2)、营业额的偏度、变异系数;
(3)、数据是否服从正态分布?
(
)
datadata1;
inputnumberprovince$;
cards;
1Hebei
3Zhejiang
5Gansu
;
run;
datadata2;
inputnumbercity$;
cards;
2Chengdu
4Nanjing
;
run;
datadata;
setdata1data2;
bynumber;
run;
procprintdata=data;
run;
dataa;
inputdatetotal;
cards;
;
procunivariatedata=a;
vartotal;
run;
2、假设某学校大学生的身高为X(记总体X的均值为
,方差为
),体重为Y(记总体Y的均值为
,方差为
),今从全校随机抽取100名学生,测得身高、体重数据如下,请根据输出结果回答以下问题:
身高
体重
身高
体重
身高
体重
身高
体重
身高
体重
172.4
75
169.3
54.8
169.3
64
171.4
64.8
166.5
47.4
171.4
62.2
168.2
66.9
165.1
52
168.8
62.2
167.8
65
165.8
62.2
167.8
65
164.4
58.7
169.9
57.5
164.9
63.5
160.3
55.2
175
66.6
172.5
73.5
172
64
168.4
57
155
57
175.5
63.9
172.3
69
168.6
58
176.4
56.9
173.2
57.5
167.5
50
169.4
52.2
166.7
72
169.5
57
165.7
55.4
161.2
48.5
172.8
57
175.1
75.5
157.5
50.5
169.8
62.9
168.6
63.4
172.6
61
163.8
58.5
165.1
61.5
166.7
52.5
170.9
61
166.1
69.5
166.2
62.5
172.4
52.6
172.8
60
177.8
63.9
162.7
56.8
168.8
54
169.1
66.2
177.5
60
177
66.2
169.9
55.9
167.4
54.4
169.3
58.4
172.8
72.8
169.8
58
160
65.3
179.1
62.2
172.3
49.8
163.3
46.5
172.9
66.7
165.4
58
175.8
63.2
162.3
52.2
165.4
65.7
171.5
59.3
176.6
66.3
181.7
68.6
175.2
74.9
169.5
59.5
169.6
61.5
169.1
63.1
185.5
77
173.9
65.5
162.5
50
171.5
58.5
175.6
59.8
166
75.5
167.2
63.3
171.9
57
176.6
58.4
177.3
67
169.2
71.8
166.2
49.8
181.7
63
175.8
68.3
172.3
55.5
172.7
58.5
174.3
64
171.2
59
174.8
68
165.4
55.5
169.1
64.8
167.9
62
176.8
64
183.5
69.9
165.5
48.6
171
70.5
170.3
58.5
1、身高、体重的均值
和方差
的90%的置信区间;
dataa;
inputheigh@@weigh@@;
cards;
;
run;
procttestdata=aalpha=0.1;
run;
{169.31,171.09}{60.201,62.307}
2、分析100名学生身高数据频率直方图;
procgchartdata=a;
vbarheigh/type=freq;
run;
3、对身高均值
和方差
做假设检验;
0.7072>0.05接受原假设
没有显著差异;
4、体重数据是否来自正态总体?
procunivariatedata=anormal;
varweight;
run;
样本少于2000看第一个大于2000看第二个
因为0.4639大于0.05所以接受原假设
所以来自正态总体
三、假设检验
1、某生产企业进行技术改造,为考察改造是否对生产量有提高,记录改造前后各10天的产量(吨/天)的数据:
改造前
3.3
11.7
9.4
6.8
2
3.1
5.3
3.7
21.8
17.6
改造后
33
30.8
8.8
11.4
42.6
5.8
1.6
19
22.4
30.2
技术改造对产量是否有显著的影响(
)?
datatest;
inputab@@;
cards;
run;
procttestdata=test;
paireda*b;
run;
因为0.0384<0.05拒绝原假设,使用新技术后有显著差异。
2、某工厂有两台不同型号的机器生产同一种产品,为检验这两台机器的产量是否有显著的差异,记录了某段时间的生产数据如下:
性别
甲
甲
甲
甲
甲
甲
甲
乙
乙
乙
乙
乙
乙
乙
产量
75
76
80
77
80
77
73
82
80
85
85
78
87
82
甲乙的产量是否有显著的差异(
)?
datatest2;
inputa$b@@;
cards;
run;
procttestdata=test2alpha=0.01;
classa;
varb;
run;
因为0.6189>0.01,所以方差相等,看第一个equal,0.0024<0.01
拒绝原假设,两个独立样本有显著差异。
四、方差分析
1、生产配方问题。
生产某种产品需要两种原材料:
A和B;考察的指标为产品的产量Y。
设因子A有三个品牌:
A1,A2,A3;因子B有四个品牌:
B1,B2,B3,B4。
对这12中配搭的每一种,安排两次实验,得数据如下表(每次实验的产量):
B1
B2
B3
B4
A1
19.3,19.2
24,27.3
26,28.5
27.8,28.5
A2
21.7,22.6
27.5,30.3
29,28.7
30.2,29.8
A3
20,20.1
24.2,27.3
24.5,27.1
28.1,27.7
(1)、原材料A的不同品牌对产量是否有显著的差别?
哪个品牌更好些(
)?
(2)、原材料B的不同品牌对产量是否有显著的影响?
(3)、A和B对产量的影响哪个更大些?
(4)、A和B是否有交互作