sas编程习题与实例应用要点.docx

上传人:b****4 文档编号:4627542 上传时间:2022-12-07 格式:DOCX 页数:22 大小:160.81KB
下载 相关 举报
sas编程习题与实例应用要点.docx_第1页
第1页 / 共22页
sas编程习题与实例应用要点.docx_第2页
第2页 / 共22页
sas编程习题与实例应用要点.docx_第3页
第3页 / 共22页
sas编程习题与实例应用要点.docx_第4页
第4页 / 共22页
sas编程习题与实例应用要点.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

sas编程习题与实例应用要点.docx

《sas编程习题与实例应用要点.docx》由会员分享,可在线阅读,更多相关《sas编程习题与实例应用要点.docx(22页珍藏版)》请在冰豆网上搜索。

sas编程习题与实例应用要点.docx

sas编程习题与实例应用要点

基本编程一、数据集整理与SAS产生均seed)试用产生标准正态分布函数的随机函数1、normal(并计算其常规统计量(均值、,方差为值为17064的正态随机数100个,标准差、变异系数、偏度和峰度)。

date1;data;mu=170;sigma=8;

1doi=to100);y=mu+sigma*RANNOR(0;output;end;

run;skewnessstderrstddataprocmeans=data1meancvy;

var=result;outoutput

;

run

name,sex,age,height中有5个变量:

、设已知数据集2classname,只包含,请编写程序新建数据集和weightclass1,其中class1sex,age三个变量,且把id。

name重命名为class;

dataname$sex$ageheighweigh;input;

cards1516050小明男;

;

rundataclass1;

1

class;

setnamesexage;keepname=id;rename;

run=class1;procprintdata;

run

的逻辑库可分为永久库和临时库两种,请编写一段程序3、SAS中的下例数据集,并按降序排序。

直接建立永久库sasuser1916

数据名tong201320162319

Sasuser.tong;datax@@;input;

cards2013201623191916

;

;

run=Sasuser.tong;procsortdata

x;bydescending;

run=Sasuser.tong;dataprocprint

;rundata2

data14、设已知数据集和数据集

provincenumbercitynumber

Hebei12ChengduZhejiang34Nanjing5Gansu

data2请编写程序串接data1和,且分组变量为numberdata1;

datanumberprovince$;input;cards1Hebei

3Zhejiang

2

5Gansu

;

;

rundata2;

datanumbercity$;input;cards2Chengdu

4Nanjing

;

;rundata;datadata1data2;setnumber;by;

run=data;printdataproc;

run

二、描述统计SAS,现用(千元)1、下表记录了某超市一个月内每天的营业额过程做描述统计,请根据给出的结果回答以下问题:

日期

营业额

日期

营业额

日期

营业额

日期

营业额

日期

营业额

1

6.14

7

14.76

13

42.41

19

11.13

25

33.87

2

48.35

8

39.18

14

30.21

20

1.07

26

20.09

3

0.95

9

36.87

15

15.62

21

17.12

27

34.73

4

18.61

10

15.64

16

40.47

22

8.33

28

43.86

5

37.89

11

30.44

17

8.81

23

8.59

29

7.56

6

3.48

12

23.38

18

2.5

24

4.08

30

23.44

1()、该超市一个月内的平均营业额,哪天最大、最小?

)(2、营业额的偏度、变异系数;3

(3)、数据是否服从正态分布?

()?

0.05?

data1;

datanumberprovince$;input;cards1Hebei

3Zhejiang

5Gansu

;

;

rundata2;

datanumbercity$;input;cards2Chengdu

4Nanjing

;

;rundata;datadata1data2;setnumber;by;

run=data;dataprintproc;run

a;

datadatetotal;input;cards;

=a;univariatedataproctotal;

var

run;

4

,方差X(记总体X的均值为2、假设某学校大学生的身高为?

1,今从全校随机Y的均值为,方差为)为),体重为Y(记总体22?

?

?

212名学生,测得身高、体重数据如下,请根据输出结果回答以抽取100下问题:

身高

体重

身高

体重

身高

体重

身高

体重

身高

体重

172.4

75

169.3

54.8

169.3

64

171.4

64.8

166.5

47.4

171.4

62.2

168.2

66.9

165.1

52

168.8

62.2

167.8

65

165.8

62.2

167.8

65

164.4

58.7

169.9

57.5

164.9

63.5

160.3

55.2

175

66.6

172.5

73.5

172

64

168.4

57

155

57

175.5

63.9

172.3

69

168.6

58

176.4

56.9

173.2

57.5

167.5

50

169.4

52.2

166.7

72

169.5

57

165.7

55.4

161.2

48.5

172.8

57

175.1

75.5

157.5

50.5

169.8

62.9

168.6

63.4

172.6

61

163.8

58.5

165.1

61.5

166.7

52.5

170.9

61

166.1

69.5

166.2

62.5

172.4

52.6

172.8

60

177.8

63.9

162.7

56.8

168.8

54

169.1

66.2

177.5

60

177

66.2

169.9

55.9

167.4

54.4

169.3

58.4

172.8

72.8

169.8

58

160

65.3

179.1

62.2

172.3

49.8

163.3

46.5

172.9

66.7

165.4

58

175.8

63.2

162.3

52.2

165.4

65.7

171.5

59.3

176.6

66.3

181.7

68.6

175.2

74.9

169.5

59.5

169.6

61.5

169.1

63.1

185.5

77

173.9

65.5

162.5

50

171.5

58.5

175.6

59.8

166

75.5

167.2

63.3

171.9

57

176.6

58.4

177.3

67

169.2

71.8

166.2

49.8

181.7

63

175.8

68.3

172.3

55.5

172.7

58.5

174.3

64

171.2

59

174.8

68

165.4

55.5

169.1

64.8

167.9

62

5

58.5

17148.670.5170.3183.5176.86469.9165.5

的置信区间;的1、身高、体重的均值和方差90%22?

?

?

?

,2121a;

dataheigh@@weigh@@;input;cards;

;

run;=0.1data=aalphaprocttest

;run

62.307},171.09}{60.201,{169.31名学生身高数据频率直方图;、分析1002=a;dataprocgchart=freq;typeheigh/vbar;run

做假设检验;和方差、对身高均值322?

?

cm30?

cm170?

6

接受原假设0.7072>0.05

没有显著差异;

、体重数据是否来自正态总体?

4;normalunivariatedata=aproc

weight;var;run

看第一个大于2000看第二个样本少于2000大于0.46390.05所以接受原假设因为所以来自正态总体三、假设检验

为考察改造是否对生产量有提高,、某生产企业进行技术改造,1天)的数据:

天的产量(吨10/记录改造前后各

7

改造前

3.3

11.7

9.4

6.8

2

3.1

5.3

3.7

21.8

17.6

改造后

33

30.8

8.8

11.4

42.6

5.8

1.6

19

22.4

30.2

技术改造对产量是否有显著的影响()?

?

0.05?

test;dataab@@;input;cards;

run=test;procttestdataa*b;paired;

run

因为0.0384<0.05拒绝原假设,使用新技术后有显著差异。

、某工厂有两台不同型号的机器生产同一种产品,为检验这两2台机器的产量是否有显著的差异,记录了某段时间的生产数据如下:

性别A3

甲20,20.1

甲24.2,27.3

甲24.5

乙,

乙27.1

乙28.1

乙27.7

产量

75

76

80

77

80

77

73

82

80

85

85

78

87

82

甲乙的产量是否有显著的差异()?

?

0.01?

test2;

data8

a$b@@;input;cards;

run;=0.01procttestdata=test2alphaa;classb;

var;

run

equal,0.0024<0.01所以方差相等,看第一个因为0.6189>0.01,拒绝原假设,两个独立样本有显著差异。

四、方差分析;考察的BA和1、生产配方问题。

生产某种产品需要两种原材料:

有BA3;因子有三个品牌:

A1,A2,指标为产品的产量Y。

设因子A中配搭的每一种,安排两次实。

对这12,B3,B4四个品牌:

B1,B2验,得数据如下表(每次实验的产量):

B4B3B1

B2

27.3

,19.224A127.8,28.519.3,26,28.5

28.72930.2,29.8

,21.7,22.627.5,30.3A2的不同品牌对产量是否有显著的差别?

哪个品牌A、

(1)原材料更好些()?

?

0.05?

9

的不同品牌对产量是否有显著的影响?

2()、原材料BA和B对产量的影响哪个更大些?

)(3、B是否有交互作用?

4()、A和、使产量达到最大的生产条件是什么?

(5)test3;data;3doa=1to

;1to4b=do;2todoc=1x@@;input

;output

;end;end;end;cards;

run=test3;dataglmproc

ab;classx=aba*b;

model*//*多重比较设置;meansaba*b/trun;

因为0.0036<0.05拒绝原假设,A品牌对产量有显著影响。

10

0.001<0.05拒绝原假设,A品牌对产量有显著影响。

0.8995>0.05接受原假设,A、B相互没有作用。

在A品牌中分成两组,a2和a1、a3.因为a2均值最大所以最好。

(如何判断看a1a3可分成一组看上面那个表格第五行,只要差值小于1.4596,即可看成一组,两个效果差不多。

同理,b4最好。

若A、B相互不影响,那么使产量最大的组合可直接选择A、B分11

别均值最大那个,即a2*b4.

若A、B相互影响,那么看这个表格均值最大那个。

2、考虑合成纤维收缩率(因子A)和总拉伸倍数(因子B)对纤维A)有4个水平:

A1,A2,弹性Y的影响。

设收缩率(A3,A4;总拉伸倍数(B)也有4个水平B1,B2,B3,B4。

在每个组合下重复二次试验,弹性的数据如下表:

B1(=460)

B2(=520)

B3(=560)

B4(=640)

(A1=0)

71,73

72,73

75,73

77,75

=4A2()

73,75

76,74

78,77

74,74

)(A3=8

76,73

79,77

74,75

74,73

=12A4()

75,73

73,72

70,71

69,69

(1)、收缩率对弹性Y是否有显著的影响?

哪个收缩率影响更大些?

()?

0.05?

(2)、不同拉伸倍数对产量是否有显著的影响?

(3)、收缩率和拉伸倍数是否有交互作用?

(4)、使弹性达到最大的生产条件是什么?

12

五、回归分析有1、某厂生产的一种产品的销售额Y与生产成本及销售成本xx2110个城市销售数据记录如下,关。

现有

x(元)1

x(元)2短寿

Y(个)长寿

x(元)1合计

x(元)2

Y(个)

120x1

100xx2贪官348

102x34232

155xY1580

210xx23

46xY4

14082.9

1109217.1清官93

100948.4487

175131580

15010140101

9314.2

19088

909321.3合计441

120969.6719

125148.21160

25010544104

2615.8

13099.9

1509625.1

779710.4

145161.8

27011249109

6917.9

120105.3

1009429

1029711.4

180174.2

30011251111

6519.6

(1)、建立销售量Y与生产成本及销售成本的回归关系式,xx21说明回归方程在的水平上是否显著?

并解释回归系数的含义。

?

0.05?

datasale;

inputx1x2y;

cards;

run;

procregdata=sale;

modely=x1x2/r;

run;

13

因为0.0078小于0.05,所以模型达到显著水平。

回归关系式:

y=79.88271+0.37176x1-0.31736x2

(2)、对回归模型进行初步诊断,并指出有无可疑点或异常点?

根据StudentResidual或星星判断,得观测1、8、9的残差较大,说明这三个模型的预测结果不是很理想。

(3)、写出模型的决定系数、均方误差、均方误差的根,并说明决定系数的含义。

决定系数:

R-Square=0.7499>0.5,说明多元回归模型的拟合程度较好。

均方误差:

MeanSquareError270.21070=均方误差的根:

RootMSE=16.43809

(4)、该回归模型回归系数是否显著?

可以从哪些方面对模型进行改进?

X1的回归系数p值=0.1265>0.05,不显著。

X2的回归系数p值=0.0029<0.05,显著。

(5)、如果元及元,试预测该厂的销售量。

160?

?

x170x2114

代进去。

2、某地区对某种电器的销售量Y进行调查,它与以下4个量有关:

=居民可支配收入,=该电器平均价格指数,=该电器保有xxx321量,=其他电器平均价格指数。

现有10个历史数据记录如下,x4

3410012.2117.7100184.71125311120.8

(1)、建立销售量Y与的回归关系式,说明回归方程在xx41

的水平上是否显著?

?

0.05?

(2)、对回归模型进行初步诊断,并指出有无可疑点或异常点?

(3)、写出模型的决定系数、均方误差、均方误差的根,并说明决定系数的含义。

(4)、该回归模型回归系数是否显著?

可以从哪些方面对模型进行改进?

六、属性数据分析

1、下表是对195名顾客的购买手机意愿(分为品牌机、山寨机、无所谓)的调查数据,同时记录了每位顾客的年收入经济状况(分为贫穷、下、中、上四个等级)。

贫穷下中上

15

12113015山寨机2918品牌机197

19

235

无所谓7

如果有关)请问购买何种手机是否与顾客的经济状况有关(?

0.01?

两者有何趋势?

test;dataa$b$x;

input;b='购买手机意愿''经济状况labela=';

cards30品牌机贫穷15下品牌机

11中品牌机

12上品牌机

7贫穷山寨机18下山寨机19中山寨机

29上山寨机

5贫穷无所谓

23无所谓下7无所谓中19上无所谓;

;

run=test;

dataprocfreq;0.01nopercentalpha=a*b/tableexpectedchisqnorowmeasuresx;weight;

run

16

17

、巴西医生马廷思收集了580名犯有各种贪污、受贿罪的官员和5802名廉洁官员之寿命调查数据,试分析贪污与寿命之间有无显著的关系?

请问短寿是否与贪污有关?

如果有关两者有何趋势?

18

19

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1