SAS论文 统计分析与应用 sas统计分析文档格式.docx
《SAS论文 统计分析与应用 sas统计分析文档格式.docx》由会员分享,可在线阅读,更多相关《SAS论文 统计分析与应用 sas统计分析文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
通过SAS软件的分析,对各地区农村居民家庭平均每人现金支出的主要影响因素有一个大致的了解;
有利于国家的宏观调控,从而可以促进全民经济更好的发展。
2、采用方法:
1描述统计量:
MEANS
2检验:
使用INSIGHT模块主成分分析。
3、理论知识:
1MEANS过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计.procmeans过
程统计量参数缺省时输出N(样本数据)、Mean(数据平均值)、StdDev(数据标准差)、Minimum
(最小值)、Maximum(最大值)五种统计值,但means过程可计算16种统计量。
2主成份分析(PrincipalComponentsAnalysis)是研究如何将多个变量指标间的问题化为较少的几个
新指标问题。
这些新的指标是彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个
指标的线性组合。
多指标的主成份分析常被用来寻找判断某种事物或现象的综合指标,并给综合
指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。
这种处理问题的方法就称为主
成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。
主分量分析还可用于揭示变量间的共线性。
三、数据预处理及具体模型:
对于数据较少的程序可以用DATA步创建永久SAS数据集。
永久SAS数据集,由定义逻辑库
与定义数据集两个步骤完成。
逻辑库定义通过
LIBNAME语句完成,数据集定义应用DATA实现。
LIBNAME语句语法格式:
LIBNAME逻辑库名称,子目录路径’;
DATA语句语法格式:
DATA逻辑库名•数据集名称;
LIBNAME语句把磁盘中的子目录与用户定义的逻辑库名连接起来。
用此种方法根据已知的数据就可以建立生成以下的数据集
3.1建成的数据集为:
TheSASSystem
20:
00Tuesday,December15,2009
Obs
area
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
1
北京
5318.9
730.2
606.4
124.2
232.5
123.7
1.9
4093.2
23.5
470.2
2
天津
3267.8
1242.8
1172.9
203.3
699.5
69.9
1.2
1896.1
6.0
121.6
3
河北
2289.6
779.6
725.0
362.7
226.2
54.6
3.1
1361.7
14.9
130.3
4
山西
2080.9
500.0
441.3
254.4
126.3
58.7
0.7
1431.2
4.0
145.1
5
内家古
3338.7
1426.9
1223.5
865.7
316.6
1.7
1617.3
52.2
240.6
6
辽宁
3926.2
1671.2
1546.2
719.9
754.5
125.0
3.8
1803.7
38.7
408.9
7
吉林
4517.7
2129.9
1836.9
1404.1
393.3
293.1
5.1
1741.0
202.9
438.7
8
黑龙江
4424.6
2047.0
1812.2
1405.0
368.8
234.8
2.9
1699.1
301.8
373.9
9
上海
5487.1
241.3
229.9
37.3
32.6
11.4
0.1
4616.7
1.4
627.6
10
江苏
3412.9
632.1
561.8
236.1
137.5
70.3
12.82438.9
5.5
323.7
11
浙江
5437.2
1320.2
1192.4
159.4
724.4
127.8
3587.7
23.7
500.1
12
安徽
2390.0
554.9
490.7
297.2
116.7
64.2
1666.2
3.0
159.9
13
福建
3026.0
626.4
566.8
251.0
208.1
59.6
2168.2
10.8
219.8
14
江西
2199.8
680.6
591.7
339.7
160.4
89.0
4.5
1328.0
163.2
15
山东
3060.9
969.5
842.4
423.3
314.6
127.1
5.7
1885.7
16.7
183.3
16
河南
2163.8
583.9
523.9
237.1
228.8
60.0
0.6
1448.6
129.3
17
湖北
2222.2
677.5
601.9
266.8
195.9
75.6
3.9
1471.3
4.6
64.8
18
湖南
2418.9
555.8
497.8
196.7
175.2
58.0
1587.9
2.8
268.5
19
广东
2895.2
576.3
547.4
171.3
216.3
29.0
2155.6
9.5
152.0
20
广西
1900.9
697.4
589.5
348.5
187.6
107.9
1125.6
1.6
73.6
21
海南
1902.8
656.1
639.2
324.3
165.4
16.9
0.3
1187.2
2.1
57.1
22
重庆
1773.4
449.1
406.3
188.7
172.8
42.8
2.5
1107.3
0.9
213.5
23
四川
2514.5
612.8
533.5
178.0
270.7
79.3
6.1
1669.5
7.0
219.1
24
贵州
1432.8
412.5
324.7
167.7
122.2
87.7
846.3
1.0
171.6
25
云南
1837.1
623.0
532.9
277.2
185.6
90.1
1.5
1089.9
6.8
115.9
26
西藏
1022.3
203.9
92.3
53.2
8.8
111.5
0.2
800.7
17.5
27
陕西
2261.3
580.1
442.6
128.4
1496.8
175.9
28
甘肃
1622.3
473.2
391.2
298.3
74.4
82.0
1068.2
4.3
75.7
29
青海
1753.8
447.9
348.0
190.1
92.5
99.8
1196.5
7.4
100.3
30
宁夏
2592.8
1029.8
870.5
406.2
359.3
159.3
1325.6
31.3
205.8
31
新疆
2705.0
1444.4
1109.7
813.2
236.6
334.7
1126.0
44.4
89.2
3.2、模型的具体程序:
datadatal;
inputarea$1-6x1x2x3x4x5x6x7x8x9x10;
cards;
北
京
天
津
河
山
西
辽
吉
林
1699