SAS软件与统计应用论文_精品文档Word格式文档下载.doc

资源描述

SAS软件与统计应用论文_精品文档Word格式文档下载.doc

《SAS软件与统计应用论文_精品文档Word格式文档下载.doc》由会员分享，可在线阅读，更多相关《SAS软件与统计应用论文_精品文档Word格式文档下载.doc（13页珍藏版）》请在冰豆网上搜索。

SAS软件与统计应用论文_精品文档Word格式文档下载.doc

高级教师占专职教师的比例；

每所学校在校生数；

生师比。

依次用A1，A2，A3，A4，A5，A6，A7，A8，A9，A10表示。

用“分析家”作主成分分析，并且对数据进行如下处理：

第一：

对于所选取的统计数据进行简单描述统计分析，得出数据的平均值、数据标准差，最大值，最小值等。

第二：

对于所选取的统计数据用”analyst”作主成分分析计算相关系数矩阵的特征值、上下特征值之差、各主成分的方差贡献率、以及累积贡献率。

第三：

由相关系数矩阵的两个最大特征值的特征向量，可以写出第一、第二主成分的得分。

第四：

在“insight”里面绘制了散点图。

由图可知，在散点图越靠向右上角的地区，教育人力资源发展水平越高，越靠向左上角的地区，教育人力资源发展水平越低。

从以上结论分析可以知道影响各省份教育人力资源发展水平的主要因素，从而可以更好地帮助国家调整教育人力资源结构，更好地发展我国西部教育事业。

关键字：

analyst主成分分析教育人力资源发展MEANS过程

第一章基本介绍 3

1.1研究目的 3

1.2采用方法 3

1.3理论知识 3

第二章数据预处理 4

第三章具体模型 4

3.1建立数据集 4

3.2具体模型（程序） 4

运行结果及分析 5

4.1使用“分析家”做主成分分析的步骤 5

4.2主成分的结果分析 8

参考文献 12

附录 13

第一章基本介绍

1.1研究目的

通过SAS软件分析，对1999年我国西部地区教育人力资源发展水平有一个大致了解。

随着国家教育方针的调整，西部各地区为了促进本地区的教育发展，分别采取了各种措施，教育方面的发展有了显著地成就。

本文通过SAS软件分析，对1999年我国西部地区教育人力资源发展水平有一个大致了解，从而可以更好地帮助国家调整（优化）教育人力资源结构，使人民的受教育水平更加优越。

1.2采用方法

（1）描述性统计量：

means。

（2）检验：

使用analyst模块进行主成分分析。

1.3理论知识

Means过程（均值过程）：

用于对数据型变量产生针对单个变量的简单描述性统计。

procmeans过程时，会对所有数值型变量进行操作，得到各变量的非缺失观测数N，均值MEAN，标准差STDDEV，最大值Max和最小值Min五种统计值，但means过程可以计算16种统计量。

主成分分析：

是对于原先提出的所有变量，建立尽可能少的新变量，使得这些新变量是两两不相关的，而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

主成分分析是数学上对数据降维的一种方法。

其基本思想是设法将原来众多的具有一定相关性的指标（比如p个指标），重新组合成一组新的互不相关的综合指标来代替原来指标。

通常数学上的处理就是将原来p个指标作线性组合，作为新的综合指标。

在所有的线性组合中所选取的F1应该是方差最大的，故称F1为第一主成分。

如果第一主成分不足以代表原来p个指标的信息，再考虑选取F2即选第二个线性组合。

为了有效地反映原有信息，F1已有的信息就不需要再出现在F2中，用数学语言表达就是要求Cov（F1，F2）＝0。

称F2为第二主成分，依此类推可以构造出第三、第四、…、第p个主成分。

第二章数据预处理

对数据较少的程序，可以用DATA步建立永久的SAS集。

永久的SAS集，由定义逻辑库与定义数据集两步完成。

逻辑库定义通过LIBNAME语句完成，数据集定义用DATA语句实现。

指定逻辑库的命令语句为全程语句，其格式如下：

LIBNAME<

逻辑库名>

路径>

；

指定要建立数据集的命令语句格式如下：

DATA<

数据集名>

LIBNAME语句把磁盘中的子目录与用户定义的逻辑库名连接起来。

用此方法根据已知的数据就可以建立生成以下的数据集。

第三章具体模型

3.1建立数据集

2012年11月19日星期一下午12时19分55秒5

ObsregionA1A2A3A4A5A6A7A8A9A10

1海南0.66496419112.047190.33291410.160

2广西0.62416919234.040180.33311310.450

3山西0.726111819360.074300.33409210.170

4内蒙古0.80467721153.071320.3626177.430

5四川0.7566112314164.077320.39419910.100

6重庆0.504177211120.053210.37419210.100

7贵州0.54286715221.035160.3328238.950

8云南0.57386617649.044200.3830798361

9西藏1.5642651573.968300.1410055.100

10陕西1.19100188496398.0140550.3641739.900

11甘肃0.715590246113.065270.3134809.230

12青海1.18496818317.068340.2015585.320

13宁夏0.92498324225.073330.3326247.520

14新疆0.966611030551.096420.3031807.230

3.2具体模型（程序）

Datawork.data1;

inputregion$1-10A1A2A3A4A5A6A7A8A9A10;

cards;

海南0.6649641911247190.33291410.16

广西0.6241691923440180.33311310.45

山西0.72611181936074300.33409210.17

内蒙古0.846772115371320.3626177.43

四川0.756611231416477320.39419910.1

重庆0.5417721112053210.37419210.1

贵州0.5428671522135160.3328238.95

云南0.5738661764944200.3830798361

西藏1.5642651573.968300.1410055.1

陕西1.19100188496398140550.3641739.9

甘肃0.71559024611365270.3134809.23

青海1.1849681831768340.215585.32

宁夏0.9249832422573330.3326247.52

新疆0.96661103055196420.331807.23

;

run;

procprint;

第四章运行结果及分析

4.1使用“分析家”做主成分分析的步骤

1）在“分析家”中打开数据集work.data1；

2）选择菜单“Statistics（统计）”®

“Multivariate（多元分析）”®

“PrincipalComponen

展开阅读全文