1、SAS论文 统计分析与应用 sas统计分析SAS统计分析与应用学号:xxxxxxxx班级:xxx姓名:xxx第一早第早:摘要,”,”,”2.1 研究目的”,”2.2采用方法,2.3理论知识.,第三章第四章第五早第六章第七章数据预处理及具体模型,3.1建立的数据集3.2主要程序.,,计算结果及分析,4.1使用INSIGHT模块做主成分分析的步骤,,4.2主成分的结果分析总结分析”,,”,参考文献,附录,SAS系统是世界公认的权威性统计软件之一,是一个大型集成信息分析管理系统。本次论文是用SAS系统对2007各地区农村居民家庭平均每人现金现金支出状况进行分析采用 的数据是北京、天津等省农村居民家庭
2、平均每人现金现金支出状(原始数据见附录) 。选出31省的情况作为统计分析数据,其中分析的项目为:期内现金支出、生产费用支出、家 庭经营费用支出、农业生产支出、牧业生产支出、购买生产性固定资产支出、税费支出、生活消费 现金支出、财产性支出、转移性支出,次用变量 XI、X2、X3、X4、X5、X6、X7、X8、X9、X10。运用SAS软件,运用主成分分析的方法对数据进行处理:(一)对于所选取的统计数据用 MEANS过程进行简单描述统计分析,得出数据平均值、数据标准(二)对于所选取的统计数据用 INSIGHT模块做主成分分析计算协方差矩阵的特征值或是计算相 关系数矩阵的特征值(Eigenvalue
3、)、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相 关系数矩阵的特征向量。系统默认计算相关系数矩阵的特征值和特征向量。(三)由相关系数矩阵的两个最大特征值的特征向量,可以写出第一、第二主成分以及第三主成分 的得分。从以上结论分析可以知道影响各地区地区农村居民家庭平均每人现金支出的主要因素, 从、可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。关键字:主成分分析、简单统计量、相关系数矩阵、相关系数矩阵的特征值及特征向量。、基本介绍1、 研究目的:通过SAS软件的分析,对各地区农村居民家庭平均每人现金支出的主要影响因素 有一个大致的了解;有利于国家的宏观调控,从而可以促进全民
4、经济更好的发展。2、 采用方法:1描述统计量:MEANS2检验:使用INSIGHT模块主成分分析。3、 理论知识:1MEANS过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计 .proc means过程统计量参数缺省时输出 N (样本数据)、Mean (数据平均值)、Std Dev (数据标准差)、Minimum(最小值)、Maximum (最大值)五种统计值,但 means过程可计算16种统计量。2主成份分析(Principal Components Analysis)是研究如何将多个变量指标间的问 题化为较少的几个新指标问题。这些新的指标是彼此既互不相关,又能综合反映 原来
5、多个指标的信息,是原来多个指标的线性组合。多指标的主成份分析常被用 来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。主分量分析还可用于 揭示变量间的共线性。三、数据预处理及具体模型:对于数据较少的程序可以用 DATA步创建永久 SAS数据集。永久SAS数据集,由定义逻辑库与定义数据集两个步骤完成。逻辑库定义通过LIBNAME 语句完成,数据集定义应用 DATA实现。LIBNAME 语句语法格式:LIBNAME 逻辑库名称,子目录路径;DATA 语
6、句语法格式:DATA逻辑库名数据集名称;LIBNAME 语句把磁盘中的子目录与用户定义的逻辑库名连接起来。用此种方法根据已知的数据就可以建立生成以下的数据集3.1建成的数据集为:The SAS System20: 00 Tuesday, December 15, 2009Obsareax1x2x3x4x5x6x7x8x9x101北京5318.9730.2606.4124.2232.5123.71.94093.223.5470.22天津3267.81242.81172.9203.3699.569.91.21896.16.0121.63河北2289.6779.6725.0362.7226.254.
7、63.11361.714.9130.34山西2080.9500.0441.3254.4126.358.70.71431.24.0145.15内家古3338.71426.91223.5865.7316.6203.31.71617.352.2240.66辽宁3926.21671.21546.2719.9754.5125.03.81803.738.7408.97吉林4517.72129.91836.91404.1393.3293.15.11741.0202.9438.78黑龙江4424.62047.01812.21405.0368.8234.82.91699.1301.8373.99上海5487.1
8、241.3229.937.332.611.40.14616.71.4627.610江苏3412.9632.1561.8236.1137.570.312.8 2438.95.5323.711浙江5437.21320.21192.4159.4724.4127.85.53587.723.7500.112安徽2390.0554.9490.7297.2116.764.26.01666.23.0159.913福建3026.0626.4566.8251.0208.159.60.72168.210.8219.814江西2199.8680.6591.7339.7160.489.04.51328.023.5163
9、.215山东3060.9969.5842.4423.3314.6127.15.71885.716.7183.316河南2163.8583.9523.9237.1228.860.00.61448.61.4129.317湖北2222.2677.5601.9266.8195.975.63.91471.34.664.818湖南2418.9555.8497.8196.7175.258.03.81587.92.8268.519广东2895.2576.3547.4171.3216.329.01.72155.69.5152.020广西1900.9697.4589.5348.5187.6107.92.91125
10、.61.673.621海南1902.8656.1639.2324.3165.416.90.31187.22.157.122重庆1773.4449.1406.3188.7172.842.82.51107.30.9213.523四川2514.5612.8533.5178.0270.779.36.11669.57.0219.124贵州1432.8412.5324.7167.7122.287.71.4846.31.0171.625云南1837.1623.0532.9277.2185.690.11.51089.96.8115.926西藏1022.3203.992.353.28.8111.50.2800.
11、70.117.527陕西2261.3580.1442.6240.6128.4137.53.91496.84.6175.928甘肃1622.3473.2391.2298.374.482.00.91068.24.375.729青海1753.8447.9348.0190.192.599.81.71196.57.4100.330宁夏2592.81029.8870.5406.2359.3159.30.21325.631.3205.831新疆2705.01444.41109.7813.2236.6334.71.01126.044.489.23.2、模型的具体程序:data datal;in put are
12、a $ 1-6 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 ;cards;1北京5318.9730.2606.4124.2232.5123.71.94093.223.5470.22天津3267.81242.81172.9203.3699.569.91.21896.16.0121.63河北2289.6779.6725.0362.7226.254.63.11361.714.9130.34山西2080.9500.0441.3254.4126.358.70.71431.24.0145.15内家古3338.71426.91223.5865.7316.6203.31.71617.352.2240.66辽3926.21671.21546.2719.9754.5125.03.81803.738.7408.97吉林4517.72129.91836.91404.1393.3293.15.11741.0202.9438.78黑龙江4424.62047.01812.21405.0368.8234.82.91699
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1