ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:211.56KB ,
资源ID:5705327      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5705327.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(9利用Matlab和SPSS实现主成分分析.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

9利用Matlab和SPSS实现主成分分析.docx

1、9利用Matlab和SPSS实现主成分分析9. 利用Matlab和SPSS实现主成分分析1.直接调用Matlab软件实现在软件Matlab中实现主成分分析可以采取两种方式实现:一是通过编程来实现;二是直接调用Matlab中自带程序实现。通过直接调用Matlab中的程序可以实现主成分分析:式中:X为输入数据矩阵 (一般要求nm)输出变量:pc 主分量fi的系数,也叫因子系数;注意:pcTpc=单位阵score是主分量下的得分值;得分矩阵与数据矩阵X的阶数是一致的;variance是score对应列的方差向量,即A的特征值;容易计算方差所占的百分比 percent-v = 100*variance

2、/sum(variance);t2表示检验的t2-统计量(方差分析要用)计算过程中应用到计算模型: (要求pm)例:表1为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法可以用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。表1 某农业生态经济系统各区域单元的有关数据样本序号x1:人口密度(人/km2)x 2:人均耕地面积(ha)x 3:森林覆盖率(%)x 4:农民人均纯收入(元/人)x 5:人均粮食产量 (kg/人)x 6:经济作物占农作物播面比例()x 7:耕地占土地面积比率()x 8:果园与林地面积之比()x 9:灌溉田占耕地面积之比()1363.9120.35

3、216.101192.11295.3426.72418.4922.23126.2622141.5031.68424.3011 752.35452.2632.31414.4641.45527.0663100.6951.06765.6011 181.54270.1218.2660.1627.47412.4894143.7391.33633.2051 436.12354.2617.48611.8051.89217.5345131.4121.62316.6071 405.09586.5940.68314.4010.30322.932668.3372.03276.2041 540.29216.398.1

4、284.0650.0114.861795.4160.80171.106926.35291.528.1354.0630.0124.862862.9011.65273.3071 501.24225.2518.3522.6450.0343.201986.6240.84168.904897.36196.3716.8615.1760.0556.1671091.3940.81266.502911.24226.5118.2795.6430.0764.4771176.9120.85850.302103.52217.0919.7934.8810.0016.1651251.2741.04164.609968.33

5、181.384.0054.0660.0155.4021368.8310.83662.804957.14194.049.1104.4840.0025.7901477.3010.62360.102824.37188.0919.4095.7215.0558.4131576.9481.02268.0011 255.42211.5511.1023.1330.0103.4251699.2650.65460.7021 251.03220.914.3834.6150.0115.59317118.5050.66163.3041 246.47242.1610.7066.0530.1548.70118141.473

6、0.73754.206814.21193.4611.4196.4420.01212.94519137.7610.59855.9011 124.05228.449.5217.8810.06912.65420117.6121.24554.503805.67175.2318.1065.7890.0488.46121122.7810.73149.1021 313.11236.2926.7247.1620.09210.078对于上述例子,Matlab进行主成分分析,可以得到如下结果。1 以及每一个主成分的贡献率和累计贡献率,如表2和图1。表2. 特征根及主成分贡献率 主成分 特征值 贡献率 累积贡献率

7、14.66151.79151.791 22.08923.21675.007 31.04311.58986.596 40.5075.63892.234 50.3153.50295.736 60.1932.14097.876 70.1141.27199.147 84.533E-020.50499.650 93.147E-020.350100.000 图1 特征根2 前3几个主成分的载荷系数如表3所示。表3 前三个主成分在原变量上的载荷 前三个主成分 变量123 X10.158-0.255-0.059 X20.0260.424-0.027 X3-0.2070.0460.091 X40.0090.41

8、50.036 X50.1740.212-0.011 X60.1760.0860.120 X70.200-0.064-0.241 X80.042-0.0480.930 X90.207-0.0120.088 2. 直接调用SPSS软件实现多元分析处理的是多指标的问题。由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又让人陷入混乱不清。由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。调用D

9、ata Reduction菜单的Factor过程命令项,可对多指标或多因素资料进行因子分析。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量,这与上一章的聚类分析不同),以较少的几个因子反映原资料的大部分信息。基本操作以以上例子来说明在SPSS中进行因子分析的整个过程。将以上数据导入到数据窗口中,先定义各变量为numberic型。激活Analysis菜单选Data Reduction的Factor.命令项,弹出Factor Analysis对话框(图1)

10、。在对话框左侧的变量列表中选变量X1至X9,点击钮使之进入Variables框。图 1 因子分析对话框点击Descriptives.钮,弹出Factor Analysis:Descriptives对话框(图2),在Statistics中选Univariate descriptives项要求输出各变量的均数与标准差,在Correlation Matrix栏内选Coefficients项要求计算相关系数矩阵,并选KMO and Bartletts test of sphericity项,要求对相关系数矩阵进行统计学检验。点击Continue钮返回Factor Analysis对话框。图2 描述性指

11、标选择对话框点击Extraction.钮,弹出Factor Analysis:Extraction对话框(图3),系统提供如下因子提取方法:图3 因子提取方法选择对话框Principal components:主成分分析法; Unweighted least squares:未加权最小平方法; Generalized least squares:综合最小平方法; Maximum likelihood:极大似然估计法; Principal axis factoring:主轴因子法; Alpha factoring:因子法; Image factoring:多元回归法。本例选用Principal

12、components方法,之后点击Continue钮返回Factor Analysis对话框。点击Rotation.钮,弹出Factor Analysis:Rotation对话框,系统有5种因子旋转方法可选:None:不作因子旋转; Varimax:正交旋转; Equamax:全体旋转,对变量和因子均作旋转; Quartimax:四分旋转,对变量作旋转; Direct Oblimin:斜交旋转。 旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击Continue钮返回Factor Analysis对话框。点击Scores.钮,弹出弹出Factor Analysis:S

13、cores对话框,系统提供3种估计因子得分系数的方法,本例选Regression(回归因子得分),之后点击Continue钮返回Factor Analysis对话框,再点击OK钮即完成分析。结果解释在输出结果窗口中将看到如下统计数据:系统首先输出各变量的均数(Mean)与标准差(Std Dev),并显示共有21例观察单位进入分析;接着输出相关系数矩阵(Correlation Matrix),经Bartlett检验表明:Bartlett值 = 159.767,P0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。Correlation Matrix人口密度人均耕地面积森林覆盖率农民人均

14、纯收入人均粮食产量经济作物占农作物播面比例耕地占土地面积比率果园与林地面积之比灌溉田占耕地面积之比人口密度1.000-.327-.714-.336.309.408.790.156.744人均耕地面积-.3271.000-.035.644.420.255.009-.078.094森林覆盖率-.714-.0351.000.070-.740-.755-.930-.109-.924农民人均纯收入-.336.644.0701.000.383.069-.046-.031.073人均粮食产量.309.420-.740.3831.000.734.672.098.747经济作物占农作物播面比例.408.255-

15、.755.069.7341.000.658.222.707耕地占土地面积比率.790.009-.930-.046.672.6581.000-.030.890果园与林地面积之比.156-.078-.109-.031.098.222-.0301.000.290灌溉田占耕地面积之比.744.094-.924.073.747.707.890.2901.000使用主成分分析法得到3个因子,因子矩阵(Factor Matrix)如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量X3与第一因子的值为-0.964,与第二因子的值为0.009 56,可见其与第一因子更近,与第二因子更远

16、。或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %14.66151.79051.7904.66151.79051.7904.60551.17251.17222.

17、08923.21775.0072.08923.21775.0072.10023.32974.50031.04311.58986.5961.04311.58986.5961.08912.09586.5964.5075.63892.2345.3153.50295.7366.1932.14097.8767.1141.27199.14784.533E-02.50499.65093.147E-02.350100.000Extraction Method: Principal Component Analysis.下面显示经正交旋转后的因子负荷矩阵(Rotated Factor Matrix)和因子转换矩

18、阵(Factor Transformation Matrix)。旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X3、X7、 X9作用,第二因子替代了X2、X4的作用,第三因子替代了X8的作用。最后将第一因子的因子分用变量名fac1_1、第二因子的因子分用变量名fac2_1、第三因子的因子分用变量名fac3_1存入原始数据库中。这些值既可用于模型诊断,又可用于进一步分析。序号fac1_1fac2_1fac3_112.440 59-2.529 70.224 8821.831 841.708 320.208 63-0.603 610.343.570 440.929 870.696 270.

19、239 4952.194 161.713 31-0.316 456-0.867 591.546 92-0.489 557-0.584 2-0.229 85-0.426 518-0.780 141.300 71-0.259 399-0.496 36-0.322 59-0.321 6510-0.404 01-0.283 93-0.346 7711-0.186 05-1.037 07-0.391 3912-0.861 94-0.088 65-0.501 5913-0.652 98-0.291 51-0.443 0914-0.448 42-0.615 782.114 8715-0.779 510.252 68-0.371 0116-0.593 5-0.281 71-0.507 7317-0.277 47-0.248 32-0.369 7618-0.007 8-0.825 86-0.452 26190.033 39-0.588 2-0.491 120-0.146 61-0.208 95-0.412 45210.260 35-0.006 1-0.257 52

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1