9利用Matlab和SPSS实现主成分分析Word格式.docx
《9利用Matlab和SPSS实现主成分分析Word格式.docx》由会员分享,可在线阅读,更多相关《9利用Matlab和SPSS实现主成分分析Word格式.docx(12页珍藏版)》请在冰豆网上搜索。
)
输出变量:
①主分量的系数,也叫因子系数;
注意:
单位阵
②是主分量下的得分值;
得分矩阵与数据矩阵的阶数是一致的;
③是对应列的方差向量,即的特征值;
容易计算方差所占的百分比
*();
④表示检验的统计量(方差分析要用)
计算过程中应用到计算模型:
(要求<
例:
表为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法可以用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。
表某农业生态经济系统各区域单元的有关数据
样本序号
:
人口密度(人)
:
人均耕地面积()
森林覆盖率()
农民人均纯收入(元人)
人均粮食产量(人)
经济作物占农作物播面比例(%)
耕地占土地面积比率(%)
果园与林地面积之比(%)
灌溉田占耕地面积之比(%)
对于上述例子,进行主成分分析,可以得到如下结果。
1以及每一个主成分的贡献率和累计贡献率,如表和图。
表.特征根及主成分贡献率
主成分
特征值
贡献率%
累积贡献率%
图特征根
2前几个主成分的载荷系数如表所示。
表前三个主成分在原变量上的载荷
前三个主成分
变量
.直接调用软件实现
多元分析处理的是多指标的问题。
由于指标太多,使得分析的复杂性增加。
观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又让人陷入混乱不清。
由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。
调用菜单的过程命令项,可对多指标或多因素资料进行因子分析。
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量,这与上一章的聚类分析不同),以较少的几个因子反映原资料的大部分信息。
基本操作
以以上例子来说明在中进行因子分析的整个过程。
将以上数据导入到数据窗口中,先定义各变量为型。
①激活菜单选的...命令项,弹出对话框(图)。
在对话框左侧的变量列表中选变量至,点击Ø
钮使之进入框。
图因子分析对话框
点击...钮,弹出对话框(图),在中选项要求输出各变量的均数与标准差,在栏内选项要求计算相关系数矩阵,并选’项,要求对相关系数矩阵进行统计学检验。
点击钮返回对话框。
图描述性指标选择对话框
点击...钮,弹出对话框(图),系统提供如下因子提取方法:
图因子提取方法选择对话框
主成分分析法;
未加权最小平方法;
综合最小平方法;
极大似然估计法;
主轴因子法;
α因子法;
多元回归法。
本例选用方法,之后点击钮返回对话框。
点击...钮,弹出对话框,系统有种因子旋转方法可选:
不作因子旋转;
正交旋转;
全体旋转,对变量和因子均作旋转;
四分旋转,对变量作旋转;
斜交旋转。
旋转的目的是为了获得简单结构,以帮助我们解释因子。
本例选正交旋转法,之后点击钮返回对话框。
点击...钮,弹出弹出对话框,系统提供种估计因子得分系数的方法,本例选(回归因子得分),之后点击钮返回对话框,再点击钮即完成分析。
结果解释
在输出结果窗口中将看到如下统计数据:
系统首先输出各变量的均数()与标准差(),并显示共有例观察单位进入分析;
接着输出相关系数矩阵(),经检验表明:
值,<
,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。
人口密度
人均耕地面积
森林覆盖率
农民人均纯收入
人均粮食产量
经济作物占农作物播面比例
耕地占土地面积比率
果园与林地面积之比
灌溉田占耕地面积之比
使用主成分分析法得到个因子,因子矩阵()如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。
如本例变量与第一因子的值为,与第二因子的值为,可见其与第一因子更近,与第二因子更远。
或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。
:
.
下面显示经正交旋转后的因子负荷矩阵()和因子转换矩阵()。
旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了、、、作用,第二因子替代了、的作用,第三因子替代了的作用。
最后将第一因子的因子分用变量名、第二因子的因子分用变量名、第三因子的因子分用变量名存入原始数据库中。
这些值既可用于模型诊断,又可用于进一步分析。
序号