ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:693.43KB ,
资源ID:2396345      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2396345.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(实例说明利用Excel进行主成分分析分解.docx)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

实例说明利用Excel进行主成分分析分解.docx

1、实例说明利用Excel进行主成分分析分解 方法: 1 利用 Excel2000 进行主成分分析 第一步,录入数据,并对进行标准化。 【例】一组古生物腕足动物贝壳标本的两个变量:长度和宽度。 原始数据和标准化数据及其均值、方差1 图 )(取自张超、杨秉庚计量地理学基础 计算的详细过程如下: 将原始数据绘成散点图(图 2)。主持分分析原则上要求数据具有线性相关趋势 如果数据之间不相关(即正交),则没有必要进行主成分分析,因为主成分分析的目的 就是用正交的变量代替原来非正交的变量;如果原始数据之间为非线性关系,则有必要对 1 可见,原始数据具有线性相关趋势,且测定系 2 数据进行线性转换,否则效果不

2、佳。从图 2。 RR=0.7056=0.4979,相应地,相关系数数 。标准化的数学公式为 对数据进行标准化 xx? jij *?x ij? j 这里假定按列标准化,式中 nn1 2? ?,)Var(x?x?x)x(x? ? ijj ijijijij n 1 i?1 i? 个变量)、第列(即第分别为第列数据的均值和标准差,为第行(即第个样本)xjijji ij *为样本数目。的标准化数据,的数据,为相应于25nx?x ijij 2.3174 =0.7686x + 原始数据的散点图y 2 0.4979 R= 25 20 15 度 宽10 5 0 2520 长度 15 100 5 原始数据的散点图

3、 图2 标准化数据的散点图 y = 0.7056x + 2E-16 2 = R0.4979 3.000000 2.000000 1.000000 度 宽 0.000000 1.000000 2.000000 0.-1.00000 3.000000-2.00000 -1.000000 000 -2.000000 长度 标准化数据的散点图3 图 2 对数据标准化的具体步骤如下: 求出各列数据的均值,命令为 average,语法为: average(起始单元格:终止单元格)。如图 1 所示,在单元格 B27 中输入 “”,确定或回车,即得第一列数据的均值;然后抓住单10.88x?B26)VERAGE

4、(B1:=A 1,便可自动生成第二列数据的均值 C27 的右下角(光标的十字变细)右拖至元格 B27 。10.68?x 2中输入 所示,在单元格 B28varp,语法同均值。如图 1 求各列数据的方差。命令为 ,右拖至”,确定或回车,可得第一列数据的方差“19.4656)?Var(xARP(B2:B26)=V 1。生成第二列数据的方差23.0976)?Var(xC28 2直接生成标准stdevp 求各列数据的标准差。将方差开方便得标准差。也可利用命令 差,语法和操作方法同均值、方差,不赘述。 ”,回车可得中输入“=(B2-$B$27)/$B$29 所示,在单元格 D2 标准化计算。如图 1 的

5、右下角下拖至D2 ”的标准化数值-1.786045,然后按住单元格 第一列第一个数据“3 ,就能E2D2 的右下角右拖至 D26,便会生成第一列数据的全部标准化数值;按照单元格 的右下角下拖至 -1.806077,抓住单元格 E2生成第二列第一个数据“2”的标准化数据 便会生成第二列数据的全部标准化数值。 E26 。可以看出,点列的总体趋势没有变换,两种数据)图 3 作标准化数据的散点图( ,斜率等于的相关系数与标准化以前完全相同。但回归模型的截距近似为,即有0? a 0 。相关系数,即有R b ? 。求相关系数矩阵的方法是:沿着“工具求标准化数据的相关系数矩阵或协方差矩阵 ,确定,弹)”选项

6、框(图 4)”(T“数据分析(D)”的路径打开“分析工具(A ,在“输入区域”的空白栏中输入标准化数据范围,并以5出“相关系数”对话框(图 ) 为输出区域,具体操作方法类似于回归分析。确定,即会在输出区域给出相关单元格 G1 分析工具选项框图 4 3 相关系数对话框 图 5系数矩阵的下三角即对角线部分,由于系对称矩阵,上三角的数值与下三角相等,故未给 出(图 6),可以通过“拷贝转置粘帖”的方式补充空白部分。 标准化数据的相关系数和协方差6图 求协方差的方法是在“分析工具”选项框中选择“协方差”(图 7),弹出“协方差” 选项框(图 8),具体设置与“相关系数”类似,不赘述。结果见图 6,可以

7、看出,对于 标准化数据而言,协方差矩阵与相关系数矩阵完全一样。因此,二者任取其一即可。 在分析工具选项框中选择“协方差” 7图 4 协方差选项框8 图 计算特征根。我们已经得到相关系数矩阵为 ?10.7056? C?,? ? 0.70561? ? 而二阶单位矩阵为 ?10? I? ?, ? 01? ? ?,我们有于是根据公式0? C)det( I ? ?0.705611 00.7056 ?1 ? ? 0 ?0.7056 0.70561?0 1 ? 1 按照行列式化为代数式的规则可得 222? 0 ? ?0.5021 ? 2? ( ? 1)? 0.7056 2时,我们有根据一元二次方程的求根公式

8、,当04ac ? b ? 2ac ? 4? b ? b ? ? a2 。这便是,据此解得(对于本例,显然,)R0.2944?1?R?1.70561? 2121相关系数矩阵的两个特征根。 求标准正交向量。将代入矩阵方程,得到0?C)?(I? 100.7056?0.7056? ? ? ?1 ?0 0.70560.7056? ? ? ? 2? 中,用第一行加第二行,化为在系数矩阵C? I 0.7056?0.70560? ? ?1 ? 0? 00? ? ? 2由此得,令,则有,于是得基础解系1?1? 2 1 2 1 ?10.7071 ,单位化为?e? ? ? 11 ? 0.70711? 5 ? i (

9、)。1,2 i ? 单位化的公式为?e 2i ? 2 12 完全类似,将代入矩阵方程,得到0?C)?(I? 20?0.7056?0.7056? ? ? ?1 ?0 0.7056? 0.7056 ? ? ? 2用系数矩阵的第二行减去第一行,化为 0?0.7056?0.7056? ? ? ?1 ? 0? 00? ? 2于是得到,取,则有,因此得基础解系为1?1? 2 1 21,单位化为e? 0.7071 ? 1 ? ? ?2 2?0.7071 ? ?1? ? 这里、便是标准正交向量。ee 21 求对角阵。首先建立标准正交矩阵 P,即有 0.7071?0.7071 e? ?eP? 2 ? 1?0.7

10、071?0.7071 ? T1T?,可逆。根据,即矩阵的该矩阵的一个特殊性质便是转置等于矩阵的CP? P D P ? P 知 ?D?1.7056?0? 0.7056?0.7071 0.7071 ? ? ? ?0.70560.70710.7071? 0.29340 0.7071? 10.7071 0 ? ? .70710.707 1 ?1 下面说明一下利用 Excel 进行矩阵乘法运算的方法。矩阵乘法的命令为 mmult,语法是 T矩阵的单元格范围,矩阵的单元格范围。例如,用矩阵与矩阵相乘,P C 21 mmult( ) 首先选择一个输出区域如 G1:H2,然后输入“=mmult(A1:B2,C

11、1:D2)”,然后按下 “Ctrl+Shift+Enter”键(图 9),即可给出 1.206044 1.206044 0.20817 -0.20817 再用乘得的结果与 P 阵相乘,便得对角矩阵 1.7056030 0.2943970 如果希望一步到位也不难,选定输出区域如 C3:D4,然后输入 “=mmult(mmult(A1:B2,C1:D2),E1:F2)” (图 10),同时按下“Ctrl+Shift+Enter”键,立 即得到结果(图 11)。显然,对角矩阵对角线的数值恰是相关系数矩阵的特征值。 矩阵乘法示例 图 9 6 矩阵连乘的命令与语法10 图 至此,标准化的原始变量 x 与

12、主成分之间 z 之间可以表作 ?x0z0.7056?1? ?1.7056 ? ? z? xz?11?x ?1 22 x 10.2944z0.705601 ? ? ? 22 显然与之间正交。zz 21 乘法结果:对角矩阵 11图 根据特征根计算累计方差贡献率。现已求得第一特征根为,第二特征根为1.7056? 1,二者之和刚好就是矩阵的维数,即有,这里为变量数2?m?0.2944?=2m? 221目(注意前面的 n=25 为样本数目)。比较图 6 或图 10 中给出的相关系数矩阵 C 与图 11 中给出的对角矩阵 D 可以看出,Tr.(C)=1+1=2,Tr.(D)=1.7056+0.2944=2,即有 Tr.(C)= Tr.(D),可见将相关系数亦即协方差矩阵转换为对角矩阵以后,矩阵的迹(trace,即对角 线元素之和)没有改变,这意味着将原始变量化为主成分以后,系统的信息量没有减少。 现在问题是,如果我们只取一个主成分代表原来的两个变量,能反映原始变量的多少信息? 这个问题可以借助相关系数矩阵的特征根来判断。利用 Excel 容易算出,第一特征根占特 征根总和即矩阵维数的 85.28%(见下表),即有 特征根累计值百分比累计百分比 1.705603 1.70560385.28%85.28% 7 100.00%0.294397214.72% 也就是说: ,:85.28%/2?/

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1