ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:156.59KB ,
资源ID:10434317      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10434317.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(实例说明利用Excel进行主成分分析.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

实例说明利用Excel进行主成分分析.docx

1、实例说明利用Excel进行主成分分析方法:1利用Excel2000进行主成分分析第一步,录入数据,并对进行标准化。【例】一组古生物腕足动物贝壳标本的两个变量:长度和宽度。图1原始数据和标准化数据及其均值、方差(取自张超、杨秉庚计量地理学基础)计算的详细过程如下:将原始数据绘成散点图 (图2 )。主持分分析原则上要求数据具有线性相关趋势一 如果数据之间不相关(即正交),则没有必要进行主成分分析,因为主成分分析的目的 就是用正交的变量代替原来非正交的变量;如果原始数据之间为非线性关系,则有必要对 数据进行线性转换,否则效果不佳。从 图2可见,原始数据具有线性相关趋势,且测定系数氏=,相应地,相关系

2、数 R=。对数据进行标准化。标准化的数学公式为* Xij Xjj这里假定按列标准化,式中_ 1 n : n _ 2 , Xj xij , ij . (xij Xj) . Var(xij)分别为第j列数据的均值和标准差,nii V i ixij为第i行(即第i个样本)、第j列(即第j个变量)的数据,xij为相应于xij的标准化数据,n 25为样本数目原始数据的散点图 y = 0.7686X + 2.3174R2 = 0.4979图2原始数据的散点图标准化数据的散点图 y = 0.7056X + 2E-16图3标准化数据的散点图对数据标准化的具体步骤如下: 求出各列数据的均值,命令为 averag

3、e,语法为:average(起始单元格:终止单元格)。如图1所示,在单元格B27中输入“ =AVERAGE(B1B26)”,确定或回车,即得第一列数据的均值 X1 10.88 ;然后抓住单元格B27的右下角(光标的十字变细)右拖至 C27,便可自动生成第二列数据的均值x2 10.682求各列数据的方差。命令为 varp,语法同均值。如图1所示,在单元格 B28中输入“ =VARP(B2:B26)”,确定或回车,可得第一列数据的方差 Var(x1) 19.4656,右拖至C28生成第二列数据的方差 Var(x2) 23.0976。3求各列数据的标准差。将方差开方便得标准差。也可利用命令 stde

4、vp直接生成标准差,语法和操作方法同均值、方差,不赘述。4标准化计算。如图1所示,在单元格 D2中输入“ =(B2-$B$27)/$B$29 ”,回车可得第一列第一个数据“ 3 ”的标准化数值,然后按住单元格 D2的右下角下拖至 D26,便会生成第一列数据的全部标准化数值;按照单元格 D2的右下角右拖至 E2,就能生成第二列第一个数据“ 2”的标准化数据,抓住单元格 E2的右下角下拖至E26便会生成第二列数据的全部标准化数值。5作标准化数据的散点图(图3)。可以看出,点列的总体趋势没有变换,两种数据的相关系数与标准化以前完全相同。但回归模型的截距近似为 0,即有a 0,斜率等于相关系数,即有b

5、 R。求标准化数据的相关系数矩阵或协方差矩阵 。求相关系数矩阵的方法是:沿着“工具(T)”- “数据分析(P)”的路径打开“分析工具(A)”选项框(图4),确定,弹出“相关系数”对话框(图5),在“输入区域”的空白栏中输入标准化数据范围,并以单元格G1为输出区域,具体操作方法类似于回归分析。确定,即会在输出区域给出相关图4分析工具选项框图5相关系数对话框系数矩阵的下三角即对角线部分,由于系对称矩阵,上三角的数值与下三角相等,故未给出(图6),可以通过“拷贝一一转置一一粘帖”的方式补充空白部分。图6标准化数据的相关系数和协方差求协方差的方法是在“分析工具”选项框中选择“协方差”( 图7),弹出“

6、协方差”选项框(图8),具体设置与“相关系数”类似,不赘述。结果见 图6,可以看出, 对于标准化数据而言,协方差矩阵与相关系数矩阵完全一样。因此,二者任取其一即可。图7在分析工具选项框中选择“协方差”图8协方差选项框计算特征根。我们已经得到相关系数矩阵为C 0.70560.70561而二阶单位矩阵为1010.705610.7056010.705610.705610,我们有按照行列式化为代数式的规则可得相关系数矩阵的两个特征根。0.70560.7056 在系数矩阵I C中,用第一行加第二行,化为0.705600.705601 02 0由此得1 2,令11,则有21,于是得基础解系10.70711

7、 ,单位化为ei10.7071单位化的公式为ei .i ( i1,2 )。i 厂2 2.12完全类似,将 2,弋入矩阵方程(I C)0,得到0.70560.70561 00.70560.70562 0用系数矩阵的第二行减去第-行,化为0.70560.70561 0002 0于是得到1 2,取1 1,则有2 1,因此得基础解系为10.70712 ,单位化为6210.7071求对角阵。首先建立标准正交矩阵可知这里ei、e2便是标准正交向量。是mmult (矩阵1的单元格范围,矩阵 2的单元格范围)。例如,用矩阵PT与矩阵C相乘,首先选择一个输出区域如 G1:H2,然后输入“ =mmult(A1:B

8、2,C1:D2) ”,然后按下Ctrl+Shift+Enter ”键(图 9),即可给出再用乘得的结果与 P阵相乘,便得对角矩阵如果希望一步到位也不难,选定输出区域如C3:D4 ,然后输入“ =mmult(mmult(A1:B2,C1:D2),E1:F2) ” (图 10),同时按下“ Ctrl+Shift+Enter ”键,立即得到结果(图11)。显然,对角矩阵对角线的数值恰是相关系数矩阵的特征值。SUN TAD EFG | H10. 7071070, 0710?; l.OOdOJO0.7C5603; 0. 707107J 70710720. 707107-0.707107 ! 0.7056

9、J3L000000)0. 707107 7071071图9矩阵乘法示例图10矩阵连乘的命令与语法至此,标准化的原始变量 X与主成分之间Z之间可以表作10.7056 为1.70560X1 x2Z1 Z2 小0.70561 x200.2944Z2显然Z1与Z2之间正交。图11乘法结果:对角矩阵1.7056,第二特征根为根据特征根计算累计方差贡献率。现已求得第一特征根为目(注意前面的n=25为样本数目)。比较 图6或图10中给出的相关系数矩阵 C与图11中给出的对角矩阵 D可以看出,Tr.(C)=1+1=2,Tr.(D)=+=2,即有Tr.(C)= Tr.(D),可见将相关系数亦即协方差矩阵转换为对

10、角矩阵以后,矩阵的 迹(trace,即对角线元素之 和)没有改变,这意味着将原始变量化为主成分以后,系统的信息量没有减少。现在问题是,如果我们只取一个主成分代表原来的两个变量,能反映原始变量的多少信息?这个问题可以借助相关系数矩阵的特征根来判断。利用Excel容易算出,第一特征根占特征根总和即矩阵维数的% (见下表),即有特征根 累计值百分比累计百分比%2%也就是说:1 : , 1 /m 1.7056/285.28%2: , 2/m0.2944/m14.72%1 2:2, ( 1 2)/m 2/2 100%这表明,如果仅取第一个主成分,可以反映原来数据 勺信息一一换言之,舍弃第二个主成分,原来

11、数据的信息仅仅损失 %但分析变量的自由度却减少一个,整个分析将会显得 更加简明。计算主成分载荷。根据公式 j , j ej,容易算出1 1.7056 0.7071 0.92350.7071 0.9235 0.7071 0.38372 02944 0.7071 0.3837计算公因子方差和方差贡献。根据上述计算结果可以比较公因子方差和方差贡献。再 考虑全部的两个主成分的时候,对应于 1和2的公因子方差分别为V1 ij2 0.92 352 0.38 372 1j2 2 2V2 ij 0.92352 ( 0.3837)2 1j对应于第一主成分 乙和第二主成分Z2的方差贡献分别为CV1 ij 0.92

12、352 0.92352 1.705622 CV2 ij 0.38372 ( 0.3837)2 0.2944i可以看出( 图 12): 第一,方差贡献等于对应主成分的特征根,即有CV j j第二,公因子方差相等或彼此接近,即有V1 V2第一,公因子方差之和等于方差贡献之和,即有Vi CVj m 2ij第一个规律是我们决定提取主成分数目的判据与之一,第二个规律是我们判断提取主成分数目是否合适的判据之一,第三个规律是我们判断提取主成分后是否损失信息的判据之一。去掉次要的主成分以后,上述规律理当仍然满足。这时如果第二个规律不满足,就意味着主成分的提取是不合适的。此外,上述规律也是我们检验计算结果是否正

13、确的判据之图 12 公因子方差、方差贡献的计算结果及其与特征根的贡献 计算主成分得分。根据主成分与原始变量的关系,应有Z PT X对于本例而言,式中X PZXx1z1 e11e120.70710.70711 , Zz1 , P e1 e2 e11x2z2 e21e220.70710.7071或者这里 e1Te11 e12e21 e22 T 为前面计算的标准化特征向量。于是有z1 0.7071 0.7071 x1z2 0.7071 0.7071 x2化为代数形式便是ZT X T P图13计算特征向量的公式及语法图14计算主成分得分根据这个式子,利用 Excel计算主成分得分的步骤如下:1将特征向

14、量复制到标准化数据的附近;2选中一个与标准化数据占据范围一样大小的数值区域(如 G2:H26);3输入如下计算公式“ =mmult(标准化数据的范围,特征向量的范围 )”,在本例中就是“ =MMULT(B2:C26,E2:F3) ” (图 13);4同时按下“ Ctrl+Shift+Enter ”键。5计算主成分得分的均值和方差,可以发现,均值为 0 (由于误差之故,约等于 0),方 差等于特征根。6最后,可以对主成分得分进行标准化。已知主成分得分的均值为 0,我们不按总体方差进行标准化,而按样本方差进行标准化。图15主成分得分的标准化结果样本方差的计算公式为相应地,标准差为Var(Xj)标准

15、化公式同前面给出的一样。结果见 表15。注意,这里之所以按样本方差进行标准化,主要目的是为了与 SPSS的计算结果进行比较。分别以Z1、Z2为坐标轴,将主成分得分(包括标准化的得分)点列标绘于坐标图中, 可以发现,点列分布没有任何趋势:回归结果表明,回归系数和相关系数均为零,即有a 0, b 0, R 0 (图16,图17)。这从几何图形上显示:主成分之间是正交的, 即有COS 0 (试将图16、图17与图2、图3对比)主成分得分的空间分布1.5000001.000000 4-分得分成主-3.00C* 0.500000y = -7E-17x - 2E-16 R2 = 2E-32+-1.0000

16、001.500000第一主成分得分图16主成分得分的相关系数为零1.5* 1*0.5i _y = -2E-16x - 4E-17R2 = 3E-32 * J*3 -2 -1 电0.5 (-1-1.5 I * 1 2 3主成分得分的空间分布(标准化)2.5第一主成分得分分得分成主一一第图17主成分得分的相关系数为零(标准化)最后可以验证因子载荷即为(标准化)原始数据与主成分得分之间的相关系数,容易算出(x1, z1) Correl (x1, z1) 0.9235,(X2,zj Correl(X2, Zi) 0.9235 ,(x-i, z2) Correl (x1, z2) 0.3837 ,41

17、C32:X 12 -1 J* 1 2 3图表标题x2-z1z1 = 1.206x 2 - 3E-16R2 = 0.8528 zi得分线性(zi得分)-3图19 X2与zi的关系及其回归方程图表标题x1-z2=0.2082X 1 - 1E-16R = 0.1472* z2得分 线性(z2得分)图20 X!与Z2的关系及其回归方程4* 11.0.5 02 -1 广(2 3-0.54 A-1 *4-口图表标题x2-z2* z2得分 线性(z2得分)z2 = -0.2082x 2 - 2E-16R = 0.1472图21 X2与Z2的关系及其回归方程回归方程为z1 1.206x1z-i 1.206x2Z2 0.2082x1z2 0.2082 x2方程的系数恰是以下矩阵的元素0.7071 0.7071 1 0.7056 1.206040.7071 0.7071 0.7056 1 0.20817

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1