实例说明利用Excel进行主成分分析.docx

资源描述

实例说明利用Excel进行主成分分析.docx

《实例说明利用Excel进行主成分分析.docx》由会员分享，可在线阅读，更多相关《实例说明利用Excel进行主成分分析.docx（16页珍藏版）》请在冰豆网上搜索。

实例说明利用Excel进行主成分分析.docx

实例说明利用Excel进行主成分分析

方法:

1利用Excel2000进行主成分分析

第一步，录入数据，并对进行标准化。

【例】一组古生物腕足动物贝壳标本的两个变量：

长度和宽度。

图1原始数据和标准化数据及其均值、方差

（取自张超、杨秉庚《计量地理学基础》）

计算的详细过程如下：

⑴将原始数据绘成散点图（图2）。

主持分分析原则上要求数据具有线性相关趋势一—如果数据之间不相关（即正交），则没有必要进行主成分分析，因为主成分分析的目的就是用正交的变量代替原来非正交的变量；如果原始数据之间为非线性关系，则有必要对数据进行线性转换，否则效果不佳。

从图2可见，原始数据具有线性相关趋势，且测定系

数氏=,相应地，相关系数R=。

⑵对数据进行标准化。

标准化的数学公式为

*XijXj

这里假定按列标准化，式中

_1n:

n_2,

Xj—xij，ij.（xijXj）■.Var（xij）

分别为第j列数据的均值和标准差,

niiVii

xij为第i行（即第i个样本）、第j列（即第j个变

量）的数据，xij为相应于xij的标准化数据，n25为样本数目

原始数据的散点图y=0.7686X+2.3174

R2=0.4979

图2原始数据的散点图

标准化数据的散点图y=0.7056X+2E-16

图3标准化数据的散点图

对数据标准化的具体步骤如下：

①求出各列数据的均值，命令为average，语法

为：

average（起始单元格：

终止单元格）。

如图1所示，在单元格B27中输入

“=AVERAGE（B1B26）”，确定或回车，即得第一列数据的均值X110.88;然后抓住单元

格B27的右下角（光标的十字变细）右拖至C27，便可自动生成第二列数据的均值

x210.68

2求各列数据的方差。

命令为varp，语法同均值。

如图1所示，在单元格B28中输入

“=VARP（B2:

B26）”，确定或回车，可得第一列数据的方差Var（x1）19.4656，右拖至

C28生成第二列数据的方差Var（x2）23.0976。

3求各列数据的标准差。

将方差开方便得标准差。

也可利用命令stdevp直接生成标

准差，语法和操作方法同均值、方差，不赘述。

4标准化计算。

如图1所示，在单元格D2中输入“=（B2-$B$27）/$B$29”，回车可得

第一列第一个数据“3”的标准化数值，然后按住单元格D2的右下角下拖至D26,便会生

成第一列数据的全部标准化数值；按照单元格D2的右下角右拖至E2,就能生成第二列第

一个数据“2”的标准化数据，抓住单元格E2的右下角下拖至E26便会生成第二列数据的

全部标准化数值。

5作标准化数据的散点图（图3）。

可以看出，点列的总体趋势没有变换，两种数据

的相关系数与标准化以前完全相同。

但回归模型的截距近似为0,即有a0，斜率等于