SPSS数据的主成分分析3PPT推荐.ppt

上传人:b****1 文档编号:14327021 上传时间:2022-10-22 格式:PPT 页数:68 大小:1.24MB
下载 相关 举报
SPSS数据的主成分分析3PPT推荐.ppt_第1页
第1页 / 共68页
SPSS数据的主成分分析3PPT推荐.ppt_第2页
第2页 / 共68页
SPSS数据的主成分分析3PPT推荐.ppt_第3页
第3页 / 共68页
SPSS数据的主成分分析3PPT推荐.ppt_第4页
第4页 / 共68页
SPSS数据的主成分分析3PPT推荐.ppt_第5页
第5页 / 共68页
点击查看更多>>
下载资源
资源描述

SPSS数据的主成分分析3PPT推荐.ppt

《SPSS数据的主成分分析3PPT推荐.ppt》由会员分享,可在线阅读,更多相关《SPSS数据的主成分分析3PPT推荐.ppt(68页珍藏版)》请在冰豆网上搜索。

SPSS数据的主成分分析3PPT推荐.ppt

1、指标与指标可能存在相关关系信息重叠,分析偏误2、指标太多,增加问题的复杂性和分析难度如何避免?

zf,6zf,主成分分析的基本思想,一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。

他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。

在进行主成分分析后,竟以97.4的精度,用三新变量就取代了原17个变量。

根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。

zf,7zf,更有意思的是,这三个变量其实都是可以直接测量的。

斯通将他得到的主成分与实际测量的总收入I、总收入变化率I以及时间t因素做相关分析,得到下表:

zf,8zf,主成分分析:

将原来具有相关关系的多个指标简化为少数几个新的综合指标的多元统计方法。

主成分:

由原始指标综合形成的几个新指标。

依据主成分所含信息量的大小成为第一主成分,第二主成分等等。

主成分与原始变量之间的关系:

(1)主成分保留了原始变量绝大多数信息。

(2)主成分的个数大大少于原始变量的数目。

(3)各个主成分之间互不相关。

(4)每个主成分都是原始变量的线性组合。

zf,9zf,主成分分析通常的做法:

寻求原指标的线性组合Fi。

数学模型主成分表达式,zf,10zf,假设有n个样品,每个样品有两个观测变量xl和x2,在由变量xl和x2所确定的二维平面中,n个样本点所散布的情况如椭圆状。

如图所示:

几何解释坐标旋转变换,平移、旋转坐标轴,zf,11zf,平移、旋转坐标轴,zf,12zf,平移、旋转坐标轴,zf,13zf,由图可以看出这n个样本点无论是沿着xl轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量xl的方差和x2的方差定量地表示。

显然,如果只考虑xl和x2中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。

如果我们将xl轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标轴Fl和F2。

Fl和F2是两个新变量。

Fl轴方向上的离散程度最大,即Fl的方差最大。

说明变量Fl代表了原始数据的绝大部分信息,即使不考虑变量F2也无损大局。

zf,14zf,旋转变换的目的:

将原始数据的大部分信息集中到Fl轴上,对数据中包含的信息起到了浓缩作用。

主成分分析的几何意义:

主成分分析的过程也就是坐标旋转的过程,各主成分表达式就是新坐标系与原坐标系的转换关系,新坐标系中各坐标轴的方向就是原始数据方差最大的方向。

其优点:

(1)可达到简化数据结构的目的。

(2)新产生的综合变量Fl,F2具有不相关的性质,从而避免了信息重叠所带来的虚假性。

zf,15zf,了解了主成分分析的基本思想、数学和几何意义后,问题的关键:

1、如何求解主成分?

2、如何确定主成分个数?

3、如何解释主成分所包含的经济意义?

zf,16zf,如何求解主成分?

(1)基于协方差矩阵求解主成分,假设有n个样本,每个样本有p个观测变量。

运用主成分分析构造以下p个主成分关于原始变量的线性组合模型:

zf,17zf,假设p个原始变量的协方差阵为:

对角线外的元素不为0意味着:

原始变量之间有相关关系,zf,18zf,如何运用主成分分析将这些具有相关关系的变量转化为没有相关关系的新变量(主成分)呢?

新变量(即主成分)之间没有相关关系,其协方差阵为对角矩阵:

对角线上的元素1、2p分别为第一、二第p个主成分方差;

同时也是原始变量协方差阵的特征根,主成分表达式的系数项即是1、2p的特征向量,zf,19zf,1、主成分的协方差阵为对角矩阵;

2、3、4、第j个主成分的方差贡献为:

主成分包含了原始变量的所有信息,协方差矩阵求解中主成分的性质,该比率为第j个主成分方差与原始变量的总方差之比。

zf,20zf,k个主成分的累积方差贡献率为:

累积方差贡献率越接近1,表示k个主成分包含原始变量的信息越多。

5.主成分载荷:

6.主成分Fj与原始变量Xi相关系数的平方:

(1)可看作为第j个主成分可解释Xi多少比率的信息

(2)可看作为Xi在第j个主成分中的相对重要性,zf,21zf,主成分的求解

(2)基于相关系数矩阵求解主成分,假设p个原始变量的相关系数矩阵阵为:

注意

(1):

相关系数矩阵可看作原始变量协方差阵的标准化形式,即:

原始变量标准化的协方差矩阵。

注意

(2):

运用主成分分析法时,若原始变量量纲不一致时,需对变量进行标准化处理基于协方差阵求解主成分;

若不标准化则基于相关系数矩阵求解主成分。

对角线外元素不全为0:

原始变量间有相关关系,zf,22zf,转化形成的没有相关关系的新变量(即主成分)的协方差阵为对角矩阵:

同时也是原始变量相关系数矩阵的特征根,主成分表达式的系数项即是1、2p的特征向量,zf,23zf,相关系数矩阵求解中主成分的性质,1、主成分的协方差矩阵为对角阵.2.3、4、第k个主成分的方差贡献率为:

前k个主成分的累积方差贡献率为:

5、主成分载荷:

6、主成分载荷的平方:

在解释第j个主成分的意义上起着重要作用,

(1)可看作为第j个主成分可解释Xi多少比率的信息(或:

Xi的信息有多少可被第j个主成分解释);

(2)可看作为Xi在第j个主成分中的相对重要性。

zf,24zf,主成分个数的确定,累积方差贡献率(Cumulativevarianceexplainedbycomponents):

通常要求累积方差贡献率达到85%以上来确定主成分个数。

特征根(eigenvalue):

根据特征根来确定;

数据标准化情况下:

碎石图(Screeplot):

依据特征值的变化来确定,即特征值变化趋势图由陡坡变为平坦的转折点即为主成分选择的最佳个数。

zf,25zf,主成分的解释,运用主成分载荷解释主成分:

陈耀辉,景睿沪深股市市场收益率成因的主成份分析,南京航空航天大学学报,2000年2期。

蒋亮,罗汉我国东西部城市经济实力比较的主成分分析,经济数学,2003年3期。

运用主成分得分系数矩阵解释主成分:

王冬我国外汇储备增长因素主成分分析,北京工商大学学报,2006年4期。

田波平等主成分分析在中国上市公司综合评价中的作用,数学的实践与认识,2004年4期,zf,26zf,基于相关系数矩阵的主成分分析。

对美国纽约上市的有关化学产业的三支股票(AlliedChemical,duPont,UnionCarbide)和石油产业的2支股票(ExxonandTexaco)做了100周的收益率调查(1975年1月1976年10月)。

1)利用相关系数矩阵做主成分分析。

2)决定要保留的主成分个数,并解释意义。

主成分解释的案例分析,zf,27zf,

(1)相关系数矩阵:

运用主成分分析法进行分析得到以下结果:

zf,28zf,

(2)相关系数矩阵的特征根:

EigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulativePRIN12.856712.047550.5713420.57134PRIN20.809160.269490.1618330.73317PRIN30.539680.088180.1079350.84111PRIN40.451500.108550.0903000.93141PRIN50.34295.0.0685901.00000(3)特征根所对应的特征向量:

EigenvectorsPRIN1PRIN2PRIN3PRIN4PRIN5X10.463605-.240339-.6117050.386635-.451262X20.457108-.5093050.1781890.2064740.676223X30.470176-.2604480.335056-.662445-.400007X40.4214590.5256650.5407630.472006-.175599X50.4212240.581970-.435176-.3824390.385024,zf,29zf,(4)前两大主成分的累积方差贡献率:

(5)前两大主成分的表达式:

zf,30zf,(6)碎石图:

zf,31zf,主成分的解释:

1、第一大主成分PRIN1几乎是5只股票的等权平均;

可将它看做股票收益率的“市场影响因素”(marketcomponent)2、第二大主成分PRIN2系数在AC,DP,UC(chemicalstocks)等3只股票上表现为负,而在EX,TE(oilstocks)等两只股票的系数表现为正;

可将它看作为股票收益率的“行业影响因素”(industrycomponent),zf,32zf,主成分分析步骤及框图,主成分分析步骤:

1.根据研究问题选取初始分析变量;

2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;

3.求协差阵或相关阵的特征根与相应标准特征向量;

4.判断是否存在明显的多重共线性,若存在,则回到第一步;

5.得到主成分的表达式并确定主成分个数,选取主成分;

6.结合主成分对研究问题进行分析并深入研究。

zf,33zf,主成分分析框图:

zf,34zf,主成分分析的上机实现SPSS操作,1、analyze-descriptionstatistic-description-savestandardizedasvariables(若需要数据标准化,则进行该操作,一般在主成分分析过程中软件已自动进行了此操作)2、analyze-datareduction-Factor3、指定参与分析的变量4、运行factor过程,zf,35zf,案例1:

某分析师试图对汽车销量进行预测,选择了汽车品牌、汽车外观、油耗等10个变量作为影响变量(即自变量)(见数据car_sales.sav)。

但是,这些影响变量之间存在相关关系,分析师担心直接进行回归预测会引起分析结果偏误。

分析师首先对10个影响变量进行主成分分析,将其转化少数几个无相关关系的新变量。

(1)可用新变量与销量进行回归预测

(2)依据新变量,对各品牌汽车进行评价,zf,36zf,(01)选择分析变量选SPSS分析Analyze菜单中的(降维DataReduction)(Factor),出现【因子分析FactorAnalysis】对话框;

在【因子FactorAnalysis】对话框中左边的原始变量中,选择将进行因子分析的变量选入(变量Variables)栏。

zf,37zf,(02)设置描述性统计量在【FactorAnalysis】框中选【描述Descriptives】按钮,出现【描述统计Descriptives】对话框;

选择原始分析结果Initialso

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1