ImageVerifierCode 换一换
格式:PPT , 页数:68 ,大小:1.24MB ,
资源ID:14327021      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/14327021.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS数据的主成分分析3PPT推荐.ppt)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS数据的主成分分析3PPT推荐.ppt

1、1、指标与指标可能存在相关关系 信息重叠,分析偏误2、指标太多,增加问题的复杂性和分析难度 如何避免?,zf,6zf,主成分分析的基本思想,一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。,在进行主成分分析后,竟以97.4的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。,zf,7zf,更有意思的是,这三个

2、变量其实都是可以直接测量的。斯通将他得到的主成分与实际测量的总收入I、总收入变化率I以及时间t因素做相关分析,得到下表:,zf,8zf,主成分分析:将原来具有相关关系的多个指标简化为少数几个新的综合指标的多元统计方法。,主成分:由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。,主成分与原始变量之间的关系:(1)主成分保留了原始变量绝大多数信息。(2)主成分的个数大大少于原始变量的数目。(3)各个主成分之间互不相关。(4)每个主成分都是原始变量的线性组合。,zf,9zf,主成分分析通常的做法:寻求原指标的线性组合Fi。,数学模型主成分表达式,zf,10z

3、f,假设有n个样品,每个样品有两个观测变量xl和x2,在由变量xl和x2 所确定的二维平面中,n个样本点所散布的情况如椭圆状。如图所示:,几何解释坐标旋转变换,平移、旋转坐标轴,zf,11zf,平移、旋转坐标轴,zf,12zf,平移、旋转坐标轴,zf,13zf,由图可以看出这n个样本点无论是沿着xl 轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量xl 的方差和x2 的方差定量地表示。显然,如果只考虑xl和x2 中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。如果我们将xl 轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标轴Fl和F2。Fl和F2是两个

4、新变量。,Fl轴方向上的离散程度最大,即Fl的方差最大。说明变量Fl代表了原始数据的绝大部分信息,即使不考虑变量F2也无损大局。,zf,14zf,旋转变换的目的:将原始数据的大部分信息集中到Fl轴上,对数据中包含的信息起到了浓缩作用。主成分分析的几何意义:主成分分析的过程也就是坐标旋转的过程,各主成分表达式就是新坐标系与原坐标系的转换关系,新坐标系中各坐标轴的方向就是原始数据方差最大的方向。,其优点:(1)可达到简化数据结构的目的。(2)新产生的综合变量Fl,F2具有不相关的性质,从而避免了信息重叠所带来的虚假性。,zf,15zf,了解了主成分分析的基本思想、数学和几何意义后,问题的关键:1、

5、如何求解主成分?2、如何确定主成分个数?3、如何解释主成分所包含的经济意义?,zf,16zf,如何求解主成分?(1)基于协方差矩阵求解主成分,假设有n个样本,每个样本有 p 个观测变量。运用主成分分析构造以下 p 个主成分关于原始变量的线性组合模型:,zf,17zf,假设p个原始变量的协方差阵为:,对角线外的元素不为0意味着:原始变量之间有相关关系,zf,18zf,如何运用主成分分析将这些具有相关关系的变量转化为没有相关关系的新变量(主成分)呢?新变量(即主成分)之间没有相关关系,其协方差阵为对角矩阵:,对角线上的元素1、2p分别为第一、二第p个主成分方差;同时也是原始变量协方差阵的特征根,主

6、成分表达式的系数项即是1、2p的特征向量,zf,19zf,1、主成分的协方差阵为对角矩阵;2、3、4、第j个主成分的方差贡献为:,主成分包含了原始变量的所有信息,协方差矩阵求解中主成分的性质,该比率为第j个主成分方差与原始变量的总方差之比。,zf,20zf,k 个主成分的累积方差贡献率为:累积方差贡献率越接近1,表示k 个主成分包含原始变量的信息越多。5.主成分载荷:6.主成分Fj与原始变量Xi相关系数的平方:(1)可看作为第j 个主成分可解释Xi多少比率的信息(2)可看作为Xi在第j 个主成分中的相对重要性,zf,21zf,主成分的求解(2)基于相关系数矩阵求解主成分,假设p个原始变量的相关

7、系数矩阵阵为:注意(1):相关系数矩阵可看作原始变量协方差阵的标准化形式,即:原始变量标准化的协方差矩阵。注意(2):运用主成分分析法时,若原始变量量纲不一致时,需对变量进行标准化处理基于协方差阵求解主成分;若不标准化则基于相关系数矩阵求解主成分。,对角线外元素不全为0:原始变量间有相关关系,zf,22zf,转化形成的没有相关关系的新变量(即主成分)的协方差阵为对角矩阵:同时也是原始变量相关系数矩阵的特征根,主成分表达式的系数项即是1、2p的特征向量,zf,23zf,相关系数矩阵求解中主成分的性质,1、主成分的协方差矩阵为对角阵.2.3、4、第k个主成分的方差贡献率为:前k个主成分的累积方差贡

8、献率为:5、主成分载荷:6、主成分载荷的平方:,在解释第j个主成分的意义上起着重要作用,(1)可看作为第j 个主成分可解释Xi多少比率的信息(或:Xi 的信息有多少可被第j个主成分解释);(2)可看作为Xi在第j 个主成分中的相对重要性。,zf,24zf,主成分个数的确定,累积方差贡献率(Cumulative variance explained by components):通常要求累积方差贡献率达到85%以上来确定主成分个数。特征根(eigenvalue):根据特征根来确定;数据标准化情况下:碎石图(Scree plot):依据特征值的变化来确定,即特征值变化趋势图由陡坡变为平坦的转折点即

9、为主成分选择的最佳个数。,zf,25zf,主成分的解释,运用主成分载荷解释主成分:陈耀辉,景睿沪深股市市场收益率成因的主成份分析,南京航空航天大学学报,2000年2期。蒋亮,罗汉我国东西部城市经济实力比较的主成分分析,经济数学,2003年3期。运用主成分得分系数矩阵解释主成分:王冬我国外汇储备增长因素主成分分析,北京工商大学学报,2006年4期。田波平等主成分分析在中国上市公司综合评价中的作用,数学的实践与认识,2004年4期,zf,26zf,基于相关系数矩阵的主成分分析。对美国纽约上市的有关化学产业的三支股票(Allied Chemical,du Pont,Union Carbide)和石油

10、产业的2支股票(Exxon and Texaco)做了100周的收益率调查(1975年1月1976年10月)。1)利用相关系数矩阵做主成分分析。2)决定要保留的主成分个数,并解释意义。,主成分解释的案例分析,zf,27zf,(1)相关系数矩阵:,运用主成分分析法进行分析得到以下结果:,zf,28zf,(2)相关系数矩阵的特征根:Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative PRIN1 2.85671 2.04755 0.571342 0.57134 PRIN2 0.80916

11、0.26949 0.161833 0.73317 PRIN3 0.53968 0.08818 0.107935 0.84111 PRIN4 0.45150 0.10855 0.090300 0.93141 PRIN5 0.34295.0.068590 1.00000(3)特征根所对应的特征向量:Eigenvectors PRIN1 PRIN2 PRIN3 PRIN4 PRIN5 X1 0.463605-.240339-.611705 0.386635-.451262 X2 0.457108-.509305 0.178189 0.206474 0.676223 X3 0.470176-.2604

12、48 0.335056-.662445-.400007 X4 0.421459 0.525665 0.540763 0.472006-.175599 X5 0.421224 0.581970-.435176-.382439 0.385024,zf,29zf,(4)前两大主成分的累积方差贡献率:,(5)前两大主成分的表达式:,zf,30zf,(6)碎石图:,zf,31zf,主成分的解释:1、第一大主成分PRIN1几乎是5只股票的等权平均;可将它看做股票收益率的“市场影响因素”(market component)2、第二大主成分PRIN2 系数在AC,DP,UC(chemical stocks)等

13、3只股票上表现为负,而在 EX,TE(oil stocks)等两只股票的系数表现为正;可将它看作为股票收益率的“行业影响因素”(industry component),zf,32zf,主成分分析步骤及框图,主成分分析步骤:1.根据研究问题选取初始分析变量;2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;3.求协差阵或相关阵的特征根与相应标准特征向量;4.判断是否存在明显的多重共线性,若存在,则回到第一步;5.得到主成分的表达式并确定主成分个数,选取主成分;6.结合主成分对研究问题进行分析并深入研究。,zf,33zf,主成分分析框图:,zf,34zf,主成分分析的上机实现SPSS

14、 操作,1、analyze-description statistic-description-save standardized as variables(若需要数据标准化,则进行该操作,一般在主成分分析过程中软件已自动进行了此操作)2、analyze-data reduction-Factor3、指定参与分析的变量4、运行factor 过程,zf,35zf,案例1:某分析师试图对汽车销量进行预测,选择了汽车品牌、汽车外观、油耗等10个 变量作为影响变量(即自变量)(见数据car_sales.sav)。但是,这些影响变量之间存在相关关系,分析师担心直接进行回归预测会引起分析结果偏误。分析师首

15、先对10个影响变量进行主成分分析,将其转化少数几个无相关关系的新变量。(1)可用新变量与销量进行回归预测(2)依据新变量,对各品牌汽车进行评价,zf,36zf,(01)选择分析变量 选SPSS 分析Analyze菜单中的(降维Data Reduction)(Factor),出现【因子分析 Factor Analysis】对话框;在【因子Factor Analysis】对话框中左边的原始变量中,选择将进行因子分析的变量选入(变量Variables)栏。,zf,37zf,(02)设置描述性统计量在【Factor Analysis】框中选【描述Descriptives】按钮,出现【描述统计Descriptives】对话框;选择原始分析结果 Initial so

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1