ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:325.54KB ,
资源ID:11637276      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11637276.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第七章 主成分分析he因子分析.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第七章 主成分分析he因子分析.docx

1、第七章 主成分分析he因子分析第七章 主成分分析和因子分析实验报告下表为2012年全国31个省、直辖市和自治区城镇居民家庭平均每人全年消费性支出的八个主要变量数据。X1 食品支出(元/人) X5家庭日用杂品(元/人)X2衣着支出(元/人) X6交通通信(元/人)X3居住支出(元/人) X7文教娱乐(元/人)X4家庭设备及用品(元/人) X8医疗保健(元/人) 表7-1 2012年全国城镇居民平均每人全年消费性支出数据 单位(元/人)地区X1X2X3X4X5X6X7X8 北京296.17 2638.901970.941610.70604.573781.513695.981658.37 天津564

2、.76 1881.431854.221151.16411.283083.372254.221556.35 河北177.91 1541.991502.41876.10340.151723.751203.801047.28 山西73.25 1529.471438.88832.52296.061672.291506.20905.88内蒙古144.44 2730.231583.561242.64446.862572.931971.781354.09 辽宁474.35 2042.401433.281069.65480.072323.291843.891309.62 吉林208.16 2044.80159

3、4.14871.46419.611780.671642.701447.50黑龙江213.69 1806.921336.85742.22338.711462.611216.561180.67 上海1011.40 2111.171790.481906.49784.854563.803723.741016.65 江苏542.92 1915.971437.081288.42533.962689.513077.761058.11 浙江949.222109.581551.691161.39475.714133.502996.591228.02 安徽268.201540.661396.97811.23244

4、.311809.721932.741142.96 福建1219.951634.211753.861254.71535.752961.782104.83773.22 江西291.381476.631173.91966.23442.491501.341487.30670.71 山东384.332196.981572.351125.99406.202370.231655.911005.25 河南105.771885.991190.811145.42395.961730.351525.331085.47 湖北334.461783.411371.15978.26405.301476.981651.921

5、029.55 湖南272.491624.571301.601034.30442.862084.151737.64918.41 广东792.271520.592099.751467.20695.324176.662954.131048.28 广西378.221146.461377.261125.39369.542088.641626.05883.56 海南963.24864.961521.04777.20420.372004.341319.54993.24 重庆266.132228.761177.021196.03499.731903.241470.641101.56 四川185.401651.

6、141284.091097.93482.161946.721587.43772.75 贵州99.051399.001013.53849.94401.781891.031396.00654.53 云南116.621759.89973.76634.09274.622264.231434.30939.13 西藏50.961361.57845.18474.69233.801387.45550.48467.23 陕西116.031789.061322.22986.82447.071788.382078.521212.44 甘肃88.241631.401287.93833.15338.121575.671

7、388.211049.65 青海112.871512.241232.39923.70327.761549.761097.21906.14 宁夏81.171875.701193.37929.01401.242110.411515.911063.09 新疆115.342031.141166.59950.17466.461660.271280.811027.60资料来源:2013中国统计年鉴根据上述八个指标,下面用spss17.0对全国各地区城镇居民消费构成进行主成分分析和因子分析。一、软件操作(一)操作步骤1.定义变量,输入数据。2.在SPSS窗口中选择Analyze/Dimension Redu

8、ction /Factor,调出主成分分析主界面,并将变量X1至X8八个数据变量移入Variables框中,如图7-1所示。图 7-1 因子分析主对话框3.单击【Descriptives】按钮,展开描述统计量对话框。(1)在“Statistics”中选择要输出的统计量:Univariate Descriptives输出单变量描述统计量和Initial solution,输出初始因子分析结果。(2)在“Correlation Matrix”中,选择要输出的相关矩阵:Coefficients,输出原始变量间的相关系数矩阵;Significance levels,输出显著性检验的P值;KMO and

9、 Bartletts test of sohericity 输出KMO测度和巴特利特球体检验。图 7-2 选择描述统计量的子对话框4.点击【Extraction】按钮,展开因子提取对话框。(1)在Method (因子提取方法)参数框中,选择Principal Components:主成分法。(2)在Analyze(分析矩阵)中,选择Correlation matrix(分析矩阵)。(3)在Extract栏中选择Number of factors(直接指定提取的因子个数),设定为3。(4)在Display中选择Unrotated factor solution,输出旋转前的因子分析结果。 单击C

10、ontinue按钮,返回主界面。图 7-3 因子提取主对话框5.点击Rotation(旋转)按钮,在Method(旋转方法)中,选择Varimax,最大方差旋转项,在Display中选择Rotated solution,输出旋转后的结果。单击Continue按钮,返回主界面。图 7-4 旋转方法选择子对话框6.点击Scores(因子得分)按钮,展开“Factor Scores”因子得分对话框。选择Save as variables,在Method中,选择Regression ,回归法。选择Display factor score coefficient matrix,输出因子得分系数矩阵。点击

11、Continue,返回主界面。图 7-5 因子得分选择项子对话框7.点击Options按钮,在Missing Values(缺失值)中选择处理缺失值的方法,选择Exclude cases Listwise,有缺失值的观测量一律剔除。在“Coefficent display format”中,选择因子载荷系数的输出方式,选择“Sorted by size”,按绝对值大小排列。如下图7-6所示。图 7-6 选择输出项对话框8.在主对话框中,单击【OK】按钮执行运行,输出结果如下。(二)主要运行结果解释1.单变量描述统计量(Descriptives Statistics)下表给出了单变量描述统计量的

12、均值、标准差和参与计算的观测量数。 表 7-2 Descriptive StatisticsMeanStd. DeviationAnalysis Nx1351.5610318.3079431x21782.8135388.8927131x31411.2358283.1226431x41042.3939283.2454031x5431.0539118.5573231x62260.2768861.6145131x71836.3910739.1511131x81048.6229253.74984312.原始变量的相关矩阵(Correlation Matrix)表7-3 Correlation Matr

13、ixx1x2x3x4x5x6x7x8Correlationx11.000-.063.632.537.611.706.576.070x2-.0631.000.305.508.383.385.470.646x3.632.3051.000.708.641.742.736.584x4.537.508.7081.000.900.802.857.367x5.611.383.641.9001.000.771.787.245x6.706.385.742.802.7711.000.890.362x7.576.470.736.857.787.8901.000.488x8.070.646.584.367.245.3

14、62.4881.000Sig. (1-tailed)x1.368.000.001.000.000.000.353x2.368.047.002.017.016.004.000x3.000.047.000.000.000.000.000x4.001.002.000.000.000.000.021x5.000.017.000.000.000.000.092x6.000.016.000.000.000.000.023x7.000.004.000.000.000.000.003x8.353.000.000.021.092.023.003上表为8个原始变量的相关矩阵与单尾检验显著性检验。可见多个变量之间相

15、关系数较大,说明这些变量之间存在着较为显著的相关性,且其对应的Sig值普遍较小,根据以上分析,这些数据有进行因子分析的必要。3.KMO检验法和巴特利特球形检验法(KMO and Bartlett Test of Sphericity)的检验结果。表7-4 KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.768Bartletts Test of SphericityApprox. Chi-Square222.767df28Sig.000 Bartlett球形检验统计量的Sig0.01,认为各变量之间存在着

16、显著的相关性。一般,KMO大于0.9时效果最佳,0.7以上可以接受,0.5以下不宜作因子分析。可见检验结果Sig0.7,认为适合作因子分析。4.总方差分解(Total Variance Explained)表7-5 Total Variance Explained(1)在“Components”中,给出各因子的序号。(2)在”Initial Eigenvalues”中,给出了相关矩阵或协方差矩阵,其中:Total :给出各因子的特征值。% of variance:给出各因子所解释的方差占总方差的百分比。Cumulative %:给出各因子方差占总方差的累计百分比。(3)在“Extraction

17、 Sums of Squared Loadings”中,给出提取若干因子后的特征值、方差百分比、累计方差百分比。由于前三个特征值累计贡献率达到90.042%,根据累计贡献率大于85%的原则,本例提取前三个特征值。5.旋转前的因子载荷矩阵(Component Matrix)表7-6 Component MatrixaComponent123x7.936.001-.057x4.920-.028-.280x6.918-.167-.014x5.873-.188-.317x3.853-.027.409x1.675-.596.247x2.530.738-.283x8.545.690.430Extracti

18、on Method: Principal Component Analysis.a. 3 components extracted.6.表7-5给出旋转前的因子载荷矩阵,计算出相应的特征向量(用前初始因子载荷矩阵的列元素分别除以相应的特征根的平方根),见表7-6所示。表7-7 特征向量第一特征向量第二特征向量第三特征向量0.41500.0008-0.06940.4079-0.0233-0.34080.4070-0.1392-0.01700.3870-0.1567-0.38580.3782-0.02250.49780.2992-0.49670.30060.23500.6150-0.34450.2

19、4160.57500.5234根据表7-6得到3个主成分的表达式:Y1=0.2992X1+0.2350X2+0.3782X3+0.4079X4+0.3870X5+0.4070X6+0.4150X7+0.2416X8Y2=-0.4967X1+0.6150X2-0.0225X3-0.0233X4-0.1567X5-0.1392X6+0.0008X7+0.5750X8Y3=0.3006X1-0.3445X2+0.4978X3-0.3408X4-0.3858X5-0.0170X6-0.0694X7+0.5234X87.旋转后的因子载荷矩阵(Rotated Component Matrix)表7-8 R

20、otated Component MatrixaComponent123x5.890.316.080x4.885.284.247x7.753.432.354x6.730.539.219x1.424.817-.155x3.398.728.456x8.073.220.951x2.507-.308.744Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 9 iterations.旋转后每个公因子上的载荷

21、分配的更清晰,因子变量代表的变量相对集中,比未旋转时更容易解释各因子的意义。载荷绝对值较大的因子与变量的关系更为密切,也更能代表这个变量。8.因子得分矩阵(Component Scores Coefficient Matrix)表7-9 Component Score Coefficient MatrixComponent123x1-.086.533-.175x2.291-.502.336x3-.253.515.257x4.403-.187-.086x5.443-.173-.203x6.164.136-.034x7.194.034.045x8-.372.251.667Extraction Me

22、thod: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.9.各样品的因子得分及综合得分在DataView窗口的当前数据集中,文件中增加了4列FAC1-1(第一因子得分)、FAC2-1(第二因子得分)、FAC3-1(第三因子得分)和zf(综合得分)。图7-7 因子得分新变量其中,zf(综合得分)=40.952%*FAC1-1+24.962%*FAC2-1+24.129%*FAC3-1计算方法如下: 图7-8 综合得分计算方法最终全国各个省市综合

23、得分如下表所示(保留两位小数)。表7-10 各省市综合得分情况序号FAC1_1FAC2_1FAC3_1zf序号FAC1_1FAC2_1FAC3_1zf124.13 0.12 2.47 1.2417-0.32 -0.17 0.01 -0.172-0.78 1.64 1.70 0.50180.17 -0.30 -0.55 -0.143-1.06 0.31 0.15 -0.32191.32 2.02 -0.43 0.944-0.93 0.00 -0.12 -0.4120-0.41 0.64 -0.96 -0.2450.60 -1.05 1.80 0.4221-1.47 2.48 -1.10 -0.2

24、56-0.01 0.09 0.77 0.21220.80 -1.37 0.19 0.037-0.94 0.19 1.60 0.05230.61 -0.78 -0.97 -0.188-1.16 -0.09 0.62 -0.35240.15 -0.95 -1.49 -0.5493.26 0.70 -0.66 1.3525-0.67 -0.79 -0.21 -0.52101.15 0.02 -0.13 0.4426-0.92 -1.10 -1.78 -1.08110.69 1.22 0.44 0.6927-0.14 -0.45 0.51 -0.0512-1.37 0.60 0.48 -0.3028-

25、0.83 -0.32 0.13 -0.39130.65 1.83 -1.27 0.4129-0.65 -0.43 -0.44 -0.48140.25 -0.61 -1.43 -0.3930-0.07 -0.87 0.14 -0.21150.22 -0.24 0.37 0.12310.24 -1.29 0.02 -0.22160.12 -1.02 0.15 -0.17二、结果分析根据各省市综合得分进行排名,得出全国消费能力排名表,如下表7-11所示。表7-11 综合得分排名省份排名得分省份排名得分上海11.35四川17-0.18北京21.24宁夏18-0.21广东30.94新疆19-0.22浙江

26、40.69广西20-0.24天津50.5海南21-0.25江苏60.44安徽22-0.3内蒙古70.42河北23-0.32福建80.41黑龙江24-0.35辽宁90.21甘肃25-0.39山东100.12江西26-0.39吉林110.05山西27-0.41重庆120.03青海28-0.48陕西13-0.05云南29-0.52湖南14-0.14贵州30-0.54河南15-0.17西藏31-1.08湖北16-0.17从总得分结果来看,上海综合得分最高为1.35,其次北京、广东分数都较高,说明这些省份消费能力强,排在全国前列,即为通常所说北上广。浙江、天津、江苏等消费能力也较强。而西藏-1.08最低,贵州、云南、青海等地综合得分都较低,说明消费能力较弱。其余省份处于全国消费能力一般水平,结果与实际各省经济情况相符

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1