1、第章主成分分析和因子分析习题答案第11章 主成分分析和因子分析教材习题答案11.1下表是2007年30家能源类上市公司的有关经营数据。其中:X1=主营业务利润;X2=净 资产收益率;X3=每股收益;X4=总资产周转率;X5=资产负债率;X6=流动比率;X7=主营业 务收入增长率;X8=资本积累率。进行主成分分析并确定主成分的数量。股票简称X1X2X3X4X5X6X7X8海油工程19.75127.0101.1320.92250.4691.23725.49510.620 1中海油服33.73312.9900.4980.51025.3983.37846.990-1.576中国石化13.07918.2
2、600.6341.83554.5840.67455.04343.677中国石油33.44119.9000.7350.92328.0681.04342.68245.593 1广聚能源6.79015.6500.4411.18813.2573.60238.44617.262 11 -鲁润股份5.3150.5000.0111.87952.5931.222207.37333.721 11 :海越股份3.35715.4800.5380.62648.8300.80733.43854.972国际实业29.33210.3400.2990.66253.1401.21816.5797.622 1靖远煤电29.961
3、16.0400.2550.66236.5960.70020.902-3.682美锦能源23.34218.5800.4970.92360.9630.9921.27112.128神火股份26.04242.5001.6400.99069.7760.51050.13852.066金牛能源35.02215.7300.7250.94439.2670.9539.002-3.877煤气化25.80914.9800.6770.92845.7680.949-3.85124.881 1西山煤电39.50617.8200.8680.70345.4501.5259.162-85.4301 -露天煤业29.89522.4
4、500.7090.80040.9771.3213.3104.369郑州煤电18.16012.7400.2991.37452.9621.240-100.00085.688兰花科创41.40220.0701.4140.61752.9161.0606.78914.259黑化股份8.7831.4300.0330.75348.0610.545-11.6596.856兖州煤业45.59213.7300.5480.68822.3502.15821.19921.953国阳新能16.06114.9201.0301.62348.3860.97315.34220.860盘江股份11.0036.6600.2601.1
5、8730.2011.68241.65775.804上海能源24.87617.9500.7090.96848.6740.51020.54814.526山西焦化12.8254.4500.3310.84948.4761.41743.67629.419恒源煤电32.22817.8201.0700.44972.0790.5159.872149.837开滦股份24.42320.6701.1020.84554.1981.10273.28526.542大同煤业44.00512.9900.5970.66747.5541.84330.62115.668中国神华48.18015.4000.9940.40837.68
6、72.09727.81346.229潞安环能28.56721.7101.5341.02354.2611.59048.31529.6101中煤能源41.21416.6800.4410.66940.9322.05829.90311.3501国投新集30.0159.6800.2220.35064.4710.63024.27836.437详细答案:SPSS输出的各主成分分析结果如下表:主成分的方差贡献率和累计方差贡献率Total Varia nee Expla inedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTota
7、l% of VarianceCumulative %Total% of VarianceCumulative %匸12.34629.32129.321 55.0532.34629.32129.32122.05925.7322.05925.73255.05331.24915.61470.6671.24915.61470.6674.84310.53981.2065 1.7549.42190.6286.3374.21594.843r 7 j.2493.11497.9578 i.1632.043100.000Extractio n Method: Prin cipal Comp onent An al
8、ysis.主成分的因子载荷矩阵Comp onent Matrix(a)Component1123X1.490-.698-.113X2.804-.066.442X3.824-.049.4641X4-.363.603.498IX5.573.643-.219X6-.434-.672.332X7-.329.248.610X8.147.524-.219Extracti on Method: Prin cipal Comp onent An alysis.a 3 comp onents extracted.主成分方差贡献率表中前3个主成分的累计方差贡献率为70.667% ,虽然没有达到80%以 上,但第四
9、个主成分的特征根小于1。因此,按着主成分的选择要求,选择3个主成分比较合 适。从因子载荷矩阵看,第一主成分主要解释了 X2 (净资产收益率)和X3 (每股收益)两个 变量;第二个主成分主要解释了 X1 (主营业务利润)、X4 (总资产周转率)、X5 (资产负债 率)、X6 (流动比率)和X8 (资本积累率)这5个变量;而第三个主成分只解释了 X7 (主营 业务收入增长率)一个变量。11.2根据11.1题的数据:(1)检验该数据是否适合进行因子分析? ( 2)进行因子分析,并 对30家上市公司的因子综合得分进行排序。详细答案:SPSS输出的因子分析结果如下表:(1)KMO 检验和Bartlett
10、球度检验表如下:KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.554Bartletts Test of SphericityApprox. Chi-Square75.082df28Sig.000从检验表中可见,Bartlett球度检验统计量为75.082。检验的值接近0。表明8个变量之间 有较强的相关关系。而KMO统计量为0.554,小于0.7。进行因子分析的效果不一定很好。(2)旋转后的因子载荷矩阵如下:Rotated Comp onent Matrix(a)Component123X1.404-.
11、313-.6931X2.912.094-.075X3.940.106-.058X4-.0661.126.850X5.264.848-.0231 X6-.082-.862.025dX7.065-.192.707X8-.066.575.090Extracti on Method: Prin cipal Comp onent An alysis.Rotati on Method: Varimax with Kaiser Normalizati on.a Rotati on con verged in 5 iterati ons.因子1与X2 (净资产收益率)和X3 (每股收益)的载荷系数较大,这两个
12、变量主要与上 市公司盈利能力有关,因此可命名为 盈利能力”因子2与X5 (资产负债率)、X6 (流动比 率)、X8 (资本积累率)这3个变量的载荷系数较大,这三个变量主要涉及企业的偿债能力, 因此可命名为偿债能力因子”因子3与X1 (主营业务利润)、X4 (总资产周转率)、X7 (主 营业务收入增长率)这三个变量的载荷系数较大,这三个变量分别涉及了盈利能力、资产管理 水平、企业成长能力等,因此,这个因子的命名比较困难。各公所的因子综合得分和排名如下:公司名称因子1因子2因子3综合猖分排公司名称因子1因子2因子3综合得分排容神火股俭2.9321.1760.&914 SG11郑州煤电-1.196
13、1.347 -061Q-Q,459中国石化0,1960.8471.8332.8762金牛能源 117 -0.292 -0.30?-0.56217鲁润股份-1.1630.0293. 4232.2933盘江股份-1 305 0.134 0 851-0,56818潞安环能1.5T3-0.0720.8632.064山西焦化-1 231 0 207 0 272-0,TS219国阳新能0.3540.3791 1575国投新集-0 981 1.Q92 -1.183-1.07220并滦股份0.9B90. 1340 5421.6953西山煤电0 657 -1.169 -0.746-1 25821海油工程1.21
14、60.056C.3T91.653?国际实业-0. ?7S 0.177 -0.703-1.30322恒源煤电0.3332.251-1.0231.5623靖远煤电-0 532 -0. 1T9 -0.G21-1 33323上海能源0. 1390. 49?-O.OOT0.6249犬同煤业-0.033 0.569 -0.736-1.36924海越股份-0. 5750.8750.2200.52910广聚能源-0 43G -2.2S4 1 314-1.40G25兰花科创1.2500.03E-0.8650.4T411中国神华0 483 -0.8T1 -1.111-1,49426美謀能源-0,0050.6S1-
15、0.2590.33612中煤能添-0 03& -0.913 -0.&67-1.61527中国石油0.335-0. 4290. 069-0.02B13黑化股份-2 044 0. SIT -0.499-1.7272B煤气化-0. 1790.314-0.325-a. 19114兖州煤业-C. 156 -1.498 -0.739-2.4539露天煤业0.417-0. 337-0.401-0. 32215中海油服-0.231 -2.266 -0.342-2.3393011.3对下表中的50名学生成绩进行主成分分析,可以选择几个综合变量来代表这些学生的六 门课程成绩?学生代码数学物理化学语文历史英语117
16、164945261522789681808976r-3695667759480r 147790806866605846775607063662678371857777465757290738917497627166972877279837610827083687785r11637060918582r127479955974591366617762736414908298477160157790856873761691828454626017788410051606018907878597266198010083537370205851677991852172 J8988778083226455
17、5068686523778980737570247268778392792572676192928826737270888679277781628590872861658198949529799583898979308190797385803185777552735932688570848986338591956376663491851007065763574748461806936-881008549716637638266897880388784100748176398198亍845765694064796472767441605160787476427584766576734359758
18、1827773446459567179674564 J6149100999546564861858280476245677876824886789287877749667279818766506166489810096详细答案:SPSS输出的主成分分析结果如下表:主成分的方差贡献率和累计方差贡献率Total Varia nee Expla inedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %13
19、.72962.14662.1463.72962.14662.14621.20620.09682.2421.20620.09682.2423.4036.72488.9664.3255.41494.3805.2043.39597.7756.1342.225100.000Extractio n Method: Prin eipal Comp onent An alysis.主成分载荷矩阵Comp onent Matrix(a)Component数学-.778.430物理-.580.682化学-.784.318语文.893.312历史.826.406英语.833.438Extractio n Meth
20、od: Prin cipal Comp onent An alysis.a 2 comp onents extracted.头两个主成分能够解释总方差的82.242% ,所以可以选择这两个主成分来代表原来的六门课程 成绩。由主成分载荷矩阵来看,第一个主成分既充分解释了数学、物理、化学三门课程成绩, 也充分解释了语文、历史、英语三门课程成绩,但前三门课程的主成分载荷为均为负值,后三 门课程的主成分载荷恰好相反,均为正值,这可能是由于文理科课程的性质不同而导致的。第 二主成分则与六门课程成绩均表现出一定的正相关关系。11.4如果事先确定选择两个因子来代表习题11.3中50名学生的六门课程成绩,试对
21、该数据进 行因子分析,得到的两个因子有没有合理的直观意义?详细答案:SPSS输出的因子分析结果如下表:旋转后的因子载荷矩阵Rotated Comp onent Matrix(a)Component112数学-.341.821物理-.028.895化学-.415.737语文.893-.312历史.899-.196英语.924-.176Extractio n Method: Prin cipal Comp onent An alysis. Rotati on Method: Varimax with Kaiser Normalizati on.a Rotati on con verged in 3
22、 iterati ons.因子得分矩阵Comp onent Score Coefficie nt MatrixComponent112数学.059.409物理.231.539化学.000.337语文.349.054历史.383.1261英语.401J.145Extracti on Method: Prin cipal Comp onent An alysis. Rotati on Method: Varimax with KaiserNormalizati on.由旋转后的因子载荷矩阵来看,第一个因子主要表现出与语文、历史和英语有较强的正相关关系,相关系数分别为0.893 , 0.899 , 0.924 ;第二个因子则主要表现出与数学、物理、化学 有较强的正相关关系,相关系数分别为0.821,0.895,0.737。因此,从直观上来,可以分别给 它们取名为文科因子”和理科因子”利用因子得分矩阵则可以计算每一个观测所对应的这两 个因子的得分值。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1