第七章 主成分分析he因子分析.docx

上传人:b****5 文档编号:11637276 上传时间:2023-03-29 格式:DOCX 页数:15 大小:325.54KB
下载 相关 举报
第七章 主成分分析he因子分析.docx_第1页
第1页 / 共15页
第七章 主成分分析he因子分析.docx_第2页
第2页 / 共15页
第七章 主成分分析he因子分析.docx_第3页
第3页 / 共15页
第七章 主成分分析he因子分析.docx_第4页
第4页 / 共15页
第七章 主成分分析he因子分析.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

第七章 主成分分析he因子分析.docx

《第七章 主成分分析he因子分析.docx》由会员分享,可在线阅读,更多相关《第七章 主成分分析he因子分析.docx(15页珍藏版)》请在冰豆网上搜索。

第七章 主成分分析he因子分析.docx

第七章主成分分析he因子分析

第七章主成分分析和因子分析实验报告

下表为2012年全国31个省、直辖市和自治区城镇居民家庭平均每人全年消费性支出的八个主要变量数据。

X1食品支出(元/人)X5家庭日用杂品(元/人)

X2衣着支出(元/人)X6交通通信(元/人)

X3居住支出(元/人)X7文教娱乐(元/人)

X4家庭设备及用品(元/人)X8医疗保健(元/人)

表7-12012年全国城镇居民平均每人全年消费性支出数据单位(元/人)

地区

X1

X2

X3

X4

X5

X6

X7

X8

北京

296.17

2638.90

1970.94

1610.70

604.57

3781.51

3695.98

1658.37

天津

564.76

1881.43

1854.22

1151.16

411.28

3083.37

2254.22

1556.35

河北

177.91

1541.99

1502.41

876.10

340.15

1723.75

1203.80

1047.28

山西

73.25

1529.47

1438.88

832.52

296.06

1672.29

1506.20

905.88

内蒙古

144.44

2730.23

1583.56

1242.64

446.86

2572.93

1971.78

1354.09

辽宁

474.35

2042.40

1433.28

1069.65

480.07

2323.29

1843.89

1309.62

吉林

208.16

2044.80

1594.14

871.46

419.61

1780.67

1642.70

1447.50

黑龙江

213.69

1806.92

1336.85

742.22

338.71

1462.61

1216.56

1180.67

上海

1011.40

2111.17

1790.48

1906.49

784.85

4563.80

3723.74

1016.65

江苏

542.92

1915.97

1437.08

1288.42

533.96

2689.51

3077.76

1058.11

浙江

949.22

2109.58

1551.69

1161.39

475.71

4133.50

2996.59

1228.02

安徽

268.20

1540.66

1396.97

811.23

244.31

1809.72

1932.74

1142.96

福建

1219.95

1634.21

1753.86

1254.71

535.75

2961.78

2104.83

773.22

江西

291.38

1476.63

1173.91

966.23

442.49

1501.34

1487.30

670.71

山东

384.33

2196.98

1572.35

1125.99

406.20

2370.23

1655.91

1005.25

河南

105.77

1885.99

1190.81

1145.42

395.96

1730.35

1525.33

1085.47

湖北

334.46

1783.41

1371.15

978.26

405.30

1476.98

1651.92

1029.55

湖南

272.49

1624.57

1301.60

1034.30

442.86

2084.15

1737.64

918.41

广东

792.27

1520.59

2099.75

1467.20

695.32

4176.66

2954.13

1048.28

广西

378.22

1146.46

1377.26

1125.39

369.54

2088.64

1626.05

883.56

海南

963.24

864.96

1521.04

777.20

420.37

2004.34

1319.54

993.24

重庆

266.13

2228.76

1177.02

1196.03

499.73

1903.24

1470.64

1101.56

四川

185.40

1651.14

1284.09

1097.93

482.16

1946.72

1587.43

772.75

贵州

99.05

1399.00

1013.53

849.94

401.78

1891.03

1396.00

654.53

云南

116.62

1759.89

973.76

634.09

274.62

2264.23

1434.30

939.13

西藏

50.96

1361.57

845.18

474.69

233.80

1387.45

550.48

467.23

陕西

116.03

1789.06

1322.22

986.82

447.07

1788.38

2078.52

1212.44

甘肃

88.24

1631.40

1287.93

833.15

338.12

1575.67

1388.21

1049.65

青海

112.87

1512.24

1232.39

923.70

327.76

1549.76

1097.21

906.14

宁夏

81.17

1875.70

1193.37

929.01

401.24

2110.41

1515.91

1063.09

新疆

115.34

2031.14

1166.59

950.17

466.46

1660.27

1280.81

1027.60

资料来源:

2013《中国统计年鉴》

根据上述八个指标,下面用spss17.0对全国各地区城镇居民消费构成进行主成分分析和因子分析。

一、软件操作

(一)操作步骤

1.定义变量,输入数据。

2.在SPSS窗口中选择Analyze/DimensionReduction/Factor,调出主成分分析主界面,并将变量X1至X8八个数据变量移入Variables框中,如图7-1所示。

图7-1因子分析主对话框

3.单击【Descriptives】按钮,展开描述统计量对话框。

(1)在“Statistics”中选择要输出的统计量:

UnivariateDescriptives输出单变量描述统计量和Initialsolution,输出初始因子分析结果。

(2)在“CorrelationMatrix”中,选择要输出的相关矩阵:

①Coefficients,输出原始变量间的相关系数矩阵;

②Significancelevels,输出显著性检验的P值;

③KMOandBartlett’stestofsohericity输出KMO测度和巴特利特球体检验。

图7-2选择描述统计量的子对话框

4.点击【Extraction】按钮,展开因子提取对话框。

(1)在Method(因子提取方法)参数框中,选择PrincipalComponents:

主成分法。

(2)在Analyze(分析矩阵)中,选择Correlationmatrix(分析矩阵)。

(3)在Extract栏中选择Numberoffactors(直接指定提取的因子个数),设定为3。

(4)在Display中选择Unrotatedfactorsolution,输出旋转前的因子分析结果。

单击Continue按钮,返回主界面。

图7-3因子提取主对话框

5.点击Rotation(旋转)按钮,在Method(旋转方法)中,选择Varimax,最大方差旋转项,在Display中选择Rotatedsolution,输出旋转后的结果。

单击Continue按钮,返回主界面。

图7-4旋转方法选择子对话框

6.点击Scores(因子得分)按钮,展开“FactorScores”因子得分对话框。

选择Saveasvariables,在Method中,选择Regression,回归法。

选择Displayfactorscorecoefficientmatrix,输出因子得分系数矩阵。

点击Continue,返回主界面。

图7-5因子得分选择项子对话框

7.点击Options按钮,在MissingValues(缺失值)中选择处理缺失值的方法,选择ExcludecasesListwise,有缺失值的观测量一律剔除。

在“Coefficentdisplayformat”中,选择因子载荷系数的输出方式,选择“Sortedbysize”,按绝对值大小排列。

如下图7-6所示。

图7-6选择输出项对话框

8.在主对话框中,单击【OK】按钮执行运行,输出结果如下。

(二)主要运行结果解释

1.单变量描述统计量(DescriptivesStatistics)

下表给出了单变量描述统计量的均值、标准差和参与计算的观测量数。

表7-2DescriptiveStatistics

Mean

Std.Deviation

AnalysisN

x1

351.5610

318.30794

31

x2

1782.8135

388.89271

31

x3

1411.2358

283.12264

31

x4

1042.3939

283.24540

31

x5

431.0539

118.55732

31

x6

2260.2768

861.61451

31

x7

1836.3910

739.15111

31

x8

1048.6229

253.74984

31

2.原始变量的相关矩阵(CorrelationMatrix)

表7-3CorrelationMatrix

x1

x2

x3

x4

x5

x6

x7

x8

Correlation

x1

1.000

-.063

.632

.537

.611

.706

.576

.070

x2

-.063

1.000

.305

.508

.383

.385

.470

.646

x3

.632

.305

1.000

.708

.641

.742

.736

.584

x4

.537

.508

.708

1.000

.900

.802

.857

.367

x5

.611

.383

.641

.900

1.000

.771

.787

.245

x6

.706

.385

.742

.802

.771

1.000

.890

.362

x7

.576

.470

.736

.857

.787

.890

1.000

.488

x8

.070

.646

.584

.367

.245

.362

.488

1.000

Sig.(1-tailed)

x1

.368

.000

.001

.000

.000

.000

.353

x2

.368

.047

.002

.017

.016

.004

.000

x3

.000

.047

.000

.000

.000

.000

.000

x4

.001

.002

.000

.000

.000

.000

.021

x5

.000

.017

.000

.000

.000

.000

.092

x6

.000

.016

.000

.000

.000

.000

.023

x7

.000

.004

.000

.000

.000

.000

.003

x8

.353

.000

.000

.021

.092

.023

.003

上表为8个原始变量的相关矩阵与单尾检验显著性检验。

可见多个变量之间相关系数较大,说明这些变量之间存在着较为显著的相关性,且其对应的Sig值普遍较小,根据以上分析,这些数据有进行因子分析的必要。

3.KMO检验法和巴特利特球形检验法(KMOandBartlettTestofSphericity)的检验结果。

表7-4KMOandBartlett'sTest

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.

.768

Bartlett'sTestofSphericity

Approx.Chi-Square

222.767

df

28

Sig.

.000

Bartlett球形检验统计量的Sig<0.01,认为各变量之间存在着显著的相关性。

一般,KMO大于0.9时效果最佳,0.7以上可以接受,0.5以下不宜作因子分析。

可见检验结果Sig<0.01且KMO>0.7,认为适合作因子分析。

4.总方差分解(TotalVarianceExplained)

表7-5TotalVarianceExplained

(1)在“Components”中,给出各因子的序号。

(2)在”InitialEigenvalues”中,给出了相关矩阵或协方差矩阵,其中:

Total:

给出各因子的特征值。

%ofvariance:

给出各因子所解释的方差占总方差的百分比。

Cumulative%:

给出各因子方差占总方差的累计百分比。

(3)在“ExtractionSumsofSquaredLoadings”中,给出提取若干因子后的特征值、方差百分比、累计方差百分比。

由于前三个特征值累计贡献率达到90.042%,根据累计贡献率大于85%的原则,本例提取前三个特征值。

5.旋转前的因子载荷矩阵(ComponentMatrix)

表7-6ComponentMatrixa

Component

1

2

3

x7

.936

.001

-.057

x4

.920

-.028

-.280

x6

.918

-.167

-.014

x5

.873

-.188

-.317

x3

.853

-.027

.409

x1

.675

-.596

.247

x2

.530

.738

-.283

x8

.545

.690

.430

ExtractionMethod:

PrincipalComponentAnalysis.

a.3componentsextracted.

6.表7-5给出旋转前的因子载荷矩阵,计算出相应的特征向量(用前初始因子载荷矩阵的列元素分别除以相应的特征根的平方根),见表7-6所示。

表7-7特征向量

第一特征向量

第二特征向量

第三特征向量

0.4150

0.0008

-0.0694

0.4079

-0.0233

-0.3408

0.4070

-0.1392

-0.0170

0.3870

-0.1567

-0.3858

0.3782

-0.0225

0.4978

0.2992

-0.4967

0.3006

0.2350

0.6150

-0.3445

0.2416

0.5750

0.5234

根据表7-6得到3个主成分的表达式:

Y1=0.2992X1+0.2350X2+0.3782X3+0.4079X4+0.3870X5+0.4070X6+0.4150X7

+0.2416X8

Y2=-0.4967X1+0.6150X2-0.0225X3-0.0233X4-0.1567X5-0.1392X6+0.0008X7

+0.5750X8

Y3=0.3006X1-0.3445X2+0.4978X3-0.3408X4-0.3858X5-0.0170X6-0.0694X7

+0.5234X8

7.旋转后的因子载荷矩阵(RotatedComponentMatrix)

表7-8RotatedComponentMatrixa

Component

1

2

3

x5

.890

.316

.080

x4

.885

.284

.247

x7

.753

.432

.354

x6

.730

.539

.219

x1

.424

.817

-.155

x3

.398

.728

.456

x8

.073

.220

.951

x2

.507

-.308

.744

ExtractionMethod:

PrincipalComponentAnalysis.

RotationMethod:

VarimaxwithKaiserNormalization.

a.Rotationconvergedin9iterations.

旋转后每个公因子上的载荷分配的更清晰,因子变量代表的变量相对集中,比未旋转时更容易解释各因子的意义。

载荷绝对值较大的因子与变量的关系更为密切,也更能代表这个变量。

8.因子得分矩阵(ComponentScoresCoefficientMatrix)

表7-9ComponentScoreCoefficientMatrix

Component

1

2

3

x1

-.086

.533

-.175

x2

.291

-.502

.336

x3

-.253

.515

.257

x4

.403

-.187

-.086

x5

.443

-.173

-.203

x6

.164

.136

-.034

x7

.194

.034

.045

x8

-.372

.251

.667

ExtractionMethod:

PrincipalComponentAnalysis.

RotationMethod:

VarimaxwithKaiserNormalization.

ComponentScores.

9.各样品的因子得分及综合得分

在DataView窗口的当前数据集中,文件中增加了4列FAC1-1(第一因子得分)、FAC2-1(第二因子得分)、FAC3-1(第三因子得分)和zf(综合得分)。

图7-7因子得分新变量

其中,zf(综合得分)=40.952%*FAC1-1+24.962%*FAC2-1+24.129%*FAC3-1

计算方法如下:

图7-8综合得分计算方法

最终全国各个省市综合得分如下表所示(保留两位小数)。

表7-10各省市综合得分情况

序号

FAC1_1

FAC2_1

FAC3_1

zf

序号

FAC1_1

FAC2_1

FAC3_1

zf

1

24.13

0.12

2.47

1.24

17

-0.32

-0.17

0.01

-0.17

2

-0.78

1.64

1.70

0.50

18

0.17

-0.30

-0.55

-0.14

3

-1.06

0.31

0.15

-0.32

19

1.32

2.02

-0.43

0.94

4

-0.93

0.00

-0.12

-0.41

20

-0.41

0.64

-0.96

-0.24

5

0.60

-1.05

1.80

0.42

21

-1.47

2.48

-1.10

-0.25

6

-0.01

0.09

0.77

0.21

22

0.80

-1.37

0.19

0.03

7

-0.94

0.19

1.60

0.05

23

0.61

-0.78

-0.97

-0.18

8

-1.16

-0.09

0.62

-0.35

24

0.15

-0.95

-1.49

-0.54

9

3.26

0.70

-0.66

1.35

25

-0.67

-0.79

-0.21

-0.52

10

1.15

0.02

-0.13

0.44

26

-0.92

-1.10

-1.78

-1.08

11

0.69

1.22

0.44

0.69

27

-0.14

-0.45

0.51

-0.05

12

-1.37

0.60

0.48

-0.30

28

-0.83

-0.32

0.13

-0.39

13

0.65

1.83

-1.27

0.41

29

-0.65

-0.43

-0.44

-0.48

14

0.25

-0.61

-1.43

-0.39

30

-0.07

-0.87

0.14

-0.21

15

0.22

-0.24

0.37

0.12

31

0.24

-1.29

0.02

-0.22

16

0.12

-1.02

0.15

-0.17

二、结果分析

根据各省市综合得分进行排名,得出全国消费能力排名表,如下表7-11所示。

表7-11综合得分排名

省份

排名

得分

省份

排名

得分

上海

1

1.35

四川

17

-0.18

北京

2

1.24

宁夏

18

-0.21

广东

3

0.94

新疆

19

-0.22

浙江

4

0.69

广西

20

-0.24

天津

5

0.5

海南

21

-0.25

江苏

6

0.44

安徽

22

-0.3

内蒙古

7

0.42

河北

23

-0.32

福建

8

0.41

黑龙江

24

-0.35

辽宁

9

0.21

甘肃

25

-0.39

山东

10

0.12

江西

26

-0.39

吉林

11

0.05

山西

27

-0.41

重庆

12

0.03

青海

28

-0.48

陕西

13

-0.05

云南

29

-0.52

湖南

14

-0.14

贵州

30

-0.54

河南

15

-0.17

西藏

31

-1.08

湖北

16

-0.17

从总得分结果来看,上海综合得分最高为1.35,其次北京、广东分数都较高,说明这些省份消费能力强,排在全国前列,即为通常所说北上广。

浙江、天津、江苏等消费能力也较强。

而西藏-1.08最低,贵州、云南、青海等地综合得分都较低,说明消费能力较弱。

其余省份处于全国消费能力一般水平,结果与实际各省经济情况相符

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 工作计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1