主成分分析和聚类分析DOCWord文档下载推荐.docx

上传人:b****6 文档编号:20696131 上传时间:2023-01-25 格式:DOCX 页数:19 大小:116.15KB
下载 相关 举报
主成分分析和聚类分析DOCWord文档下载推荐.docx_第1页
第1页 / 共19页
主成分分析和聚类分析DOCWord文档下载推荐.docx_第2页
第2页 / 共19页
主成分分析和聚类分析DOCWord文档下载推荐.docx_第3页
第3页 / 共19页
主成分分析和聚类分析DOCWord文档下载推荐.docx_第4页
第4页 / 共19页
主成分分析和聚类分析DOCWord文档下载推荐.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

主成分分析和聚类分析DOCWord文档下载推荐.docx

《主成分分析和聚类分析DOCWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《主成分分析和聚类分析DOCWord文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。

主成分分析和聚类分析DOCWord文档下载推荐.docx

并与

(1)的结果进行比较

【实验步骤】

(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)

1

1)

相关矩阵

V2

V3

V4

V5

V6

V7

V8

V9

相关

1.000

.334

-.055

-.061

-.289

.199

.349

.319

-.023

.399

-.156

.711

.414

.835

.533

.497

.033

-.139

-.258

.698

.468

-.171

.313

.280

-.208

-.081

.417

.702

 

2)

表:

方差贡献率和累计贡献率

解释的总方差

成份

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

3.096

38.704

3.079

38.485

2

2.367

29.590

68.294

2.385

29.809

3

.920

11.500

79.794

4

.706

8.824

88.618

5

.498

6.231

94.848

6

.230

2.874

97.722

7

.131

1.635

99.357

8

.051

.643

100.000

提取方法:

主成份分析。

由上图可知,只有前两个成分的特征值大于1,所以只选择前两个主成分。

第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。

前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。

最终聚类中心

聚类

8.79

8.48

10.38

47.05

31.14

70.37

8.82

7.07

6.76

12.80

9.14

16.73

16.96

16.31

17.29

10.21

18.56

1.88

1.78

3.09

13.63

11.51

24.20

2

每个聚类中的案例数

10.000

18.000

2.000

有效

30.000

缺失

.000

由上图可知,聚类2包含样本数最多,聚类3包含样本数最少。

通过K中心聚类分析,可以对我国各地区生活中的人均支出类别情况有一个基本的了解。

我们可以将不同地区的人均消费情况分为3类;

其中第二类包含的省市最多,有18个,其他两类包含城市较少。

通过分析结果也可知每个地区所属类别。

(2)

按最短距离法(最近邻居距离)对样本进行谱系聚类分析

聚类表

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

3.299

15

4.854

4.910

9

6.314

12

13

10.409

10

10.539

11.730

12.469

14

11

15.194

17.539

16

18.698

18

19.264

20.778

22.778

25.407

17

27.956

19

24

25

33.748

37.414

20

37.945

38.070

23

21

22

39.765

47.432

52.468

26

64.048

82.053

27

82.066

28

259.409

29

300.223

30

396.775

由聚类表可知聚类的具体过程。

以第一步为例,样品1和2合并为一类,距离系数为3.299,在“首次出现阶段集群”里显示为0,因此合并两项都是第一次出现,合并结果取15,即归为第15类。

群集成员

案例

3群集

1:

山西

2:

内蒙古

3:

吉林

4:

黑龙江

5:

河南

6:

甘肃

7:

青海

8:

河北

9:

陕西

10:

宁夏

11:

新疆

12:

湖北

13:

云南

14:

湖南

15:

安徽

16:

贵州

17:

辽宁

18:

四川

19:

山东

20:

江西

21:

福建

22:

广西

23:

海南

24:

天津

25:

江苏

26:

浙江

27:

北京

28:

西藏

29:

上海

30:

广东

集群成员表如图,当划分为3个类别时,各个地区所属类别。

与上一问所得结论有较大出入。

上图直观的反应了样品逐步合并的过程。

最长距离法(最远邻居距离)

12.276

15.294

17.559

27.077

28.855

40.887

49.520

67.778

68.931

86.817

102.216

160.503

219.108

333.013

459.195

821.706

846.540

3198.129

类平均距离法(组间平均距离)

8.593

13.512

17.549

21.704

24.981

32.350

32.651

40.437

47.824

68.645

74.041

74.824

110.184

126.926

134.045

197.455

453.036

489.847

1591.227

重心距离法

7.379

11.933

14.947

15.250

23.080

19.932

27.520

32.272

53.945

64.883

65.605

91.421

94.200

106.723

141.246

346.674

375.156

1368.518

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1