spss样本聚类案例分析.docx

资源描述

spss样本聚类案例分析.docx

《spss样本聚类案例分析.docx》由会员分享，可在线阅读，更多相关《spss样本聚类案例分析.docx（22页珍藏版）》请在冰豆网上搜索。

spss样本聚类案例分析.docx

spss样本聚类案例分析

原数据

1.1样本聚类（Q聚类）

聚类表

阶

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

群集1

群集2

.855

1.379

1.772

1.776

2.451

2.772

4.322

4.557

4.895

5.500

7.740

8.314

12.790

16.650

通过系数做出其散点图

群集成员

案例

5群集

4群集

3群集

Case1

Case2

Case3

Case4

Case5

Case6

Case7

Case8

Case9

10:

Case10

11:

Case11

12:

Case12

13:

Case13

14:

Case14

15:

Case15

1.2变量聚类（R聚类）

近似矩阵

案例

矩阵文件输入

总人口

从业人员

土地面积

耕地面积

财政收入

粮食产量

总人口

1.000

.857

.698

.714

.512

.043

从业人员

.857

1.000

.597

.570

.643

.277

土地面积

.698

.597

1.000

.856

.044

-.147

耕地面积

.714

.570

.856

1.000

-.001

-.335

财政收入

.512

.643

.044

-.001

1.000

.342

粮食产量

.043

.277

-.147

-.335

.342

1.000

聚类表

阶

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

群集1

群集2

.857

.856

.645

.342

.129

群集成员

案例

5群集

4群集

3群集

总人口

从业人员

土地面积

耕地面积

财政收入

粮食产量

2.K—均值聚类

原数据

描述统计量

极小值

极大值

均值

标准差

身高月平均增长率

.34

11.03

1.8842

2.56342

体重月平均增长率

.49

50.30

5.6363

11.71814

胸围月平均增长率

.16

11.81

1.4958

2.79339

坐高月平均增长率

.14

11.27

1.7111

2.80709

有效的N（列表状态）

输出结果：

初始聚类中心

聚类

Zscore（身高月平均增长率）

3.56781

1.39883

.66153

.04907

-.60240

Zscore（体重月平均增长率）

3.81150

1.16603

.35959

-.12513

-.43918

Zscore（胸围月平均增长率）

3.69236

1.32606

.58861

-.00923

-.47104

Zscore（坐高月平均增长率）

3.40529

1.94826

.14212

-.04669

-.55255

迭代历史记录a

迭代

聚类中心内的更改

.000

.208

.183

.000

a.由于聚类中心内没有改动或改动较小而达到收敛。

任何中心的最大绝对坐标更改为.000。

当前迭代为2。

初始中心间的最小距离为.996。

聚类成员

案例号

月份

聚类

距离

dimension0

.000

.208

.258

.312

.194

.297

.245

.065

.070

.112

.045

.119

.051

.103

.166

.074

.183

最终聚类中心

聚类

Zscore（身高月平均增长率）

3.56781

1.39883

.66153

.02859

-.47855

Zscore（体重月平均增长率）

3.81150

1.16603

.35959

-.19084

-.38115

Zscore（胸围月平均增长率）

3.69236

1.32606

.58861

-.20255

-.39974

Zscore（坐高月平均增长率）

3.40529

1.94826

.14212

-.01106

-.45429

最终聚类中心间的距离

聚类

4.407

6.375

7.442

8.099

4.407

2.236

3.146

3.830

6.375

2.236

1.163

1.784

7.442

3.146

1.163

.727

8.099

3.830

1.784

.727

ANOVA

聚类

误差

Sig.

均方

Zscore（身高月平均增长率）

4.469

.009

500.431

.000

Zscore（体重月平均增长率）

4.476

.007

662.430

.000

Zscore（胸围月平均增长率）

4.455

.013

346.563

.000

Zscore（坐高月平均增长率）

4.472

.008

563.652

.000

F检验应仅用于描述性目的，因为选中的聚类将被用来最大化不同聚类中的案例间的差别。

观测到的显著性水平并未据此进行更正，因此无法将其解释为是对聚类均值相等这一假设的检验。

每个聚类中的案例数

聚类

1.000

4.000

12.000

有效

19.000

缺失

6.000

3.线性回归

研究变量间的非确定性关系，构造变量间经验公式的数理统计方法称为回归分析。

根据自变量的个数，分为一元线性回归和多元线性回归。

3.1一元线性回归

原数据

输入／移去的变量b

模型

输入的变量

移去的变量

方法

咖啡类饮料销售量,固体冲泡饮料销售量,茶饮料销售量,碳酸饮料销售量a

输入

a.已输入所有请求的变量。

b.因变量:

果汁销售量

模型汇总

模型

R方

调整R方

标准估计的误差

.997a

.994

.992

.44012

a.预测变量:

（常量）,咖啡类饮料销售量,固体冲泡饮料销售量,茶饮料销售量,碳酸饮料销售量。

Anovab

模型

平方和

均方

Sig.

回归

338.056

84.514

436.306

.000a

残差

1.937

.194

总计

339.993

a.预测变量:

（常量）,咖啡类饮料销售量,固体冲泡饮料销售量,茶饮料销售量,碳酸饮料销售量。

b.因变量:

果汁销售量

系数a

模型

非标准化系数

标准系数

Sig.

标准误差

试用版

（常量）

17.296

.470

36.830

.000

碳酸饮料销售量

.043

.018

.170

2.427

.036

茶饮料销售量

.265

.021

.726

12.852

.000

固体冲泡饮料销售量

-.004

.034

-.009

-.117

.909

咖啡类饮料销售量

-.238

.013

-.455

-18.640

.000

a.因变量:

果汁销售量

3.2多元线性回归

原数据

输出结果：

输入／移去的变量b

模型

输入的变量

移去的变量

方法

X4,X1,X2,X3a

输入

a.已输入所有请求的变量。

b.因变量:

模型汇总b

模型

R方

调整R方

标准估计的误差

.894a

.799

.726

.619

a.预测变量:

（常量）,X4,X1,X2,X3。

b.因变量:

Anovab

模型

平方和

均方

Sig.

回归

16.779

4.195

10.930

.001a

残差

4.221

.384

总计

21.000

a.预测变量:

（常量）,X4,X1,X2,X3。

b.因变量:

展开阅读全文