Spss大作业.docx

资源描述

Spss大作业.docx

《Spss大作业.docx》由会员分享，可在线阅读，更多相关《Spss大作业.docx（12页珍藏版）》请在冰豆网上搜索。

Spss大作业.docx

Spss大作业

大作业

汽车市场研究

问题描述

以往在我国各地汽车需求量的研究中，主要是根据国家政策、国民经济发展情况、各地区公路状况等，总和不同时期汽车保有量，对汽车市场进行定性分析和决策，这样往往带有主观因素，下面为一组可能影响汽车保有量的数据，部分数据如图，用合理的方法对数据进行研究。

北東

139489

11R11

29097

5094

尾IZ人I□魁散（方人｝

'920.11

19260

2600

424J

L—3

河北

2049.52

6437

51630

59660

72.64

山茜

10924B

3077

33644

39774

33.29

向蒙古

S3280

2264

44763

24394

2212

ilt

2793.37

4092

43434

6997E

63.90

1129.20

2552

31321

20478

23.61

2014.53

3701

40819

19201

3636

上海

2462.57

1415

3737

24645

3071

江苏

5155.25

7066

25970

4957E

5119

一层次聚类、求解思路

用层次聚类的方法，分析与预测各个地区的汽车市场发展情况

首先对原始数据进行标准化变换处理，经过运算使得每列数据的平均值为0,方差为1,这样原始数据中5列具有不同比较标准的数据就能放在一起比较；然后用标准化后的30个不同地区数据求出欧式距离；最后米用Wald离差平方和法。

、问题求解与分析

通过SPSS软件求解的结果与分析：

结果分析：

图为层次分析的凝聚状态表，第一列为聚类步骤，表示共进行了29个步骤的分析；第二列和第三列表示某部聚类分析中，哪两个样本或聚类成了一类；第四列表示两个样本或类间距，从图看出，距离小的样本之间先聚类；第五列和第六列表示某步聚类分析中，参与聚类的是样本还是类，0表示样本；第七列表示本步聚类分析结果在下面聚类的第几步中用到。

AgglomerationSchedule

Cluster

Combined

StageCluster

FirstAppears

Stag

Cluste

Coeffici

ents

Cluster1

Cluster2

Stage

.010

.025

.040

.056

.081

.107

.136

.169

.213

.269

.328

.395

.469

.559

.650

.766

.887

结果分析：

图将30个样本分为三类,

第一类包括1、2、6、9、10、11,

Cluster

Membership

Case

Cluster

北京

天津

河北

山西

内蒙

古

辽宁

吉林

黑龙

江

上海

10:

江

苏

11:

浙

江

12:

安

徽

13:

福

建

14:

江

西

15:

山

东

16:

河

南

17:

湖

北

18:

湖

南

19:

广

东

20:

广

西

21:

海

南

22:

四

川

23:

贵

州

24:

云

南

25:

西

藏

26:

陕

西

27:

甘

肃

28:

青

海

29:

宁

夏

30:

新

疆

结果分析：

图是层次聚类分析的树形图，由于部分样本或小类之间的距离较小，因此光从该图很难清晰看出哪几个样本先聚类，这时应借助于图进行判别。

*******************H

IERARCHICALCLUSTER

ANALYSIS***********

Rescaled

DistaneeClusterCombine

CASE

1520

安徽

河南

广东

四川

吉林

陕

西

26k

湖

南

181

河

北

3—

东15

贵

州23

青

海28

西

藏25

黑龙

江8

夏29

内蒙

古5

新

疆30

湖

北17

江

西14

肃27

建13

南21

天

津2

浙

江11

上

海9

北京11

江苏10k

辽宁

总分析：

第一类反应的是我国经济发展较发达地区与相对欠发达地区。

1、2、9代表为北京、天津、上海三个直辖市，在全国具有举足轻重的地位，它们的汽车市场发展仍将处于全国领先水平；6、10、11代表辽宁、江苏、浙江，由于地理、人口、气候及交通等原因，汽车市场的发展将作为今后发展的重要因素，带动这些地区经济的腾飞。

第二类中10个元素，分别代表陕西、山东、陕西等，这些地区从经济发展看处于中等水平，将是今后汽车发展的大市场。

第三类为内蒙古、宁夏、新疆等，这些地区相对来说经济发展较慢，汽车发展空间不大。

二多元线性回归分析

求解思路

用多远线性回归的方法，分析国内生产总值、地区人口总数、地区公路长度、全社会货运量对汽车保有量是否有影响。

首先自变量强制进入，不用管个因素质量如何，对回归方程是否有影响；然后选择输出默认输出项，输出回归系数的标准误差、标准回归系数等；最后选择Modelfit和Descriptives,输出判定系数、自变量与因变量的均值、标准差等。

问题求解与分析通过SPSS软件求解的结果与分析:

DescriptiveStatistics

Mean

Std.

Deviation

汽车总保有量

（万辆）

国内生产总值

（亿元）

地区人口总数

（万人）

地区公路长度

（km）

全社会货运量

（万吨）

结果分析：

图为四个自变量和一个因变量的平均值、方差和个案数为

30。

VariablesEntered/Removed

Model

Variables

Entered

Variables

Removed

Method

全社会货运量

（万吨），地区公路长度

（km,国内生产总值（亿元），地区人口总数（万人）a

Enter

a.Allrequestedvariablesentered.

VariablesEntered/Removed

Model

Variables

Entered

Variables

Removed

Method

全社会货运量

（万吨），地区公路长度

（km）,国内生产总值（亿元），地区人口总数（万人）a

Enter

b.DependentVariable:

汽车总保有量（万辆）

结果分析：

图2.2中第二列为被引入的变量，第三列为从回归方程中被剔除的各个变量，第四列为进入方式。

ModelSummary

Model

RSquare

AdjustedR

Square

Std.ErroroftheEstimate

.916a

.838

.812

a.Predictors:

（Constant）,全社会货运量（万吨），地

区公路长度（km,国内生产总值（亿元），地区人口

总数（万人）

图

结果分析：

图输出常用统计量关系数R为，调整的判定系数为，回归

估计的标准误差s=。

anoVA

Model

Sumof

Squares

Mean

Square

Sig.

1Regressi

.000a

Residual

Total

a.Predictors:

（Constant）,全社会货运量（万吨），地区公

路长度（km,国内生产总值（亿元），地区人口总数（万人）

b.DependentVariable:

汽车总保有量（万辆）

图

结果分析：

图为方差分析表，统计量F二；相伴概率p=0,说明多个变量

与因变量之间存在线性回归关系。

Coefficients

Model

Unstandardized

Coefficients

Standardized

Coefficients

Sig.

Std.

Error

Beta

1（Constant）

.404

.690

国内生产总值

（亿元）

.010

.003

.606

.002

地区人口总数

（万人）

.002

.009

地区公路长度

（km

.000

.237

.100

全社会货运量

（万吨）

.001

.000

.603

.002

a.DependentVariable:

汽车总保有量（万

辆）

图

结果分析：

图为回归系数分析，UnstandardizedCoefficients为非

标准化系数，StandardizedCoefficients为标准化系数，t为回归系数检验统计量，Sig为相伴概率，从图看出各个自变量与因变量的线性回归分析关系不显著。

总分析：

四个因变量对因变量的影响作用不显著

展开阅读全文