各地区生产总值及构成项目的差异.docx

上传人:b****5 文档编号:8639421 上传时间:2023-02-01 格式:DOCX 页数:24 大小:656.86KB
下载 相关 举报
各地区生产总值及构成项目的差异.docx_第1页
第1页 / 共24页
各地区生产总值及构成项目的差异.docx_第2页
第2页 / 共24页
各地区生产总值及构成项目的差异.docx_第3页
第3页 / 共24页
各地区生产总值及构成项目的差异.docx_第4页
第4页 / 共24页
各地区生产总值及构成项目的差异.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

各地区生产总值及构成项目的差异.docx

《各地区生产总值及构成项目的差异.docx》由会员分享,可在线阅读,更多相关《各地区生产总值及构成项目的差异.docx(24页珍藏版)》请在冰豆网上搜索。

各地区生产总值及构成项目的差异.docx

各地区生产总值及构成项目的差异

目录

1实训的题目与数据1

1.1实训的题目与目的1

1.2样本与变量1

1.3数据文件1

2统计软件操作3

2.1对我国收入生产总值及构成项目差异的描述性统计分析3

2.1.1对我国收入生产总值及构成项目差异的统计软件处理3

2.1.2对我国收入生产总值及构成项目差异的计算结果的说明4

2.2对我国收入生产总值及构成项目差异的多元线性分析5

2.2.1对我国收入生产总值及构成项目差异的多元线性软件处理5

2.2.2对我国收入生产总值及构成项目差异的多元线性计算结果的说明10

2.3对我国收入生产总值及构成项目差异的聚类分析15

2.3.1对我国收入生产总值及构成项目差异的聚类分析的软件处理15

2.3.1对我国收入生产总值及构成项目差异的聚类分析的计算结果的说明19

3对我国收入生产总值及构成项目差异的研究结论23

3.1我国收入生产总值差距过大23

3.2劳动者报酬占收入生产总值比重最高23

3.3我国东中西部收入生产总值差距过大23

参考文献24

1实训的题目与数据

1.1实训的题目与目的

(1)实训的题目:

2013我国生产总值及构成项目的差异分析

(2)实训的目的:

了解我国各地区生产总值之间的差异以及构成项目之间的差异。

1.2样本与变量

样本为我国31个省、自治区、直辖市(不包括港澳台),变量为y1营业盈余、y2固定资产折旧、y3生产税净额、y4劳动者报酬、y5收入生产总值。

1.3数据文件

依据2013年《中国统计年鉴》选取我国31个省、自治区、直辖市(不包括港澳台)的营业盈余、固定资产折旧、生产税净额、劳动者报酬、收入生产总值。

原始数据见表1。

表12013我国各地区生产总值及构成项目的差异

资料来源:

2013年《中国统计年鉴》。

 

2统计软件操作

2.1对我国收入生产总值及构成项目差异的描述性统计分析

2.1.1对我国收入生产总值及构成项目差异的统计软件处理

(1)调出主菜单(Analyze/DescriptiveStatistics/Descriptives)

首先打开要进行描述统计分析的数据文件。

其次在SPSS统计软件数据数据编辑窗口,依次点击Analyze/DescriptiveStatistics/Descriptives,调出描述统计主菜单并进入描述统计主对话框Descriptive(见图1)。

(2)主对话框的设置

在描述统计主对话框中,从左侧的源变量框中将研究变量y1、y2、y3、y4、y5等调入到右侧的Variable(s)框中。

同时选择对话框左下角的Savestandardizedvaluesasvariables,输出各个变量的标准化值(见图2)。

(3)二级对话框的设置(Optins)

在主对话框中,点击Options按钮,进入二级对话框Descriptives:

Optins。

在二级对话框中,根据研究目的选择需要计算的指标,如均值Mean、标准差Std.deviation、最小值Minimum、最大值Maximum、偏度Skewness、峰度Kurtosis等(见图3)。

上述设置完成后,点击Continue返回主对话框。

(4)运行程序

图1描述统计菜单

图2描述统计主对话框的设置

图3描述统计二级对话框的设置

2.1.2对我国收入生产总值及构成项目差异的计算结果的说明

运行以上程序,即可得到描述统计分析的计算结果,并据此给出研究结论。

 

表2描述统计量

N

极小值

极大值

均值

标准差

营业盈余

31

112.65

18166.28

5251.7294

4448.86106

固定资产折旧

31

116.63

7763.87

2571.9077

2015.62725

生产税净额

31

75.86

9623.38

3253.8413

2386.54399

劳动者报酬

31

510.53

29809.60

9385.2742

7055.82470

收入生产总值

31

815.67

62474.79

20462.7523

15709.73731

有效的N(列表状态)

31

表2的计算结果是我国31个省、自治区、直辖市的收入生产总值及构成项目的平均水平、差异程度和分布形态。

在收入生产总值的均值中,劳动者报酬的均值最高,达到了9385.2742元;固定资产折旧最低,仅为2571.9077元。

离散程度最大的是收入生产总值,最小的是固定资产折旧。

2.2对我国收入生产总值及构成项目差异的多元线性分析

2.2.1对我国收入生产总值及构成项目差异的多元线性软件处理

(1)调出主菜单(Analyze/Regression/Linear)

在数据编辑窗口,依次点击Analyze/Regression/Linear,调出多元线性回归分析菜单并进入多元线性回归分析主对话框LinearRegression(见图4)

图4多元线性回归分析菜单

(2)主对话框的设置(Linear)

1 设置因变量。

在主对话框中,将因变量y5调入到主对话框右上角的因变量Dependent框中。

2 设置自变量。

设置完因变量后,在主对话框中,依次选择自变量y1,y2,y3,y4并调入到主对话框右侧中部的自变量框Independent(s)中。

3 设置自变量进入模型的方法。

在主对话框的右侧中部的Method框中,按照默认选项选择Enter(见图5)。

(3)各个二级对话框的设置

1 设置模型参数及有效性的检验1。

在主对话框中,点击Statistics,进入多元线性回归分析二级对话框LinearRegression:

Statistics。

在二级对话框中,主要进行以下设置。

●设置模型参数和模型参数有效性检验。

在RegressionCoefficients框中选择Estimates,输出模型参数及模型参数有效性检验的结果(即t检验)。

●设置模型的拟合优度检验和模型有效性检验。

选择右侧的Modelfit,输出模型的拟合优度检验和模型有效性检验的结果(即R检验与F检验)。

图5多元线性回归分析主对话框

●设置多重共线性检验。

选择右侧的Collinearitydiagnostics,输出多重共线性检验的结果(即VIF检验)。

●设置序列自相关检验。

在左侧的Residuals框中,选择Durbin-Watson,输出序列自相关检验结果(即DW检验)。

●设置异常值与强影响点检验。

在左侧的Reaiduals框中,选择Casewisediagnostics,输出异常值与强影响点检验的结果。

上述内容见图6。

完成后,点击Continue返回主对话框。

图6多元线性回归分析模型参数与有效性检验

2 设置模型参数有效性检验2。

在主对话框中,点击Plots,进入多元线性回归分析二级对话框LinearRegression:

Plots二级对话框。

在二级对话框中,主要进行以下设置。

●正态性检验。

在下方的StandardizedResidualPlots框中,选择Normalprobabilityplot,进行正态性检验。

●方差齐检验。

在左侧框中,选择ZPRED做X轴,选择ZRESID做Y轴,进行方差齐检验。

之后返回上级对话框(见图7)。

图7多元线性回归分析模拟有效性检验

3 设置输出内容与模型检验3。

在主对话框中,点击Save进入LinearRegression:

Save二级对话框。

在这个对话框中,主要有以下设置。

●输出点预测值。

在PredictedValues框中,选择Unstandardized,输出非标准化的点预测值。

●输出预测区间。

在PredictedValues框中,选择Individual,输出概率为95%的预测区间。

●因变量y的异常值和强影响点检验。

在Residuals框中分别选择标准化残差Standardized、学生化残差Studentized、剔除残差Deleted,进行因变量y的异常值和强影响点的检验。

●自变量x的异常值和强影响点检验。

在Distances框中,选择Cook’s库克距离,进行自变量x的异常值和强影响点的检验(见图8)。

上述设置完成后,返回到主对话框。

④设置自变量进入模型的条件。

在主对话框中,点击Options进入LinearRegression:

Option二级对话框,查看自变量进入模型或被剔除模型的条件(也可修改软件指定的条件)。

(4)运行程序(OK)

REGRESSION

/MISSINGLISTWISE

/STATISTICSCOEFFOUTSRANOVACOLLINTOL

/CRITERIA=PIN(.05)POUT(.10)CIN(95)

/NOORIGIN

/DEPENDENTy5

/METHOD=ENTERy1y2y4

/SCATTERPLOT=(*ZRESID,*ZPRED)

/RESIDUALSDURBIN

/CASEWISEPLOT(ZRESID)OUTLIERS(3)

/SAVEPREDCOOKICINSRESIDDRESID

图8多元线性回归分析模型输出项设置

2.2.2对我国收入生产总值及构成项目差异的多元线性计算结果的说明

(1)模型的分析建立

运用SPSS统计软件,计算得到多元线性回归分析的模型参数,见表3。

 

表3系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

207.231

145.225

1.427

.165

营业盈余

1.034

.094

.293

10.965

.000

.042

24.007

固定资产折旧

1.694

.253

.217

6.682

.000

.028

35.639

劳动者报酬

1.116

.049

.501

22.666

.000

.061

16.469

a.因变量:

收入生产总值

 

根据计算结果,可以得到多元线性回归模型:

lny5=207.231+1.034y1+1.694y2+1.116y4

该模型反映了三个构成项目对收入生产总值的影响方向和影响程度,表明三个构成项目的变动对收入生产总值的影响。

根据模型,我国2013年三个构成项目影响收入生产总值的弹性系数分别为1.034,1.694和1.116。

说明营业盈余和劳动者报酬的增加对收入生产总值增加的影响没有固定资产折旧的增加对收入生产总值增加的影响大。

固定资产折旧每增加1个百分点,收入生产总值九增加1.694个百分点。

说明目前情况下增加固定资产折旧收入是增加收入生产总值的最佳途径。

(2)模型有效性检验

1 拟合优度检验(R检验)。

拟合优度检验专门用来研究模型自变量与因变量之间的拟合程度。

 

表4模型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

1.000a

.999

.999

468.77486

2.599

a.预测变量:

(常量),劳动者报酬,营业盈余,固定资产折旧。

b.因变量:

收入生产总值

根据检验的计算结果,R,R方和调整R方分别为1.0,0.999和0.999,都属于高度相关,所以该多元线性回归模型的拟合优度较高,自变量对因变量的解释程度较高,模型显著有效。

2 序列自相关检验(DW检验)。

根据上面的拟合优度计算表,可以看到模型序列自相关的检验结果。

DW统计量为2.599。

根据序列自相关检验理论,DW统计量离DW的中心值较远,所以接受零假设,即基本认定模型存在序列自相关。

3 模型有效性检验(F检验)。

模型有效性检验是从整体上检验模型的有效性,这种检验对于多元线性回归模型非常重要。

检验方法一般采用F检验。

检验数据见表5。

表5Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

7397942140.765

3

2465980713.588

11221.762

.000b

残差

5933246.455

27

219749.869

总计

7403875387.220

30

a.因变量:

收入生产总值

b.预测变量:

(常量),劳动者报酬,营业盈余,固定资产折旧。

由于相伴,概率Sig小于显著性水平,所以拒绝零假设而接受备选假设即模型所有参数不同时为零,认为模型整体有效。

4 多重根据共线性检验(VIF检验)。

根据上面的模型建立的计算表(表3),可以看到模型多重共线性的检验结果。

根据容忍度Tol的计算结果,三个构成项目的Tol值分别是0.042,0.028,0.061,均接近普通临界值0,所以可以认定该模型存在严重的多重共线性。

若根据方差膨胀系数VIF的计算结果,三个产业的VIF值分别是24.007,35.639,16.469均大于普通临界值10,也可认为该模型存在严重的多重共线性。

图9P-P概率图

5 正态性检验。

根据P-P概率图,可以看到残差的实际累计概率与理论累计概率之间比较接近,可以认为残差的正态性假设基本成立,可以对此进行多元线性回归分析

图10残差散点图

6 方差齐检验。

根据图10所示的散点图,可以看到所有的散点都落在横轴、纵轴±3的范围之内,可以认为残差的方差齐假设基本成立,可以对此进行多元线性回归分析。

综上所述,多元线性回归分析模型有效性检验的基本结果是:

模型拟合优度较高,模拟整体有效,模型的多重共线性严重,模型的正态性和方差齐检验也都通过。

所以,整体模型有效,可以使用。

2.3对我国收入生产总值及构成项目差异的聚类分析

2.3.1对我国收入生产总值及构成项目差异的聚类分析的软件处理

(1)调出主菜单(Analyze/Classify/K-MeansCluster)

在数据编辑窗口,依次点击Analyze/Classify/K-MeansCluster,调出快速聚类分析菜单并进入快速聚类分析主对话框K-MeansClusterAnalysis(见图11)。

图11K-Means聚类分析分析菜单

(2)主对话框的设置

在K-Means聚类分析主对话框中,分别进行以下设置:

1聚类分析变量的设置

在主对话框中的左侧,分别选择5个变量“y1至y5”,调入到右侧的Variables框中。

2聚类对象(标签)的设置

选择字符型变量“地区”,调入到LabelCasesby框中。

3设置聚类数

在NumberofClusters框中指定分类数,此处设置为5(这个过程非常重要,一般要经过多次的尝试才可完成,一定要十分慎重)。

4聚类类中心的设置

聚类类中心的设置有2种方式:

●查找已有的类中心

点击左侧的Centers,可以调出查找已有类中心的对话框,通过查找已有的SPSS数据文件(类中心)作为本次聚类分析的类中心。

其前提是以前做过类似的聚类分析而有类中心;以前有过类似的聚类分析而又类中心。

●计算指定类中心

若以前没有做过本问题的聚类分析,也没有过类似的聚类分析,则由计算机(SPSS统计软件)代替用户而自动指定类中心。

此时,用户不用进行人户操作。

5设置聚类分析的方式

在Method框下选中Iterateandclassify,表示以初始类中心开始,经过一定的迭代过程,直到得到最后的类中心,聚类分析完毕(见图12)。

图12K-Means聚类分析主对话框的设置

(3)各个二级对话框的设计

1 设置聚类分析终止的条件

在主对话框中,点击Iterate按钮,进入K-MeansClusterAnalysis:

Iterate二级对话框。

按照默认的选项进行,用来设置程序终止的条件。

终止的条件有两个:

●计算次数

系统默认为10次,当计算达到10次时,则聚类分析自动终止。

但实际山,计算的次数在2-5次左右。

●移动距离

系统默认的类中心的移动距离为0.02(SPSS统计软件上看到的是0.000)。

若移动距离达不到0.02,则聚类分析自动终止。

这两个条件达到一个,聚类就结束(见图13)。

上述设置完成后,返回主对话框。

图13K-Means聚类分析终止条件的设置

2 设置保存内容

在主对话框中,点击Save按钮,进入K-MeansCluster:

SaveNewVariables二级对话框。

选择2个备选项ClusterMembership和Distancefromclustercenter,即保存聚类分析的类号和该个体距离其所属的类的类中心的距离(见图14)。

上述设置完成后,返回主对话框。

图14K-Means聚类分析保存内容的设置

3检验聚类分析变量的有效性

在主对话框中,点击Options按钮,进入K-MeansClusterAnalysis:

Options二级对话框。

●Statistics框

选中3个选项Initialclustercenters,即输出初始类中心,ANOVAtable以聚类分析产生的类为控制变量,对参与聚类分析的所有变量进行的单因素方差分析,目的是判断该变量是否有“资格”作为聚类分析的依据。

Clusterinformationforeachcase表示输出个案聚类信息及其距离所属类中心的距离

●MissingValues框

选择Exclues,表示去除所有含缺失值的个案后再进行聚类分析(见图15)。

上述设置完成后,返回主对话框

图15K-Means聚类分析保存内容的设置

(4)运行程序

QUICKCLUSTERy1y2y3y4y5

/MISSING=LISTWISE

/CRITERIA=CLUSTER(5)MXITER(10)CONVERGE(0)

/METHOD=KMEANS(NOUPDATE)

/SAVECLUSTERDISTANCE

/PRINTID(地区)INITIALANOVACLUSTERDISTAN.

 

2.3.1对我国收入生产总值及构成项目差异的聚类分析的计算结果的说明

表6初始聚类中心

聚类

1

2

3

4

5

营业盈余

3809.12

7640.85

15277.94

112.65

9483.10

固定资产折旧

1539.78

3252.59

7763.87

116.63

4663.63

生产税净额

2281.36

4149.96

9623.38

75.86

5711.10

劳动者报酬

5153.00

11348.67

29809.60

510.53

17898.75

收入生产总值

12783.26

26392.07

62474.79

815.67

37756.58

由于我们以前没有做过类似的研究,所以缺少用来做聚类分析的类中心,故初始类中心是由计算机自动收索的类中心。

在这份数据中,很明显是第3类的类中心的数据最优,第5类、第2类、第1类直到第4类依次降低。

 

表7迭代历史记录a

迭代

聚类中心内的更改

1

2

3

4

5

1

1281.387

2718.618

5332.252

2508.429

3126.878

2

122.873

668.006

.000

993.429

.000

3

589.730

.000

.000

770.980

.000

4

.000

.000

.000

.000

.000

a.由于聚类中心内没有改动或改动较小而达到收敛。

任何中心的最大绝对坐标更改为.000。

当前迭代为4。

初始中心间的最小距离为13411.850。

它反映了5个类中心每次迭代是聚类偏移的过程。

经过第1次的迭代,5个类的类中心分别偏移了1281.387、2718.618、5332.252、2508.429、3126.878,经过第2次的迭代,5个类的类中心分别偏移了122.873、668.006、.000、993.429、.000,经过第3次的迭代,5个类的类中心分别偏移了589.730、000、000、770.980、.000,到第4次计算的时候,位置不再移动。

所以到第4次迭代时,5个类的类中心(几乎)没有发生变化,所以聚类分析到此结束。

表8最终聚类中心

聚类

1

2

3

4

5

营业盈余

3842.87

5762.06

16571.18

788.92

8640.18

固定资产折旧

1766.14

2896.66

7707.70

665.93

4106.59

生产税净额

2385.33

3877.13

8976.27

687.72

5189.43

劳动者报酬

6126.28

11261.77

25897.68

2365.18

17037.75

收入生产总值

14120.62

23797.61

59152.83

4507.75

34973.94

与最初类中心类似,表中数据显示的是聚类分析的最终类中心。

数据显示,第3类各项指标的数值最好,第5类次之,第2类、第1类依次降低,第4类最差。

 

表9ANOVA

聚类

误差

F

Sig.

均方

df

均方

df

营业盈余

142240667.211

4

954164.306

26

149.074

.000

固定资产折旧

29177650.641

4

198922.836

26

146.678

.000

生产税净额

40716482.984

4

307762.871

26

132.298

.000

劳动者报酬

354493228.177

4

2906421.352

26

121.969

.000

收入生产总值

1799041953.417

4

7988752.829

26

225.197

.000

F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。

观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。

表中数据反映各个变量在不同类的均值的比较情况。

5个变量的F统计量都较大,分别是149.074、146.678、132.298、121.969、225.197,同时其对应的相伴概率sig值都很小,分别是.000、.000、.000、.000、.000,都小于显著性水平0.05,故拒绝零假设,认为用于聚类分析的5个变量对于本次K-mean聚类分析都是有效的,可以据此进行聚类分析。

表10聚类成员

案例号

地区

聚类

距离

1

北京市

2

4562.222

2

天津市

1

948.590

3

河北省

2

5645.518

4

山西省

1

2015.137

5

内蒙古

1

3488.715

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1