711数据分析零售总额汇总.docx

资源描述

711数据分析零售总额汇总.docx

《711数据分析零售总额汇总.docx》由会员分享，可在线阅读，更多相关《711数据分析零售总额汇总.docx（18页珍藏版）》请在冰豆网上搜索。

711数据分析零售总额汇总.docx

711数据分析零售总额汇总

成绩评定表

学生姓名

班级学号

专业

信息与计算科学

课程设计题目

国内生产总值和零售总额间关系的分析

评

语

组长签字：

成绩

日期

20年月日

课程设计任务书

学院

理学院

专业

信息与计算科学

学生姓名

班级学号

课程设计题目

国内生产总值和零售总额间关系的分析

实践教学要求与任务:

设计要求（技术参数）：

1.熟练掌握SPSS软件的操作方法；

2.根据所选题目及调研所得数据，运用数据分析知识，建立适当的数学模型；

3.运用SPSS软件，对模型进行求解，对结果进行分析并得出结论;

4.掌握利用数据分析理论知识解决实际问题的一般步骤。

设计任务：

1.查阅相关资料，获得1980-2009年的国内生产总值和社会消费品零售总额的具体数据；

2.利用数据分析的理论，建立曲线回归模型以及时间序列模型，分析国内生产总值和零售总额间的关系；

3.利用SPSS软件求解,并给出正确的结论；

工作计划与进度安排:

第一天——第二天学习使用SPSS软件并选题

第三天——第四天查阅资料

第五天——第六天建立数学模型

第七天——第九天上机求解并完成论文

第十天答辩

指导教师：

201年月日

专业负责人：

201年月日

学院教学副院长：

201年月日

摘要

数据分析是用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析，以求最大化地开发数据资料的功能，发挥数据的作用的一门课程。

是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

居居的最终消费总额影响因素很多从微观层面来看居民储蓄可支配收入、工资水平等情况等都能对居民的最终消费造成一定的影响。

但若从宏观方面来分析收入是影响消费的主要因素即国内生产总值，其他一系列因素很大程度上也在国内生产总值中有一定的反映，因此最终消费支出和国内生产总值之间存在密切的关系。

所以可以确定以最终消费支出为被解释变量以国内生产总值为解释变量其他的影响因素归入随机误差项的计量经济学模型。

本文对1980-2009年的国内生产总值以及社会消费品零售总额运用SPSS进行回归分析，对2010以及2011年的数据进行预测。

关键词：

SPSS；回归分析；曲线估计；时间序列

1引言1

2建立模型1

2.1分析方法1

2.2曲线回归2

2.3时间序列7

3结果分析10

参考文献12

国内生产总值和零售总额间关系的分析

1引言

一个国家或地区的经济究竟处于增长抑或衰退阶段，从GDP这个数字的变化便可以观察到。

一国的GDP大幅增长，反映出该国经济发展蓬勃，国民收入增加，国内需求水平提高，消费能力也随之增强。

反过来说，如果一国的GDP出现负增长，显示该国经济处于衰退状态，消费能力减低。

GDP是反映一个国家经济状况的指标。

本文采用的数据都是国家统计局在经济普查后修正的数据，与现实经济情况更加相符。

我们常常说，消费、投资、出口是拉动经济增长的三驾马车，从对我国的经济分析可以看出，目前中国消费需求虽有提速，但对经济增长的贡献还远不够高。

高投资率、低消费率的局面一直存在中国经济发展状况中。

本文选取占消费比重最大的社会消费品零售总额作为指标，重点分析居民消费中的社会消费品零售总额与GDP的关系。

社会消费品零售总额指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业（含农民对非农业居民零售额）对城乡居民和社会集团消费品零售的总和。

这个指标反映通过各种商品流通渠道向居民和社会集团供应的生活消费品，是研究人民生活、社会消费品购买力、货币流通等问题的重要指标。

对居民的消费品零售额：

指售给城乡居民用于生活消费的商品。

对社会集团的消费品零售额是指售给机关、团体、部队、学校、企业、事业单位和城市街道居民委员会、农村村民委员会用公款购买的用作非生产、非经营用的消费品。

所以分析社会消费品零售总额与GDP关系的情况，有助于了解社会消费品零售总额对我国社会经济发展的作用。

本文运用回归统计方法分析GDP与社会消费品零售总额，分析未来几年内社会消费品零售总额与GDP的增长情况及他们之间的关系。

2建立模型

2.1分析方法

本文需要选用SPSS分析模块的回归中的曲线估计实现对样本的处理。

再用时间序列对2010年的数据进行预测，与实际值相比较，由此给予方法评价。

曲线回归是反映变量曲线关系的曲线回归方程的过程，其一般步骤如下：

1.根据自变量X和因变量Y散点图呈现的趋势，结合专业知识和经验选择合适的曲线形式，在某种情况下，绘制散点图时采用一些特殊的坐标系可能更有利于解释变量之间的关系，更容易确定曲线方程的形式。

例如，在半对数坐标系中，散点呈现较为明显的直线趋势，即可选择对数曲线

或指数曲线

2.选用适当的估计方法求得回归方程。

如果曲线形式课表示为X的某种变化形式与Y的线性关系（例如，对数曲线

），即可采用“曲线直线化”的方法对变换后的Z（如

）和Y做最小二乘拟合；如果曲线形式表示为Y的某种变换形式

与

的线性关系（例如，将指数曲线

变换为

），则可采用“非线性最小二乘”估计方法。

3.在实际工作中，有时可结合散点图试拟合几种不同形式的曲线方程并计算

一般来说，

较大时拟合效果较好。

但应注意，为了单纯的得到较大的

，模型的形式可能会很复杂，甚至使其中的参数无法解释实际意义，这是不可取的。

因此，要充分考虑专业知识，结合实际解释和应用效果来确定最终的曲线形式。

决定系数

定义为：

曲线回归是回归的一个分支，它可以用于你和许多常用的曲线，理论上只有两个变量间存在某种可以被它描述的数量关系，就可以应该过程来分析处理。

时间序列分析是一种根据动态数据揭示系统动态结构和规律的统计方法。

对于本文的数据问题，是“国民生产总值”在不同时间点上的数值，按照时间的先后顺序排列而成的数列，当其受到各种随机因素影响，从而表现出某种随机性。

时间序列数据的特点是按一定顺序排列，序列中的数据依赖于时间，其取值依赖于时间的变化，适用于对未来情况的预测。

2.2曲线回归

具体步骤及结果如下：

1.建立数据文件，将数据文件导入到SPSS中。

2.做出“社会销售品零售总额”关于变量“国内生产总值”的散点图，可以通过基本命令：

图形→旧对话框→散点/点状→定义打开简单散点图对话框，在对话框左侧的变量列表框中单击选中变量“社会销售品零售总额”，单机

按钮，将其移动到右侧的“Y轴”列表中，用同样的方法将变量“国内生产总值”选入到“X轴”列表框中，单机确定。

输出结果：

图2.1“社会销售品零售总额”关于变量“国内生产总值”简单散点图

3.选入变量并设置参数，在SPSS中进行线性回归，可以利用：

分析→回归→曲线估计命令实现，打开“曲线估计”对话框，在对话框左侧的变量列表框中选中变量“社会销售品零售总额”作为因变量，将“国内生产总值”选入到“变量”列表框中，单机确定。

在上述“模型”选项组中列出了曲线拟合的模型。

根据两个变量散点图显示的曲线趋势选择合适的拟合模型，是该对话框的重点。

模型中包含的选项及其意义如表2.1所示。

表2.1模型的选项及其意义

选项

意义

线性

拟合直线方程，与“线性拟合”过程的直线回归相同

对数

拟合对数方程

逆模型

拟合方程

二次项

拟合二次方程

立方

拟合三次方程

幂

拟合乘幂曲线模型

复合

拟合复合曲线模型

拟合S型曲线

Logistic

拟合逻辑曲线模型

。

选择此模型，“上限”文本框被激活，用户可以输入数值，作为上限

增长

拟合复合比级数曲线

指数分布

拟合指数方程

“在等式中包含常量”可以在方程中包含常数项，为对话框默认选项。

“模型绘图”包括原始数值的连线图和拟合模型的曲线图，它在曲线拟合中是十分重要的，也是默认选型。

“显示ANOVA”可在结果中显示方差分析表。

单机图中的保存按钮，打开“曲线回归：

保存”的对话框。

该对话框用于设置存储中间结果，如预测值、残差、预测区间等。

“保存变量”选项组包括“预测值”、“残差”和“预测区间”3个选项。

单机继续→确定。

输出结果：

（1）模型描述：

表2.2对模型拟合过程做出了一些描述，给出了因变量数量和变量名、拟合模型的数量和类型、自变量变量名、回归方程包括常数项等情况。

表2,2模型描述

模型名称

MOD_1

因变量

社会消费品零售总额（亿元）

方程

线性

对数

倒数

二次

三次

复合a

幂a

增长a

指数a

Logistica

自变量

国内生产总值（亿元）

常数

包含

其值在图中标记为观测值的变量

未指定

用于在方程中输入项的容差

.0001

（2）模型汇总和参数估计：

表2.3模型汇总和参数估计值

因变量:

社会消费品零售总额（亿元）

方程

模型汇总

参数估计值

R方

df1

df2

Sig.

常数

线性

.997

9735.799

.000

564.834

.348

对数

.738

78.970

.000

-190274.139

20781.205

倒数

.359

15.657

.000

46820.183

-2.988E8

二次

.998

6982.162

.000

1581.052

.315

1.095E-7

三次

.998

4761.172

.000

1204.679

.340

-1.146E-7

4.785E-13

复合

.787

103.305

.000

5995.450

1.000

幂

.996

7753.249

.000

1.156

.898

.787

103.665

.000

10.590

-16474.884

增长

.787

103.305

.000

8.699

1.150E-5

指数

.787

103.305

.000

5995.450

1.150E-5

Logistic

.787

103.305

.000

1.000

自变量为国内生产总值（亿元）。

表2.3给出了所拟合的11个回归模型的检验报告，包括拟合优度、模型检验结果和各个参数值。

结果所示，11个回国模型均有统计学意义。

由拟合优度来确定最佳的模型，线性拟合的优度是最好的，而且相对较为简单，因此选择线性模型。

由参数估计值并依据表2.1中线性模型的意义，可以得出线性拟合方程为：

其中x代表“国内生产总值”，y代表“社会消费品零售总额”。

（3）描述性统计表：

表2.4为描述性统计量，给出了个案总数、已排除的个数、已经预测的个案和新创建的个案等信息。

表2.4个案处理摘要

个案总数

已排除的个案a

已预测的个案

新创建的个案

（4）变量处理摘要：

表2.5为变量处理摘要，给出了变量拟合过程的一些情况。

表2.5变量处理摘要

变量

因变量

自变量

社会消费品零售总额（亿元）

国内生产总值（亿元）

正值数

零的个数

负值数

缺失值数

用户自定义缺失

系统缺失

（5）不同模型的拟合结果曲线：

图2.2是十一个模型的曲线和实际测量值的连线情况，线性拟合和幂曲线对模型拟合相差很小，但是由于线性拟合要简单得多，并且在模型汇总中通过比较，也得出线性拟合优度最好，所以本例选择线性拟合。

图2.2“社会销售品零售总额”关于“国内生产总值”不同模型的拟合结果曲线

2.3时间序列

由于中文版SPSS功能具有局限性，用英文版进行时间序列分析。

具体步骤及结果如下：

1.绘制时序图。

由于SPSS软件不会自动把某些变量看成带有某些周期的时间序列，因此需要对该变量的观测值附加上时间因素；方法是通过选项卡Date→DefineDates来建立，如图设置：

图2.3定义数据日期

单机确定后进入。

2.Analyze→Timeseries→SequenceCharts打开时序图对话框，国内生产总值选入Variables框中，年份选入TimeAxisLables框中，确定。

所得的时序图如下所示：

图2.4时序图

从上图中可以看到，每一年中GDP的增长趋势近似为指数关系

3.对数据中季节因素的分解。

我们采用上面提到过的加法模型，相对而言，乘法模型比加法模型用的更多，乘法模型中，时间序列值和长期趋势用绝对值表示，季节变动、周期变动和不规则变动用相对值（百分数）表示。

Analyze→Regression→curveEstimation打开主对话框，如图2.5设置，选择指数EXP函数来估计。

图2.5曲线估计

得到的图形如下：

图2.6指数模型拟合结果

整体来看，比较趋于一致。

4.利用指数平滑法预测。

选趋势模型和季节模型：

用选项Analyze→Timeseries→CreateModel，如图2.7设置

图2.7创建模型

之后设置Options，预测时间变成至2011年，如图2.8所示。

图2.8预测输出图

单机OK按钮，得出预测表图2.9所示：

图2.9预测表

预测图：

图2.10预测图

3结果分析

将预测的国内生产总值值代入方程

，算出预测社会消费品零售总额

（1）。

再将实际的国内生产总值值代入方程算出预测社会消费品零售总额

（2）。

整理如下表所示：

表3.1结果汇总

年份

预测国内生产总值（亿元）

实际国内生产总值（亿元）

预测社会消费品零售总额

（1）

预测社会消费品零售总额

（2）

实际社会消费品零售总额（亿元）

2010

367759

397983

128544

139062

154554

2011

394616

471564

137891

164669

181226

曲线回归模型的优劣可以通过比较预测社会消费品零售总额

（2）与实际社会消费品零售总额得出，由表可看出2010年的社会消费品零售总额预测值与实际值相差15492，2011年的社会消费品零售总额预测值与实际值相差16557，残差较小，可算是正常误差。

由此可得出曲线回归模型较好。

时间序列模型的优劣可以通过比较国内生产总值的预测值与实际值得出，2010年国内生产总值的预测值与实际值相差30224，2012年国内生产总值的预测值与实际值相差76948。

相比而言相差较大，说明我国近两年飞速发展，国内生产总值的增长速度较之前有着明显提高，我国正向经济强国大迈步前进。

参考文献

[1]梅长林.数据分析方法.1版.北京：

高等教育出版社，2010.

[2]赖国毅.SPSS17中文版统计分析典型实例.5版.北京：

电子工业出版社，2010.

[3]李洪成.SPSS数据分析教程.1版.北京：

人民邮电出版社，2012.

[4]我们分析使用的数据来源于《中国统计年鉴》（2010）

[5]国民生产总值查询网址为：

[6]社会消费品零售总额查询网址：

展开阅读全文

711数据分析 零售总额汇总.docx

711数据分析零售总额汇总.docx