北航数理统计回归分析大作业Word下载.docx

上传人:b****5 文档编号:16139168 上传时间:2022-11-20 格式:DOCX 页数:14 大小:204.29KB
下载 相关 举报
北航数理统计回归分析大作业Word下载.docx_第1页
第1页 / 共14页
北航数理统计回归分析大作业Word下载.docx_第2页
第2页 / 共14页
北航数理统计回归分析大作业Word下载.docx_第3页
第3页 / 共14页
北航数理统计回归分析大作业Word下载.docx_第4页
第4页 / 共14页
北航数理统计回归分析大作业Word下载.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

北航数理统计回归分析大作业Word下载.docx

《北航数理统计回归分析大作业Word下载.docx》由会员分享,可在线阅读,更多相关《北航数理统计回归分析大作业Word下载.docx(14页珍藏版)》请在冰豆网上搜索。

北航数理统计回归分析大作业Word下载.docx

进出口总额

X7

1引言

中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。

近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。

经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。

政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。

所以对国家财政的收入状况进行研究是十分必要的。

国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。

为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。

而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。

本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,批发和零售贸易餐饮业,人口总数等。

文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。

2解决问题的方法和计算结果

2.1样本数据的选取与整理

本文在进行统计时,查阅《中国统计年鉴2010》中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、受灾面积和商品零售总额等因素为自变量,分析它们之间的联系。

根据选择的指标,从《中国统计年鉴2010》查选数据,整理如表2-1所示。

表2-11990-2009年财政收入及其影响因素统计表

 

工业

(亿元)

农业

受灾面积(千公顷)

建筑业

人口

(万人)

社会商品零售总额(亿元)

国民生产总值(亿元)

1990

18689.22

7662.1

38474

1345

114333

8300.1

2937.1

18718.3

1991

22088.68

8157

55472

1564.3

115823

9415.6

3149.48

21826.2

1992

27724.21

9084.7

51333

2174.4

117171

10993.7

3483.37

26937.3

1993

39693

10995.5

48829

3253.5

118517

14270.4

4348.95

35260.0

1994

51353.03

15750.5

55043

4653.3

119850

18622.9

5218.1

48108.5

1995

54946.86

20340.9

45821

5793.8

121121

23613.8

6242.2

59810.5

1996

62740.16

22353.7

46989

8282.2

122389

28360.2

7407.99

70142.5

1997

68352.68

23788.4

53429

9126.5

123626

31252.9

8651.14

78060.8

1998

67737.14

24541.9

50145

10062

124761

33378.1

9875.95

83024.3

1999

72707.04

24519.1

49981

11152.9

125786

35647.9

11444.08

88479.2

2000

85673.66

24915.8

54688

12497.6

126743

39105.7

13395.23

98000.5

2001

95448.98

26179.6

52215

15361.5

127627

43055.4

16386.04

108068.2

2002

110776.48

27390.8

47119.1

18527.1

128453

48135.9

18903.64

119095.7

2003

142271.22

29691.8

54506.3

23083.8

129227

52516.3

21715.25

135174.0

2004

201722.19

36239

37106.256

27745.3

129988

59501

26396.47

159586.7

2005

251619.5

39450.9

38818.225

34552.0

130756

67176.6

31649.29

185808.6

2006

316588.96

40810.8

41091.41

41557.1

131448

76410

38760.2

217522.7

2007

405177.13

48892.9

35972.23

51043.7

132129

89210

51321.78

267763.7

2008

130260.2

33702.0

56234.26

18743.2

132802

116032

61330.35

316228.8

2009

135239.9

35226.0

50223.51

22398.8

133474

14894

68518.30

343464.7

2.2模型的建立与分析

将数据录入统计软件excel,建立统计数据库,先建立财政收入与各变量的散点图,如图2-1至图2-7所示。

图2-1财政收入与工业总产值的散点图

图2-2财政收入与农业总产值的散点图

图2-3财政收入与受灾面积的散点图

图2-4财政收入与建筑业的散点图

图2-5财政收入与人口总数的散点图

图2-6财政收入与商品零售总额的散点图

图2-7财政收入与国内总产值的散点图

从散点图中看出,国内生产总值、工业生产总值、农业、建筑业、商品零售总额这四个变量与财政收入总量基本呈线性分布;

而人口总数虽然也与财政收入存在正比的关系,但是从直观上看线性关系不显著,并且人口因素呈现指数关系。

受灾面积与财政收入总量的关系不明显。

因此为使得到的模型有显著的线性关系,在选取进入回归模型的自变量时,就要进行筛选。

下面给出筛选过程。

(1)将国内生产总值、农业、工业生产总值、建筑业和商品零售总额纳入自变量,逐步回归法,输出结果如图2-8(a)(b)所示。

从结果可以看出,该回归的F值为1600.595,查表得

,显而易见,回归的显著性很好;

但是由于在这里我们要分析的是影响财政收入的具体产业,而该结果只说明了财政收入与国民生产总值的相关性很好,并不能说明问题的根本所在。

所以在下面的分析中我们将剔除国民生产总值这个因素做进一步的分析。

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

7.506E9

1600.595

.000a

残差

8.441E7

18

4689341.382

总计

7.590E9

19

a.预测变量:

(常量),国民生产总值

b.因变量:

财政收入

模型汇总b

R

R方

调整

标准估计

的误差

更改统计量

Durbin-

Watson

R方更改

F更改

df1

df2

Sig.F更改

.994a

.989

.988

2165.489

.000

.200

图2-8(a)(b)输出结果

(2)将工业生产总值、农工、建筑业和商品零售总额纳入自变量,逐步回归法,输出结果如图2-9(a)(b)(c)所示。

4.757E9

30.215

2.834E9

1.574E8

(常量),农业

调整

Durbin

-Watson

.792a

.627

.606

12546.807

.390

图2-9(a)(b)(c)输出结果

从结果可以看出,该回归的F值为30.215,查表得

但是对回归系数的显著性来说,从直方图中可以看出,采用以上三个变量作为自变量得到的线性模型仍不是很好。

这个模型也不是理想中的模型,所以下面我们试图根据我们的判断对样本数据进行筛选,力求得出比较理想的模型。

(3)下面我将农业这个变量暂且剔除,只采用工业、建筑业和商品零售总额作为自变量,采用逐步回归法,输出结果如图2-10(a)(b)所示。

从结果可以看出,该回归的F值为20.219,查表得

但是对回归系数的显著性来说,建筑业的t检验值为0.0002,查表得

,显然回归系数的显著性不好。

以上检验得到的与利用P值法(图中的Sig值)得到的检验结果相符。

因此,采用以上三个变量作为自变量得到的线性模型仍不是很好。

同时可以看出,只对建筑业做回归分析时,F值为20.19,查表得到

,这证明一元回归模型和回归系数的显著性都很好。

4.015E9

20.219

3.575E9

1.986E8

(常量),建筑业

b

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1