北京航空航天大学数理统计作业线性回归第一次大作业.docx
《北京航空航天大学数理统计作业线性回归第一次大作业.docx》由会员分享,可在线阅读,更多相关《北京航空航天大学数理统计作业线性回归第一次大作业.docx(15页珍藏版)》请在冰豆网上搜索。
![北京航空航天大学数理统计作业线性回归第一次大作业.docx](https://file1.bdocx.com/fileroot1/2022-10/9/aaa9ef8f-b97c-4f3b-bede-aad879e276b2/aaa9ef8f-b97c-4f3b-bede-aad879e276b21.gif)
北京航空航天大学数理统计作业线性回归第一次大作业
BEIHANGUNIVERSITY
应用数理统计
第一次大作业
班级:
A1-1班
学号:
姓名:
2013年12月7日
中国能源消耗总量的多元线性回归模型
北京航空航天大学(北京100191)
摘要:
本文通过选取2000至2010年国内能源消费总量及各类能源消费总量作为研究样本,将国内能源消费总量其作为因变量,从9种能源类型中筛选出4种作为影响因
素,利用统计软件SPSSStatistics19.0对各影响因素进行了回归分析,最终确定了能反映国内能源消耗总量与各因素之间关系的最优回归方程:
Y=-10558.960+4.716*Xs+1.014*X1+32.317*Xy+0.823*X4
最后我们用2011年数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响国内能源消费总量的各因素的情况。
关键词:
能源;消耗总量;回归分析
0符号说明
本文中采用的数学符号:
变量
符号
能源消耗总量(万吨标准煤)
Y
煤炭消耗总量(万吨标准煤)
Xi
天然气消耗总量(万吨标准煤)
X2
水电、核电、风电消耗总量(万吨标准煤)
X3
焦炭消耗量(万吨)
X4
原油消耗量(万吨)
X5
汽油消耗量(万吨)
X6
煤油消耗量(万吨)
X7
柴油消耗量(万吨)
X8
燃料油消耗量(万吨)
X9
1引言
能源是经济和社会发展的动力,是社会经济发展目标能否实现的具体保证。
我国
正处于工业化过程中,社会经济发展对能源的依赖远大于其他国家。
2000年一次能源
消费量为7.5亿吨,称为除美国外世界第一能源消费国,石油的对外依存度也达31%2001年全国能源费用支出达1.25万亿,占GDP勺13%2002年中国进口石油达7000
多万吨。
2003年经济增长的资源消耗总量为50亿吨,其中煤炭资源占世界30鸠上。
同时我国称为仅次于美国的第二大石油消耗国,进口量增长近3倍。
预计到2020年,
石油消费量最少4.5亿吨,石油的对外依存度有可能接近60%与目前美国的水平相当。
随着工业的大力发展,国内能源消耗远大于国内能源生产,能源的进出口缺陷等问题将越发影响我国经济、社会以及环境等全面协调发展。
回归分析时处理变量间相关关系的一种有效工具,它可以提供变量间相关关系的经验公式,并对相关问题进行分析、判断确定经验公式的有效性,且可以利用分析得到的经验公式,对某些变量进行预测或控制其值,同时还可以知道这种预测和控制可以达到怎样的精确程度。
本文通过比较2000年到2010年国内能源生产及消耗总值,得到11年内国内能源消费的数据模型,采用多元回归分析建立国内能源消费回归模型,并采用2011年数据验证了回归模型的准确性。
2模型的建立于分析
2.1样本数据的选取与整理
本文参阅《中国统计年鉴2013》中收录的2000年到2011年连续12年全国能源消耗总量表(表2-1)中全国能源消耗总量作为因变量,选取这12年中的煤炭消耗总量、天然气消耗总量、水电、核电、风电消耗总量、焦炭消耗量、原油消耗量、汽油消耗量、煤油消耗量、柴油消耗量、燃料油消耗量9种因素作为自变量,分析他们之
间的相关关系。
整理数据得到的全国能源消耗总量数据见表2-1。
表2-12000年-2011年全国消费生产总量单位:
万吨
指标
能源消
费总量
煤炭消
费总量
天然气
消费总
量
水、核、
风电消
费总量
焦炭
消费量
原油
消费量
汽油
消费量
煤油
消费量
柴油
消费量
燃料油
消费量
2011年
393913.3
238033.4
17400.1
27840.16
38163.27
43965.84
7395.95
1816.72
15635.11
3662.8
2010年
366785.1
220958.6
14297.32
27944.75
33687.8
42874.55
6886.21
1744.07
14633.8
3758.02
2009年
345932.3
215879.5
11959.23
23918.47
31849.97
38128.59
6172.69
1439.41
13756.64
2827.8
2008年
327720.8
204887.9
10783.58
22441.5
29900.23
35498.24
6145.52
1294.01
13532.58
3237.15
2007年
314389.2
199441.2
9256.76
19074.54
29168.12
34031.6
5519.09
1243.72
12496.67
4157.49
2006年
291460.6
183918.6
7501.6
17331.29
27892.77
32245.2
5242.55
1124.74
11835.43
4368.33
2005年
265607.7
167085.9
6135.92
16047.8
25105.84
30086.24
4854.91
1076.84
10972.16
4242.06
2004年
235242.1
148351.9
5336.4
14301.55
18067.01
28749.31
4695.72
1060.86
9895.86
4783.47
2003年
202672.2
128286.8
4594.8
11946.48
15298.47
24922
4072.02
921.61
8409.43
4220.53
2002年
174974.8
108413.1
3826.34
11638.46
12343.62
22544.05
3749.32
919.2
7666.86
3873.87
2001年
166387.7
102727.3
3609.74
11280.45
11931.46
21342.74
3597.57
890.27
7157.97
3850.22
2000年
160351
100707.5
3201.68
9313.98
10840.76
21232.01
3504.56
871.61
6806.23
3872.75
2.2模型的建立与分析
建立如图2.1-图2.9各影响因素与能源消耗总量之间的散点图,通过分析散点图
初步筛选出影响能源消耗总量的影响因素。
图2.9能源消费总量与燃料油消费总量散点图
从各能源消费量与消费总量的散点图中可以发现,除燃料油这一项自变量外,
煤炭、天然气、电能、焦炭、原油、煤油、汽油、柴油这8个自变量分别与国内能源
消耗总量这一因变量基本呈线性关系。
因此选取该八个变量为主要影响因子,采用逐步回归法进行回归分析。
将数据导入SPSS统计分析软件中,系统通过准则:
F-to-enter的概率<=.050,
F-to-remove的概率>=.100,易9除了天然气、电能、原油、汽油、这四个自变量,选取剩余的煤炭、焦炭、煤油、柴油做自变量。
如表2-2所示:
在表2-3到表2-5模型汇总表中可以看出,回归模型确定系数的平方根为0.999,确定系数为0.998,调整后的确定系数为0.998。
回归方程和回归系数都通过了0.05的显著性水平检验。
模型
输入的变量
移去的变量
方法
1
柴油消费量(万吨)
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概
率>=.100)。
2
煤炭消费总量(万吨
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概
标准煤)
率>=.100)。
3
煤油消费量(万吨)
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概
率>=.100)。
4
焦炭消费量(万吨)
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概
率>=.100)。
柴油消费量
a.
(万吨)。
b.
c.
d.
预测变量:
(预测变量:
(预测变量:
(预测变量:
(
常量),常量),常量),常量),
柴油消费量
柴油消费量
柴油消费量
(万吨),
(万吨),
(万吨),
煤炭消费总量
煤炭消费总量
煤炭消费总量
(万吨标准煤
(万吨标准煤
(万吨标准煤
)。
),煤油消费量(万吨)。
),煤油消费量(万吨),焦炭消费量(万吨)。
模型
R
R方
调整R方
标准估计的误差
1
.996a
.995
.994
4565.65374491014900
2
.997b
.996
.995
3375.54208871595070
3
0.998c
0.997
0.997
1145.78836858253070
4
0.999d
0.998
0.998
661.93962403402700
表2-3模型汇总
柴油消费量
a.
(万吨)。
b.
c.
d.
预测变量:
(预测变量:
(预测变量:
(预测变量:
(
常量),常量),常量),常量),
柴油消费量
柴油消费量
柴油消费量
(万吨),
(万吨),
(万吨),
煤炭消费总量
煤炭消费总量
煤炭消费总量
(万吨标准煤
(万吨标准煤
(万吨标准煤
)。
),煤油消费量(万吨)。
),煤油消费量(万吨),焦炭消费量(万吨)。
模型
平方和
df
均方
F
Sig.
1
回归
5.698E10
1
5.698E10
2733.516
.000a
残差
1.876E8
9
20845194.118
总计
5.717E10
10
2
回归
5.708E10
2
2.854E10
2504.639
.000b
残差
91154275.142
8
11394284.393
总计
5.717E10
10
3
回归
5.716E10
3
1.905E10
14512.935
.000c
残差
9189816.899
7
1312830.986
总计
5.717E10
10
4
回归
5.717E10
4
1.429E10
32616.580
.000d
残差
2628984.395
6
438164.066
总计
5.717E10
10
预测变量
柴油消费量
:
(
a.
b.
预测变量
常量),
常量),
柴油消费量
(万吨)。
(万吨),
煤炭消费总量
(万吨标准煤
C.
预测变量
预测变量吨)。
d.
常量),
常量),
柴油消费量
柴油消费量
(万吨),
(万吨),
煤炭消费总量
煤炭消费总量
(万吨标准煤
(万吨标准煤
),煤油消费量(