基于多元线性回归分析餐饮业营业收入的影响因素.docx
《基于多元线性回归分析餐饮业营业收入的影响因素.docx》由会员分享,可在线阅读,更多相关《基于多元线性回归分析餐饮业营业收入的影响因素.docx(14页珍藏版)》请在冰豆网上搜索。
基于多元线性回归分析餐饮业营业收入的影响因素
基于多元线性回归分析餐饮业营业收入的影响因素
一、导论
餐饮业是国民经济的一个重要产业,“民以食为天”。
开门七件事,“柴米油盐酱醋茶”,件件事与吃有关。
在现代社会,很难想象,没有餐饮业,社会将会是怎样。
鉴于餐饮业在国民经济中有如此重要的作用,我尝试通过经济学的方法来分析一下影响餐饮业的因素,并期望为我国餐饮业健康发展思路提供一定基础。
餐饮业营业收入是衡量餐饮业发展水平的重要指标,本文着重研究影响餐饮业营业收入的因素来考察制约餐饮业发展的关键所在。
假定除我们考虑到的因素外,其他因素对餐饮业营业收入的影响可以忽略。
有效的餐饮需求:
指城乡居民愿意并能够消费的餐饮产品总和。
这里:
①GDP:
可以认为影响着餐饮业营业收入的总水平; ② 人均GDP:
也可以认为影响着餐饮业营业收入的总水平,但这里我考虑到人口因素的影响;③ 从业人数:
对餐饮业营业收入也有影响;④ 企业数:
企业数越多,营业收入也会越高; ⑤城乡居民人民币储蓄存款余额:
可以反映我国城乡居民的餐饮消费能力。
二、模型建立
根据经济学理论把模型设定为:
其中:
Y 代表餐饮业营业收入2013(单位亿元)
X1代表GDP(单位亿元)
X2代表从业人数(单位万人)
X3代表企业数(单位个)
X4代表城乡居民人民币储蓄存款余额(单位亿元)
X5代表人口(单位万人)
数据如下:
餐饮业营业额(亿元)
Gdp(亿元)
餐饮业企业法人个数(个)
餐饮业从业人数(人)
城乡居民人民存款余额(亿元)
人口
(万人)
北京市
520.7
19800.81
3086.4
2115
天津市
103.6
14442.
612.3
1472
河北省
45.2
28442.95
467
40007
23357.2
7333
山西省
75
12665.25
568
67599
13339.4
3630
内蒙古自治区
65.5
16916.5
427
36128
7455.2
2498
辽宁省
142.7
27213.22
715
46528
19659.5
4390
吉林省
20.2
13046.4
162
11016
7745.3
2751
黑龙江省
24.6
14454.91
21
.6
3835
上海市
469.5
21818.
5
20486.3
2415
江苏省
399.5
59753.37
24
23.9
7939
浙江省
261
37756.59
8923
5498
安徽省
100.1
19229.34
1
24.9
6030
福建省
158.9
21868.49
797
76123
11847.3
3774
江西省
31.8
14410.19
241
25778
9725.2
4522
山东省
335.9
55230.32
243
.1
9733
河南省
150.4
32191.3
232.1
9413
湖北省
225.8
24791.83
5507
5799
湖南省
109.3
24621.67
587
58591
14539.7
6691
广东省
604.1
62474.79
2883
337224
49891.3
10644
广西壮族自治区
32
14449.9
3
.9
4719
海南省
10.4
3177.56
84
8553
2465.4
895
重庆市
163
12783.26
1
.3
2970
四川省
231.3
26392.
8
22597.3
8107
贵州省
21.1
8086.86
3
.1
3502
云南省
49.6
11832.3
69.8
4687
西藏自治区
0.9
815.67
陕西省
125.6
16205.45
958
91202
12249.4
3764
甘肃省
30.7
6330.69
346
24301
5878.5
2582
青海省
3.7
2122.
4.2
578
宁夏回族自治区
8.6
2577.57
90
8081
1887.2
654
新疆维吾尔自治区
12.2
8443.84
77
8870
5884.5
2264
数据标准化处理后:
餐饮业营业额(亿元)
Gdp(亿元)
餐饮业企业法人个数(个)
餐饮业从业人数(人)
城乡居民人民存款余额(亿元)
人口
(万人)
北京市
2.29149
-0.04214
1.20155
1.87475
0.79709
-0.81002
天津市
-0.26081
-0.38325
-0.5507
-0.26829
-0.62394
-1.04084
河北省
-0.61817
0.50798
-0.49559
-0.4823
0.82196
1.06311
山西省
-0.43582
-0.49635
-0.36908
-0.14621
-0.098
-0.26617
内蒙古自治区
-0.49395
-0.22574
-0.54569
-0.52954
-0.63836
-0.67253
辽宁省
-0.02156
0.4297
-0.18497
-0.40287
0.48239
0.00665
吉林省
-0.77115
-0.47209
-0.8776
-0.83542
-0.61172
-0.58171
黑龙江省
-0.74423
-0.38243
-0.81748
-0.77564
-0.39929
-0.19258
上海市
1.97818
0.08628
0.97109
1.67057
0.55832
-0.70233
江苏省
1.54984
2.50104
1.928
1.814
1.78315
1.28065
浙江省
0.70234
1.10084
0.80576
0.69331
1.33309
0.40439
安徽省
-0.28223
-0.07851
0.21208
-0.08228
-0.13606
0.59537
福建省
0.07758
0.08948
-0.08226
-0.04239
-0.23502
-0.21448
江西省
-0.70017
-0.38527
-0.77865
-0.65561
-0.4299
0.05403
山东省
1.16067
2.21312
1.96307
0.94039
1.41327
1.92465
河南省
0.02556
0.74658
0.64043
-0.03808
0.53498
1.80978
湖北省
0.48695
0.27557
1.2504
0.57153
0.10106
0.51244
湖南省
-0.22594
0.26474
-0.34529
-0.25593
0.01223
0.83265
广东省
2.80182
2.67427
2.53045
3.13793
3.25866
2.25168
广西壮族自治区
-0.69895
-0.38275
-0.701
-0.59863
-0.48558
0.12475
海南省
-0.83112
-1.10029
-0.97529
-0.86542
-1.09659
-1.24797
重庆市
0.10266
-0.48884
0.19078
0.00845
-0.43935
-0.5031
四川省
0.5206
0.37743
0.93727
0.7399
0.75218
1.34096
贵州省
-0.76564
-0.78778
-0.69974
-0.73031
-0.77943
-0.31212
云南省
-0.59125
-0.54937
-0.6296
-0.5897
-0.49927
0.11326
西藏自治区
-0.88925
-1.25063
-1.06422
-0.96066
-1.27745
-1.45725
陕西省
-0.12619
-0.271
0.11939
0.14128
-0.1981
-0.21807
甘肃省
-0.7069
-0.89957
-0.64714
-0.6736
-0.78316
-0.64238
青海省
-0.87212
-1.16747
-1.03416
-0.92651
-1.18486
-1.36177
宁夏回族自治区
-0.84213
-1.13848
-0.96778
-0.87117
-1.14969
-1.33448
新疆维吾尔自治区
-0.8201
-0.76506
-0.98406
-0.86156
-0.7826
-0.75653
三、 参数估计
利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:
用Eviews估计结果为:
根据表中的样本数据,模型估计结果为:
t=(3.33E-05)(-0.111061)(1.617020)(4.861177)(1.004762)(-2.675348)
可以看出,可决系数
,修正的可决系数
。
说明模型的拟合程度还可以。
但是当
时,X1、X2、X4系数均不能通过检验,且X1、X5的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性
四、模型检验
1.多重共线性的检验:
计算各个解释变量的相关系数,得到相关系数矩阵
表4.1相关系数矩阵
由相关系数矩阵可以看出,解释变量X1、X2、X4之间存在较高的相关系数,证实确实存在严重的多重共线性。
2.多重共线性修正
表4.2一元回归结果
变量
X1
X2
X3
X4
X5
参数估计值
0.752443
0.919239
0.983748
0.846699
0.486108
t统计值
6.151980
12.57375
29.50603
8.569556
2.995510
0.566173
0.845002
0.967764
0.716900
0.236301
0.551213
0.839657
0.966652
0.707138
0.209967
其中,X3的方程
最大,以X3为基础,顺次加入其它变量逐步回归。
表4.3 加入新变量的回归结果
(一)
X1
X2
X3
X4
X5
X3,X1
-0.054372
(-1.008505)
1.026484
(19.03952)
0.966672
X3,X2
-0.026179
(-0.268539)
1.008295
(10.34290)
0.965550
X3,X4
1.055460
(15.16408)
-0.081541
(-1.171518)
0.967075
X3,X5
1.028601
(27.30802)
-0.081308
(-2.158633)
0.970389
经比较,新加入X5的方程
=0.970389,改进最大,而且各个参数的t检验显著,选择保留X5,再加入其它新变量逐步回归.
表4.4 加入新变量的回归结果
(二)
X1
X2
X3
X4
X5
X3,X5,X1
0.098910
(1.152762)
0.983546
(18.17055)
-0.140565
(-2.210221)
0.970733
X3,X5,X2
0.179349
(1.531826)
0.887519
(8.948776)
-0.130404
(-2.672514)
0.971748
X3,X5,X4
0.971111
(12.24452)
0.091688
(0.825091)
-0.123267
(-1.943885)
0.970047
当加入X1、X2或X4时,
均没有所增加,且其参数是t检验不显著。
从相关系数可以看出X1、X3、X5之间相关系数较高,这说明X1、X3、X5引起了多重共线性,但是由于虑到X3对模型的影响蛮大的,可能存在异方差或自相关,保留X3、x1,剔除、X5。
修正多重共线性影响后的模型为:
t=(-1.620452)(3.619150)(1.538409)(8.823194)
在确定模型以后,进行参数估计
表4.5 消除多重共线性后的回归结果
五、异方差检验
在实际的经济问题题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。
(1) 检验异方差
表5.1 White检验结果
从上表可以看出,n
=20.48293,由White检验可知,在
下,查
分布表,得临界值
比较计算
统计量与临界值n
=20.48293>
所以拒绝原假设,表明模型存在异方差。
(2)异方差的修正
分析数据取对数,设权重为X4
0.002851
0.662614
0.534865
0.219372
-0.721076
由于
的系数为负数不符合经济规律,舍去
异方差修正后模型为:
六、结论
1) 从模型可以看出人均GDP、从业人数、企业数、,是影响餐饮业营业收入的最显著因素。
(2) 系数解释:
人均GDP提高1元,营业收入就会提高13.85万元;从业人数增加一万人,营业收入就会提高510.77万元;企业数增加一个,营业收入就会提高16.05万元。