我国各地区职工工资的影响因素分析.docx
《我国各地区职工工资的影响因素分析.docx》由会员分享,可在线阅读,更多相关《我国各地区职工工资的影响因素分析.docx(17页珍藏版)》请在冰豆网上搜索。
我国各地区职工工资的影响因素分析
我国各地区职工工资的影响因素分析
摘要:
随着经济的发展,我国各地区职工的平均工资都有所增长,但各地区的增长幅度又有所不同,本文主要就是研究影响各地区职工平均工资的因素,并最终建立数学模型,从而可以起到对未来的工资水平走向进行预测及政策建议的效果。
关键词:
平均工资影响因素增长
一、经济背景分析
近年来,随着改革开放的进程不断加快,我国职工工资收入不断提高,劳动和社会保障法制建设进一步加强,劳动者合法权益得到保障。
2003年,城镇职工平均工资达到14040元,是1990年的6倍多,扣除物价因素,实际年均增长8.1%,是建国以来城镇职工工资收入增长最快的时期之一。
以XX为例,自改革开放以来,XX职工工资收入逐年增长,近十多年来,职工工资年均增幅超过百分之十。
统计数字显示,一九九○年XX的人均年工资为二千九百一十七元,二○○四年上升到二万四千三百九十八元,增加近十倍。
其他地区的工资增长虽不及XX那般显著,却也是在节节攀升。
二、研究目的:
职工工资的增长逐渐成为一个热点话题,在XX中输入“职工工资”,你会在0.001秒后得到237000篇相关报道,工资协商制、工资拖欠、工资保障机制也成为学术界人士争相研究的焦点。
而也是随着职工工资的增长,其他的一些问题,诸如个税征收、社会保障机制改革等接踵而来。
因此,研究好职工工资的影响因素,对于预测工资走向,安排生产生活,体制改革等有积极意义。
三、变量的选取和样本数据来源
(一)变量的选取
纵观各项可能对职工工资产生影响的因素,结合经济意义和数据获得的可能性,我最终将以下变量列为备选变量,2003年的各地区平均工资(元)、各地区性别比(女=100)、各地区教育经费(万元)、各地区第三产业就业人数(万人)、各地区第三产业就业比(%)、各地区总扶养比(%)、各地区年底人口数(万人),各地区私营企业就业人数(万人)、各地区消费指数(%)、各地区铁路长度(公里)、各地区内河长度(公里)、各地区公路长度(公里)、人均地区生产总值(元/人)。
因为时间序列数据样本太少,故本文选择2003年的各地区截面数据作为研究对象。
根据基本经济理论及经济常识,可以初步判定各地区职工平均工资与性别比例有一定关系,所以性别比会是影响平均工资的一个因素;而各地区的教育经费投入(包括国家投入和地方投入的总和)、高校数量、高校在校生人数直接关系着该地区的职工业务素质,所以也是影响职工平均工资的因素,但这三者之间从常识上来说可能存在一定共线性,所有要建模之后再作取舍;另外,第三产业的就业人数肯定也会影响平均工资,因为一般说来,第三产业的平均工资会高于一二产业,所有第三产业的就业人数和比例也在考虑X围之列,但考虑到各地区人口数量不一,按绝对数就业人数来做模型显然不够科学,所以我选择了第三产业的就业比例来替代第三产业的就业人数;各地区的总抚养比(包括抚养比儿童和老人扶养比)从理论上来说也会影响平均工资,因为若总抚养比较高,则意味着该地区的劳动力比例较少,根据供求定价原则,此地区的平均工资就会高于其他抚养比低的地区;但抚养比只是一个相对数,不能直接表明该地区劳动力的丰欠程度,所以各地区年底人口数也要考虑;各地区私营企业就业人数也可能会影响平均工资,因为一般人会认为私营企业的工资高于国有企业;各地区铁路长度(公里)、各地区内河长度(公里)、各地区公路长度(公里)说明了该地区的交通状况,俗话说“要致富,先修路”,交通发达的地方一般来说经济也比较发达,自然平均工资也会受其影响;地区人均生产总值表明个人所创造的财富,直接决定了平均工资的基数;至于各地区消费指数,我认为其与平均工资应该是一个正向相关的关系。
而是否是西部地区也会影响平均工资,因为西部地区相对而言是我国不够发达的地区,其平均工资自然会低于中东部地区。
以上是对各因素的初步定性分析,接下来将根据定量分析来决定各因素的取舍。
(二)数据的收集
本文数据全部来自中国国家统计局的统计年鉴,真实性可以保证。
是否为西部地区的划分依据国家西部大开发确定的12个省市为西部地区,包括:
XX市XX省XX省XX省XX省XX省XX省XX省XX、XX、。
令Y=各地区职工平均工资
X1、X2、X3………X13、X14分别为“是否西部地区”、性别比、教育经费………各地区高校在校生人数、各地区高校数,所有数据如下图所示:
地区
Y平均工资(元)
X1是否西部
X2性别比
(女=100)
X3教育经费(万元)
X4第三产业就业比例(%)
X5抚养比(%)
X62003年底人口数(万人)
X7私营企业就业人数(万人)
X8消费指数(%)
X9铁路长度(公里)
X10内河长度(公里)
X11公路长度
(公里)
X12人均地区生产总值(元)
X13各地区高校在校生(人)
X14各地区高等学校数
25312
0
106.1
3538686
59.6
27.8
1456.4
267.3
100.2
1136.1
0
14453
32061
82828
73
XX
18648
0
97.44
975729.9
40.4
33.2
1011.3
66.18
101
666.3
89
10168
26532
40221
37
11189
0
104.2
2101072
23.1
36.5
6769.44
181.7
102.2
4744
0
65391
10513.2
113442
83
10729
0
105.0
1176900
31.2
43
3314.29
110.4
101.8
3137.5
485
63122
7435
40779
45
内蒙
11279
1
104.4
854998.4
30.2
34.9
2379.61
51.35
102.2
6202.6
2403
74135
8974.65
24919
27
13008
0
100.1
1943995
38
32.3
4210
207
101.7
4173.9
413
50095
14257.8
98908
70
11081
0
100.7
1226407
32.4
28.7
2703.7
41.15
101.2
3561.8
1444
43779
9338
52605
40
黑龙
11038
0
103.5
1587805
29.4
29
3815
76.24
100.9
5483.7
5130
65123
11615.1
69050
54
27304
0
99.82
2739674
49.4
33.7
1711
318.1
100.1
256.5
2223
6484
46718
71158
56
15712
0
97.99
4044278
31
39.6
7405.82
468
101
1393.6
24793
65565
16809
137048
94
21367
0
102.4
3396099
33.5
38.1
4679.55
484
101.9
1249.9
9892
46193
20147
78685
64
10581
0
106.0
1640473
26.2
42.9
6410
118.8
101.7
2219.7
5586
69560
6455
65685
73
14310
0
104.6
1779257
29.8
41.5
3488
106.2
100.8
1453.9
3245
54876
14979
47792
39
10521
0
105.2
1169816
32.1
43.2
4254.23
93.3
100.8
2298.2
5590
61233
6678
47167
54
12567
0
100.4
3338764
26.8
37.8
9125
366.5
101.1
3150.5
1012
76266
13661
117253
85
10749
0
107.4
2288399
20.2
44.2
9667
80.45
101.6
3654.2
1208
73831
7570.18
108975
71
10692
0
104.8
2301981
36.2
40.9
6001.7
105.3
102.2
2388.5
8155
87813
9010.7
119118
75
12221
0
108.4
2104948
27.1
39.6
6662.8
109.1
102.4
2977.2
11551
85233
7554
90035
73
19986
0
104.6
5203412
34.2
52.9
7954.22
359.4
100.6
2112.5
11843
110253
17213.1
105533
77
XX
11953
1
109.8
1346031
29.4
44.3
4857
49.35
101.1
2738
5413
58451
5969
40178
45
10397
0
113.3
297249.9
30.7
46.9
810.52
28.3
100.1
221.7
343
20877
8316
5846
11
12425
1
103.6
1066535
32.1
38.9
3130
86.45
100.6
718.2
4103
31407
7209
42653
34
12441
1
103.0
2437437
28.6
40.3
8700.4
150.3
101.7
2961.8
10720
112543
6418
74307
62
11037
1
107.6
867637.9
27.7
50.3
3869.66
29.52
101.2
1900.1
3502
45304
3603
25362
34
12870
1
109.3
1295046
18.3
46.3
4375.6
56.75
101.2
2340.3
2540
166133
5662
31337
34
26931
1
92.25
141177.9
25.8
49.3
270.17
3.272
100.9
0
0
41302
6871
1745
4
11461
1
105.2
1597679
31.3
40.2
3689.5
160.2
101.7
2892.3
1065
50019
6480
79785
57
12307
1
105.3
836405
27.4
42.2
2603.34
36.29
101.1
2312.5
860
40293
5021.63
29582
31
15356
1
104.2
190401
30.1
43.9
533.8
20.55
102
1091.8
330
24377
7277
4771
12
12981
1
103.3
229622.8
26.4
47.1
580.3
18.61
101.7
791.4
26
11916
6691
5461
12
XX
13255
1
103.8
1082359
31.7
43.2
1933.95
49.17
100.4
2773.3
0
83633
9700
25264
26
四、模型的参数估计、检验及修正
(一)对所有变量作回归,结果如下:
DependentVariable:
Y
Method:
LeastSquares
Date:
12/13/05Time:
19:
39
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-51121.93
96753.71
-0.528372
0.6045
X1
1441.402
1341.172
1.074733
0.2984
X2
-439.6940
137.4853
-3.198117
0.0056
X3
0.004073
0.001712
2.378765
0.0302
X4
-104.3862
159.7650
-0.653374
0.5228
X5
61.56835
142.4845
0.432106
0.6714
X6
-0.812005
0.609660
-1.331897
0.2016
X7
-11.19245
9.951612
-1.124687
0.2773
X8
1077.667
945.8382
1.139378
0.2713
X9
-0.965230
0.546700
-1.765557
0.0965
X10
-0.125980
0.122026
-1.032402
0.3172
X11
0.003696
0.023070
0.160223
0.8747
X12
0.271989
0.113764
2.390824
0.0295
X13
-0.058740
0.050324
-1.167226
0.2602
X14
56.06971
93.75443
0.598049
0.5582
R-squared
0.869886
Meandependentvar
14248.65
AdjustedR-squared
0.756035
S.D.dependentvar
4914.869
S.E.ofregression
2427.590
Akaikeinfocriterion
18.73353
Sumsquaredresid
94291129
Schwarzcriterion
19.42739
Loglikelihood
-275.3697
F-statistic
7.640616
Durbin-Watsonstat
2.440897
Prob(F-statistic)
0.000118
显然由于变量过多,不可避免的可能存在共性线、异方差、自回归、自相关等问题,因此我们接下来对模型进行逐步的修正。
(二)模型修正:
1、通过对X1、X2、X3…….X13、X14作相关性分析,得到R(X3、X13)=0.8292,R(X3,X14)=0.8334,R(X3,X7)=0.8796,R(X4,X12)=0.7903,R(X13,X14)=0.9629,R(X14,X6)=0.7954,R(X3,X7)=0.8796,都属于相关系数相当高的,再结合实际意义,我们都知道,教育经费与各地区高校数和高校在校人数有很强的关系,再对X3,X13,X14作简单回归,得
DependentVariable:
X3
Method:
LeastSquares
Date:
12/13/05Time:
20:
09
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-107739.9
333478.1
-0.323079
0.7490
X13
11.45324
11.90236
0.962266
0.3442
X14
23606.21
18709.68
1.261711
0.2175
R-squared
0.704346
Meandependentvar
1767751.
AdjustedR-squared
0.683228
S.D.dependentvar
1192864.
S.E.ofregression
671373.6
Akaikeinfocriterion
29.76380
Sumsquaredresid
1.26E+13
Schwarzcriterion
29.90258
Loglikelihood
-458.3390
F-statistic
33.35265
Durbin-Watsonstat
2.116204
Prob(F-statistic)
0.000000
上式中可决系数较小,且P值过大,t值也不显著,所有说X3不能由X13和X14替代,由实际意思也知道,教育经费除与学校数,学生数相关外,还与学校等级,学校所在地区经济状况相关,所以我们要保留X3。
再对X13、X14作回归
DependentVariable:
X14
Method:
LeastSquares
Date:
12/13/05Time:
20:
18
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
12.96482
2.271278
5.708160
0.0000
X13
0.000613
3.19E-05
19.21879
0.0000
R-squared
0.927202
Meandependentvar
50.06452
AdjustedR-squared
0.924692
S.D.dependentvar
24.28159
S.E.ofregression
6.663447
Akaikeinfocriterion
6.693492
Sumsquaredresid
1287.644
Schwarzcriterion
6.786007
Loglikelihood
-101.7491
F-statistic
369.3618
Durbin-Watsonstat
1.839489
Prob(F-statistic)
0.000000
并综合考虑,决定舍弃X14(即各地区高校数),因为在当前中国大学高校普遍扩招的情况下,每个学校的学生人数都几乎在一个水平上,所有X14可以由X13间接表示,从上表中也可以看出这点,所以最终保留X13。
这一步我们去掉了X14一个变量。
虽然其余几对变量的相关系数也较高,但它们之间没有直接的因果关系,所以暂时保留。
2、把三个关于交通发展程度的变量都考虑进来显得过余冗杂,所以我们构造新变量X15=X9+X10+X11,名为交通发达程度(公里)。
至此,剩下的变量仍然有11个,仍然过多,所以我们要继续筛选,此时再对剩下的变量作回归,结果如下图:
DependentVariable:
Y
Method:
LeastSquares
Date:
12/13/05Time:
20:
29
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-21933.28
93974.36
-0.233396
0.8179
X1
1185.167
1297.304
0.913561
0.3724
X2
-438.2329
133.0776
-3.293063
0.0038
X3
0.003207
0.001653
1.940378
0.0673
X4
-24.74117
141.2128
-0.175205
0.8628
X5
208.7114
108.5391
1.922914
0.0696
X6
-0.625946
0.524198
-1.194102
0.2471
X7
-7.577568
9.037186
-0.838488
0.4122
X8
696.1704
912.9488
0.762551
0.4551
X12
0.331014
0.107950
3.066359
0.0064
X13
-0.037183
0.037834
-0.982806
0.3381
X15
-0.008471
0.021496
-0.394064
0.6979
R-squared
0.841746
Meandependentvar
14248.65
AdjustedR-squared
0.750125
S.D.dependentvar
4914.869
S.E.ofregression
2456.821
Akaikeinfocriterion
18.73577
Sumsquaredresid
1.15E+08
Schwarzcriterion
19.29086
Loglikelihood
-278.4044
F-statistic
9.187271
Durbin-Watsonstat
2.019385
Prob(F-statistic)
0.000018
从上图中看,DW正好在2的附近,所有可能初步判定该模型不存在自相关的问题,又因为本文选取的是2003年的截面数据,所以也可以不考虑自回归的问题。
因此接下来我们要解决的主要问题是异方差与共线性。
2、通过WHITE检验,如下图
WhiteHeteroskedasticityTest:
F-statistic
9.979173
Probability
0.000620
Obs*R-squared
29.72348
Probability
0.097687
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
12/13/05Time:
21:
03
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
5.05E+10
2.33E+10
2.163941
0.0587
X1
152421.3
1829350.
0.083320
0.9354
X2
-25892600
5528057.
-4.6