工资模型.docx
《工资模型.docx》由会员分享,可在线阅读,更多相关《工资模型.docx(37页珍藏版)》请在冰豆网上搜索。
![工资模型.docx](https://file1.bdocx.com/fileroot1/2023-2/4/74c2ea6e-0612-4b56-b2ba-986bbc0e2c29/74c2ea6e-0612-4b56-b2ba-986bbc0e2c291.gif)
工资模型
职工工资模型
摘要
本文要求我们对某企业职工工资与其影响因素进行分析,并分析出影响工资的主要因素,同时判断女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入,最后要求我们对模型进行优化,得出实用性,可靠性较高的模型。
问题一模型,我们分别建立了多元线性回归模型和多元非线性回归模型,通过eviews运行结果比较可知多元非线性模型具有较高的可行性,即工资一工龄之间为非线性关系。
同时我们通过SPSS利用主成分分析法分析了工资的影响因素,得出了结论:
影响工资的主要因素为工龄,学历,培训情况,一线经历。
问题二模型,通过问题一的主成分分析,我们对问题一的模型进行了简化,剔除次要因素,使得模型更具有实用性,也更便于数据较多时的计算。
而后对女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入进行了判断,得出结论:
该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入。
问题三模型,我们采用逐步回归分析法,对问题一的模型中的解释变量逐个引入,通过检验是否合格来筛选解释变量,因此,该模型具有很高的可靠性。
最后对模型进行了误差分析,可知模型四具有较高的可行性,最后我们得出结论:
工龄和学历是影响该企业职工工资的关键因素。
模型平均误差如下表:
模型一
模型二
模型三
模型四
平均误差
5.87982343
4.55709
4.5866
4.367151
结论1、影响工资的主要因素为工龄,学历,培训情况,一线经历。
2、该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入。
3、工龄和学历是影响该企业职工工资的关键因素。
关键词:
多元线性回归多元非线性回归eviews主成分分析SPSS逐步回归分析法
一、问题重述
1.1问题描述
职工工资可以说是人们最为关切、议论最多的部分,因此也常常是最受重视的部分。
一般说来,现代企业的工资具有补偿职能、激励职能、调节职能、效益职能。
科学合理的工资制度,是激励职工的劳动积极性,提高劳动效率的重要手段,正确运用工资的杠杆作用在调动员工积极性方面会起到事半功倍的效果。
此外,对于企业中的各种不同的“特殊职务族”,是否要制定和执行专门的倾斜与优惠政策,如对管理干部、高级专家、女工等,也是需要重点考虑的问题。
现随机抽取了某企业若干职工的相关数据,见附件Bdata.xls。
请建立适当的数学模型研究下列问题:
1.2问题提出
(1)分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;
(2)考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;
(3)继续改进你的模型,并给出模型误差分析。
二问题分析
本题要求我们分析企业员工的平均日工资与其他影响因素之间的关系,同时指出哪些因素对平均日工资影响较大。
我们先建立简单的多元线性回归模型,对日工资与各因素之间的关系进行粗略的分析,因考虑到工龄达到一定程度后,工龄再增大对模型的结果影响不大,故建立了多元非线性回归模型,拟合平均日工资。
。
用主成分分析法[1]对各个因素进行分析,并找出对日工资影响较大的几个。
接着,我们剔除对模型结果影响较小的因素,保留主要因素使模型得到简化,这样更易于计算也更符合实际。
最后我们利用逐步回归法[2]对问题一的模型进行改进,剔除对工资影响较小的因素,使得模型得到优化。
三、模型假设因素
1、本题所给数据能确实反映出该公司的工资的构成
2、所给数据有较高的可靠性及准确性
3、男性和女性的工资数据在相同条件下获得
4、男性不管是否已婚等同于女性已婚
四、主要符号说明
这里仅给出主要符号说明,其余符号在文中会一一说明
五、问题一模型的建立与求解
5.1多元线性回归模型的建立与求解
5.1.1多元线性回归模型建立
首先对题目所给数据进行量化,量化结果见附录附表一
假设该企业员工工资与其影响因素满足多元线性关系,且各因素没有相互影响,由此建立多元线性回归模型,得:
(5-1)
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)是待回归系数参量,
是满足正态分布的随机误差。
5.1.2模型求解
利用eviews软件[3]对模型中工资与各个影响因素进行回归分析得如下结果
表一
DependentVariable:
Y
Method:
LeastSquares
Date:
08/18/28Time:
16:
18
Sample:
190
Includedobservations:
90
Y=C
(1)+C
(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7
+C(9)*X8
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
37.14526
2.325447
15.97338
0.0000
C
(2)
0.087893
0.006701
13.11734
0.0000
C(3)
-0.156203
2.239736
-0.069742
0.9446
C(4)
-4.925091
6.531140
-0.754094
0.4530
C(5)
1.218269
2.045119
0.595696
0.5530
C(6)
1.608884
2.617405
0.614686
0.5405
C(7)
0.981923
2.701711
0.363445
0.7172
C(8)
24.63417
5.789966
4.254631
0.0001
C(9)
17.13245
6.680527
2.564536
0.0122
R-squared
0.796310
Meandependentvar
57.63333
AdjustedR-squared
0.776193
S.D.dependentvar
16.23594
S.E.ofregression
7.680945
Akaikeinfocriterion
7.010002
Sumsquaredresid
4778.750
Schwarzcriterion
7.259983
Loglikelihood
-306.4501
Durbin-Watsonstat
1.066961
由此可得出各待定系数的值如下表:
表二
参量
参量估计
C
(1)
37.14526
C
(2)
0.087893
C(3)
-0.156203
C(4)
-4.925091
C(5)
1.218269
C(6)
1.608884
C(7)
0.981923
C(8)
24.63417
C(9)
17.13245
将结果带入模型得
(5-2)
5.1.3结论与检验
5.1.3.1对模型的检验
相关系数检验法
在模型中,相关系数的计算公式为:
(5-3)
此公式反映出了X与Y线性度的一个度量指标,其中r范围为(0,1),r越接近1,则X与Y线性度越高。
由相关系数检验法计算得到
r=0.8924
可见r并不接近1,线性相关度并不高,因此,该企业职工工资与个因素之间并不是线性关系。
图一
通过eviews得到实际值、拟合值、残差的走势图,从图中可以看出拟合值与实际值存在较大误差,因此该模型需要进一步的改进
5.3.1.2结论
该模型中,本文建立了多元线性回归模型,简单的给出了该企业工资与影响因素之间的关系。
由于考虑到工龄增加到一定程度后继续增加对模型的影响较小,同时该模型优化拟合度只有0.8924,故该模型并不可靠,我们需要引入非线性量对模型进行改进。
5.2多元非线性回归模型的建立与求解
5.2.1模型建立
考虑到工龄增加到一定程度后继续增加,对工资的影响程度较小,因此建立工资关于各因素的多元非线性模型:
(5-4)
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量,
是满足正态分布的随即误差。
5.2.2模型求解
利用eviews软件对模型中工资与各个影响因素进行回归分析得如下结果
表三
DependentVariable:
Y
Method:
LeastSquares
Date:
08/18/28Time:
17:
58
Sample:
190
Includedobservations:
90
Y=C
(1)+C
(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7
+C(9)*X8+C(10)*X1^2
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
29.69142
2.081745
14.26275
0.0000
C
(2)
0.222376
0.019167
11.60186
0.0000
C(3)
-2.458851
1.775009
-1.385261
0.1698
C(4)
-2.773818
5.101962
-0.543677
0.5882
C(5)
-0.436665
1.610987
-0.271054
0.7870
C(6)
1.932692
2.041714
0.946603
0.3467
C(7)
0.841216
2.107066
0.399236
0.6908
C(8)
19.61945
4.567470
4.295474
0.0000
C(9)
17.80518
5.210745
3.417012
0.0010
C(10)
-0.000320
4.39E-05
-7.292542
0.0000
R-squared
0.877646
Meandependentvar
57.63333
AdjustedR-squared
0.863882
S.D.dependentvar
16.23594
S.E.ofregression
5.990123
Akaikeinfocriterion
6.522540
Sumsquaredresid
2870.526
Schwarzcriterion
6.800297
Loglikelihood
-283.5143
Durbin-Watsonstat
1.583030
算法同模型一,由此可得出各系数的值如下表:
表四
参量
参量估计
C
(1)
29.69142
C
(2)
0.222376
C(3)
-2.458851
C(4)
-2.773818
C(5)
-0.436665
C(6)
1.932692
C(7)
0.841216
C(8)
19.61945
C(9)
17.80518
C(10)
-0.000320
将结果带入模型,得到该公司员工工资与影响因素之间的关系为:
(5-5)
5.2.3结论与检验
5.2.3.1模型的检验
检验方法同模型一
本模型中r=0.9368,接近1,因此本模型满足非线性关系,比模型一更实际,应用范围也更广,具有比较高的运用价值。
图二
同样我们通过eviews得到实际值、拟合值、残差的走势图,从图中可以看出,模型的拟合优度值比较高,样本的拟合值与实际值基本吻合,模型具有较高的实用价值。
5.2.3.2结论
我们建立了多元非线性回归模型,给出了该企业员工的工资与其影响因素的非线性关系。
由于考虑到了工龄增加到一定程度后继续增加对模型的影响较小,使得模型的拟合优度达到了0.8639,因此模型二更具有实际应用价值和可靠性。
5.3企业职工工资影响因素主成分分析
5.3.1下表给出了影响该企业职工工资的8项变量指标。
(详见附录附表一)
其中x1表示职工工龄(月),x2表示职工是否有过一线工作经历,
x3表示是否接受过培训,x4表示工作性质,
x5表示职工性别,x6表示职工婚姻状况,
x7、x8联合表示职工学历情况
表五
序号
x1
x2
x3
x4
x5
x6
x7
x8
1
7
0
0
0
0
1
0
0
2
14
0
0
0
1
1
0
0
3
18
0
0
1
1
1
0
0
…
…
…
…
…
…
…
…
…
85
403
1
1
1
1
1
0
1
90
464
0
1
1
1
1
0
1
将表中的原始数据按公式
(5-6)
做标准化处理,然后将它们代入相关系数公式计算,得到相关系数矩阵
表六
X1
X2
X3
X4
X5
X6
X7
X8
X1
1.000000
0.151146
0.156321
0.098854
0.160389
0.009829
0.005996
0.180312
X2
0.151146
1.000000
0.255665
-0.053068
-0.104982
0.254374
0.094888
0.255223
X3
0.156321
0.255665
1.000000
0.423355
0.316025
0.095618
0.490436
0.802955
X4
0.098854
-0.053068
0.423355
1.000000
0.417621
0.229484
0.263066
0.346091
X5
0.160389
-0.104982
0.316025
0.417621
1.000000
0.409081
0.263066
0.161418
X6
0.009829
0.254374
0.095618
0.229484
0.409081
1.000000
0.034922
0.027420
X7
0.005996
0.094888
0.490436
0.263066
0.263066
0.034922
1.000000
-0.026333
X8
0.180312
0.255223
0.802955
0.346091
0.161418
0.027420
-0.026333
1.000000
通过SPSS软件[4]由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率
5.3.2
表七
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
2.674
33.428
33.428
2.674
33.428
33.428
2
1.350
16.876
50.304
1.350
16.876
50.304
3
1.149
14.357
64.661
1.149
14.357
64.661
4
1.013
12.669
77.330
1.013
12.669
77.330
5
.897
11.213
88.543
.897
11.213
88.543
6
.542
6.781
95.324
7
.330
4.123
99.448
8
.044
.552
100.000
提取方法:
主成份分析。
由此得到各个成分的贡献率与累计贡献率
表八
影响因素
原变量
成份
特征值
贡献率%
累积贡献率%
工龄(月)
x1
1
2.674
33.428
33.428
学历
x7
2
1.350
16.876
50.304
x8
3
1.149
14.357
64.661
培训情况
X3
5
1.013
12.669
77.330
一线经历
X2
6
.897
11.213
88.543
性别
X5
7
.542
6.781
95.324
婚姻状况
X6
4
.330
4.123
99.448
工作性质
X4
8
.044
.552
100.000
结果分析
由分析结果可得知在所有影响职工工资的因素中,工龄,学历,培训情况,一线经历对职工的工资影响比较大,尤其是工龄以及学历对工资的影响较大。
六、问题二模型建立与求解
6.1问题分析
通过问题一的5.3的分析可以得出,影响该企业职工的工资的主要因素为工龄,学历,培训情况,一线经历。
因而我们在建立模型的时候可以排除次要因素的影响,使模型简化而更易于实际操作。
6.2模型的建立
通过对之前的主成分分析,我们剔除了对模型结果影响不大的工作性质,性别,婚姻状况几个因素,对模型进行了简单化处理,使得模型更加简易。
由于考虑到工龄,学历,培训情况,一线经历这些影响较大的因素,我们建立如下模型:
(6-1)
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)是待回归系数参量,
是满足正态分布的随即误差。
此模型自变量较少,因此可以更好的适用于实际情况。
6.3模型的求解
通过eviews软件对y,x1,x2,x3,x7,x8,x12进行回归分析可以得到各自变量系数的值,运行结果如下表:
表九
DependentVariable:
Y
Method:
LeastSquares
Date:
08/19/10Time:
20:
34
Sample:
190
Includedobservations:
90
Y=C
(1)+C
(2)*X1+C(3)*X2+C(4)*X3+C(5)*X7+C(6)*X8+C(7)*X1^2
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
30.60164
1.519258
20.14248
0.0000
C
(2)
0.222447
0.018659
11.92158
0.0000
C(3)
-2.428197
1.545233
-1.571412
0.1199
C(4)
-1.686006
4.921521
-0.342578
0.7328
C(5)
19.14110
4.353868
4.396344
0.0000
C(6)
16.80218
4.937967
3.402651
0.0010
C(7)
-0.000320
4.29E-05
-7.444191
0.0000
R-squared
0.876059
Meandependentvar
57.63333
AdjustedR-squared
0.867099
S.D.dependentvar
16.23594
S.E.ofregression
5.918909
Akaikeinfocriterion
6.468768
Sumsquaredresid
2907.779
Schwarzcriterion
6.663197
Loglikelihood
-284.0945
Durbin-Watsonstat
1.651991
由表可得到各自变量系数的值如下:
表十
参量
参量估计
C
(1)
30.60164
C
(2)
0.222447
C(3)
-2.428197
C(4)
-1.686006
C(5)
19.14110
C(6)
16.80218
C(7)
-0.000320
将结果带入模型得到该公司员工工资与影响因素之间的关系为:
(6-2)
6.4结论与检验
6.4.1模型检验
有运算结果可以得出P值除了个别外数值都接近于0或为0,因此P检验通过。
D.W值为1.65接近2
表中拟合优度R2=0.8761,接近于1,表明模型拟合优度较高。
各种分析表明,此模型具有较高的可行性与可靠性,同时也简化的影响因素,使得更加具有实用价值。
6.4.2考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入
我们利用模型选取一组x1,x2,x3,x4,x7,x8相近,且代表性别婚姻的x5,x6取不同值,检验输出值,与期望值的误差在可接受范围内。
计算结果如下,比较可知,性别对工资影响小,因此可以说明该企业女性职工并未受到不公平待遇。
而女性的婚姻状况对工资虽有一定的影响,但影响导致的误差在允许范围内,可以忽略不计,因此,可以认为,该企业女性职工的婚姻状况不影响其收入。
表十一
y
X1
X2
X3
X4
X5
X6
X7
X8
y’
37
38
0
0
0
0
1
0
0
41.7565
37
41
0
0
0
1
1
0
0
42.022
38
42
0
0
0
0
1
0
0
42.1105
42
42
0
0
1
1
1
0
0
42.1105
38
42
0
0
0
1
1
0
0
42.1105
38
42
0
0
1
0
1
0
0
42.1105
6.4.3结论
模型三中,根据问题一中的主成份分析结果,采用剔除法将对工资影响不大的因素剔除,并利用回归法对模型进行回归。
这种简化的模型,在实际应用中,特别是当需要计算的工资数目非常多时,用此法可以较精确的计算出结果,因此有重要的实际意义。
通过对数据的分析我们得出结论:
该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入。
七、问题三模型的建立与求解
7.1问题分析
本文要求我们进一步改进模型,使得模型更加合理有效,为此我们利用模型二,采用逐步回归法,对模型二进行改进,检验及修正。
7.2模型的建立
7.2.1模型二为:
(7-1)
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量,
是随即误差。
首先我们对模型二所有变量做回归分析,回归结果如下:
表十二
DependentVariable:
Y
Method:
LeastSquares
Date:
08/20/10Time:
01:
50
Sample(adjusted):
189