最新数学建模教师薪水问题分析人事策略的合理性好好的.docx
《最新数学建模教师薪水问题分析人事策略的合理性好好的.docx》由会员分享,可在线阅读,更多相关《最新数学建模教师薪水问题分析人事策略的合理性好好的.docx(16页珍藏版)》请在冰豆网上搜索。
最新数学建模教师薪水问题分析人事策略的合理性好好的
数学建模教师薪水问题-分析人事策略的合理性-好好的
教师薪金问题
教师薪金问题
摘要
本文是一个关于建立教师薪金影响因素的回归模型。
在模型中我们考虑到了题目给出的所有因素,通过题目给出的数据,发现这七个变量之间与因变量均呈线性关系,因此我们初步的建立了一般的线性回归模型,然后我们用MATLAB软件求解。
我们首先利用MATLAB软件作出薪金与老师工作时间的散点图,然后假设工作时间与教师薪金为线性关系,通过对解出的数据进行分析,我们发现模型存在缺陷,有些变量对因变量的影响不显著,这也就说明性别和婚姻状况上的差异对所调查的教师的薪金影响较小。
经过对模型的各个变量的逐步回归和作残差图,从影响系数的表图中我们得出了工作时间和学历对教师的薪金的影响最大。
关键词:
统计回归模型MATLAB软件残差分析法逐步回归
一、问题提出
某地人事部门为研究中学教师的薪金与他们的资历,性别,教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人士策略的合理,特别是考虑女教师是否受到不公平的待遇,以及他们的婚姻状况是否会影响收入。
为此,从当地教师中随机选了3414位进行观察,然后从中保留了90个观察对象,得到了下表给出的相关数据。
尽管这些数据具有一定的代表性,但是仍有统计分析的必要。
现将表中数据的符号介绍如下:
Z~月薪(单位:
元);X1~工作时间(以月计);X2=1~男性,X2=0~女性;X3=1~男性或单身女性,X3=0~已婚女性;X4~学历(取值0~6,值越大表示学历越高);X5=1~受雇于重点中学,X5=0~其它;;X6=1~受过培训的毕业生,X6=0~未受过培训的毕业生或受过培训的肄业生;X7=1~以两年以上未从事教学工作,X7=0~其他。
注意组合(X2,X3)=(1,1),(0,1),(0,0)的含义。
(1)进行变量选择,建立变量X1~X7与Z的回归模型(不一定包括每个自变量),说明教师的薪金与哪些变量关系密切,是否存在性别和婚姻状况上的差异。
为了数据处理上的方便,建立对薪金取对数后作为因变量。
(2)除了变量X1~X7本身之外,尝试将他们的平方项或交互项加入到模型中,建立更好的模型量。
ZX1X2X3X4X5X6X7
ZX1X2X3X4X5X6X7
1
9987000000
46
2201158114011
2
101514110000
47
2992159115111
3
102818110100
48
1695162010000
4
125019110000
49
1792167110100
5
102819010100
50
1690173000001
6
102819000000
51
1827174000001
7
101827000001
52
2604175112110
8
107230000000
53
1720199010000
9
129030110000
54
1720209000000
10
120430010000
55
2159209014100
11
135231012010
56
1852210010000
12
120431000100
57
2104213110100
13
110438000000
58
1852220000001
14
111841110000
59
1852222000000
15
112742000000
60
2210222110000
16
125942110100
61
2266223010000
17
112742110000
62
202723110000
18
112742000100
63
1852227000100
19
109547000001
64
1852232000001
20
111352000001
65
1995235000001
21
146252012010
66
2616245113110
22
118254110000
67
2324253110100
23
140454000100
68
1852257010001
24
118254000000
69
2054260000000
25
159455112110
70
2617284113110
26
145966000100
71
1948287110000
27
123767110100
72
1720290010001
28
123767010100
73
2604308112110
29
149675010000
74
1852309110101
30
142478110100
75
1942319000100
31
142479010000
76
2027325110000
32
134791110100
77
1942326110100
33
134392000001
78
1720329110100
34
131094000100
79
2048337000000
35
1814103002110
80
2334346112111
36
1534103000000
81
1720355000001
37
1430103110000
82
1942357110000
38
1439111110100
83
2117380110001
39
1946114113110
84
2742387112111
40
2216114114110
85
2740403112111
41
1834114114111
86
1942406110100
42
1414117000001
87
2266437010000
43
2052139110100
88
2436453010000
44
2087140002111
89
2067458010000
45
2264154002111
90
2000464112110
二、基本假设
假设1:
教师薪金除题中所列因素之外不再考虑其他因素对教师薪金的影响。
假设2:
工作时间对教师薪金影响是成线性分布的。
假设3:
其他因素对教师薪金的影响也是成线性的。
假设4:
女性是否结婚与其工作能力无关。
假设5:
该地区的人事部门对中学教师的薪金调查是可信的。
三、符号说明
符号
意义
单位
备注
Z
月薪
元
工作时间
月
性别
婚姻状况
学历
是否受雇于重点中学
是否受过培训
从事教育年限
回归系数
随机误差
四、问题分析
本题要求我们分析教师薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系。
按到日常生活中的常识,教师薪金应该与他们的资历、受教育程度有密切关系,资历高、受教育程度高其薪金也应该相应的要高,与其性别、婚姻状况应该没有必然的联系。
为了说明教师薪金与各个因素之间的关系以及女教师是否受到不公正的待遇,她们的婚姻状况是否影响其收入。
我们建立统计回归模型,通过各组数据来说明它们之间的关系,并进一步分析论证来确定影响教师薪金的因素。
五、模型的建立与求解
首先,我们把所有的相关变量都予以考虑,分别对作散点图,分
别得到与各个变量之间的关系,在下面的散点图中我们可以很
清楚的看到,再根据题目的建议和运算的方便我
们开始对薪金取自然对数进行计算.由此,我们初步地得出了一个基本
的线性回归模型如下:
的散点图
然后我们用MATLAB求解此模型,直接在MATLAB中输入命令(见附录),我们可以得到结果(如下图),我们可以得到
值
参数
参数估计值
置信区间
1.1311
[1.02681.2353]
0.0027
[0.00230.0031]
-0.0229
[-0.14320.0974]
0.0094
[-0.10050.1193]
0.1089
[0.02960.1882]
0.0385
[-0.06700.1440]
0.1817
[-0.05070.4142]
0
[00]
=0.7889
F=51.6934
P=0
六、结果分析
由上表中
=0.7889可以知道薪金(
)的78.89%可由模型确定,由
远小于0.05,模型从整体上看是成立的,但是还可以看到一个问题,也就是说有些变量的置信区间是包含0点的,因此我们可以知道
对因变量(
)的影响是不太显著的.
模型的改进;
我们可以把它们剔除掉,保留
建立逐步线性回归方程,根据题目的建议,我们尝试将它们的交互项和平方项加入其中,经过反复几次的尝试我们得到了相对较好的模型,得到如下方程:
用MATLAB来解上式模型:
在MATLAB中运行
>>
>>
得到了
值和置信区间如下:
参数
参数估计值
置信区间
6.9026
[6.85576.9496]
0.0043
[0.00370.0049]
0.1746
[0.10730.2419]
-0.0001
[-0.00030.0001]
-0.0000
[-0.0000-0.0000]
-0.0228
[-0.0371-0.0085]
=0.9008
F=152.6081
P=0
在上述改进的模型中,通过数据我们可以看到
明显地得到了提高,也就是说薪金
的90.08&均可由模型确定.
远小于0.05,模型从整体上看是成立的
进行残差分析:
在MATLAB中运行命令:
>>rcoplot(r,rint)
可以得到残差分析:
.
残差图
在残差图中我们可以看到,除个别数据(在图中用红色表示)外,其他数据的残差离零点均较近,且残差的置信区间都包含零点.这说明回归模型
能较好地符合原始数据.而个别异常点可以去掉.
七、模型的评价与推广
优点:
1.该模型将现实中的人事策略问题用简单的线性规划问题进行分析计算.结构简单,计算方便,有利于对相似问题进行求解和对模型进行扩充.比如教学评估问题,公司员工薪金问题等模型求解.
2.根据已知的数据,从常识和经验进行分析,辅作散点图,决定取那几个回归变量及它们的函数形式.
缺点:
该模型在处理此问题时有假设与理想化的思想,与实际问题的求解
还有一定的距离.比如所求模型结果只达到了模型设想的90%左右.
八、参考文献
姜启源谢金星叶俊数学模型(第三版)高等教育出版社
九、附录
stats=
0.789543.92420.00000.0183
>>xi;
>>x2;
>>x3;
>>x4;
>>x5;
>>x6;
>>x7;
>>x=[xi,x2,x3,x4,x5,x6,x7];
>>stepwise(x,z)
[b,bint,r,rint,stats]=regress(z,x);
>>[b,bint,r,rint,stats]=regress(z,x)
b=
7.0625
0.0017
0.0029
-0.0014
0.0691
0.0180
0.0795
-0.0200
bint=
6.99767.1275
0.00140.0019
-0.08070.0866
-0.08660.0839
0.02060.1175
-0.05130.0873
-0.06590.2250
-0.08860.0487
r=
-0.1685
-0.1649
-0.1769
0.0350
-0.1756
-0.1590
-0.1621
-0.1354
0.0481
-0.0180
-0.1213
-0.0390
-0.1194
-0.1134
-0.1055
-0.0143
-0.1070
-0.1235
-0.1227
-0.1147
-0.0383
-0.0794
0.0762
-0.0779
-0.0178
0.0946
-0.0737
-0.0708
0.1239
0.0487
0.0679
-0.0287
0.0062
-0.0600
0.0328
0.1008
0.0291
0.0040
0.0141
0.0749
-0.0943
0.0174
0.3120
0.1311
0.1891
0.0326
-0.0157
0.1033
0.1297
0.1006
0.1769
0.2724
0.0561
0.0380
-0.0276
0.1117
0.2133
0.1135
0.0902
0.2654
0.2917
0.1773
0.0638
0.0935
0.1628
0.0909
0.2458
0.0530
0.1302
0.0260
0.0305
-0.0761
0.0500
-0.0549
-0.0426
0.0067
-0.0558
-0.1822
-0.0015
-0.1031
-0.1862
-0.0896
-0.0218
-0.0105
-0.0380
-0.1896
-0.0662
-0.0206
-0.1932
-0.4748
rint=
-0.42850.0915
-0.42280.0931
-0.43460.0809
-0.22560.2956
-0.42460.0734
-0.41950.1016
-0.42070.0964
-0.39690.1260
-0.21270.3090
-0.27720.2413
-0.36240.1197
-0.29940.2214
-0.38130.1425
-0.37360.1468
-0.36770.1568
-0.27580.2472
-0.36740.1533
-0.38280.1358
-0.38280.1374
-0.37510.1457
-0.26560.1890
-0.34060.1817
-0.18420.3366
-0.34080.1850
-0.27480.2393
-0.16570.3548
-0.33550.1880
-0.32390.1823
-0.13510.3830
-0.21370.3110
-0.19220.3281
-0.29140.2341
-0.25610.2686
-0.32100.2010
-0.21860.2842
-0.16200.3637
-0.23360.2918
-0.25930.2672
-0.24590.2740
-0.17670.3265
-0.34480.1562
-0.24520.2800
0.05750.5664
-0.12170.3840
-0.06200.4402
-0.21180.2769
-0.25060.2192
-0.15730.3640
-0.13260.3920
-0.16120.3624
-0.08300.4367
0.02020.5245
-0.20520.3174
-0.22460.3006
-0.20840.1533
-0.14870.3721
-0.04640.4729
-0.14760.3747
-0.17150.3519
0.00880.5220
0.03830.5451
-0.08300.4376
-0.19610.3237
-0.16790.3549
-0.09680.4225
-0.16840.3501
-0.01200.5037
-0.20320.3092
-0.12960.3900
-0.23320.2853
-0.23160.2926
-0.33170.1795
-0.20780.3078
-0.30770.1979
-0.29970.2146
-0.25450.2679
-0.31760.2060
-0.44110.0766
-0.25980.2568
-0.35880.1527
-0.44150.0692
-0.34900.1697
-0.27720.2335
-0.26620.2451
-0.29310.2170
-0.44530.0661
-0.32040.1880
-0.27430.2331
-0.44300.0566
-0.7036-0.2460