数学建模教师的薪金.docx
《数学建模教师的薪金.docx》由会员分享,可在线阅读,更多相关《数学建模教师的薪金.docx(26页珍藏版)》请在冰豆网上搜索。
数学建模教师的薪金
昆明理工大学第六届大学生数学建模竞赛
承诺书
我们仔细阅读了昆明理工大学大学生数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的。
如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
评阅编号(由组委会评阅前进行编号):
昆明理工大学第六届大学生数学建模竞赛
评阅专用页
评阅编号(由组委会评阅前进行编号):
评阅记录(供评阅时使用):
评阅人
评分
备注
总分
大学教师薪金模型
一、摘要:
模型一:
利用Matlab建立X1--X7与Z(薪金)的线性关系,得到散点图与一般的线性回归模型(模型一),模型如下:
模型二:
由模型一整体效果与StepwiseTable图推断部分变量对Z(薪金)的影响并不显着,由残差分析法筛选出影响明显的变量X1、X4,将他们的平方项与交互项加入建立新的回归模型(模型二),模型如下:
得到R2,F,P,与模型一相比较。
模型一调用原始参数较全,但回归性差,模型二只启用影响明显的变量,回归模型更为显着,可靠度更高。
于是得出:
教师的薪金与工作时间、学历关系明显,与性别、是否受雇于重点大学、是否接受过培训的关系较小,即女教师没有受到不公正的待遇,婚姻状况也不会影响收入。
关键词:
回归分析,互交作用,图形结合,残值分析法。
二、问题重述:
某地人事部门为研究中学教师的薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人事策略的合理性,特别是考察女教师是否受到不公平的待遇,以及她们的婚姻状况是否会影响收入。
要求从当地教师中随机选了3414位进行观察后,从中所保留的90个观察对象的数据进行分析。
(1)进行变量,建立变量与的回归模型的关系,说明教师薪金与哪些变量的关系密切,是否存在性别和婚姻状况上的差异。
(2)除了变量本身之外,尝试将它们的平方项或交叉项加到模型中,建立更好的模型。
三、模型假设:
1、该地区的人事部门对中学教师的薪金调查是可信的;
2、各参数对薪金的影响呈线性关系;
3、工作时间、性别、教育程度及培训情况之间相互独立,没有交互作用;
四、符号说明:
Z:
月薪(元);
X1:
工作时间(月);
X2:
1男性,女性;
X3:
1男性或单身女性,0已婚女性;
X4:
学历(取值0-6,值越大表示学历越高);
X5:
1受雇于重点大学,0其它;
X6:
1受过培训的毕业生,0未受过培训的毕业生或受过培训的肄业生;
X7:
1已两年以上未从事教学工作,0其它。
五、分析与建立模型:
首先,调用所有相关变量,运用Matlab分别得到,Z与X1--X7之间的关系及散点图,由此知Z与各变化量呈线性关系,于是可以建立线性回归模型:
Z(薪金)为因变量,X1--X7分别表示对Z的值产生影响的各个变量,
表示回归系数,
表示随机变量.
用Matlab求解模型(见附录),得到
的值与置信区间如下:
参数
参数估计值
置信区间
1.1311
[1.02681.2353]
0.0027
[0.00230.0031]
-0.0229
[-0.14320.0974]
0.0094
[-0.10050.1193]
0.1089
[0.02960.1882]
0.0385
[-0.06700.1440]
0.1817
[-0.05070.4142]
0
[00]
=0.7889
F=51.6934
P=0
表一
由上表中
=0.7889可以知道薪金(
)的78.89%可由模型确定,由P=0远小于0.05,模型从整体上看是成立的,但是还可以看到一个问题,即些部分的置信区间包含0点,因此我们可以知道这些变量对因变量的影响是不显着的.在Matlab中运行stepwise命令得到下图:
由图可知,在模型中
对因变量的影响是不显着的.
于是只保留
,并将它们的交互项和平方项加入,建立逐步线性回归方程如下:
然后使用Matlab求解模型(程序见附录),得到
值与置信区间如下:
参数
参数估计值
置信区间
6.9026
[6.85576.9496]
0.0043
[0.00370.0049]
0.1746
[0.10730.2419]
-0.0001
[-0.00030.0001]
-0.0000
[-0.0000-0.0000]
-0.0228
[-0.0371-0.0085]
=0.9008
F=152.6081
P=0
通过新建模型中得到的数据,可以看到
明显提高,薪金
的90.08%可由模型确定.
远小于0.05,F远超过临界值,回归模型更为显着,可靠度增高.
然后进行残差分析,在Matlab中运行命令rcoplot得到残差图如下:
由图可知,除个别数据外,其他数据的残差离零点均较近,且残差的置信区间都包含零点.这说明回归模型能较好地符合原始数据,而个别异常点可以忽略.
六、模型的评价
优点:
1.该方案实用简单,可行性强,模型简单,易于理解。
2.模型一首先用简单的线性规划进行分析.结构简单,计算方便,有利于对相似问题进行求解和对模型进行扩充。
3.模型二的建立是从一般问题到特殊问题的发展过程.根据已知的数据,从常识和经验进行初步分析,并运用了逐步线性回归方法以及辅作散点图,决定取那几个回归变量及它们的函数形式.把对
影响不显着的变量(
)予以排除,又运用残值分析法建立新的回归模型.使得精确值增高,模型更合理.
缺点:
1该模型在处理此问题时有假设与理想化的思想,与实际问题的求解
还有所差距.比如所求模型结果只达到了模型设想的80%左右.
七、参考文献
【01】赵静,数学建模与数学实验,北京,高等教育出版社,2003
【02】苏彦华,MATLAB7.0从入门到精通,北京,人民邮电出版社,2010
八、附录:
1、薪金模型数据表:
编号
Z
X1
X2
X3
X4
X5
X6
X7
1
998
7
0
0
0
0
0
0
2
1015
14
1
1
0
0
0
0
3
1028
18
1
1
0
1
0
0
4
1250
19
1
1
0
0
0
0
5
1028
19
0
1
0
1
0
0
6
1028
19
0
0
0
0
0
0
7
1018
27
0
0
0
0
0
1
8
1072
30
0
0
0
0
0
0
9
1290
30
1
1
0
0
0
0
10
1204
30
0
1
0
0
0
0
11
1352
31
0
1
2
0
1
0
12
1204
31
0
0
0
1
0
0
13
1104
38
0
0
0
0
0
0
14
1118
41
1
1
0
0
0
0
15
1127
42
0
0
0
0
0
0
16
1259
42
1
1
0
1
0
0
17
1127
42
1
1
0
0
0
0
18
1127
42
0
0
0
1
0
0
19
1095
47
0
0
0
0
0
1
20
1113
52
0
0
0
0
0
1
21
1462
52
0
1
2
0
1
0
22
1182
54
1
1
0
0
0
0
23
1404
54
0
0
0
1
0
0
24
1182
54
0
0
0
0
0
0
25
1594
55
1
1
2
1
1
0
26
1459
66
0
0
0
1
0
0
27
1237
67
1
1
0
1
0
0
28
1237
67
0
1
0
1
0
0
29
1496
75
0
1
0
0
0
0
30
1424
78
1
1
0
1
0
0
31
1424
79
0
1
0
0
0
0
32
1347
91
1
1
0
1
0
0
33
1342
92
0
0
0
0
0
1
34
1310
94
0
0
0
1
0
0
35
1814
103
0
0
2
1
1
0
36
1534
103
0
0
0
0
0
0
37
1430
103
1
1
0
0
0
0
38
1439
111
1
1
0
1
0
0
39
1946
114
1
1
3
1
1
0
40
2216
114
1
1
4
1
1
0
41
1834
114
1
1
4
1
1
1
42
1416
117
0
0
0
0
0
1
43
2052
139
1
1
0
1
0
0
44
2087
140
0
0
2
1
1
1
45
2264
154
0
0
2
1
1
1
46
2201
158
1
1
4
0
1
1
47
2992
159
1
1
5
1
1
1
48
1695
162
0
1
0
0
0
0
49
1792
167
1
1
0
1
0
0
50
1690
173
0
0
0
0
0
1
51
1827
174
0
0
0
0
0
1
52
2604
175
1
1
2
1
1
0
53
1720
199
0
1
0
0
0
0
54
1720
209
0
0
0
0
0
0
55
2159
209
0
1
4
1
0
0
56
1852
210
0
1
0
0
0
0
57
2104
213
1
1
0
1
0
0
58
1852
220
0
0
0
0
0
1
59
1852
222
0
0
0
0
0
0
60
2210
222
1
1
0
0
0
0
61
2266
223
0
1
0
0
0
0
62
2027
223
1
1
0
0
0
0
63
1852
227
0
0
0
1
0
0
64
1852
232
0
0
0
0
0
1
65
1995
235
0
0
0
0
0
1
66
2616
245
1
1
3
1
1
0
67
2324
253
1
1
0
1
0
0
68
1852
257
0
1
0
0
0
1
69
2054
260
0
0
0
0
0
0
70
2617
284
1
1
3
1
1
0
71
1948
287
1
1
0
0
0
0
72
1720
290
0
1
0
0
0
1
73
2604
308
1
1
2
1
1
0
74
1852
309
1
1
0
1
0
1
75
1942
319
0
0
0
1
0
0
76
2027
325
1
1
0
0
0
0
77
1942
326
1
1
0
1
0
0
78
1720
329
1
1
0
1
0
0
79
2048
337
0
0
0
0
0
0
80
2334
346
1
1
2
1
1
1
81
1720
355
0
0
0
0
0
1
82
1942
357
1
1
0
0
0
0
83
2117
380
1
1
0
0
0
1
84
2742
387
1
1
2
1
1
1
85
2740
403
1
1
2
1
1
1
86
1942
406
1
1
0
1
0
0
87
2266
437
0
1
0
0
0
0
88
2436
453
0
1
0
0
0
0
89
2067
458
0
1
0
0
0
0
90
2000
464
1
1
2
1
1
0
2、
与Z的关系及散点图:
>>x1=[7141819191927303030313138414242424247525254545455666767757879919294103103103111114114114117139140154158159162167173174175199209209210213220222222223223227232235245253257260284287290308309319325326329337346355357380387403406437453458464]';|
>>X1=[ones(90,1)x1];
>>Z=[99810151028125010281028101810721290120413521204110411181127125911271127109511131462118214041182159414591237123714961424142413471342131018141534143014391946221618341416205220872264220129921695179216901827260417201720215918522104185218522210226620271852185219952616232418522054261719481720260418521942202719421720204823341720194221172742274019422266243620672000]';
>>x2=[011100001000010110000100101001010000111110100110100100001001010001100110110111010111110001]';
>>X2=[ones(90,1)x2];
>>Z=[99810151028125010281028101810721290120413521204110411181127125911271127109511131462118214041182159414591237123714961424142413471342131018141534143014391946221618341416205220872264220129921695179216901827260417201720215918522104185218522210226620271852185219952616232418522054261719481720260418521942202719421720204823341720194221172742274019422266243620672000]';
x3=[011110001110010110001100101111110000111110100111100110111001110001110111110111010111111111
x3=[011110001110010110001100101111110000111110100111100110111001110001110111110111010111111111]';
>>X3=[ones(90,1)x3];
>>Z=[99810151028125010281028101810721290120413521204110411181127125911271127109511131462118214041182159414591237123714961424142413471342131018141534143014391946221618341416205220872264220129921695179216901827260417201720215918522104185218522210226620271852185219952616232418522054261719481720260418521942202719421720204823341720194221172742274019422266243620672000]';
>>x4=[000000000020000000002000200000000020003440022450000200400000000003000300200000020002200002]';
>>X4=[ones(90,1)x4];
>>Z=[99810151028125010281028101810721290120413521204110411181127125911271127109511131462118214041182159414591237123714961424142413471342131018141534143014391946221618341416205220872264220129921695179216901827260417201720215918522104185218522210226620271852185219952616232418522054261719481720260418521942202719421720204823341720194221172742274019422266243620672000]';
x5=[001010000001000101000010111101010110011110111010100100101000001001100100111011010001110001]';
>>X5=[ones(90,1)x5];
>>Z=[99810151028125010281028101810721290120413521204110411181127125911271127109511131462118214041182159414591237123714961424142413471342131018141534143014391946221618341416205220872264220129921695179216901827260417201720215918522104185218522210226620271852185219952616232418522054261719481720260418521942202719421720204823341720194221172742274019422266243620672000]';
>>x6=[000000000010000000001000100000000010001110011110000100000000000001000100100000010001100001]';
>>X6=[ones(90,1)x6];
>>Z=[9981015102812501028102810181072129012041352120411041118112712591127112710951113146211821404118215941459123712371496142414241347134213101814153414301439194622161834141620522087226422012992169