招聘问题数学建模.docx

资源描述

招聘问题数学建模.docx

《招聘问题数学建模.docx》由会员分享，可在线阅读，更多相关《招聘问题数学建模.docx（32页珍藏版）》请在冰豆网上搜索。

招聘问题数学建模.docx

招聘问题数学建模

2013高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：

我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：

西南科技大学

参赛队员（打印并签名）：

1.李扬

2.王佐泽

3.汪婧婷

指导教师或指导教师组负责人（打印并签名）：

郭晓波胡波文林军

日期：

2013年8月12日

赛区评阅编号（由赛区组委会评阅前进行编号）：

2013高教社杯全国大学生数学建模竞赛

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

赛区评阅记录（可供赛区评阅时使用）：

评

阅

人

评

分

备

注

全国统一编号（由赛区组委会送交全国前编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

摘要

本文利用统计学知识，结合软件spss、excel、matlab对招聘中各问题，模型进行求解。

关于问题一，如何补齐缺失数据，我们知道此数据样本为大容量样本，不完全数据集中数据的缺失依赖于完全变量，这种缺失模式为随机缺失。

且本文缺失数据极少，我们采用均值填充。

由于均值填充需要满足服从正态分布的前提，所以我们首先检验甲、乙、丙三组数据是否服从正态分布。

利用软件spss正态性检验后证明服从，故用均值法填充。

最终得到甲组第9个数据为77；乙组第25个数据为80；丙组第58个数据为80。

关于问题二，如何给出101位应聘者的录取顺序，我们考虑到不同才的专家对同一应聘者的欣赏程度不同，所打的分数也会不同，因此不同专家所打每1分的贡献值也不同。

为了调节每位专家所打一分的贡献值在同一水平线上，我们将每位专家所打的分数进行方差压缩，而这个水平我们选取五位专家方差的均值，然后对所有专家的分数进行调节，经过调整后，所有专家的均值相同，方差也相同，从而不同专家打分产生的干扰就会被最大程度地清除。

进行排序后录取顺序也会公正合理。

具体录取顺序见下表。

关于问题三，如何比较五位专家中哪位打分比较严格，哪位比较宽松，我们将五位专家打分用spss进行两两显著性差异分析，得出除甲-丙外p值都>0.05，显然只有甲-丙专家组打分有显著性差异。

再计算五位专家打分方差，方差越大，分数波动越大，打分越严格。

结合可得专家甲打分最为严格，专家丙打分最为宽松。

关于问题四

关于问题五

一、问题重述

某单位组成了一个五人专家小组，对101名应试者进行了招聘测试，各位专家对每位应聘者进行了打分（见附表），请你运用数学建模方法解决下列问题

问题一：

补齐表中缺失的数据,给出补缺的方法及理由。

问题二：

给出101名应聘者的录取顺序。

问题三：

五位专家中哪位专家打分比较严格，哪位专家打分比较宽松。

问题四：

你认为哪些应聘者应给予第二次应聘的机会

问题五：

如果第二次应聘的专家小组只由其中的3位专家组成，你认为这个专家组应由哪3位专家组成。

二、符号说明

三、问题假设

1.假设题目所提供的数据准确无误，具有可靠性。

2.假设甲、乙、丙、丁、戊五位专家的打分都保持客观、公平公正。

3.假设应聘者录用与否只和专家对其所打的分有关，不考虑外界因素。

4.假设应聘单位对每位专家打分的重视度相同。

5.假设第四问中，二次应聘分为两种情况。

四、模型分析

4.1问题一的分析

根据题目附件我们知道甲、乙、丙、丁、戊五位专家对101位应聘者每人的打分。

由于特殊情况，甲、乙、丙三位专家在101位应聘者中各有一个数据缺失。

问题一要求我们补齐表中缺失的数据。

处理缺失数据前首先要判别缺失机构，此文不完全数据集中数据的缺失依赖于完全变量，这种缺失模式为随机缺失。

此题样本>30，大样本容量我们可以选用均值填充。

均值填充是用已观测到的数据作为缺失值的代替值，但前提条件是变量服从正态分布或近似服从正态分布。

所以我们第一步应该检验变量甲、乙、丙组打分是否服从正态分布。

由软件spss分析统计箱在置信度为95%的条件下，甲组P值略小于0.05，但由于数据的随机性以及大样本变量，可将甲组近似看做正态分布；乙组p=0.20>0.05,服从正态分布;丙组p=0.154>0.05,服从正态分布。

综上，我们用spss软件以均值填充的方法得出甲组均值为77.37，四舍五入后得到甲组第9个数据为77；乙组均值为79.86，四舍五入后得到乙组第25个数据为80；丙组均值为80.42，四舍五入后得到丙组第58个数据为80。

4.2问题二的分析

题目要求我们给出101名应聘者的录取顺序。

根据问题一，补齐缺失数据后得到5位专家对101名应聘者的打分的完整数据。

在处理好的数据中，每一位专家所给的分数会出现最高分和最低分，而最高分和最低分不能直接去掉，也不能简单地取平均值。

考虑到不同专家对同一应聘者的优劣程度会有所不同，所打的分数也会不相同，因而每位专家给出1分的贡献值也就不同。

为了最大程度地消除不同专家打分产生的干扰，我们将分数进行调整。

4.3问题三的分析

第三问题目要求我们比较五位专家中哪位专家打分严格，哪位专家打分宽松。

由题目含义可知，五位专家中个别专家打分有明显差异。

首先我们可以进行差异显著性分析，显著性差异（p），是统计学上对数据差异性的评价。

当数据之间具有了显著性差异，就说明参与比对的数据不是来自于同一总体（Population），而是来自于具有差异的两个不同总体。

我们将甲、乙、丙、丁、戊五组数据用spss软件进行两两差异性分析，结果得到除甲-丙外，其余两两一组之间p值皆>0.05，可见除甲-丙外其余专家之间无显著性差异。

同时我们又采取计算五位专家分数样本方差，通过其值比较大小来验证上面所得结论，方差越大，波动程度越大。

由下文模型可解得专家甲最严格，专家丙最宽松。

4.4问题四的分析

通过查阅资料【1】，我们了解到：

大多数公司招聘的人数与应聘的人数呈1:

3的比例。

所以为了方便计算，我们假设这所单位需要招聘的人数为30人。

题目要求我们找出应给予第二次应聘机会的应聘者，查阅资料【2】后了解到：

大多数公司招聘职员都会进行不少于两次招聘测试，但也有少数急需用人的公司招聘职员仅进行一次招聘测试。

为了不将问题太过复杂化，我们决定仅讨论这所单位的招聘测试进行一次和两次这两种情况。

4.5问题五的分析

题目要求我们判断第二次应聘的专家小组应由哪三位组成。

根据查阅资料及分析得出，为了保证所招职员的质量，因此参加第二次应聘的专家应该比较严格。

由第三问了解到，专家甲打分最为严格，专家丙打分最为宽松，由于第二次招聘是要选取真正的优秀者，所以首先将专家甲列入专家小组、专家丙不予考虑。

然后比较剩余三位专家打分权重（重是一权个相对的概念，针对某一个指标而言，某一个指标的权重是指指标在整体评价中的相对重要程度。

）。

五、模型的建立与求解

5.11问题一的建立

经过分析得出，第一步用spss软件进行正态分布检验：

若随机变量

服从一个位置参数为

尺度参数为

的概率分布，且其概率密度函数为

则这个随机变量就称为正态随机变量，正态随机变量服从的分布就称为正态分布，记作

，读作

服从

，或

服从正态分布。

首先根据函数图像直观地判断甲、乙、丙三组数据是否满足正态分布，再根据spss正态性检验sig值进行判断。

若p值>0.05，则服从正态分布,反之,则不服从。

第二步：

根据均值填充计算方法算出缺失数据。

5.12问题一的求解

根据上述方法，分别检验甲、乙、丙三组数据是否服从正态分布。

应用spss软件analysis中得出甲组打分直方图如下：

从下图看出专家甲在70到80分段分数频率较小，但由于样本容量远>30,且p值略<0.05，可近似看做服从正态分布。

在满足正态分布的条件下，用spss计算出均值为76,5544554，四舍五入后填入第9个缺失数据为77。

相同原理可得乙组数据的直方图如下：

从图中可直接观察到分数大致满足正态分布，又由spss软件检验出p=0.078>0.05,服从正态分布。

在满足正态分布的条件下，用spss计算出均值为79.8613861，四舍五入后填入第25个缺失数据为80。

同理可得丙组数据的直方图如下，从图中可直接观察到分数大致满足正态分布，又由spss软件检验出p=0.082>0.05,服从正态分布。

在满足正态分布的条件下，用spss计算出均值为80.0891089，四舍五入后填入第58个缺失数据为80。

5.21问题二的建立

经过分析，我们决定将每位专家打的分数进行整体的平移，调至一个基点，这个基点就选择专家打分的均值（记为

，

1，2，3，4，5）。

为了调节每位专家所打一分的贡献值在同一水平线上，我们将每位专家所打的分数进行方差（记为

，

1，2，3，4，5）压缩，而这个水平我们选取五位专家方差的均值（记为

）。

然后对所有专家的分数进行调节，记

为第

个专家对第

位应聘者的打分，那么调整后的分数

为：

这里

表示所有专家评分均值的均值，经过调整后，所有专家的均值相同，方差也相同，从而不同专家打分产生的干扰就会被最大程度地清除。

5.22问题二的求解

利用excel计算出调整后的101个数据，再进行分数的高低排序，可得到101位应聘者最终的录取顺序，具体结果见下表：

5.31问题三的建立

经过分析可得，第一步对甲、乙、丙、丁、戊五组数据用spss软件进行两两差异性分析，得出有显著性差异的两组数据，可初步判断这两位专家可能就是较严格和较宽松的两位。

再根据假设我们可以认为打分的宽松度是由专家对优劣应聘者区分度大小即所打分数的波动性决定的，也就是说较严格的专家对优秀的应聘者的打分会明显高于劣者。

因此我们可以用专家所打分数的方差来表示波动性，方差大的专家就比较严格。

方差刻画了随机变量的取值对于其数学期望的离散程度。

方差越大，离散程度越大；反之则越小。

若X的取值比较集中，则方差

较小；若

的取值比较分散，则方差

较大。

因此，

是刻画

取值分散程度的一个量，它是衡量

取值分散程度的一个尺度。

换而言之，方差就是和中心偏离的程度。

用来衡量一批数据的波动大小，即这批数据偏离平均数的大，并把它叫做这组数据的方差，记作

。

在样本容量相

样本方差：

5.32问题三的求解

由上述方法用spss软件进行配对样本T检验，分别对两两数据显著性差异对比分析后得出

甲-乙之间p值为0.062；

甲-丁之间p值为0.140；

甲-戊之间p值为0.057；

乙-丙之间p值为0.893；

乙-丁之间p值为0.712；

乙-戊之间p值为0.939；

丙-丁之间p值为0.579；

丙-戊之间p值为0.947；

丁-戊之间p值为0.674；

上述组别间p值皆>0.05

而甲-丙间p值为0.030<0.05,说明甲-丙专家之间打分有明显差异。

进一步在excel中对甲、丙两组进行均值方差计算对比

专家甲

专家乙

专家丙

专家丁

专家戊

平均值

76.554

79.861

70.089

79.267

79.98

方差

161.534

129.288

114.477

129.82

117.584

由上表知：

甲的平均值大于丙的平均值，而甲的方差最大，丙的方差最小，专家所打分数的方差来表示波动性，方差大的专家就比较严格，所以专家甲最严格，专家丙最宽松。

5.41问题四的建立

1、这所单位招聘测试进行两次的情况。

在第一次招聘测试过后，表现优秀的应聘者直接拥有第二次的应聘机会，这种情况即拥有第二次应聘机会的人就是通过第一次测试的那些人。

由第二问的结果可得，前30位的应聘者即为通过第一次测试的应聘者，也就是拥有第二次应聘机会的应聘者。

2、这所单位招聘测试仅进行一次的情况。

在招聘测试过后，根据各位专家对每位应聘者打分的情况，会有一部分应聘者直接被录用。

然而很有可能被录用的人数少于实际需要的人数，因此就有可能给上一次招聘测试中没有表现好或者专家间对个别有争议（即有的专家打分较高，而有的专家打分较低）的应聘者第二次应聘的机会。

只进行一次招聘测试的公司，对应聘者的要求会比较高。

由第三问得出甲专家最严格，丙专家最宽松。

为了保证公平公正，去掉甲专家与丙专家两组数据后对剩余三组数据求其均值，再进行高低排序得出前30位。

我们设第二问中调整后所得的分数进行高低排序后得到前30位的应聘者为集合A,设去掉甲、丙两组数据后对剩余三组数据求平均值再进行高低排序的前30位应聘者为集合B,再设集合

。

再将101位应聘者中除去集合C中的应聘者外剩余的应聘者的分数计算平均值和方差，分别进行高低排序。

5.42问题四的求解

1、这所单位招聘测试进行两次的情况求解。

由第二问的结果可直接得出排在前30位的应聘者即可拥有第二次应聘机会，结果如下表所示：

2、这所单位招聘测试仅进行一次情况的求解。

由上表可得集合A=

（39,5,19,47,66,69,51,4,77,40,91,87,64,100,8,53,86,67,18,79,22,45,43,16,82,49,38,98,101,84）。

去掉甲、丙两组数据后对剩余三组数据求平均值再进行高低排序的前30位应聘者结果如下表：

乙、丁、戊专家打分

第1-15名

第16-30名

即集合B=

（19,8,38,39,30,79,69,4,35,5,86,66,77,43,10,84,22,47,70,40,4887,51,58,63,97,25,45,67,81）

所以集合

=（19,47,66,69,51,39,5,4,77,40,87,8,86,67,79,22,45,43,38,84）

则集合C里的20个元素所对应的应聘者通过招聘测试,还剩余10个招聘名额。

因此单位就可能给上一次招聘测试中没有表现好或者专家间对个别有争议（即有的专家打分较高，而有的专家打分较低，也就是说分数波动性较大）的应聘者第二次应聘的机会。

所以我们再将剩余的81位应聘者的分数计算平均值和方差，再将两种算法的结果分别进行高低排序得到结果如下：

由于方差大只能说明分数波动性较大，而不能说明分数的高低，所以为了找出分数既较高，分数差异也比较明显的应聘者，我们取上表中两种方法排序都位于前30位的应聘者，即（1，11,14,18,49,53,70，71，76，80,91，97,98,100,101），有15位应聘者满足条件。

尽管单位只差10个名额，但是应聘者一般要大于实际招聘名额。

所以我们决定将第二次应聘机会给（1，11,14,18,49,53,70，71，76，80,91，97,98,100,101）这15位应聘者。

5.51问题五的建立

然后比较剩余三位专家打分权重（重是一权个相对的概念，针对某一个指标而言，某一个指标的权重是指指标在整体评价中的相对重要程度。

），如果某两位专家打分的权重相同或非常接近，则可视为打出的分数是同一种效果，所以只需要选其中一个就可以达到所需的评分效果。

而选择原则是根据其打分的严格程度，由第三问已经得出各个专家的严格程度，其依据是各专家打出的分数的方差，方差越大评分越严格，所以选取所打分数方差较大的一个。

5.52问题五的求解

我们已经算出各专家所打分数的均值

和标准差

，通过公式计算变异系数为

，

1,2,3,4,5

最后对变异系数归一化得到各专家打分的权重为：

（0.2302,0.1974，0.1852,0.1993,0.1880）

由各位专家打分的权重大小可得：

选取专家甲、专家乙、专家丁组成专家小组给参加给二次应聘的应聘者打分。

六、模型结果的分析和推广

七、参考文献

【1】

【2】

八、附录

表一（原始数据）

组数

专家甲

专家乙

专家丙

专家丁

专家戊

100

101

图一

图二

图三

表二（标准分计算）

72.43369629

72.19697463

84.71386937

87.93548729

85.82708042

81.58596795

91.5663

展开阅读全文