全国建模竞赛一等奖高校硕士研究生招生指标分配问题.docx

资源描述

全国建模竞赛一等奖高校硕士研究生招生指标分配问题.docx

《全国建模竞赛一等奖高校硕士研究生招生指标分配问题.docx》由会员分享，可在线阅读，更多相关《全国建模竞赛一等奖高校硕士研究生招生指标分配问题.docx（27页珍藏版）》请在冰豆网上搜索。

全国建模竞赛一等奖高校硕士研究生招生指标分配问题.docx

全国建模竞赛一等奖高校硕士研究生招生指标分配问题

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：

我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：

参赛队员（打印并签名）：

1.夏旭东

2.刘小均

3.陈卓

指导教师或指导教师组负责人（打印并签名）：

日期：

2012年9月10日

赛区评阅编号（由赛区组委会评阅前进行编号）：

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

赛区评阅记录（可供赛区评阅时使用）：

评

阅

人

评

分

备

注

全国统一编号（由赛区组委会送交全国前编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

高校硕士研究生招生指标分配问题

摘要

在研究生教育规模化趋势下，各高校对研究生的指标分配也呈现出多元化，高等学校研究生招生指标分配问题，对研究生的培养质量、学科建设和科研成果的取得有直接影响。

作为全日制硕士研究生招生工作的首要环节，招生指标分配的合理性和科学性对我国教育制度的完善具有重要意义。

本文基于统计中的相关分析理论，针对学科情况、科研情况、国家政策等因素对招生指标分配方案进行了调整，希望为研究生指标分配提供科学的参考依据。

针对问题一，主要是缺失数据的补充，利用已知数据选取合理的方法，建立理想的数学模型。

根据对数据的细致分析，选择了距离判别分析法，建立模型将未知数据代入，得出数据如下：

教师编号

103

110

123

150

168

274

324

335

352

岗位级别

针对问题二，考虑到更好的调整指标分配方案，需要确定各相关因素与岗位级别的相关关系，本文通过Excel作图，直观地反映了招生人数和科研经费等各因素在不同年份的数值与岗位级别之间的关系，得出申请专利数和获奖数与岗位级别相关性较小，其余因素与岗位级别有较大相关性。

针对问题三，首先要确定2012年硕士研究生招生总人数，根据2007-2011前五年的数据，建立灰色预测模型，预测出总人数。

通过层次分析法确立的数学模型确定各岗位级别的权重，根据权重得出相应总人数。

引入相对权重的概念，将各学科各岗位的权重确定，得到2012年招生名额分配的具体分配方案表。

针对问题四，结合各学科从2007到2011研究生指标分配名额趋势，从学科的特点和学科发展的需要出发，分析出A,E,I,J,K学科是重点建设和发展的学科，B,C,D,F,G学科属于基础保持学科，而学科H虽然指标虽增长量很大，但波动性很大，因此在2012年各学科在分配指标的权重上有所差异。

分别采取了线性拟合和时间序列不同的分析法，得出了调整方案。

针对问题五，前面的分配方案中，对研究生指标分配的因素还不够充分，仍具有一定的局限性，为使分配方案更科学、更合理。

通过招生计划的探讨，以及分配现状的分析，提出了从学校的学科特色、硕士研究生生源数量出发，提出采用基于加速遗传算法（AGA）的PP法，提取评价指标样本集的分类信息来确定各评价指标的分类权重，解决硕士研究生招生计划编制中名额分配问题，实现研究生招生计划的科学分配以及研究生资源的优化配置。

关键词：

判别分析层次分析主成分分析GM（1,1）模型

一、问题重述

问题的背景

高等学校研究生招生指标分配问题，对研究生的培养质量、学科建设和科研成果的取得有直接影响。

研究生指标分配是指招生单位的教育部门或有关工作人员采取适当的手段，对各院系及其学科招生人数进行合理配置、协调和控制等活动。

在招生及分配过程中，必须对招生单位培养能力、师资力量、科研水平等各影响因素总和均衡，由于主观因素发挥较大作用，因此在指标分配过程中具有很好的可操作性，显然这种方法过于片面，缺乏科学、合理的判断依据，很难保证招生指标分配和人才培养的之类的协调发展。

特别在2011年研究生招生改革方案中，将硕士研究生招生指标划分为学术型和专业型两类。

这一改革方案的实施，给研究生教育的发展带来发展机遇的同时，也给研究生招生指标分配的优化配置提出了新的思考。

而我国在研究生招生指标分配方面至今还没有一套科学、合理的分配方法。

因此，通过根据数据建立数学模型对研究生招生指标进行分类，得出各指标之间的统计规律，并结合更多参考因素提出更加合理的分配方案，具有更加强烈的社会需求，成为各高校分配指标面临的一个实际问题。

问题的提出

1.由于统计数据的缺失，第18、103、110、123、150、168、274、324、335、352位教师的数据不完整，请你用数学模型的方法将这些缺失的数据补充完整。

2.以前的硕士研究生名额分配方案主要参考导师岗位级别进行分配。

请你以岗位级别为指标，分析每个岗位的招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量的统计规律，并给出合理的解释。

3.根据第二问的结论，提出更加合理的研究生名额分配方案，使得新方案既兼顾到岗位又能兼顾到其他因素，例如研究生的招生类型等，并要求用此方案对2012年的名额进行预分配。

4.如果在研究生招生指标分配当中，考虑到学科的特点和学科发展的需要，进行差异分配，请你设计调整方案，并用你的方案给出2012年的调整方案。

5.如果想把分配方案做得更加合理，你认为还需要哪些指标数据，用什么方法可以完成你的方案？

请阐述你的思想。

二、模型假设

（一）模型的假设

1、所有指标准确反映了该高校各个学科的真实招生能力；

2、每位专家给出的评价权重是客观的；

3、分配给各个学科的招生名额方案只与所计算出来的权重有关

三、符号说明

符号

定义

一层对应的元素

因素i与j的重要性之比

层次总排序随机一致性比率

一致性指标

随机一致性指标

判断矩阵的最大特征根

判断矩阵的阶数

权向量

第i各学科j等级的教师在整个研究生名额分配中的权重

i学科在研究生名额分配中的权重

第i学科j等级教师的人数

j等级教师所占权重

四、问题分析

问题一的分析

考虑缺失岗位级别的教师进行补充，又已知2007-2011五年间名额分配及各项指标，选取了判别分析法，通过已知样本的岗位级别判断缺失数据的样本的岗位级别，由考虑量纲，引入马氏距离。

经主成分分析降维，减少指标数量，编程求解出缺失数据。

问题二的分析

由于历年硕士研究生名额都是以导师岗位级别进行分配，由影响分配的有招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量等因素，因此可以通过Excel作曲线图，分析各因素在不同年份的数值与各岗位级别之间的关系。

从而得出各岗位与各因素之间的统计规律，并结合相关统计规律的知识对得出的统计规律进行解释和分析。

问题三的分析

运用灰色预测理论中的模型预测出2012招生名额，而研究生招生名额分配的新方案需要既兼顾到岗位又能兼顾到其他因素，属于多因素影响的决策问题，因此可利用层次分析法建立模型，求解出各个因素对最终名额分配的权重，进而根据权重来决定招生名额分配的新方案。

通过综合权重来确定各学科各岗位的研究生分配名额。

问题四的分析

与问题三不同，问题四从学科的特点和学科发展的需要入手，需要进行差异分配。

因此要对前五年的各学科各岗位的数据进行分析与预测，分析出重点建设和发展的学科和基础保持学科，以及这几年的发展趋势。

运用线性拟合与时间序列等不同预测方法，综合给出2012年的调整方案

问题五的分析

问题三、四中对对研究生指标分配的因素还不够充分，得出的分配方案具有一定的局限性，因此要加入了一些其他影响研究生指标分配的因素，使分配方案更科学、更合理，采用更合理的方法提高硕士研究生的生源质量，适应社会主义市场经济对各种高素质人才的需求。

五、模型的建立与求解

问题一

概念的引入

判别分析是在已知研究对象分成若干类型（或组别）并已取得各种类型的一批已知样品观测数据，在此基础上根据某些准则建立判别式，然后对未知类型的样品进行分类．

准则的不同，判别方法又分为距离判别法，Ｆisher判别法，Ｂayes判别法和逐步判别法．

距离判别分析方法是判别样品所属类别的一应用性很强的多因素决策方法，根据已掌握的、历史上每个类别的若干样本数据信息，总结出客观事物分类的规律性，建立判别准则，当遇到新的样本点，只需根据总结得出的判别公式和判别准则，就能判别该样本点所属的类别。

距离判别分析的基本思想是：

样本和哪个总体的距离最近，就判它属于哪个总体。

利用已知类别的样本培训模型，为未知样本判别一种统计方法。

马氏距离是由印度学家马哈拉诺比斯提出的，表示数据的协方差距离。

它是一种有效的计算两个未知样本集的相似度的方法。

与欧式距离不同的是它考虑到各种特性之间的联系（例如：

一条关于身高的信息会带来一条关于体重的信息，因为两者是有关联的）并且是尺度无关的，即独立于测量尺度。

设和从期望和方差阵的总体G抽得的两个观测值，则称与之间的马氏距离

样本和类之间的马氏距离定义为与类重心间的距离：

马氏距离有如下的特点：

1、马氏距离不受计量单位的影响;

2、马氏距离是标准化后的变量的欧式距离

3、若变量之间是相互无关的，则协方差矩阵为对角矩阵

多总体的距离判别法

随着计算机计算能力的增强和计算机的普及，距离判别法的判别函数也在逐步改进，一种等价的距离判别为：

有个K总体，分别有均值向量μi（i=1,2,…,k）和协方差阵Σi=Σ，各总体出现的先验概率相等。

又设Y是一个待判样品。

则与的距离为（即判别函数）

上式中的第一项Y’Σ-1Y与i无关，则舍去，得一个等价的函数

将上式中提-2，得

则距离判别法的判别函数为：

令

判别规则为，则

从概率论的角度看，可把判别问题归结为如下模型。

设共有个总体：

其中是维随机变量，其分布函数为

而是表征总体特性的个随机变量的取值。

在判别分析中称这个变量为判别因子。

现有一个新的样本点，要判断此样本点属于哪一个总体。

Matlab的统计工具箱提供了判别函数classify。

函数的调用格式为：

其中SAMPLE为未知待分类的样本矩阵，TRAINING为已知分类的样本矩阵，它们有相同的列数，设待分类的样本点的个数，即SAMPLE的行数为，已知样本点的个数，即TRAINING的行数为，则GROUP为维列向量，若TRAINING的第行属于总体，则GROUP对应位置的元素可以记为，TYPE为分类方法，缺省值为'linear'，即线性分类，

TYPE还可取值'quadratic'，'mahalanobis'（mahalanobis距离）。

返回值CLASS为维列向量，给出了SAMPLE中样本的分类，ERR给出了分类误判率的估计值。

问题的求解

由于本问需要确定第18、103、110、123

展开阅读全文