历年全国数学建模试题解法归纳及评阅要点.docx
《历年全国数学建模试题解法归纳及评阅要点.docx》由会员分享,可在线阅读,更多相关《历年全国数学建模试题解法归纳及评阅要点.docx(13页珍藏版)》请在冰豆网上搜索。
历年全国数学建模试题解法归纳及评阅要点
历年全国数学建模试题及解法归纳
赛题 解法
93A非线性交调的频率设计 拟合、规划
93B足球队排名 图论、层次分析、整数规划
94A逢山开路 图论、插值、动态规划
94B锁具装箱问题 图论、组合数学
95A飞行管理问题 非线性规划、线性规划
95B天车与冶炼炉的作业调度 动态规划、排队论、图论
96A最优捕鱼策略 微分方程、优化
96B节水洗衣机 非线性规划
97A零件的参数设计 非线性规划
97B截断切割的最优排列 随机模拟、图论
98A一类投资组合问题 多目标优化、非线性规划
98B灾情巡视的最佳路线 图论、组合优化
99A自动化车床管理 随机优化、计算机模拟
99B钻井布局 0-1规划、图论
00A DNA序列分类 模式识别、Fisher判别、人工
神经网络
00B钢管订购和运输 组合优化、运输问题
01A血管三维重建 曲线拟合、曲面重建
赛题 解法
01B 公交车调度问题 多目标规划
02A车灯线光源的优化 非线性规划
02B彩票问题 单目标决策
03A SARS的传播 微分方程、差分方程
03B 露天矿生产的车辆安排 整数规划、运输问题
04A奥运会临时超市网点设计 统计分析、数据处理、优化
04B电力市场的输电阻塞管理 数据拟合、优化
05A长江水质的评价和预测 预测评价、数据处理
05B DVD在线租赁 随机规划、整数规划
06A出版社书号问题整数规划、数据处理、优化
06BHiv病毒问题线性规划、回归分析
07A人口问题微分方程、数据处理、优化
07B公交车问题多目标规划、动态规划、图
论、0-1规划
08A照相机问题非线性方程组、优化
08B大学学费问题数据收集和处理、统计分
析、回归分析
赛题发展的特点:
1.对选手的计算机能力提出了更高的要求:
赛题的解决依赖计算机,题目的数据较多,手工计算不能完成,如03B,某些问题需要使用计算机软件,01A。
问题的数据读取需要计算机技术,如00A(大数据),01A(图象数据,图象处理的方法获得),04A(数据库数据,数据库方法,统计软件包)。
计算机模拟和以算法形式给出最终结果。
2.赛题的开放性增大 解法的多样性,一道赛题可用多种解法。
开放性还表现在对模型假设和对数据处理上。
3.试题向大规模数据处理方向发展
4.求解算法和各类现代算法的融合
2006高教社杯全国大学生数学建模竞赛A题评阅要点
本题考察的重点是:
从决策问题的海量的、不完全的、甚至错漏(带有噪音、错误、异型)的数据中分析出决策的逻辑结构和提取有用的数据(附录中许多数据是没有用的!
)以及依赖数据信息,进而构建数学模型的能力。
本题的资源优化配置模型是规划问题,其中也包括一些预测模型。
因此,理解并且实现优化问题的基础结构是取得基本分值的必要条件。
1、目标函数的构成成分
主要包括销售额表达式(注意如果作者利用了附录数据说明中的假设,则赢利与销售额等价),可以以课程为单位,也可以以学科为单位;包括由市场信息产生的对于不同课程的调控因子(竞争力系数);由于数据说明中的提示,也应该包括每个课程的申报需求量的“计划准确性因子”(学生用词会不同)。
当然,前两点更重要些。
2、约束条件构成
对于出版社来说,所谓产能主要是人力资源,即策划、编辑和版面设计人员的分布形成主要约束;此外,书号总量(500)也应该作为约束条件;同时,在数据说明中指出的“满足申请书号量的一半”也应该以约束方式表达。
3、规划变量
可以以每个课程的书号数量,也可以以学科的书号数作为变量,但是得到的结果会有所不同。
实现以上三点,对于问题的理解是比较全面的,应该得到基本分值。
进一步提高的分值来源于实现上述三点的具体模型的考虑和建模水平。
1)如果注意到数据说明中提示的,同一课程的教材在价格和销售量的同一性,销售额表达式是比较容易表示的:
构造每个课程的、用书号数表达的销售额,然后将所有书号的销售额的表达式累加,形成总社的销售额的基本表达式,这是目标函数的主体部分。
2)市场信息产生的对于不同课程的调控因子(也称竞争力系数)的表示,是一个信息不足情况下的决策模型。
主要是满意度和市场占有率的恰当表示和计算(由附件2),以及两个指标的联合形成竞争力系数问题,这里既可以使用拟合模型,也可以使用各种多因素分析模型等等,方法不同。
对这个问题解决的优劣,可以导致明显的评分差别。
其中应该特别注意需求信息是否重复使用的问题,也就是说,如果在构造销售额表达式时已经使用了课程的销售数据,则不同课程的支持强度的不同,主要由市场竞争力参数表达。
3)在优化问题中,应该恰当地表示“计划准确性因子”,数据给出的计划销量和实际销量之比应该是比较合适的表示。
4)加上前述约束条件构成适当的规划问题。
比较好的实现以上四点,应该得到80%的分值。
最后剩余分值是:
计算出结果,创造性,论文表述和格式。
[注1]以下给出建模所需信息和附录数据表的关系:
在问卷调查表的调查目的中提示了满意度和市场占有率是竞争力的主要组成,也提示了数据依据(附录1);课程级销售额以及销售额与利润的等价性关系(附录3),满意度和市场占有份额由问卷调查数据表检索计算产生(附录2),各个课程的需求的书号数(附录4)和“计划准确性因子”(附录3),人力资源(附录5)。
其中附录1只是让学生了解市场调查的方法。
[注2]学生会提出附录5和4之间在书号数与人力资源上的差别,事实上人力资源和分配到的书号数没有直接的单一因果联系(如临时雇用人员、临时增加书号等)。
附录4的书号总和的计算错误是实际数据的错误,但是与解题无关(学生采用哪组数据应该都是可以的)。
附件:
对问题更详细的分析过程(供参考)
本题背景是:
某出版社总社汇总各个分社提交的出版需求计划,然后根据市场信息、在总社产能允许的条件下,将给定数量的书号进行分配,以期在此分配方案下,出版的图书产生最好的经济效益。
由于企业的生产是市场导向的,因此市场信息是对分社计划进行调整的主要依据,同时要考虑产能的限制。
这是一个资源配置的决策问题,因此需要分析决策的信息依据以及决策的逻辑过程。
1、决策的总体结构
市场信息 决策部门 分社计划信息 决策结果
各个分社提出的出版需求计划是决策的基础,而市场信息是调整分社计划达到效益最大化的主要调节依据。
在以上总体结构下,需要将各个分社的计划信息和市场信息的信息产生结构分析清楚。
2、分社计划信息
在附录4中给出了各个分社06年申请的书号计划数,即分社所属课程的计划数的列表。
该出版社中,分社是按学科划分的,学科之下又有若干课程,问题的决策对象可以分两级:
课程级以及学科级。
也就是说,可以以课程作为基本分配对象,学科数据可以通过汇总得到;也可以先将数据汇总到学科,然后以学科作为配置单位。
两种方法计算结果会有所不同。
3、市场信息
相关的市场信息主要包括两个方面:
需求信息和竞争力信息,包括它们的变化趋势。
3.1需求信息。
课程级的销售额是决策的目标函数的基础组分(附录4中提示了销售额与盈利的等价性)。
在根据课程级的需求计划计算销售额时,需要用过去五年该课程的实际销售量去预测当年的销售量。
这样就已经考虑了市场的需求信息,因此在总社的进一步分析中不必要重复使用这类市场信息。
另一方面,由于分社有夸大需求的倾向(附录4提示),将课程级的计划销售量与实际销售量之比作为“计划准确性系数”,在课程级的销售额中作为权重是恰当的考虑。
3.2竞争力信息。
企业在战略决策中的主要原则是:
重点支持竞争力强、竞争力发展趋势强的产品(题目中已经提示)。
虽然企业也要关注现实竞争力不强、但有潜力的产品,但这不是主要的决策原则,这是一个恰当的简化。
竞争力因素很多,但是对于本题,由于只给出了两方面的数据(A.对教材的课程级的满意度,B.该出版社的课程级的市场占有率),因此也只有用这两个数据产生对于各个课程的不同的竞争力系数,这是总社的主要调控手段,应体现在规划问题的目标函数中。
4、建模过程
如何从给定数据中提取需要的每项市场信息,是本题建模的关键之一。
4.1市场需求信息。
这里主要是课程级的需求量预测。
从历年的销售数据,即已经出版过的同课程的历年销售数据,可得到目标函数的主要表达式:
[(课程级销量*平均书价)/当年的该课程的获得书号数]=该课程的书号的平均销售额
4.2产品满意度。
在问卷调查中的本出版社的满意度(课程级)的均值除以所有出版社的满意值的均值,可以作为该课程的满意度,这里“度”是率的含意。
4.3市场份额占有率。
在问卷调查的统计中已经给出了关于课程与出版社市场份额分布表,而通过五年的市场份额分布表可以回归出预测的市场份额占有率。
4.4竞争力系数。
以上两点可以产生单一的竞争力系数(通过模型方法)加入到目标函数中,例如,可以从五年的历史数据拟合得到加权系数,再进行加权求和等,方法各异。
由以上4点以及考虑到3.1中的“计划准确性系数”,可以构成规划的目标函数。
4.5约束条件:
该社的产能即人力资源的约束,书号总量的限制以及至少满足申请数一半的要求(附录4),即可得到规划问题的完整表示。
5、决策的逻辑结构
2006高教社杯全国大学生数学建模竞赛B题评阅要点
问题
(1)利用附件1的数据预测继续治疗的效果,或者确定最佳治疗终止时间。
1.分析数据随机取若干个病人,画出他们CD4和HIV浓度随时间变化的图形(折线),可以看出CD4大致有先增后减的趋势,HIV有先减后增的趋势,启示应建立时间的二次函数模型(若先用一次函数模型,应与二次函数模型做统计分析比较)。
附件1中个别病人缺CD4或HIV数据(数据表中为空),计算时应注意。
2.建立模型可能有以下形式的回归模型:
1)总体回归模型用全部数据拟合一个模型,如yij=b0+b1tij+b2tij2,tij为第i病人第j次测量时间,yij为第i病人第j次测量值(CD4,HIV)或测量值与初始值之比。
一次与二次函数模型比较,二次较优。
用数据估计b0,b1,b2,对CD4,b2<0,b1>0,t=-b1/2b2达到最大;对HIV,b2>0,b1<0,t=-b1/2b2达到最小。
一般在25~30(周)CD4达到最大、HIV达到最小。
可以合理地确定最佳治疗终止时间。
2)个人回归模型用每个病人的数据拟合一个模型,如上式(bk改为bik,k=0,1,2),计算bik的均值和均方差,用均值同1)可得CD4的最大点和HIV的最小点,一般为20~30(周)。
可对CD4统计b2i<0,b1i>0(存在正最大点)及b2i>0(不存在最大点)的频率,对HIV统计b2i>0,b1i<0(存在正最小点)及b2i<0(不存在最小点)的频率,在一定条件下可以作为终止治疗与继续治疗的概率(一般为0.6~0.8与0.3~0.2);也可用bik的均值和均方差在一定分布的假定下直接计算这些概率。
注1建立几种模型相互比较、验证者较优。
注2 不能只有模型,不做统计分析;对模型结果进行统计分析,考虑与数据拟合程度、注意去除异常数据者较优
注3 注意到有一些数据是当出现CD4下降、HIV上升就及时结束的,并做出适当考虑者较优。
注4 注意到题目中“艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度”,并对结果做出适当考虑者较优
问题
(2)利用附件2的数据,评价4种疗法的优劣,并对较好疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
回归模型方法
1.分析数据对于每种疗法随机取若干个病人,画出他们CD4随时间变化的图形(折线),可以看出疗法1~3的CD4基本上水平,略有下降,而疗法4有先增后减的趋势。
启示应建立时间的一次与二次函数模型,经统计分析比较,确定哪种较优。
2.建立模型
1)回归模型可以引入4(或3)个0-1变量表示4种疗法建立统一模型,或者对每种疗法各建立一个模型(一般来说前者较优);仍可利用问题
(1)中的各种模型。
以总体回归模型为例,分别用一次与二次时间函数模型进行比较,可知疗法1~3用一次模型较优,且一次项系数为负,即CD4在减少,从数值看疗法3优于疗法2和1;疗法4用二次模型较优,即CD4先增后减,在t=20左右达到最大。
可以通过4条回归曲线进行比较,显示疗法4在30周之前明显优于其它。
年龄的处理:
简单地增加年龄变量;按年龄分组,考虑不同年龄的影响。
2)用假设检验做疗法有无显著性差异的两两比较用1个0-1变量构造两种疗法的统一模型,可以用t检验作回归系数是否为零的假设检验(与回归系数置信区间是否含零点等价)。
结果是疗法1与2无显著性差异,而疗法1与3,2与3,3与4均有显著性差异。
注注意问题
(1)的几个注。
线性规划模型方法
1.数据分析考虑到治疗的效果与患者的年龄有关,将患者按年龄分组,如14~25岁,25~35岁,35~45岁及45岁以上4组。
每组中按照4种疗法和4个治疗阶段(如0~10周,10~20周,20~30周,30~40周),构造16个决策单元。
取4种药品量为输入,治疗各个阶段末患者的CD4值与开始治疗时CD4值的比值为输出
2.建立模型利用相对有效性评价方法,建立分式规划模型并经过变换,转化为线性规划模型求解,对各年龄组患者在各阶段的治疗效率进行评价。
计算结果:
对第1年龄组疗法2和4在整个治疗中效率较高,在第4阶段仍然有效;对第2年龄组疗法1在第1,2阶段有效;对第3年龄组疗法1,2,3在第1阶段有效;对第4年龄组疗法1,2在第1,2阶段有效。
表明只有14~25岁的年4种轻患者,才能在治疗的最后阶段仍然有有效的疗法。
由线性规划模型的对偶形式建立预测模型,对各年龄组各种疗法下一阶段的疗效进行预测。
若由某决策单元得到的实际输出大于预测输出,则该决策单元相对有效;反之,说明该种疗法对该组患者在治疗的未来阶段不再有效,应该转换疗法。
2007高教社杯全国大学生数学建模竞赛A题评阅要点
模型的建立必须考虑我国近年来人口发展的总趋势。
例如,老龄化进程加速、出生人口性别比持续升高、乡村人口城镇化等因素。
以下几点供阅卷参考。
1.分析数据
从详细数据中也可以看出。
附录2中给出的2005年人口数据就是大约1%的抽样调查数据。
从网上及文献中还可以查到更多数据,这里不一一列出。
2.建立模型
(1)基本假设:
从中国人口增长的特点出发,可以提出如下假设作为建立模型的依据:
老龄化进程加速;农村育龄妇女的生育率明显高于城镇;出生人口的男女性别比持续升高;农村人口不断城镇化。
根据这些假设,区分模型中的状态变量和参数。
(2)状态变量的设置:
根据上述假设和数据分析,可以把城镇人口与农村人口,及男女性别区分开来。
另一方面,注意到育龄妇女的生育率是决定人口增长的主要因素,可以对人口的年龄分布按不同年龄段进行简化,以减少状态变量。
(3)老龄化的影响:
数据分析表明,在每一类人(比如城镇妇女)中,老年人口在该类总人口中的比例逐年上升,而青壮年和幼年人口比例逐年下降。
可以通过对人口矩阵的迭代,或用其他模型方法,找出他们上升或下降的一般规律。
(4)农村人口以一定规律转化为城镇人口。
(5)人口增长有迟滞效应。
在附录1中提到“由于20世纪80年代至90年代第三次出生人口高峰的影响”,导致在2005-2020年出生人口数量会“出现一个小高峰”,这就是迟滞效应。
如果在模型中适当引进迟滞项,就可预测到这种“小高峰”现象。
当然,此时的初值应当是一个近几十年来的人口变化函数。
这个函数可以从网上搜索到,也可以用1(4)提示的方法找出。
当然,这可能有一定难度,不一定作为必须要考虑的要求。
如果有同学考虑到这种迟滞效应,应该说是有创意的。
(6)在本题的数据说明中曾指出“个别数据有异常,原文如此,可酌情处理。
”实际上,这些异常数据在个别年份才会出现,如果把他们从总体上进行拟合,对整个模型的建立应该是没有很大影响的。
而且一些异常通过查阅其他资料也可得到纠正。
附录2中最大的异常是关于2003年育龄妇女的生育率数据,这里按原《年鉴》中说法以千分比计,实际应该是百分比,相差十倍(在该附录最后几行给出的总生育率中已把它们恢复正常)。
正如一开始及下面所强调的,本题的重点是要根据我国近年来人口发展的总趋势和特点来建立模型,因此,必须从总体上来把握数据。
(7)如果有学生考虑人口分布的地区和产业等差别,也是可以的,但需要自己补充相关数据。
3.模型的求解和预测
用适当的数值方法求解所得的数学模型,即可得到今后几十年的预测结果。
可以把这些结果与附录1(《国家人口发展战略研究报告》)或其他文献中的结果进行对照分析。
如出现较大差异,则应找出原因,予以改进,或提出自己的看法
4.关于文献与模型的“自我评价”
(1)本问题提供的文献(附录1)是要求重点阅读的。
此外,还应列出自己查阅过并引用的比较可靠和权威的文献,包括论文、著作和数据,都要注明出处。
如果是网上的,则应列出网址。
(2)在评阅学生对自己模型的优点与不足的评价时,一定要注意是否实事求是。
2007高教社杯全国大学生数学建模竞赛B题评阅要点
命题思路 本题根据公交线路查询系统研制的实际需求简化改编而成。
问题容易理解,相关参考文献也较多,但涉及到公汽与地铁线路的联系,以及换乘时间等细节的处理,加上需要处理的数据量较大,问题并不十分简单。
这是一个多目标优化问题,换乘次数最少、费用最省、时间最短显然是乘客在选择乘车线路时最关心的几个目标,从该问题的实际背景来看,采取加权合成将问题转化为单目标优化问题的解题思路不太合适。
比较适当的方法是对每个目标寻求最佳线路,然后让乘客按照自己的需求进行选择。
本题1、2问要求在不知道站点地理信息的条件下给出解决线路选择问题的模型与算法,并就题目给定的数据计算得到线路选择结果,此二问主要考核建模及编程能力。
第3问加上了步行因素,建模难度更大一些。
问题1
不考虑地铁线路时的公交线路选择
可能主要有以下几种解法。
1、
图论模型,这可能是最常使用的方法,首先要考虑如何根据不同目标建立有向赋权图(如利用不同的矩阵表示),然后再求给定点对之间的最小换乘次数或最短路。
求两点间最短路有Dijkstra算法与Floyd算法等,但并不能将这两种算法直接套用于本问题,还需要处理好换乘和换乘时间问题,阅卷时需要重点关注。
2、
规划模型,包括0-1规划方法与动态规划方法等。
3、数据库模型,利用数据库技术直接对线路及站点数据进行搜索。
[注]
(1)本问的关键点是换乘时间的处理及最短时间线路的选择。
(2)若算法运算时间比较长,可事先计算出所有最佳线路,将结果存入数据库备查。
因此算法的运算时间问题不是本题的考察重点。
(3)对于原始数据中出现的一些异常数据,同学可根据自己的理解作出假设和处理。
如:
●
对于个别线路相邻站点名相同,可以采取去掉其中1个点或不作处理等方式,一般不会影响实例计算中线路选择的结果。
●
对于L406未标明是环行线的问题,无论学生是否将其当作环线处理,一般不会影响到实例的计算结果。
●
对于L290标明是环线,但首尾站点分别为1477与1479的问题,可将所有线路中1477与1479统一为1477后计算。
同学也可以按照各自认为合理的方式处理,包括不当作环线,实例计算用到的是该线路中部的几个站点,一般不会影响实例计算结果。
问题2
考虑地铁线路时的公交线路选择
本问可有多种处理方法,关键看合理性与可操作性。
换乘时间的处理较第一问要复杂,需重点关注。
问题3
已知站点间步行时间条件下的公交线路选择
这是比较一般的线路选择问题,更接近实际。
由于增加了步行因素,每个站点的可换乘方案大大增加了,于是用图论方法处理的难度也会有很大增加。
最常用的目标有:
换车次数最少,乘车的总站数最少,步行的总时间最少,总车费最少等等,应该针对不同的情况分别写出模型。
实例结果
[注]
(1)本计算结果由命题人提供,并不一定完全准确(如最优可能仅为次优),仅供参考。
此外,由于假设的不同(如对换乘时间的处理不同),结果也可能会有差异。
(2)下表中每行第1目标为最优结果(带*号者),其余两个目标在第1目标最优条件下为最优或次优结果。
(表中“时间”包括起始站点处的3分钟等车时间。
)
2008高教社杯全国大学生数学建模竞赛B题评阅要点
高等教育学费标准是社会关注的热点之一,是一个相当开放的问题,许多媒体的讨论都缺乏数据的支持和定量的分析。
评阅中除了目中的明确要求外,要特别注意以下问题:
1.应多角度、全面、综合地考虑学费标准问题。
模型中至少应考虑教育质量的保证和承受能力两个方面;例如,培养成本、成本分担、承受能力、长远收益、国际比较、历史比较等方面的考虑.
2.数据的收集非常重要。
应该收集充分的、有根据、有说服力的数据,并能支持建模的结论。
估计可能收集到的数据有:
国民经济增长数据,教育经费的比例,国家生均拨款和其它教育投入,培养一个大学生平均每年所需费用、学校每年的运营开支、每年报考大学的人数和录取人数、学生分布结构,家庭经济收入分布、困难学生的人数、每个学生每年的学费、生活费、奖学金、助学金、贷款、捐赠款等。
3.应该通过数据的统计分析和建模深入细致地讨论学费标准问题,要有明确的结论
2008高教社杯全国大学生数学建模竞赛A题评阅要点
(1)靶标上圆的像是椭圆,但圆心的像一般不是椭圆的形心。
对给定的坐标系,由相片可获取靶标圆的像的边界坐标数据,根据这些边界点的原像落在靶标平面且落在对应圆周上的性质,利用光学成像原理可建立确定靶标平面方程和靶标圆的圆心坐标的非线性方程组数学模型,进而求得靶标圆心像的坐标。
模型求解可直接求解非线性方程组,也可化为优化问题求解。
由于在某些情形模型可能有多解,化为优化问题后,目标函数有可能为多峰,在求解时应加以注意。
(2) 要以模型的合理性和优劣作为主要评价标准,不要以数值结果好坏作为评价的唯一标准。
(3) 模型检验是数学建模的一个重要环节。
但以往重视不够。
对本问题,应对于靶标平面具有已知特殊倾角的情形,分别对有无误差的情形逆向设计数据,即在靶标平面方程和圆方程已知的情况下,根据光学成像原理,计算获得圆周像的各点坐标和圆心像的坐标。
利用圆周像的各点坐标数据(并加上随机误差)用建立的模型和方法,计算出圆心的像坐标,并与通过光学成像原理计算所得的圆心像坐标进行比较,检验模型与方法的有效性与稳定性。
精度是一个复杂的问题,鼓励学生发挥自己的想象力加以研究。
(4) 对两部相机各自取固定在其上的坐标系,决定它们相对位置即确定这两个坐标系之间的变换关系。
此变换可分解为一个平移和一个绕原点的旋转。
于是要确定一个三维平移向量t和一个旋转变换矩阵R,R是一个正交阵,因此需要确定6个未知的参数