数学建模方法综述_精品文档PPT推荐.ppt
《数学建模方法综述_精品文档PPT推荐.ppt》由会员分享,可在线阅读,更多相关《数学建模方法综述_精品文档PPT推荐.ppt(58页珍藏版)》请在冰豆网上搜索。
葡萄和葡萄酒的芳香物质(含4个表格),引例-12012年A题(葡萄酒的评价),3,破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
请讨论以下问题:
1.对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,请写出干预方式及干预的时间节点。
复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。
2.对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。
复原结果表达要求同上。
3.,引例-22013年B题(碎纸片的拼接复原),4,数学建模常用方法介绍,1.数学规划及其延伸内容,2.插值,拟合,偏最小二乘法,3.描述性统计与多元统计分析,4.数据建模的综合评价方法,.数据建模的预测方法,.现代优化算法,5,例1某机床厂生产甲、乙两种机床,每台销售后的利润分别为4000元与3000元。
生产甲机床需用A、B机器加工,加工时间分别为每台2小时和1小时;
生产乙机床需用A、B、C三种机器加工,加工时间为每台各一小时。
若每天可用于加工的机器时数分别为A机器10小时、B机器8小时和C机器7小时,问该厂应生产甲、乙机床各几台,才能使总利润最大?
1线性规划,一、数学规划,设该厂生产x台甲机床和x乙机床时总利润最大,注:
单纯形法,灵敏性分析(影子价格),6,2整数规划,一、数学规划,求解方法:
(1)分支定界法可求纯或混合整数线性规划;
(2)割平面法可求纯或混合整数线性规划;
(3)隐枚举法求解0-1整数规划;
(4)匈牙利法求解0-1整数规划;
(5)蒙特卡洛法求解各种类型规划。
30-1规划(指派问题),7,4非线性规划(参考资料-1),一、数学规划,求解方法:
(1)罚函数法(外点法);
(2)罚函数法(内点法或障碍函数法);
(3)直接法(解析法);
(4)间接法(如:
最速下降法);
8,5动态规划(参考资料-2),一、数学规划-延伸知识,例2生产计划问题设某工厂有1000台机器,生产两种产品A、B,若投入x台机器生产A产品,则纯收入为5x,若投入y台机器生产B种产品,则纯收入为4y,又知:
生产A种产品机器的年折损率为20%,生产B产品机器的年折损率为10%,问在5年内如何安排各年度的生产计划,才能使总收入最高?
优点:
(1)能够得到全局最优解;
(2)可以得到一族最优解;
缺点:
(3)没有统一的标准模型;
(4)维数灾变量过多取值过宽求解困难。
9,6目标规划,一、数学规划-延伸知识,求解方法:
(1)加权系数法为每一个目标赋一个权系数;
(2)优先等级法序贯算法。
10,7图与网络(参考资料-3),一、数学规划-延伸知识,7.1最短路问题现有A、B1、B2、C1、C2、C3、D共7个城市,点与点之间的连线表示城市间有道路相连。
连线旁的数字表示道路的长度。
求城市A到城市D的一条最短路。
求解算法:
(1)Dijkstra算法
(2)Floyd算法注:
参考资料-4,11,7图与网络,一、数学规划-延伸知识,7.2最小生成树欲修建连接n个城市的铁路,已知i城与j城之间的铁路造价为cij设计一个线路图,使总造价最低?
(1)prim算法
(2)Kruskal算法注:
参考资料-4,12,7图与网络,一、数学规划-延伸知识,7.3网络最大流问题现需要将城市s的石油通过管道运送到城市t,中间有4个中转站,城市与中转站的连接以及管道的容量如图所示,求从城市s到城市t的最大流。
标号法注:
参考资料-4,数学模型:
13,7图与网络,一、数学规划-延伸知识,7.4最小费用最大流问题对前面的问题考虑带有运费的网络,其中第1个数字是网络的容量,第2个数字是网络的单位运费。
注:
表示用线性规划模型求得的最大流的流量。
14,7图与网络,一、数学规划-延伸知识,7.5旅行商(TSP)问题一名推销员准备前往若干城市推销产品,然后回到他的出发地。
如何为他设计一条最短的旅行路线(从驻地出发,经过每个城市恰好一次,最后返回驻地)?
7.6计划评审方法和关键路线法(统筹方法),数学模型的一般形式:
15,8排队论(参考资料-5),一、数学规划-延伸知识,例3某维修中心在周末现只安排一名员工为顾客提供服务。
新来的顾客到达后,若已有顾客正在服务,则需要排队等待,若排队的人数过多,势必会造成顾客抱怨,会影响到公司效益;
若维修人员多,会增加维修中心的支出,如何调整两者的关系,使得系统到达最优。
分类:
(1)等待制排队模型,如:
M/M/S/
(2)损失制排队模型,如:
M/M/S/S(3)混合制排队模型,如:
M/M/S/K(4)闭合式排队模型,如:
M/M/S/K/K,16,9对策论和存储论(参考资料-6,7),一、数学规划-延伸知识,例4(囚徒的困境),例5某商品单位成本为5元,每天保管费为成本的0.1%,每次定购费为10元。
已知对该商品的需求是100件/天,不允许缺货(允许缺货)。
假设该商品的进货可以随时实现。
问应怎样组织进货,才能最经济。
17,插值:
求过已知有限个数据点的近似函数。
1插值,二、插值,拟合,偏最小二乘回归,拟合:
已知有限个数据点,求近似函数,不要求过已知数据点,只要求在某种意义下它在这些点上的总偏差最小。
18,一维插值:
二、插值,拟合,偏最小二乘回归,拉格朗日插值,牛顿插值,Hermite插值,分段线性插值,三次样条插值,19,二维插值:
Shepard方法、反距离平均法、线性插值三角网格法、Kriging方法插值节点为网络节点interp2插值节点为散乱节点griddata,二、插值,拟合,偏最小二乘回归,20,拟合:
多项式拟合,非线性拟合原则:
一般是最小二乘法,活用cftool命定,2拟合,二、插值,拟合,偏最小二乘回归,21,传统的回归方法,一般是输入量多个,输出量一个;
如果输入和输出量都是多个的情况,我们可以用偏最小二乘回归分析。
3偏最小二乘回归,二、插值,拟合,偏最小二乘回归,22,三、描述性统计与多元统计分析,数理统计研究的对象是受随机因素影响的数据,多元分析是多变量的统计分析方法,是数理统计中应用广泛的一个重要分支。
描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。
算数平均数(简称均值)描述数据取值的平均位置中位数将数据由小到大排序后位于中间位置的那个数值标准差各个数据与均值偏离程度的度量,这种偏离不妨称为变异方差标准差的平方极差最大值与最小值之差偏度和峰度分布形状的统计量,1.统计量,23,三、描述性统计与多元统计分析,2.1.1方差已知,关于均值的检验(Z检验),2.假设检验(参考资料-8),2.1单个总体均值的检验,例如:
某车间用一台包装机包装糖果。
包得的袋装糖重是一个随机变量,它服从正态分布。
当机器正常时,其均值为0.5公斤,标准差为0.015公斤。
某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):
0.4970.5060.5180.5240.4980.5110.5200.5150.512问机器是否正常?
24,三、描述性统计与多元统计分析,2.假设检验,2.2两个正态总体均值差的检验(t检验),2.1.2方差未知,关于均值的检验(t检验),例如:
某种电子元件的寿命x(以小时计)服从正态分布,均值,方差均未知.现得16只元件的寿命如下:
159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225(小时)?
例如:
在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一平炉上进行的。
每炼一炉钢时除操作方法外,其它条件都可能做到相同。
先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交换进行,各炼了10炉,其得率分别为1标准方法78.172.476.274.377.478.476.075.676.777.32新方法79.181.077.379.180.079.179.177.380.282.1设这两个样本相互独立且分别来自正态总体均未知,问建议的新方法能否提高得率?
(取=0.05),注:
方差不相等的假设检验也可以做,25,三、描述性统计与多元统计分析,2.3分布拟合检验(参考资料-9),26,三、描述性统计与多元统计分析,2.4非参数检验,参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
两独立样本的非参数检验:
(1)曼-惠特尼U检验
(2)K-S检验(3)游程检验(4)极端反应检验多独立样本的非参数检验:
(1)中位数检验
(2)Kruskal-Wallis检验(3)Jonckheere-Terpstra检验,两配对样本的非参数检验:
(1)McNemar检验
(2)符号检验(3)Wilcoxon符号秩检验多配对样本的非参数检验:
(1)Friedman检验
(2)CochranQ检验(3)Kendall协同系数检验,27,三、描述性统计与多元统计分析,例为考察5名工人的劳动生产率是否相同,记录了每人4天的产量,并算出其平均值,如下表。
你能从这些数据推断出他们的生产率有无显著差别吗?
3.方差分析,3.1单因素方差分析,28,三、描述性统计与多元统计分析,例一种火箭使用了四种燃料、三种推进器,进行射程试验,对于每种燃料与每种推进器的组合作一次试验,得到试验数据如下表。
问各种燃料之间及各种推进器之间有无显著差异?
3.方差分析,3.2双因素方差分析,29,三、描述性统计与多元统计分析,4.聚类分析,样本的相似性度量:
绝对值距离、欧式距离、车比雪夫距离、马氏距离变量相似性度量:
相关系数、夹角余弦类与类间的相似性度量:
最短距离法、最长距离法、重心法、类平均法、离差平方和法,聚类分析又称为群分析,是对多个样本(或指标)进行定量分类的一种多元统计分析方法。
Q型聚类分析对样本