数学建模B题球队排名问题答案详解doc.docx
《数学建模B题球队排名问题答案详解doc.docx》由会员分享,可在线阅读,更多相关《数学建模B题球队排名问题答案详解doc.docx(31页珍藏版)》请在冰豆网上搜索。
数学建模B题球队排名问题答案详解doc
2010高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:
年月日
赛区评阅编号(由赛区组委会评阅前进行编号):
2010高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
一个给足球队排名次的方法
戚立峰毛威马斌
(北京大学数学系,100871)
指导教师樊启洪
摘要本文利用层次分析法建立了一个为足球排名次的数学模型.它首先用来排
名次的数据是否充分做出判断,在能够排名次时对数据的可依赖程度做出估计,
然后给出名次.文中证明了这个名次正是比赛成绩所体现的各队实力的顺序.
文中将看到此模型充分考虑了排名结果对各场比赛的重要性的反馈影响,基
本上消除了由于比赛对手的强弱不同造成的不公平现象.文中还证明了模型的稳
定性,这保证了各队在发挥水平上的小的波动不会对排名顺序造成大的变动.本
模型比较完满地解决了足球队排名次问题,而且经过简单修改,它可以适用于任
何一种对抗型比赛的排名.
§1问题的提出及分析
本题的表1给出的是我国12支足球队在1988-1989年全国甲级联赛中的成绩,要求通过建立数学模型,对各队进行排名次.
按照通常的理解,排名的目的是根据比赛成绩排出反映各队真实实力状况的一个顺序.为达到这一点,一个好的排名算法应满足下面一些基本要求:
(1)保序性;
(2)稳定性;(3)能够处理不同场比赛的权重;(4)能够判断成绩表的可约性;(5)能够准确地进行补残;(6)容忍不一致现象;(7)对数据可依赖程度给出较为精确的描述.
可以想象,各队的真实实力水平在成绩表中反映出来(见§3假定Ⅱ),所以
根据排名目的,我们要求排名顺序与成绩表反映的各队实力水平的顺序是一致的,这就是要求
(1).
也就是说,如果a比b表现出色,a的名次就应排在b前面.但a比b出色不能只是由a对b这一场比赛所决定,必须参考a,b相对于其他队的成绩,像a平c,c胜d,d平b这组比赛对a,b的相对表现是有影响的.为使一个算法满足保序
性,就必须充分考虑到将a,b连结起来的所有场比赛.下面的例子表明积分法布满足保序性.
例1a平c,c胜d,d平b,a平b.
在上述比赛中a表现应比b出色,但按积分法计算a,b都积2分.其原因就在于积分法没有把a平c,c胜d,d平b这组比赛中所体现的a,b实力对比情况考虑进去;
要求
(2)就是说成绩表小的变动不会对排名结果造成巨大影响.这是由于球队发挥水平存在正常波动而必须提供的,如果这种正常的小波动引起名次的巨大变化,那么排名就不令人信服;
要求(3)使得不同场比赛在排名中的地位不同,这是因为在实际比赛中,往往会有的队不幸遇到较强的队而输掉.为了避免由于对手的强弱不同造成的不公
平,要求(3)是必须的.但现在的排名制度大都满足不了要求(3),以至于许多时候“运气”对名次起了重要作用;
要求(4)—(7)是为了适应实际比赛中可能会出现在一些复杂情况而提出的.
首先是可能某两个队之间没有打比赛,我们称之为数据(成绩)残缺.对于
两队成绩残缺,只能通过它们同其他队的比赛成绩来判断它们的实力比较.如果
残缺元素过多,就有可能导致参赛队分成两组,组与组之间没有比赛,称这种情况
为成绩表可约,这时显然是不应该排名次的.这样就有要求(4),(5);
其次是前后比赛成绩矛盾,比如说a胜b,b胜c,c平a,称这种情况为数据不一致.如果不一致的情况过于严重,说明比赛偶然因素太大,数据的可依赖程度太
低,应该考虑放弃比赛成绩.所以排名算法还应满足(6),(7).
本文使用的层次分析法的特征根方法已满足了上述要求,下面将在§
出具体算法.§3中给出算发满足上述要求的解释和论证.
2中给
§2模型设计及其算法
一、基本假设和名词约定
假设Ⅰ参赛各队存在客观的真实实力(见名词约定
1).这是任何一种排
名算法的基础.
假设Ⅱ在每场比赛中体现出来的强队对弱队的表面实力对比是以它们的
真实实力对比为中心的互相对立的正态分布.(见名词约定2)
这条假设保证了我们可以以比赛成绩为依据对球队的真实实力进行排名
另外它在很大程度上反映了球队水平发挥的不稳定性.
名词约定
1.称w=(w1,w2,⋯,wn)为真实实力向量,如果wi的大小表现了Ti的实力强
弱.当wi的大小表现了Ti在比赛中出色程度时,称w为排名向量.由假设Ⅱ,两者应是近似相同的,以后就把它们当成同一个.
2.称Ti对Tj这场比赛中体现出来的Ti对Tj的相对强弱程度为Ti对Tj的表
面实力对比,一般记作aij,当Ti对Tj成绩残缺是约定aij=0.显然地有
(i)aij0,(ii)aji
1,(iii)aii1.
aij
(2.1)
矩阵A=(aij)nn就称为比赛成绩的判断矩阵,它是可以通过各种方法(见§
5)从比赛成绩中求出来的.
由假设Ⅱ,若Ti对Tj成绩不残缺且wiwj1时有
aij~N(wiwj,ij2)
(2.2)
这里w是真实实力向量.
3
.称方阵An
n为正互反对称的,若
(1)aij>0,
(2)aji
1
1i,jn.显
aij
然一个无残缺的比赛成绩的判断矩阵是正互反对称的.
4
.称矩阵Ann
A1
0
是可约的,若A能用行列同时调换化
这里A1,A4都
A2
A4
是方阵,在[1]的227页证明了一个判断矩阵可约当且仅当成绩表可约.
5.称判断矩阵A是一致的,若对任意1i,k,jn满足aijajkaik一致则存在w,使得
wi
A()nn
.显然地,A
(2.3)
6.称矩阵A的最大正特征根
max为主特征根;对应于
max的右特征向量w
称为主特征向量,若
n
wi1且wi>0.
i1
由非负矩阵的Perron-Frobenius
定理,一个判断矩阵A的max存在唯一且可
1
的每个分量都大于零,令w
w1
以让对应于max的特征向量w
n
即得主特征
wi
1
i1
向量.
二、模型设计与算法
我们的模型的主要部分是一个算法,模型的输入是一张成绩表,输出是关于是否可约的判断、数据可依赖程度值和排名次的结果.
算法
(一)根据比赛成绩表构造判断矩阵A.
i从1到n,j从1到n的循环.
1)若Ti与Tj互胜场次相等,则
1o净胜球=0时令aijaji1;跳出作下一步循环;
2oTi净胜球多时以Ti净胜Tj一场作后续处理.
2)若Ti净胜Tjk场且k>0,则
2omijTi胜Tj平均每场净胜球数;
3oaijbijdij,aji1/aij.
3)若Ti与Tj无比赛成绩,则aijaji0.
(二)检测A的可约性,如果可约则输出可约信息后退出.
~
(三)构造辅助矩阵A
i从1到n,j从1到n循环
~
(四)计算A的主特征根max和住特征向量w.
任取初始正向量x0
0,⋯,xn
T
1)允许误差
x1
0
x2
0
m0
maxxi
0
;
1
in
令k=0,计算
y0
y10,⋯,yn0
T
1x
0.
m0
2)迭代计算
xk1
~
Ayk
;
mk
1
maxxik1
;
1
in
yk
1
1
xk
1
;
mk
1
k
k
1;
直到|mk
1
mk|
.
yk
3)maxmk;wn.
k
yi
i1
(五)按w各分量由大到小的顺序对参赛各队排名次.
(六)计算
aij
2
aij
2
h
1
;
wi/wj
1
wi
wj
wi
wjwi/wj
aij
0
aij
0
i
j
Y
n(n1)
n
mi;其中mi为A的第i行0的个数.
2
i1
2
根据2h查x2表得到可依赖程度a
P(x2
2h).
关于算法的几点说明
算法的第
(一)步可以有多种不同的方法,这在§5还将讨论.
第
(二)步实际上是把A看作有向图的邻接矩阵表示求图是否连通.算法是标
准的,可参阅任何一本有关于算法的书,这里省略.它在可约时作的退出处理保证
了以后各步处理的是一个不可约阵.
第(三)步使用的是幂法,其整个算法收敛性和正确性的证明可参阅[1]的
103页.
第(四)步是一个排序,可参阅任何一本有关算法的书.
第(五)步我们举了一个例子,若算出2h=47.56,r=48,则在x2表的自由度为
48一行找到47.56,它所在的列的a值为65%左右.
§3算法的理论分析
一、排名的合理性和保序性要求
关于为什么无残缺的判断矩阵A的主特征向量就是排名向量是层次分析法中特征根发的基础,可以在[1]的211页找到详细证明,这里只作简单说明.先假
~
定比赛无残缺
此时算法中
A=A.
先看一下
A为一致矩阵时
有(2.3)式存w使得A
(wi
/wj)nn,显然向量
w
就是排名向量.
n
而我们有
(wi
/wj)wj
nwi
i
1,2,⋯,n
;
i1
即
Aw
nw
(3.1)
在[1]
的109页证明了下述定理:
定理
n
阶互反矩阵是一致的
当且仅当
max
n.
再由(3.1)可见w还是A的主特征向量,这样,对于一个一致矩阵A,求排名向量就是求A的主特征向量.
对于一个不一致的判断矩阵A(注意:
无残缺),令
||A||
aij
(3.2)
1
i,jn
n
wi
aij/||A||,1in;
(3.3)
i1
由于wi是A的第i
列元素(即Ti与其他队的表面实力对比)的和被||A||
除,可以猜测它给出了Ti的排序权重.
但正如问题分析中所提到的,Ti与Tj的实力对比必须考虑到将Ti与Tj连结
起来的所有场比赛,反应到判断矩阵A上就是所有aii1ai1i2⋯aik1j都要考虑进去.
令aijk是Ak的第i行j列元素,不难看出
n
n
n
aij
k
aii
aii
ai
k-1
j
(3.4)
i1
1i21
ik
1
11
2
1
而aij(k)就是考虑了所有经过
k
场比赛将Ti,Tj
连结起来的路径后反映的
Ti,Tj的相对强弱,称其为Ti对Tj的k步优势.
当ik1j时aik1j1,所以(3.4)式成为
aij(k)
n
n
n
n
⋯
aii
⋯ai
1
j
⋯
aii
1
⋯ai
k2
j
;
i11
ik11
1
k
i11
ik21
ik1i
注意到等式右端一项正是
aij(k
1)
所以k
步优势就隐含了
k-1步以及
k-2,,1.
同(3.3)式,令w(k)
n
aij(k)/||Ak
||,i
1,⋯,n;
j
1
再令w(k)
(w1(k),⋯,wn(k))T
可以想象,当k
足够大时,w(k)
就给出了A所反映
的排名向量.在[1]的104
页正证明了等式
lim
Ake
w,其中e
(1,1,⋯,1)
T
;
T
k
k
eAe
w是A的主特征向量.
即
limw(k)
w;
k
所以在充分考虑了足够步优势后得到的排名向量
w()就是A的主特征向量
w.
我们的排名是合理的和保序的
下面来看
上面的讨论表明在比赛无残缺时
看残缺的情况.
二、残缺的处理
对于一个残缺的判断矩阵
A,可以通过下述方法转化成一中讨论的情形
如果这样得到得矩阵C=(cij)n
n
的主特征向量为w,那么当dij
wi/wj时,我
们认为补残是准确的.如果令
C
(cij)nn;
~
~
A
ij
)n
n;
(a
则有下面命题成立:
~
命题Cww等价于Aww.
n
证
cijwi
wi,i
1,⋯,n.
j1
~
由上述命题还可知
C的最大特征根也是
A的主特征根
C的主特征向量也是
~
A的主特征向量
.这样,我们只需解
Aw
maxw即可,这正是算法(三)、(四)步
作的工作.
从上面讨论可知,本模型对于残缺的处理是非常准确的,满足了要求
(1),
(5).另外算法第
(二)步对成绩表的可约性作出了判断,这也满足了因为残缺而提出的要求(4).
下面继续讨论其余四个要求
三、对手的强弱对自己名次的影响
~
maxw,即
排名向量满足Aw
~
~
如果Ti对Tk成绩不残缺,则aikaik
0,固定aik,令wk变大,则aikwk就会变大,从
而引起wi变大.这实际上是排名结果对每场比赛权重的反馈影响.
这样的话,若Ti对Tk战线固定,Ti排名靠前,Tk也会因此受益.这就满足了要
求(3).
四、模型稳定性的分析
不加证明地引用下面定理([1]103页).
定理则A为nn复矩阵,1是A的单特征根,B是n
n矩阵,则一定可以从
~
~
A+Be(其中||足够小)的特征根中找到一个特征根
满足
1O().
~
由名词的约定6中解释A的最大特征根是单的,由上述定理可知,只要判断
矩阵的变动微小,主特征根的变动是微小的,进一步容易证明线性方程组
~n
(A
maxE)w
0的满足
w1
1的解的变动是微小的
即主特征向量的变动是微
i1
小的,排名是稳定的,满足了要求
(2).
五、关于可依赖程度的分析
很明显本模型是容忍不一致现象的,即满足要求(6).
当A是一个残缺的不一致矩阵时,由它得到的排名向量设为w,由名词约定
(1)我们认为这既是真实实力向量,令
aij
(3.5)
ij
1,i,j1,⋯,n.
wi/wj
则由(2.2)式可知wi/wj
1时,
aij
wi/wj~N(0,
2
ij
ij
).
(3.6)
wi/wj
wi
/wj
为计算方便,我们进一步假定wi/wj
1时,
2
ij
2为常数,
(3.7)
wi
/wj
令
h
2
2
(3.8)
ij
ij.
wi/wj
1
wi/wj
1
aij
0
aij0,i
j
则h可看作A的前后矛盾程度,再由(3.6),(3.7)可知
h/
2~xr2,
(3.9)
其中
r
n(n1)
n
mi,
(3.10)
2
i1
2
mi为第i
行零的个数.
那么对某个固定A0,可以通过(3.10)求出r0,通过(3.8)求出h0
设随机
变量h/2~xr2,则查x2表可得到
0
a
P(h2
h02)
(3.11)
称a为A0
的可依赖程度.则一个判断矩阵A0的可依赖程度为a就表示,如果与
A0相同的几个队在同样的比赛程序(队编号相同,残缺元素相同)下踢大量赛季
的比赛(假定各队水平不长进),判断矩阵为A0的这次的前后矛盾程度h0比大约
a100%的赛季的比赛前后矛盾程度h要小.
2的值可以用统计的方法估出,在本模型中我们只是简单地取2=1.
2
a临界值的确定可以很灵活地由比赛组织者决定,也可以通过大量好的和坏的比赛成绩比较给出一个值.
这样,我们的模型就满足了要求(7).
§4模型运行结果的分析
我们在计算机上实现了上述模型,并对表1中的数据进行了排名,结果是令人满意的