NBA.docx
《NBA.docx》由会员分享,可在线阅读,更多相关《NBA.docx(13页珍藏版)》请在冰豆网上搜索。
NBA
NBA赛程的分析与评价
摘要
本文要求对NBA的赛程表进行定量分析评估。
故考虑层次分析法的模型(目标层:
各队的综合优势分;准则层:
“士气度”、“负疲劳度”;决策层:
30支球队)
为分析赛程对球队的利弊,分别考虑利因:
士气;弊因:
疲劳(其权重都为0.5)。
并计算相应的“士气度”、“疲劳度”。
最终求得各队的“综合优势分”,用它来评价赛程利弊:
若综合分=0,该队不占优势也不吃亏;若>0,则该队占优;若<0,则不利于该队。
考虑因连续比赛引起的疲劳(据此计算相应的疲劳指数,单位化成疲劳度),建模型一并求解,得出结论:
赛程对火箭队不利,对开拓者队最有利,对篮网、步行者最不利。
考虑因连续往返东西部比赛引起的疲劳(据此计算相应的疲劳指数,单位化成疲劳度),建模型二并求解,得出结论:
赛程对火箭队不利,对湖人队,国王队最有利,对森林狼队最不利。
问题三中,本文给出了选取赛三场的球队的方法。
作图示意所提的新赛程方案。
在选取安排的过程中,我们始终坚持尽可能均衡的原则.。
注意到每一支球队与同部不同区的6支队伍比赛4场(2主2客)的情况是比较均衡的状态,故先确定这6支队伍(剩余的4支就是赛3场的)。
为了使同部3个区的球队间保持均衡,因此这6支队伍,将分别从2个区中各找出3支(赛4场)。
显然,剩下的4支球队就是赛3场的(每区2支)
在确定赛4场的队伍时,我们尽量安排实力相当(均衡原则)的对手进行比赛(实力用区内排名来衡量)。
而每个区中剩下的2支球队就被安排赛3场,安排与其中较强的那个队进行2主1客,与其中较弱的那个队进行2客1主。
(这是为了平衡“客场”、“以弱对强”两项不利因素,避免出现极端情况弱队以2客一主对战强队)
最后我们对本文所提模型进一步思考,考虑可以改进之处:
比如在准则层中可以增加考虑对手强弱带来的影响。
比如提出新的更合理的疲劳度的量化准则:
连续两天往返东西部比赛(对该队的“疲劳指数”贡献了1分,)、连续两天往返不同区(同部)比赛(为与前面跨部拉开差距,不妨认为对该队的“疲劳指数”贡献了0.5分)。
关键词:
层次分析法、疲劳度、士气度、综合优势分
问题的提出
对于2008~2009新赛季,NBA将有1230场赛事,每支球队都要进行82场比赛。
现提供了2008~2009赛季常规赛的赛程表(附件1)及各球队分部、分区和排名情况(附件2)。
要求用数学建模方法对已有的赛程进行定量的分析与评价:
1)考虑在安排赛程时哪些因素会影响球队,并根据这些因素将赛程转换为便于进行数学处理的数字格式,并给出评价赛程利弊的数量指标。
2)按照1)的结果计算、分析赛程对姚明加盟的火箭队的利弊,并找出赛程对30支球队最有利和最不利的球队。
3)分析赛程可以发现,每支球队与同区的每一球队赛4场(主客各2场),与不同部的每一球队赛2场(主客各1场),与同部不同区的每一球队有赛4场和赛3场(2主1客或2客1主)两种情况,每支球队的主客场数量相同且同部3个区的球队间保持均衡。
试根据赛程找出与同部不同区球队比赛中,选取赛3场的球队的方法。
这种方法如何实现,对该方法给予评价,也可以给出你认为合适的方法。
问题的假设与说明
说明:
题目所给数据有误,实际仅有1225场比赛记录,而非题目所提及的1230场比赛,本文就将错就错,进行建模求解分析。
假设一:
由赛程可知基本上同一支球队不会在同一天参加两场比赛,故忽略具体比赛时刻,只关注比赛日期。
假设二:
从2008-10-29到2009-4-16的常规赛阶段里,并不是每天都有比赛,(如圣诞节那天就没有安排比赛),故只关注有安排比赛的日期。
假设三:
“士气”这一利因及“疲劳”这一弊因重要性相同,权重W1=W2=0.5。
假设四:
如果某一球队打了一场主场比赛,休息了几天后再次比赛,仍然是主场的话,就认为它是连续主场比赛。
假设五:
球队连续两天进行比赛,由于没有休息,球员感到疲劳,就认为会对球队产生不利影响。
(模型一)
假设六:
球员在连续的两天里往返东西两部比赛时,由于长途旅行,会感到特别的疲劳,对其产生不利影响。
如果某一球队在东部(或西部)打了一场比赛,休息了几天后再次赶到西部(或东部)打比赛,就认为球员的疲劳已经通过休息得到缓解,对其没有不利影响。
至于球员在连续的两天里往返同部的赛区比赛,则对其没有不利影响。
(模型二)
符号说明
名称
符号
说明
新赛程表
SC
将所给赛程数字化后生成的1225×3的数表,包含了1225场比赛的相关信息(比赛日期、客队号码、主队号码),数据保存在文件book.xls
主场状态变量
ZC(I,J)
162×30的数表,表示第I个比赛日时第J队是否主场
(是主场则取值1,否则0)
客场状态变量
KC(I,J)
162×30的数表,表示第I个比赛日时第J队是否客场
(是客场则取值1,否则0)
主客场状态变量
ZKC(I,J)
162×30的数表,表示第I个比赛日时第J队的状态
(是主场则取值1,是客场则取值-1,不比赛则取值0)
主客场连续变量
ZKL(I,J)
82×30的数表,表示第J队在进行他的第I场比赛时(每队一共82场比赛)的状态,该表是上表的缩略版
分部比赛状态变量
FB(I,J)
162×30的数表,表示第I个比赛日时第J队的状态
(在东部则取值1,在西部则取值-1,不比赛则取值0)
士气分
sq
1×30的数表,表示第J队的连续主场次数
士气度
SQD
1×30的数表,对“士气分”向量作单位化处理
疲劳指数
pl
1×30的数表,
疲劳度
PLD
1×30的数表,为“疲劳指数”向量作单位化
权重向量
W
(W1,W2)分别对应了“士气”、“疲劳”两因素的权重
综合
优势分
Z
1×30的数表,
问题的简要分析
●为了分析赛程对球队的利弊,我们打算从利弊两方面来考虑因素。
从生活常识,我们很快想到“主场”是个有利的因素。
但注意到题目中提及每支球队的主客场数量相同(都是41场),显然单纯计算每支队伍的主场次数没什么用处。
于是我们关注每支球队连续主场作战的次数,以此得出士气分。
另一方面,我们也想到如果某支球队连续两天(或更久)进行比赛,势必会累积疲劳,形势不利。
于是,我们关注每支球队发生此类情况的次数,以此计算疲劳指数。
这样,本题就可看作是一个层次分析法的模型。
(目标层:
各队的综合优势;
准则层:
士气度、负疲劳度;决策层:
30支球队)
模型的准备
●为了能够定量分析赛程,首先利用excel对所给的赛程表作数字化处理:
1.根据假设一,只关注比赛日期,故删去“时刻”、“星期”两列的数据;
2.由假设二,只对有安排比赛的日期依序标号,非比赛日不予考虑,直接跳过,不标号。
并且保证同一日期对应的数字标号相同。
3.将30支球队按照附件二中所列次序分别标记1~30的球队号码。
4.得到新的赛程表:
1225*3的数表(见“模型的准备”文件夹中book文件)如下表示例:
1
12
6
1
15
14
1
23
26
2
9
2
…..
其第一列的数据表示是整个赛季的第几个比赛日,
其第二列的数据表示该场比赛的客队号码,
其第三列的数据表示该场比赛的主队号码。
●为了便于定量分析,我们需要从这张新的赛程表中产生出一些反映主场状态、客场状态等数表。
(每张表格中变量的含义可参考前文“符号的说明”)用mathcad软件编程实现了目的。
(程序及表格保存在“模型的准备”文件夹中)这里以计算主场状态表(162×30的数表,第I个比赛日时第J队是主场则取1,否则0)的程序为例说明我们的编程思路:
首先读取赛程表SC,分别取出第1、2、3列向量,命名为DAY、K、Z
下面确定162×30的数。
最外层是对i从1~162循环(对行循环)
内层是对j从1~30循环(对列循环)
最内层是对l从1~1225循环(1225条记录)
找到某条记录,其DAY值正好等于i,且Z值正好等于j,则令
第i行第j列元素为1,并中断最内层的循环。
当读完1225条记录仍然没有找到符合上述要求的记录,则令第i行第j列元素为0
建立模型(问题一)
●评价赛程利弊的数量指标——目标层
为了能够便于评价赛程的利弊。
我们不妨考虑士气”这一利因及“疲劳”这一弊因重要性相同,权重W1=W2=0.5。
又注意到“士气分”、“疲劳指数”的得分很可能不平衡,(如公务员招聘模型中面试满分16分,笔试满分300,不平衡),干脆将它们单位化成相应的士气度、疲劳度。
在层次分析法模型中,我们的目标是综合优势分,显然,疲劳度的增加会减少综合优势分。
这就是为什么,我们在准则层中考虑了负疲劳度。
这样我们就可以将各支队伍的综合优势分作为评价赛程利弊的指标。
如果综合优势分等于0,说明利弊正好互相抵消,该球队不占优却也不吃亏。
综合优势分大于0,说明利的影响超过了弊的影响,球队占优;且值越大,该队所占优势越大。
综合优势分小于0,说明利的影响不敌弊的影响,对球队不利;且值越小,对该队越不利。
●计算30支球队各自的士气分sq
对主客场连续表(82×30),针对每一列,统计“1”连续出现的情况,当连续出现两次1则认为士气分加1;若连续出现三次1,则认为士气分加2,以此类推。
利用mathcad软件编了程序实现这一算法。
(见“计算程序”文件夹)
●计算30支球队各自的疲劳指数pl
对主客场状态表(162×30),针对每一列,统计非零的数(1或-1)连续出现的次数。
此时说明该队连续比赛没有休息(休息对应“0”)利用mathcad软件编了程序实现这一算法。
(见“计算程序”文件夹中“计算各队疲劳指数(连续比赛)”文件)
●将士气分、疲劳指数单位化成相应的士气度SQD、疲劳度PLD
●计算30支球队的综合优势分Z
第i支球队的综合分Zi=W1*SQDi+W2*PLDi
模型的求解与分析(问题二)
●模型一
按照上述模型,得各队得分表
队号
士气分(sq)
士气度(SQD)
疲劳指数(pl)
疲劳度(PLD)
综合优势分(Z)
1
17
2.94%
18
2.88%
0.0003
2
17
2.94%
20
3.19%
-0.0013
3
23
3.97%
23
3.67%
0.0015
4
20
3.45%
22
3.51%
-0.0003
5
20
3.45%
19
3.04%
0.0021
6
18
3.11%
19
3.04%
0.0004
7
20
3.45%
19
3.04%
0.0021
8
18
3.11%
24
3.83%
-0.0036
9
16
2.76%
23
3.67%
-0.0046
10
19
3.28%
19
3.04%
0.0012
11
17
2.94%
15
2.40%
0.0027
12
17
2.94%
21
3.35%
-0.0021
13
15
2.59%
22
3.51%
-0.0046
14
19
3.28%
23
3.67%
-0.0020
15
20
3.45%
24
3.83%
-0.0019
16
19
3.28%
20
3.19%
0.0004
17
18
3.11%
21
3.35%
-0.0012
18
20
3.45%
23
3.67%
-0.0011
19
19
3.28%
18
2.88%
0.0020
20
19
3.28%
22
3.51%
-0.0012
21
20
3.45%
22
3.51%
-0.0003
22
21
3.63%
23
3.67%
-0.0002
23
24
4.15%
19
3.04%
0.0055
24
17
2.94%
24
3.83%
-0.0045
25
19
3.28%
20
3.19%
0.0004
26
22
3.80%
22
3.51%
0.0014
27
21
3.63%
20
3.19%
0.0022
28
21
3.63%
16
2.56%
0.0054
29
22
3.80%
21
3.35%
0.0022
30
21
3.63%
24
3.83%
-0.0010
结论:
1.从表中发现第23个队(开拓者队)综合分最高,即赛程对其最有利。
2.从表中发现第9、13个队(篮网队、步行者队)综合分最低,即赛程对其最不利。
3.火箭队的综合得分-0.0011<0,即赛程对火箭队不利。
●模型二
我们还注意到赛程中,有些队连续两场比赛在东西不同部。
显然,这对球队不利。
所以,我们不再从“是否连续比赛”的角度,定义疲劳度。
提出新的假设,见假设六,主要关注各支球队连续往返东西部的次数。
模型二大致类同模型一,只是计算30支球队各自的疲劳指数pl的方法不同:
对分部比赛的状态表(162×30的数表,表示第I个比赛日时第J队的状态,在东部则取值1,在西部则取值-1,不比赛则取值0),(见“模型准备”文件夹)
针对每一列,统计1和-1连续出现的次数。
利用mathcad软件编了程序实现这一算法。
(见“计算程序”文件夹中“各队疲劳指数(连续往返东西部)”文件)
经计算,得得各队得分表
队号
士气分(sq)
士气度(SQD)
疲劳指数(pl)
疲劳度(PLD)
综合优势分(Z)
1
17
2.94%
3
4.48%
-0.008
2
17
2.94%
1
1.49%
0.007
3
23
3.97%
2
2.99%
0.005
4
20
3.45%
3
4.48%
-0.005
5
20
3.45%
2
2.99%
0.002
6
18
3.11%
2
2.99%
0.001
7
20
3.45%
1
1.49%
0.010
8
18
3.11%
0
0.00%
0.016
9
16
2.76%
1
1.49%
0.006
10
19
3.28%
3
4.48%
-0.006
11
17
2.94%
1
1.49%
0.007
12
17
2.94%
0
0.00%
0.015
13
15
2.59%
0
0.00%
0.013
14
19
3.28%
2
2.99%
0.001
15
20
3.45%
5
7.46%
-0.020
16
19
3.28%
5
7.46%
-0.021
17
18
3.11%
5
7.46%
-0.022
18
20
3.45%
3
4.48%
-0.005
19
19
3.28%
2
2.99%
0.001
20
19
3.28%
7
10.45%
-0.036
21
20
3.45%
0
0.00%
0.017
22
21
3.63%
2
2.99%
0.003
23
24
4.15%
1
1.49%
0.013
24
17
2.94%
8
11.94%
-0.045
25
19
3.28%
4
5.97%
-0.013
26
22
3.80%
0
0.00%
0.019
27
21
3.63%
0
0.00%
0.018
28
21
3.63%
1
1.49%
0.011
29
22
3.80%
0
0.00%
0.019
30
21
3.63%
3
4.48%
-0.004
结论:
1.从表中发现第26、29个队(湖人队,国王队)综合分最高,即赛程对其最有利。
2.从表中发现第24个队(森林狼队)综合分最低,即赛程对其最不利。
火箭队的综合得分-0.005<0,即赛程对火箭队不利。
问题三
1.处理原则
由题目知:
每一支球队在与同部不同区的10支球队比赛时会有2种情况:
与其中6支战4场(2主2客)、与另外2支战3场(2主1客)、与剩下的2支战3场(2客1主)。
故,面临一个不确定的情况,需要决定选取哪些球队(同部不同区的)赛3场。
我们的原则是尽可能公平、均衡。
注意到与6支队伍比赛4场(2主2客)的情况是比较均衡的状态,故我们考虑先确定这6支队伍(剩余的4支就是赛3场的)。
又因为题目要求同部3个区的球队间保持均衡,因此我们只需要在另2个区中各找出3支队伍赛4场即可。
考虑到比赛的赛程是双向的,对于A区而言,如果在B区中确定了赛4场的队,反过来,对于B区而言,与A区中赛4场的队伍也就确定了。
因此,在安排同部三个区的赛程时,先以某个区为主,确定它在另两区赛4场的对手,这样我们只需再完成另外2区之间的赛程即可。
在确定赛4场的队伍时,我们始终坚持尽可能均衡的原则,尽量安排实力相当的对手进行比赛(其中实力我们用区内排名来衡量)
2.处理步骤
现提出了具体选取方法。
为了便于说明,不妨将同部的三个区比较其整体实力(用上赛季的胜率衡量)排序为A、B、C(A为整体实力最强的区,C为最弱的区)
步骤一:
为A区中每支队伍,在B、C两区确定其赛4场的对手。
(原则:
尽量安排实力相当的对手进行比赛。
)
为安排实力尽可能相当的对手,从理论上来说,A区中的第i名应与B(C)区的第i+1、i、i-1名比赛。
但是,这样会使B(C)区中的有些队伍与A区三支以上的队伍进行比赛,违反了限制条件。
这种情况也不适用于安排A区中的第一名和最后一名。
所以做如下调整:
●将A区中第i名的球队与B(C)区中第i名的队进行比赛。
●将A区中第3名的球队与B(C)区中第2、3、4名的队进行比赛。
●将A区中第1、5名的球队分别与B(C)区中最强的三个队(1、2、3)、最弱的三个队(3、4、5)进行比赛。
●将A区中第2名的球队与B(C)区中第1、2、5名的队进行比赛。
●将A区中第4名的球队与B(C)区中第4、5、1名的队进行比赛。
步骤二:
为A区中每支队伍,在B(C)区确定其赛3场的对手
显然对A区中的每支队伍,B(C)区剩下的两支队将与其赛3场。
步骤三:
对步骤二中所确定的对手进一步确定与其中哪支球队进行2主1客的比赛。
注意到两队比赛有“以弱对强”、“己队客场比赛”这两个不利因素,因此为尽可能公平,避免出现失衡状态,尽量在一场比赛中避免球队同时面临这两个不利因素。
所以,我们只要安排A区中的队与B(C)区中它的两个对手中实力较强的那支队打2主1客,而与实力较弱的那支球队打2客1主的比赛。
3.提出方案
按上述步骤和原则提出赛3场方案见下图。
(与不同区10支队的所有比赛安排见“结果”文件夹)说明:
连线表示两个队要比赛,箭头指向的就是比赛地(即主场队)
西部赛区同部不同区赛3场分布图
东部赛区同部不同区赛3场分布图
4.评价
此方案是基于尽可能公平、均衡的原则提出的。
显然,依此所确定的赛程表相对而言,保证了各球队之间尽可能均衡。
另外一方面,避免了(最)强队和(最)弱队赛4场,减少了比赛的不稳定性。
而在赛3场的比赛中,避免了在遇到实力稍强队时,打客场的不利因素,也使比赛的可看性增加。
模型的进一步探讨
●疲劳度的测定
在模型一中,我们用连续比赛的次数,量化疲劳指数,主要考虑球队因连续作战没有休息而引起的疲劳。
在模型二中,我们关注长途旅行给球队带来的疲劳,用连续两天往返东西部比赛的
次数,量化疲劳指数。
事实上,我们也可以提出测定疲劳度的其他标准。
比如,进一步改进模型二,认为球队除了因连续两天往返东西部比赛会产生疲劳
外,连续两天往返不同区(同部)比赛也会增加球员的疲劳度。
显然,前一情况对球队的不利影响更厉害(因为奔走的距离更远,球员更加疲劳)。
为体现这两种情况的差别,不妨认为出现一次前种情况,就对该队的“疲劳指数”贡献了1分;出现一次后种情况,就对该队的“疲劳指数”贡献了0.5分,以此来计算相应的疲劳指数。
●因素的考量
在本文的模型中只考虑了两项因素:
“士气度”、“疲劳度”。
但是,直观而言,
对手的情况应该也会对球队产生影响。
经过对赛程安排的仔细分析,我们发现,大多数球队间进行的主客场比赛数目都是均等的(2主2客或者1主1客)。
认为这部分对手的情况对球队不产生影响。
仅仅关注不均等的部分,即每支球队与同部不同区(共10支队)的4支球队赛3场(2主1客或2客1主),(这一部分赛程:
即选择跟哪四支队打,怎么打都是不定的)。
考虑到某球队与其对手赛3场时可能会面临“已队客场”、“以弱对强”2种不利情况。
对此分别用其(主场次数-客场次数)、(主场队的主场胜率-客队的客场胜率)来量化,提出对手差距分这一数量化指标。
计算方法如下:
●对于确定的某一支球队,找出与其赛3场的4个对手(姑且称为a,b,c,d)
●对于该球队,计算其与对手a的差距:
Cj(a)=(主场次数-客场次数)*(主队胜率-客队胜率)
●同上步计算Cj(b)、Cj(c)、Cj(d)
●对于该球队,计算得到差距分:
Cj(a)+Cj(b)+Cj(c)+Cj(d)