多智能体第7章PPT文档格式.pptx
《多智能体第7章PPT文档格式.pptx》由会员分享,可在线阅读,更多相关《多智能体第7章PPT文档格式.pptx(37页珍藏版)》请在冰豆网上搜索。
![多智能体第7章PPT文档格式.pptx](https://file1.bdocx.com/fileroot1/2022-10/4/fb4dc6b0-d0cd-4d40-a370-62b55cc3dee9/fb4dc6b0-d0cd-4d40-a370-62b55cc3dee91.gif)
在一般情况下,卖方希望物品的价格最高;
而买方则希望这个价格最低。
5,拍卖的影响因素,物品可能具有:
私有价值公共价值相关价值获胜者可能决定出:
第一价格第二价格出价过程可能是:
公开叫价秘密叫价叫价过程可能是:
一轮拍卖加价拍卖降价拍卖,6,英国拍卖,最普通的拍卖形式:
第一价格公开叫价加价拍卖Agent采用的优势策略是相继以略高于当前最高叫价的价格叫价,直到当前的最高叫价达到它们的估价,然后撤标。
容易产生的问题:
中标者的悲哀雇用“托”,7,荷兰拍卖,荷兰拍卖是公开叫价降价拍卖的例子:
卖方从一个人为的高价开始拍卖物品。
卖方不停地一点点降低物品的价格,直到有Agent以等于当前的价格竞买这个物品。
然后,物品分配给这个开价的Agent。
8,第一价格密封叫价拍卖,第一价格密封叫价拍卖属于一轮拍卖的例子:
拍卖只有一轮买方为物品提供一个密封的出价物品分配给出价最高的Agent获胜者支付最高的出价价格最好的策略是以低于真正价值叫价。
9,Vickrey拍卖,Vickrey拍卖是:
第二价格拍卖密封叫价拍卖物品分配给出价最高的Agent,但这个Agent以第二高的叫价支付。
在Vickrey拍卖中有时策略是:
以真实的估价叫价。
Vickrey拍卖会使反社会的行为成为可能。
10,说谎与串通,各种拍卖协议在不同程度上容易使部分拍卖人说谎,出价人互相串通。
四种拍卖可能受出价人的勾结控制(英国、荷兰、第一价格密封叫价和Vickrey拍卖)不诚实的拍卖人在Vickrey拍卖中可以谎报第二最高出价从中获利。
在英国拍卖中,可以雇佣“托”来抬高叫价价格。
11,协商,拍卖只与物品的分派有关系,在多数情况下技术过于简单,而达成一致需要更多的技术。
协商是Agent就需要共同关心的问题达成一致的过程。
任何协商框架都有4个组成部分:
一个协商集合,Agent可能提出建议的空间。
一个协议,定义Agent提出的合法建议。
一组策略,每个Agent一个策略,通常是保密的。
一条规则,决定什么时候达成交易以及这个一致的交易是什么。
协商通常进行多轮,每个Agent在每一轮都给出建议。
12,面向任务领域(Task-OrientedDomains)协商,设想你有三个孩子,每天早晨需要把每个孩子送到不同的学校。
你的邻居有四个孩子,也需要把他们送到学校。
每送一个孩子可以建模成一个不能再分解的任务。
你和你的邻居可以讨论这种情况,并且达成一致,这对双方都有利(例如,捎上另一个人的孩子到同一个目的地,节省他的路程)。
自己能完成自己的任务没有什么要讨论的。
最坏的情形是你和你的邻居不能就送孩子建立汽车统筹达成一致,这种达成一致比你自己完成任务的情况并没有损失。
而你可以从你邻居的任务中获益(或者不会更差)。
假设,你的一个孩子和邻居的一个孩子上同一所学校(这就是说,两次送孩子的开销,或者两个任务,与执行其中一个任务的开销是一样的)。
显然,同时送两个孩子是合理的,并且只有你的邻居或者你去送孩子,完成这两个任务。
你们会达成什么样的一致?
你们可能会决定由你每个月的双日送孩子,你的邻居单日送孩子。
或许,如果还有其他的孩子,也可能由你的邻居总是送这两个特殊的孩子,你负责送其他的孩子。
-RulesofEncounter,RosenscheinandZlotkin,1994,13,协商中的领域理论,14,面向任务领域(TOD:
TaskOrientedDomains)Agent拥有要完成的任务任务重新分配面向状态领域(SOD:
StateOrientedDomains)目标指定了满足要求的最终状态副作用把规划和时间进度结合起来面向价值领域(WOD:
WorthOrientedDomains)通过环境状态的价值函数确定目标把规划、时间进度和放宽的目标结合起来,邮递员领域,PostOffice,a,c,2,1,d,e,TOD,b,f,15,数据库领域,公共数据库,2,1,TOD“Allfemaleemployeeswithmorethanthreechildren.”,“Allfemaleemployeesmakingover$50,000ayear.”,16,传真领域,faxestosend,a,c,b,d,e,成本只是建立线路的开销f,2,1,TOD,17,SlottedBlocksWorld,1,2,3,1,2,3,SOD,2,1,18,多Agent瓦片世界,222,55,342,A,B,瓦片,洞穴,障碍物,Agents,WOD,19,面向任务领域协商的定义,面向任务领域的协商是一个三元组:
其中:
T是所有可能任务的(有限)集合。
Ag=1,n是参与协商的Agent的集合。
c:
(T)R定义了执行每个T的子集的费用,用一个实数表示。
一次相遇是一个任务集合:
TTn其中:
对每个iAg有TiT。
20,面向任务领域协商中的交易,给定相遇,交易是把任务T1T2分配给Agent1和Agent2。
Agenti在交易d=中的费用定义为c(Di),表示成costi(d)。
交易d对于Agenti的效用表示为:
utilityi(d)=c(Ti)costi(d)冲突交易表示为Q,是没有达成一致后Agent必须执行最初分配的任务,可见最初分配的任务是冲突交易。
注意:
对所有iAg,utilityi(Q)=0。
如果这个交易弱优于冲突交易,交易d称为是个体理性的。
21,协商集合,协商集合由交易组成,并且是:
个体理性的pareto最优的,22,协商集合的图示说明,23,协商协议,24,Agent应该采用结果最大化的协商协议。
协议应该是对称的结果最大化的PMM(productmaximizingmechanism)例如:
1-step协议,单调让步协议等,单调让步协议,这个协议的规则如下:
协商进行多轮。
在第一轮协商中,Agent同时从协商集合中提出一项交易。
如果有一个Agent发现另一个Agent提出的交易至少与自己提出的一样好或者比自己提出的更好,就达成了一致。
如果没有达成一致,那么再同时提出建议,协商继续进行下一轮。
在第u+1轮,不允许Agent提出比第u轮建议对其它Agent更差的建议。
如果在某一轮u0中,没有Agent做出让步,那么协商以冲突交易结束。
25,Zeuthen策略,三个问题:
Agent的第一个建议应该是什么?
应该是它最希望进行的交易。
在给定的一轮协商中,谁应该让步?
更愿意冒冲突风险的Agent。
如果一个Agent让步,它应该让步多少?
恰好足够的让步以改变风险的平衡。
26,愿意冒冲突的风险,假设你做了很多让步,那么:
你的建议现在接近冲突交易了。
在冲突发生时,还不是最坏的情况。
你会更愿意冒冲突的风险。
如果Agent当前的建议与冲突交易在效用上差别不大,Agent会更愿意冒冲突的风险。
27,再次出现Nash平衡,Zeuthen策略处于Nash平衡,根据这一假设,一个Agent使用这个策略,其它Agent不会有其它更好的策略。
这对于自动Agent设计者是特别有意义的。
它消除了所有程序员对于保密部分的要求。
一个Agent的策略可以公开,并且其它Agent设计者无法通过选择不同的策略利用这个信息。
事实上,知道这策略是所希望的,可以避免不小心引起的冲突。
28,面向任务领域协商中的欺骗,欺骗在下面两种方式中对Agent是有利的:
虚幻和虚假任务假装已经分配了一个任务,而它却没有分配这个任务。
隐瞒任务假装没有分配一个任务,实际它却分配这个任务。
29,其它有关的工作,30,有关StateOrientedDomains还有很多相似的分析工作,但所研究的状态更加复杂。
联合(多于两个Agent,Kraus,Shechory)机制设计(Sandholm,Nisan,Tennenholtz,Ephrati,Kraus)其它类型的协商模型(Kraus,Sycara,Durfee,Lesser,Gasser,Gmytrasiewicz)舆论机制、投票技术和经济模型(Wellman,Ephrati),结论,通过适当地调整Agent相互作用的相遇规则,我们可以改变设计者嵌入它们机制中的秘密策略。
交互机制必须保证多Agent系统的效率。
相遇规则,效率,31,结论,要想维持动态多Agent系统的效率随时间的不变性,规则也必须稳定。
形式化工具的使用,可以设计效率和稳定性机制,以及实现它们属性的精确化描述。
稳定性,形式化工具,32,辩论,辩论是就某种事情试图使他人信服的过程。
Gilbert(1994)把辩论区分为下列4种模型:
逻辑模式同数学证明类似,倾向于自然演绎。
例“如果你接受A并且A包含B,那么你应该接受B”情感模式呼吁带有感情和态度等情形。
“如果这件事发生在你身上,你会感觉怎样?
”本能模式自然和社会的方面。
“白痴!
”神秘模式借助于直觉、隐秘现象或宗教等。
“这是对耶稣教诲的对抗!
”,33,基于逻辑的辩论,基本的逻辑辩论形势如下:
Database|-(Sentence,Grounds)其中:
Database是逻辑公式的集合(可能是不一致的)。
Sentence是称为结论的逻辑公式。
Grounds是逻辑公式集合,使得:
GroundsDatabase;
Sentence可以由Grounds证明。
34,攻击与击败,设(f1,G1)和(f2,G2)是由数据库D得出的论证,。
那么论证(f2,G2)可以用两种方式之一击败(攻击):
(f1,G1)反驳(f2,G2),如果f1攻击f2,35,G2有f1,(f1,G1)削弱(f2,G2),如果对于y攻击y。
反驳和削弱就被认为是攻击。
抽象辩论,只关心论证的整体机构,不关心论证的内部机构。
写作xy“论证x攻击论证y”“x是y的反例”“x是y的攻击者”我们并不关心xy的内容,也不关心攻击关系来自何处。
一个抽象论证系统就是集合或辩论由关系符“”连接起来的谁攻击谁的系统。
如果一个辩论有攻击者,就是out;
所有攻击者被击败,就是in。
36,一个抽象辩论系统例子,37,