ImageVerifierCode 换一换
格式:PPTX , 页数:57 ,大小:518.27KB ,
资源ID:1050402      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/1050402.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(多智能体第2章.pptx)为本站会员(b****9)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

多智能体第2章.pptx

1、,多智能体机器人,1,第2章智能Agent,哈尔滨工业大学,计算机科学与技术学院,什么是 Agent?,Agent最主要的特点就是它们是自治的:能够独立行 动,并对它们的内部状态进行控制。Agent是处在某个环境中的计算机系统,该系统有能 力在这个环境中自主行动以实现其设计目标。,2,什么是 Agent?,几个Agent例子:温度控制系统软件指示器(UNIX 操作系统中用于邮件收 发的后台程序daemon)智能 Agent就是一个在一定环境下能够 灵活自主行动的计算机系统。灵活的意思是:反应性 预动性社会行为能力,3,反 应,如果一个程序的环境已经固定,这个程序不必担 心它的成功或失败仅仅执行

2、就可以了。固定环境的例子:编译器真实世界不像那样:事物在改变,信息也是不完 整的。很多有趣的环境是动态的。动态域中开发软件很难:编程必须考虑失败的可 能性 问它自己是不是值得执行!一个有反应的系统就是一个可以保持与它现有的 环境进行交互,并能够对环境的变化作出反应的 系统(及时响应是很有用的)。,4,预 动,对一个环境作出反应是容易的(例如,刺激响应规则)。但是我们通常想让Agent为我们做事。因此需要目标引导行为。预动=产生并试图完成目标,不仅仅是事 件驱动,而是采取主动。承认存在机会。,5,平衡反应式和目标引导系统的行为,我们想让Agent是反应式的,即以一种 恰当的(及时的)形式响应环境

3、的改变。我们想让Agent能够按部就班地工作以 满足长期的目标。这两种事项彼此之间可能产生冲突。设计一个能平衡这两种行为的Agent仍 然是一个需要解决的研究问题。,6,社会能力,真实世界是一个多Agent环境:我们不能不考 虑其它Agent的目标就尝试实现自己的目标。有些目标只有通过与别人合作才能完成。对于很多计算机环境来说也存在同样的问题:Internet就是一个实例。Agent的社会能力是通过某种Agent通信语言 来相互沟通(可能有人类),或许是相互合作。,7,其它特性,移动性:沿着电子网络移动的能力。准确性:一个Agent不能有意地传达错误信息。友善:Agent没有冲突的目标,而且每

4、个Agent都将试图去做要求做的事情。合理性:Agent为了完成目标而采取行动,而 且在阻止它的目标实现时就不采取行动。学习/适应:Agent会不断改进性能。,8,Agent与对象,Agent仅仅是对象的另一个名字吗?对象:被定义为一个计算实体,封装了一些状态。通过消息传递来进行通信。有方法,可能是对应某个状态执行的操作。,9,Agent与对象,主要的区别:Agent是自治的:Agent拥有比对象更强的自治性,特别是它们自 己决定是否接受其它Agent请求执行一个动作。Agent 是灵活的:能够产生灵活的(反应的,预动的,社会的)行为,而标准的对象模型根本没有这种行为能力。Agent 是主动的

5、:多Agent系统本质上是多线程的,其中每个Agent至少假定拥有一个主动控制线程。,10,对象做事是自由的,Agent做它想做的事情。Agent为了利益而工作。,11,Agent与专家系统,Agent仅仅是专家系统的另一个名字吗?专家系统是一些领域中无实体的“专家意 见”。例子:MYCIN 知道人类的血液疾病知识它具有很多有关血液疾病的知识,以规则的形式 存在。通过提供事实,回答问题和查询,医生可以从MYCIN 获得关于血液疾病的专家意见。,12,Agent与专家系统,主要的区别:Agent处于某个环境中:MYCIN 不能感知世界 只能通过问用户问 题来获得信息。Agent产生行为:MYCI

6、N 不会对病人进行手术。一些实时的专家系统(执行实时控制任务 的专家系统)就是Agent。,13,智能Agent与人工智能,Agent仅仅是人工智能工程吗?构建一个Agent是人工智能的全部么?人工智能目的在于构建能够(最终)理解自 然语言,识别和理解场景,用普通的常识,创造性地思维等等所有这些都是很困难 的。所以,我们不必解决所有的人工智能问题来 构建一个Agent,14,智能Agent与人工智能,当构建一个Agent时,我们仅仅想让一个系 统(在有限的领域内)能够选择正确的动作 来执行。我们不必为了构建一个有用的Agent 而解决 所有的人工智能问题:一点智能就已经大有帮助了!Oren E

7、tzioni,speaking about the commercial experience of NETBOT,Inc:“We made our agents dumber and dumber and dumberuntil finally they made money.”,15,环境可观察与不可观察,在可观察的环境中,Agent能够获得完 全的、精确的、最新的环境状态信息。多数真实世界环境(例如日常生活的物 理世界和Internet)是不可观察的。一个环境越容易观察,构建一个在环境 中发挥作用的Agent越简单。,16,环境确定性的与不确定性的,一个确定的环境就是一个动作会产生一个

8、确定的效果执行一个动作不会产生不 确定的状态。对于各种意图和目的来说,物理世界被认 为是不确定的。不确定的环境给Agent设计者带来了巨大 的问题。,17,环境静态的与动态的,静态环境是假定如果没有Agent执行动作,环境就不会发生变化。动态环境有其它过程发生作用,因此,会在Agent的控制之外发生变化。其它的过程可以干预Agent的活动(例如并 行系统理论)。物理世界是一个高度动态的环境。,18,环境离散的与连续的,如果存在确定的,有限数量的动作并且可以 在环境中被感知,则环境是离散的。Russell and Norvig把国际象棋的游戏作为 一个离散环境的例子,把出租汽车驾驶作为 连续的例

9、子。连续环境与计算机系统有一定程度的不匹配。离散环境原则上来说,可以通过一类“查表 法”来处理。,19,复杂环境,20,作为意识系统的Agent,当说明人类活动的时候,像下面的状态通常是 很有用的:张三带着伞,因为他相信将要下雨了。李四努力工作,因为他想要获得博士学位。这些陈述利用了大众心理学,通过大众心理学,人们的行为被预测和解释,像相信和想要(上 面例子中用到的),希望、害怕等等。在这样大众心理学里面的想法描述被称作有意 图的观念。,21,作为意识系统的Agent,哲学家Daniel Dennett 创造了意识系统这个 术语来描述一些实体,实体的行为可以通过 信念、期望和理性敏感等属性来预

10、测。Dennett 区分了不同“层次”的意识系统:一阶意识系统拥有信念和愿望(等),但是 没有关于信念和愿望的信念和愿望 二阶意 识系统更加复杂,它有关于信念和愿望的信 念和愿望(当然还可以有其它的思维状态)包括对于他人的和对于自己的。,22,作为意识系统的Agent,使用信念、愿望和意图等属性,对计 算机系统是合法的、有用的吗?,23,作为意识系统的Agents,McCarthy等人的意见是在有些情况下采用意 识立场是合适的:当赋予信念、自由愿望、意图、知觉、能力、要求等与表示一 个人具有同样信息的时候,这种表示是合理的。如果这样做有 助于理解机器的结构、机器的过去和将来的行为,或者有助于

11、修理或改进这台机器,则这种表示是有用的。从逻辑上讲,即 使对于人类这种表示也不一定是必须的,但是,用有条理并且 简单的方式表示在特定情况下实际知道的机器状态可能会需要 意识属性或者拟人的属性。关于机器的信念、知识、要求等思 维属性理论可以用比人类思维属性更简单的方式构造,也可以 用于人类。给已知其结构的机器赋予思维属性是最直接的方式,比如恒温控制器和计算机操作系统。但是,当应用于并不完全 知道其机构的机器时是最有用的。,24,作为意识系统的Agent,什么样的对象可以用意识立场来描述?结论是,几乎所有的自动控制系统都可以用 意识立场描述。例如,下面的灯的开关:用(合作的)Agent描述灯的开关

12、是非常合适的,它具 有按照人的意志传送电流的能力。当开关相信要它传送 电流时,它会不停地传送;否则就不传送。拨动开关就 是向它传达我们的愿望。(Yoav Shoham)但是多数成年人会发现这样一个描述很荒谬!这是为什么?,25,作为意识系统的Agent,答案是这样的,意识立场描述的方法与我们观察到的电 灯开关动作非常一致,内部也是一致的:.但是它并不能为我们提供什么,因为我们完全理解开关的机制,可以对开关的动作给出更简单的和机械 的描述。(Yoav Shoham)通常来说,对系统的了解越多,越不需要依赖对其行为 意图进行有灵性的解释。但是对于非常复杂的系统,机械地对它的行为解释可能 就行不通。

13、当计算机系统变得越来越复杂时,我们需要更加抽象的 技术和方法来解释它们的行为低水平的解释没有实 际意义。意识立场就是这样一个抽象。,26,作为意识系统的Agent,意识立场就是这样的抽象工具,它给我们提供了 方便而熟悉的描述、解释和预测复杂系统行为的 方式。记住:在计算领域最重要的发展就是基于新的抽 象:过程抽象抽象数据类型 对象Agent和作为意识系统的 Agent代表了一个更深一层的和 日益增强的抽象。,所以Agent理论家从作为意识系统的Agent开始 认为:系统最简单的协调性描述需要意识立场。,27,作为意识系统的Agent,意识立场是一个抽象工具一个讨论复杂系统 的抽象方式,它允许我

14、们去预测和解释它们的行 为而不必去理解机制是如何工作的。现在,很多计算机科学关注于寻找抽象机制(过 程抽象、自动数据变换ATD和对象都是例证)。所以为什么不可以用意识立场作为计算技术的 抽象工具用意识立场对复杂的计算机系统进行解释、理解和程序设计呢?这是有利于Agent的最重要的观点。,28,智能Agent的抽象结构,假定环境是任何离散的瞬时状态的有限集合 E:假设Agent有一个可执行动作的清单,它们改变环 境的状态:Agent在环境中的一次执行r是环境状态与动作的一 个序列:,29,智能Agent的抽象结构,设:R是所有可能的(E 和 Ac上的)有限序列集 合RAc 是以动作结束的序列所组

15、成的R的子集RE是以状态结束的序列所组成的R的子集,30,状态转移函数,一个状态转移函数代表了环境的行为:注意环境是 与历史有关的 非确定的如果 r,那么不可能存在对r后继状态。在这 种情况下,就说系统结束它的执行。形式上,环境 Env 是一个三元组 Env=E e,其中:E 是环境状态的集合,e0E 是初始状态,而是状态转移函数。,31,Agent模型,据系统的到当前为,把Agent的模型表示成一个函数,将一次执 行映射到动作:一个Agent根止历史状态 决定执行什么动作。设AG是所有Agent的集 合。,32,什么是系统?,系统是Agent和环境构成的对。任何系统都有与之相关的可能的执行集

16、合;用R(Ag,Env)表示Agent在环境Env执行的集 合。,33,什么是系统?,E e中,ent Ag 在环境 Env=如果:,形式上,一个序列 表示 一个 Ag的一次执行,e 是 Env的初始状态 Age对于 u,34,纯反应式Agent,一些Agent在没有参考它们的历史的情况下 决定该作什么没有对过去作出参考,它 们基于现在的情况而作出决定。我们称这样的Agent为纯反应式Agent:一个温度控制器是一个纯反应式Agent:,35,感 知,感知系统:把Agent的决策函数分解成感知子 系统和动作子系统:,环境,Agent,see,action,36,感 知,函数see代表Agent观察环境的能力,而函数action代表Agent的决策过程。see函数的输出是一个感知对象:see:EPer把环境状态映射到感知,action是一个函数:action Per*Ac把感知序列映射到动作。,37,有状态的Agent,现在考虑包含状态的Agent:,环境,Agent,see,action,next,state,38,有状态的Agent,这些Agent有内部的数据结构,一般用来记录环境

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1