博弈论与电子信息技术.docx
《博弈论与电子信息技术.docx》由会员分享,可在线阅读,更多相关《博弈论与电子信息技术.docx(9页珍藏版)》请在冰豆网上搜索。
![博弈论与电子信息技术.docx](https://file1.bdocx.com/fileroot1/2022-10/11/bc162704-42c0-41c6-88ba-577b93c372a2/bc162704-42c0-41c6-88ba-577b93c372a21.gif)
博弈论与电子信息技术
博弈论与电子信息技术
摘要:
博弈论及其相关立论目前已经广泛的应用于经济社会的各项活动中。
作为一项有力的工具,博弈论理论也应当被电子信息领域所应用。
本文从系统论、信息论、控制论等角度探讨博弈论在电子信息领域应用的可能性,并对其将来的发展做出展望。
关键词:
博弈论;电子信息;系统论;信息论;控制论
GameTheoryandElectronicInformationTechnology
Abstract:
Gametheoryanditsrelatedargumenthasbeenwidelyusedintheeconomicandsocialactivities.Asapowerfultool,GameTheoryalsoshouldbeappliedinthefieldofelectronicinformation.Inthispaper,wediscussthepossibilityofapplicationoftheGameTheoryinthewayofSystemtheory,Informationtheoryandcybernetics,andmakeavista
Keywords:
Gametheory;electronicinformation;Information;System;cybernetics
引言
博弈论是研究多人决策的理论,在经济领域中,博弈论的应用已经非常广泛,为人类社会带来了巨大的实际效应。
交易机制的模拟、劳动力经济学、贸易政策,无不充斥着博弈论的身影。
然而,作为电子信息工科出身的我却发现,博弈论与电子信息科学及工程技术的联系却还不是很多。
无论是博弈论把电子信息技术作为工具来发展自身,还是博弈论作为工具来为电子信息技术的发展提供支持,均未见有深入研究和应用。
实际上,我们可以发现博弈论和电子信息技术的发展有很多的结合点。
博弈论的理论研究会有很多的模型,目前最多能做的是利用仿真软件对模型进行简单的仿真研究,然而实际上我们可以利用更多的技术和工具对博弈论模型进行深入的研究,得到更为客观的数据和结果。
反之,当今电子信息技术正走向大规模化、智能化的方向,需要面临和处理的问题趋于复杂,这就需要类似于博弈论的理论来为其理论的发展做为支撑,只有这样,才会让电子信息技术向着正确、有希望的方向去发展。
因此,如果我们能注重博弈论与电子信息科学的理论和工程实践的结合,那么,无论是对于博弈理论的发展还是对于电子信息科学的前进,都是非常有远见的行为。
本文主要是对利用先进的电子信息技术来进行博弈论研究,以及博弈论将会在电子信息领域所能起到的作用进行介绍和设想。
1博弈论与控制论
1.1关于控制论
自从1948年诺伯特·维纳发表了著名的《控制论——关于在动物和机中控制和通讯的科学》一书以来,控制论的思想和方法已经渗透到了几乎有的自然科学和社会科学领域。
维纳把控控制论制论看作是一门研究机器、生命社会中控制和通讯的一般规律的科学,是研究动态系统在变的环境条件下如何保持平衡状态或稳定状态的科学。
他特意创“Cybernetics”这个英语新词来命名这门科学。
在控制论中,“控制”的定义是:
为了“改善”某个或某些受控对象的功能或发展,需要获得并使用信息,以这种信息为基础而选出的、于该对象上的作用,就叫作控制。
由此可见,控制的基础是信息,一切信息传递都是为了控制,进而任何控制又都有赖于信息反馈来实现。
信息反馈是控制论的一个极其重要的概念。
通俗地说,信息反馈就是指由控制系统把信息输送出去,又把其作用结果返送回来,并对信息的再输出发生影响,起到制约的作用,以达到预定的目的。
控制论主要包含的知识领域有:
信息论、自动控制系统理论、自动快速电子计算机的理论。
随着控制学科的发展现在还包括:
优化算法、矩阵理论、泛函分析、系统辨识等复杂的数学知识。
1.1.1控制系统的分类
按照系统的结构形式来分类,控制系统基本的控制形式可分为以下几类:
1开环控制系统
就是控制量与输出量之间仅有前向通路而无反馈通路(即输出量不能对控制量产生影响)。
1-1开环控制系统
2闭环控制系统
是指系统的信息传递形成闭合回路。
也称反馈控制系统。
1-2闭环控制系统
3复合控制系统
即开环和闭环联合应用的控制系统。
1.1.2智能控制简介
在第二次世界大战之后,在控制领域中,随着被控对象、环境、控制目标或任务越来越复杂;模型的不确定性、高度非线性、分布式的传感器和执行器、动态突变,多时间标度、复杂的信息模式、庞大的数据量以及严格的性能指标,智能控制作为新兴的有效的控制理论和方法,得到了极大的发展。
较为主要的有一下几种方法:
1模糊控制系统
模糊控制是以模糊集理论、模糊语言变量和模糊逻辑为基础的一种智能控制方法,它从行为上模仿人的模糊推理和决策过程。
该方法首先将操作人员或专家经验编成模糊规则,然后将来自传感器的实时信号模糊化,将模糊化后的信号作为模糊规则的输入,完成模糊推理,将推理后得到得输出量加到执行器上。
如图:
1-3模糊控制系统
2专家控制系统
专家系统是一个包含着知识和推理的智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。
1-4专家控制系统
3递阶控制系统
4多智能体控制系统等等……
1.2博弈控制系统的构想
1.2.1博弈控制系统的概念引入
我们已经知道,博弈论是研究多人决策的理论。
笼统的看,它的作用是对于一个问题,给出其相应的解决方法及结果。
因此,从控制角度来看,我们可以在控制系统中,将博弈论作为一种智能的控制算法进行应用。
就好比模糊控制算法、专家系统一样。
这样的控制系统将拓展控制理论解决问题的范围。
1.2.2博弈控制系统所涉及到技术支持
讲博弈理论转化为实际应用的系统,需要许多领域的支持。
首先我们需要精确的知识表达将博弈论理论进行形象化,将理论中的数字计算、逻辑表达等统一变成计算机可以表达运算的知识。
这些需要知识表达、计算机科学等学科领域的技术支持。
其次,还需要从控制论出发对系统的稳定精确等性能进行设计和调试。
这是非常庞大和漫长的工作。
这需要控制理论、控制工程等支持。
1.2.3博弈控制系统的设计
我们可以参考模糊控制和专家控制的方法,来设计博弈控制。
以下是我设想的博弈论控制系统的设计步骤:
1知识表达:
首先应用“知识表达”理论,来对博弈论进行建模。
即通过语义网、谓词逻辑等知识表达的方法来将博弈论中的各种信息统一的表达出来。
2推理规则:
利用现在已有的博弈论领域的正确结论,建立其对于可能遇到的各种问题的推理机制
3知识库建立:
建立一个存储空间,用以存储已经遇到并成功解决的问题,作为“记忆”,以备将来应用。
因此,这是一个可以智能成长的控制系统。
4推理机:
一个运算推理单元,综合“推理规则”和“知识库”,并利用确定的知识表达方法来进行问题的运算和解决。
5人机接口:
用于控制系统和人的交流。
它可以讲机器的知识表达(语义网、谓词逻辑等)和人类的表达(文字输入、语音等)进行互相转换。
1-5博弈控制系统
这是一个闭环控制系统,根据目前已有的技术和理论知识,这样的一个博弈控制系统,是完全有可能被建立起来的。
这种控制系统可以用来解决经济等领域的需要博弈论理论来解决的问题。
当然,它需要通过实践的运行进一步的完善。
1.3博弈控制系统面临的问题
目前未见任何博弈控制系统的设计和研究。
然而从博弈论本身以及控制理论的成熟发展角度来看,仍然可以设想博弈控制系统将会面临的问题。
1实时性博弈控制系统或许能给我们提供处好的解决问题的决策,但是,是否能满足工程实际的实时性要求。
如果不能在要求的时间范围内做出决策,则系统的应用范围将会大打折扣。
2伦理问题博弈理论时将人类的情感认知考虑在内的理论。
在设计博弈控制理论的时,也需要考虑到伦理问题,系统做出的结论必须符合人类伦理道德,至少要符合阿西莫夫机器人三定理。
这也是所有控制系统随需要遵循的基本原则。
2博弈论的实现----多Agent系统
2.1Agent的概念
现在IT界的Agent概念则是由麻省理工学院的著名计算机学家和人工智能学科创始人之一的Minsky提出来的,他在“SocietyofMind”一书中将社会与社会行为概念引入计算系统。
传统的计算系统是封闭的,要满足一致性的要求,然而社会机制是开放的,不能满足一致性条件,这种机制下的部分个体在矛盾的情况下,需要通过某种协商机制达成一个可接受的解。
Minsky将计算社会中的这种个体称为Agent。
这些个体的有机组合则构成计算社会——多Agent系
Agent是一个运行于动态环境的具有较高自治能力的实体。
其根本目标是接收另外一个实体的委托并为之提供帮助和服务,能够在该目标的驱动下主动采取包括社交、学习等手段在内的各种必要的行为,可感知、适应并对动态环境的变化进行适当的反应,它与其服务主体之间具有较为松散和相对独立的关系。
2.2Agent的基本特性
(1)自主性
亦称自治性,即能够在没有人或别的Agent的干预下,主动地自发地控制自身的行为和内部状态,并且还有自己的目标或意图。
(2)反应性
即能够感知环境,并通过行为改变环境。
(3)适应性
即能根据目标、环境等的要求和制约作出行动计划,并根据环境的变化,修改自己的目标和计划。
(4)社会性
一个Agent一般不能在环境中单独存在,而要与其它Agent在同一环境中协同工作。
而协作就要协商,要协商就要进行信息交流,信息交流的方式是相互通信
2.3Agent的基本结构
一般情况下,自主Agent内部基本的智能活动概括为局部感知、通信、协调控制、局部问题求解、冲突消解和学习。
具体如下图所示:
3-1Agent结构图
结果说明:
信念库:
主要指有关外部环境的事实信息和状态信息。
知识库:
表示Agent实现协作问题求解所必须的各种知识。
意图库:
主要包含Agent打算实现的目标以及Agent承诺执行以完成这些目标的部分行为计划。
局部感:
知是指Agent感知外部现实世界的能力。
局部问题求解包括基于信念库和知识库进行局部推理的活动,将推理结果施加到外部世界的活动。
协调控制:
主要指Agent根据所感知的信息选择求解目标,并对每一待求解问题进行权衡,决定自己求解还是与其它Agent协作。
对于无法独立完成的任务,需要进行任务的分解与分配,制定相应的协作求解计划,并控制计划的实施完成。
Agent具有通信能力是指:
Agent能够“说”和“理解”一种通信语言,通过使用这一语言获得与其它Agent的信息交换。
2.4多Agent系统
2.4.1基本概念
多Agent系统是一个松散耦合的Agent网络,这些Agent通过交互、协作进行问题求解(所解问题一般是单个Agent能力或知识所不及的)。
其中的每一个Agent都是自主的,它们可以由不同的设计方法和语言开发而成的,因而可能是完全异质的。
2.4.2多Agent系统特征
1每个Agent拥有解决问题的不完全的信息或能力;
2没有系统全局控制;
3数据是分散的;
4计算是异步的。
2.5多Agent系统与博弈理论的仿真
通过对Agent系统的了解,我们可以很容易的感觉的,每一个Agent都可以看做一个人类个体。
因此,我们任何博弈论的模型、理论都可以用Agent系统来进行模拟。
由于每一个Agent都有着独立的处理能力,这种模拟要比一般的软件模拟更加真实,更能够得到可靠的结果。
2.5.1Agent类型的选择
Agent根据功能的不同,有不同的种类,在此不做赘述。
在博弈论的仿真中,我们应选