一级倒立摆的单神经元PID控制器的设计毕业设计.docx
《一级倒立摆的单神经元PID控制器的设计毕业设计.docx》由会员分享,可在线阅读,更多相关《一级倒立摆的单神经元PID控制器的设计毕业设计.docx(40页珍藏版)》请在冰豆网上搜索。
一级倒立摆的单神经元PID控制器的设计毕业设计
一级倒立摆的单神经元PID控制器的设计
摘要
倒立摆装置被公认为自动控制理论中的典型试验设备,是控制理论教学和科研中最典型的物理模型。
通过对它的研究不仪可以将控制理论中的许多分析问题加以验证,还能将控制理论涉及的三个主要基础学科:
力学、数学和电学(包含计算机)进行有机的综合应用。
倒立摆可为多种具有实际工程背景的物理系统提供一个很好的实验平台,从而可以将所设计的控制器应用于此平台上。
首先利用牛顿一欧拉方法对倒立摆系统进行建模,从LQR控制方法,传统的PID控制方法与神经网络控制理论出发,学习了LQR算法和单神经元PID控制器算法,并根据控制模型设计LQR控制器和单神经元PID控制器。
通过MZTLAB仿真和倒立摆实验装置实现倒立摆系统的稳定控制。
文中采用两种控制方法:
LQR控制和单神经元PID控制法。
通过仿真可以看出采用单神经元PID控制方法的控制效果比LQR控制效果要好,超调量小或无超调量,调节时间比LQR控制短。
关键词:
倒立摆PID控制单神经元网络控制
DesignofsingleneuronPIDcontrollerforaninvertedpendulum
Abstract
Nvertedpendulumdeviceisregardedasthetypicaltestequipmentinthetheoryofautomaticcontrol,anditisthemosttypicalphysicalmodelintheteachingandscientificresearchofcontroltheory.Throughtheresearchinstrumentcancontrolmanyoftheanalyticalproblemsintheoryisverified,butalsothecontroltheoryinvolvesthreemainbasicdisciplines:
mechanics,mathematicsandelectrical(includingcomputer)fororganicsynthesisapplication.Invertedpendulumcanprovideagoodexperimentalplatformforavarietyofphysicalsystemswithpracticalengineeringbackground,sothatthedesignedcontrollercanbeappliedtotheplatform.
Firstly,theNewtonEulermethodofinvertedpendulumsystemmodeling,theLQRcontrolmethod,thetraditionalPIDcontrolmethodandneuralnetworkcontroltheory,tostudytherelatedlearningalgorithm,theLQRalgorithmandsingleneuronPIDcontrolleralgorithm,andaccordingtothecontrolmodeldesignofLQRcontrolsystemwiththesingleneuronPIDcontroller.ThestabilitycontrolofinvertedpendulumsystemisrealizedbytheMZTLABsimulationandtheinvertedpendulumexperimentdevice.Twocontrolmethodsareusedinthispaper:
LQRcontrolandsingleneuronPIDcontrol.
Throughthesimulation,wecanseethatthecontroleffectofsingleneuronPIDcontrolmethodisbetterthantheLQRcontroleffect,theovershootissmallornoovershoot,andthecontroltimeisshorterthanthatofLQRcontrol.
Eywords:
invertedpendulumPIDcontrolsingleneuronnetworkcontrol
插图清单
引言
倒立摆,顾名思义,是处于倒置不稳定状态,人为控制使其处于动态平衡的一种。
一般是由一个可以在水平轨道上自由移动的小车和倒置摆铰链而成。
倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦和的非线性系统,是进行控制理论教学及开展各种控制实验的理想实验平台。
对倒立摆系统的研究能有效的反映控制中的许多典型问题:
如非线性问题、鲁棒性问题、镇定问题、随动问题以及跟踪问题等。
PID控制具有结构简单、稳定性能好、可靠性高等优点,尤其适用于不能建立精确数学模型的不确定性控制系统。
PID控制中一个关键的问题便是PID参数的整定。
但是在实际的应用中,许多被控过程机理复杂,具有高度非线性、时变不确定性和纯滞后等特点。
在噪声、负载扰动等因素的影响下,过程参数甚至模型结构均会随时间和工作环境的变化而变化。
这就要求在PID控制中,不仅PID参数的整定不依赖于对象数学模型,并且PID参数能够在线调整,以满足实时控制的要求。
神经网络主要用来解决那些传统方法难以解决的控制对象参数在大范围变化的问题,其思想是解决PID参数在线调整问题的有效途径。
单神经元是构成神经网络的基本单位,神经元构成的单神经元PID控制器.不但结构简单、学习算法物理意义明确、计算量小,而且具备自学习、自适应、自组织的能力,能够自动辨识被控过程参数,自动整定控制参数、能够适应被控过程参数的变化,鲁棒性强、可靠性高,这类控制器已在实际问题中得到了应用
本文提出一种方案利用单神经元PID来控制一级倒立摆。
因为一级倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦和的非线性系统单神经元,而PID控制具有结构简单、计算量小、权值学习时问短、鲁棒性强、易于实现等优点。
同时利用LQR控制器与单神经元PID进行对比,仿真后得出结论单神经元PID控制方法的控制效果比LQR控制效果要好,超调量小或无超调量,调节时间比LQR控制短。
第1章绪论
1.1倒立摆简介
倒立摆,顾名思义,是处于倒置不稳定状态,人为控制使其处于动态平衡的一种。
一般是由一个可以在水平轨道上自由移动的小车和倒置摆铰链而成。
倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦和的非线性系统,是进行理论教学及开展各种控制实验的理想实验平台。
对倒立摆系统的研究能有效的反映控制中的许多典型问题:
如非线性问题、鲁棒性问题、镇定问题、随动问题以及跟踪问题等。
通过对它的研究不仅可以解决控制中的理论和技术实现问题,还能将控制理论涉及的主要基础学科:
力学、数学和计算机科学进行有机的综合应用。
其控制方法和思路无论对理论或实际的过程控制都有很好的启迪,是检验各种控制理论和方法的有效的“试金石”。
倒立摆的研究不仅有其深刻的理论意义,还有重要的工程背景。
在多种控制理论与方法的研究与应用中,特别是在工程实践中,也存在一种可行性的实验问题,使其理论与方法得到有效检验,倒立摆就能为此提供一个从理论通往实践的桥梁,目前,对倒立摆的研究已经引起国内外学者的广泛关注,是控制领域研究的热门课题之一。
倒立摆不仅仅是一种优秀的教学实验仪器,同时也是进行控制理论研究的理想实验平台。
由于倒立摆系统本身具有的高阶次、不稳定、多变量、非线性和强耦合特性,许多现代控制理论的研究人员一直将它视为典型的研究对象,不断从中发掘出新的控制策略和控制方法,相关的科研成果在航天科技和机器人学方面获得了广阔的应用[1]。
二十世纪九十年代以来,更加复杂多种形式的倒立摆系统成为控制理论研究领域的热点,每年在专业杂志上都有大量的优秀论文出现。
因此,倒立摆系统在控制理论研究中是一种较为理想的实验装置。
倒立摆主要应用在以下几个方面:
(1) 机器人的站立与行走类似于双倒立摆系统,尽管第一台机器人在美国问世至今已有三十年的历史,机器人的关键技术——机器人的行走控制至今仍未能很好解决。
(2) 在火箭等飞行器的飞行过程中,为了保持其正确的姿态,要不断进行实时控制。
(3) 通信卫星在预先计算好的轨道和确定的位置上运行的同时,要保持其稳定的姿态,使卫星天线一直指向地球,使它的太阳能电池板一直指向太阳。
(4) 侦察卫星中摄像机的轻微抖动会对摄像的图像质量产生很大的影响,为了提高摄像的质量,必须能自动地保持伺服云台的稳定,消除震动。
1.2倒立摆的控制方法
倒立摆有多种控制方法[2]。
对倒立摆这样的一个典型被控对象进行研究,无论在理论上和方法上都具有重要意义。
不仅由于其级数增加而产生的控制难度是对人类控制能力的有力挑战,更重要的是实现其控制稳定的过程中不断发现新的控制方法,探索新的控制理论,并进而将新的控制方法应用到更广泛的受控对象中。
当前,倒立摆的控制方法可分为以下几类 :
(1) 线性理论控制
将倒立摆系统的非线性模型进行近似线性化处理,获得系统在平衡点附近的线性化模型,然后再利用各种线性系统控制器设计方法,得到期望的控制器。
PID控制、状态反馈控制、能量控制、LQR控制算法是其典型的代表。
(2) 预测控制
预测控制:
是一种优化控制方法,强调的是模型的功能而不是结构。
变结构控制:
是一种非连续控制,可将控制对象从任意位置控制到滑动曲面上仍然保持系统的稳定性和鲁棒性,但是系统存在颤抖。
预测控制、变结构控制和自适应控制在理论上有较好的控制效果,但由于控制方法复杂,成本也高,不易在快速变化的系统上实时实现。
(3) 智能控制
智能控制(IC)是一门新型的理论和技术,是传统控制的高级阶段,主要用来解决复杂系统的控制。
近几年来国内外对智能控制的理论和应用研究十分活跃。
随着智能控制技术的迅速发展,已提出了许多方法,如模糊控制、神经网络、专家系统、遗传算法等。
(4) 多种算法相结合的控制
尽管各类算法有自己的优点,但也存在不足之处。
多种算法相结合就可以取长补短,达到更好的控制效果。
比如神经网络与模糊算法相结合、模糊控制与PID算法相结合、免疫算法和遗传算法相结合等。
按偏差的比例(Proportion)、积分(Integral)、微分(Derivative)控制,简称PID控制。
PID控制是过程控制中广泛应用的一种控制。
PID控制器早在30年代末期就已出现。
PID控制器问世至今已有近70年历史,它以其结构简单、稳定性好、工作可靠、调整方便而成为工业控制的主要技术之一。
经过50多年来的不断更新换代,PID控制得到了长足的发展。
特别是近年来,随着计算机技术的飞速发展,发生了由模拟PID控制到数字PID控制的重大转变。
与此同时还涌现出了许多新型PID控制算法和控制方式。
20世纪80年代,随着神经网络在世界范围内的复苏,国内也逐步掀起了研究热潮。
2004年10月在合肥召开的“人工神经网络学术会议”已是第十四界学术年会了;2004年8月在大连召开的ISNN2004国际会议,引起了国内外神经网络研究者的广泛关注,产生了较大的影响;另外,国内外许多相关的学术会议都设有人工神经网络专题,如国内的WCICA、CIAC、CDC、CCC、CAA国外的CCA、IDEAC等,经过十几年的发展,中国学术界和工程界在人工神经网络的理论研究和应用方面取得了丰硕成果,学术论文。
应用和研究人员逐年增加。
神经网络可以任意逼近线性或非线性系统,能够实现几乎所有的常规非线性与不确定系统的控制[3]。
但是它通常由多个神经元单元和多层结构组成,结构复杂,权值训练的时间较长,不利于实时控制。
而神经网络的各个神经元本身就具备白适应、自学习以及任意函数逼近的能力,而且具有结构简单、计算量小、权值学习时问短、鲁棒性强、易于实现等优点。
[2]因此单神经元pid控制能更好的控制一级倒立摆。
1.3本文的主要任务
本论文的主要任务是研究直线型一级倒立摆的PID控制问题。
主要设计思想是通过倒立摆的摆干的位置反馈给系统,从而作出参数调整,使之达到期望的结果。
首先,通过牛顿力学的分析和微分方程的计算,初步建立一级倒立摆的数学模型,并计算出一级倒立摆的状态空间描述。
然后,在给定的目标函数下,利用LQR控制算法实现对倒立摆的稳定控制。
然后,利用单神经元PID算法和搜索最优参数的方法,实现PID控制器参数整定与优化,并完成仿真实验。
最后,比较两种控制算法的仿真结果,得出相应的结论,选择合适的算法进行控制器的设计。
第二章一级倒立摆
2.1一级倒立摆的系统组成
(1)在有限长的导轨L上作一直线运动的小车;
(2)与小车铰接在一起,并能在包含L的平面内绕O点转动的摆;
(3)驱动小车的直流力矩电机和转轮,且使小车稳定在轨道中心位置附近的控制器;
倒立摆系统主要由计算机、A\D、D\A、电机、电位计以及一些机械部件组成。
计算机作为数字控制器实现对系统的实时控制,同时也为操作者提供人机界面,完成系统的监督管理功能;A\D、D\A板在计算机内,完成数模,模数转换;放大器用于电压和功率放大。
力矩电机是系统的执行元件;单位计是系统的测量元件,它分别测量小车相对于轨道中心点的位移,摆和铅垂线的角度偏移。
系统的整套机械部件安装在一块架体上,上面固定着导轨支架、电机底座和传动装置等。
通过导轨支架安装好导轨,小车靠直线轴承与导轨配合通过拉线钢丝传递电机动力实现运动。
图2-1所示是一级倒立摆系统的原理图
图2-1一级倒立摆系统的原理图
2.2一级倒立摆的物理模型
倒立摆的物理构成可以表述为:
光滑的导轨,可以在导轨上自由移动的小车,和一个质量块的摆杆。
它们的铰接方式决定了它们在竖直平面内运动。
水平方向的驱动力F使小车根据摆角的变化而在导轨上运动,从而达到倒立摆系统的平衡[4]。
其模型如图2-2所示。
该系统的被控变量分别为:
θ1为摆杆偏离垂直方向的角度,X为小车相对参考点(导轨的最左端位置)的相对位移。
摆杆的中心坐标为(X1,Y1)。
实际上,倒立摆系统要保持竖直方向的稳定状态,前提是摆杆与竖直方向所成的角度必须在一定的范围之内。
一般情况下,要求不得小于5O[4]。
图2-2直线一级倒立摆的物理模型
2.3一级倒立摆的数学模型
利用牛顿力学方法建立直线型一级倒立摆系统的数学模型。
为简化系统,我们在建模时忽略了空气阻力和各种摩擦,并认为摆杆为刚体。
在忽略了空气阻力和各种摩擦之后, 可将直线一级倒立摆系统抽象成小车和匀质杆组成的系统,如图2-3所示。
我们不妨做以下假设:
M 小车质量
m 摆杆质量
b 小车摩擦系数
l 摆杆转动轴心到杆质心的长度
I 摆杆惯量
φ 摆杆与垂直向上方向的夹角
θ 摆杆与垂直向下方向的夹角(考虑到摆杆初始位置为竖直向下)
倒立摆系统数学模型的建立基于以下假设:
1.摆杆及小车都是刚体。
2. 皮带轮与皮带之间无相对滑动,传动皮带无伸长现象。
3. 小车的驱动力与直流放大器的输入成正比,而且无滞后,忽略交流伺服电机电枢组中的电感。
4. 实验过程中的库仑摩擦、各种动摩擦等所有摩擦力足够小,在建模过程中可忽略不计。
对摆杆进行受力分析,建立一级倒立摆系统的数学模型。
对摆杆的受力分解如图2-3所示。
图中θ1为摆杆与竖直方向的夹角。
F11'为小车对摆杆的水平分力,F12'为小车对摆杆的竖直分力。
图2-3对摆杆的受力分析
水平方向的方程为:
(2.1)
竖直方向的方程为:
(2.2)
将两个方程合并:
(2.3)
当摆杆与垂直向上方向之间的夹角相比很小时,则可以进行如下处理:
为了得到控制理论的习惯表达,即u为一般控制量,用u代表控制量的输入力F,线性化得到数学模型方程为:
(2.4)
(2.5)
将式(2.4),(2.5)进行拉普拉斯变化为:
(2.6)
(2.7)
整理后得以u为输入量,以摆杆摆角为输出量的传递函数,将上式整理得:
(2.8)
其中
控制系统的状态空间方程为:
(2.9)
方程组对
解代数方程,得如下状态空间方程:
(2.10)
(2.11)
以小车加速度作为输入的系统状态方程,设
,
。
假设如下表2-1所示:
符号
大小
单位
M
1.32
Kg
m
0.07
Kg
b
0.1
N/m/s
l
0.2
m
i
0.0009
Kgm2
表2-1
则有:
(2.12)
(2.13)
第三章LQR控制
3.1LQR控制器的二次最优控制原理
大多数线性定常被控对象,采用传统的PID控制,都可以取得良好的控制效果;但对具有分布参数特性、非线性、大滞后和时变的系统,则难以获得满意的控制效果。
线性二次调节器(LinearQuadraticRegnilator-LC}R)在现代控制理论中占有相当重要的地位,在控制领域受到一定的重视。
它的主要优点是易于分析、处理和计算,而且通过LQR控制法的倒立摆系统具有较好的鲁棒性与动态特性,同时具有能够得到现行反馈结构的优点,因此在实际的倒立摆控制系统中得到了广泛的应用。
采用LQR控制的关键是如何选取控制加权矩阵Q和R。
入股这两个矩阵选取不当,可能使求得的解不能满足实际系统的性能要求,因而会导致控制失败。
通过倒立摆LQR最优控制系统设计与研究,并反复实验选取好加权阵Q和R可以很好的实现倒立摆的稳定控制。
仿真及实验结果可以看到该力方法与极点配置状态反馈法一样都能取得良好的控制效果。
LQR控制器是应用线性二次型最优控制原理设计的控制器。
它的任务在于,当系统状态由于任何原因偏离了平衡状态时,能在不消耗过多能量的情况下,保持系统状态各分量仍接近于平衡状态[5]。
线性二次型最优控制研究的系统是线性的或可线性化的,并且性能指标是状态变量和控制变量的二次型函数的积分。
LQR是根据系统的状态方程
确定最佳控制向量矩阵K,
,使得性能指标
达到最小[6]。
再根据期望性能指标选取Q和R,利用Matlab,命令
(A,B,Q,R)就可以得到反馈矩阵K的值。
改变矩阵Q的值,可以得到不同的响应效果,Q的值越大(在一定的范围之内),系统抵抗干扰的能力越强,调整时间越短。
下面是是最优控制LQR控制原理图。
图3-1最优控制LQR控制原理图
3.2设计方案
假设
,则系统状态方程为:
,
。
四个状态量X,
,
,
.分别代表小车位移、小车速度、摆杆角度和摆杆角速度,输出
包括小车位置和摆杆角度。
设计控制器使得当给系统施加一个阶跃输入时,摆杆会摆动,然后仍然回到垂直位置,小车可以到达新的指定位置。
假定全状态反馈可以实现(4个状态量都可测),找出确定反馈控制规律的向量K,用MATLAB中的lqr函数,可以得到最优控制器对应的K。
Lqr函数允许选择两个参数R和Q,这两个参数用来平衡输入量和状态量的权重。
假定
.其中Q1.1代表小车位置权重,而Q3.3是摆杆角度的权重,输入R是1。
取Q1.1=4000,Q3.3=100由
程序
Clear:
A=[ 0 1 0 0;
0000;
0001;
0036.750];
B=[0103.75];
C=[1000;
0010;]
D=[00]’;
Q11=4000,Q33=100;
Q=[Q11000;
0000;
00Q330;
0000];
R=1;
K=lqr(A,B,Q,R);
可得K=(-63.2456-31.552094.025714.8289)。
根据图3-1以及上述内容可在Simulink作出一级倒立摆LQR控制仿真模型如下图所示:
图3-2一级倒立摆LQR控制仿真模型
、
第四章单神经元PID控制
4.1PID控制的基本原理
在模拟控制系统中,控制器中最常用的规律就是PID控制[7]。
模拟PID控制系统原理框图如下图4-1所示。
系统由模拟PID控制器和被控对象组成。
PID控制是将偏差的比例,积分和微分通过线性组合构成控制量。
对被控对象进行控制。
PID系统原理图如下:
图4-1模拟PID系统原理框图
整个系统主要由PID控制器和被控对象组成。
作为一种线性控制器,PID控制器根据给定值SV和实际输出值PV构成偏差,即
,然后按差的比例,积分和微分通过线性组合构成控制量[8]。
对被控对象进行控制。
由上图可知PID控制器理想算法为:
(4.1)
其中,Kp,Ti,Td为别为PID控制器的比例增益、积分时间常数和微分时间常数。
PID各个校正环节的作用如下:
1.比例环节即时成比例地反映控制系统的偏差信号e(t),偏差一旦产生,控制器立即产生控制作用,以减少偏差。
偏差一旦生成,控制器立刻产生控制作用。
以减少偏差。
2.积分环节 主要用于消除静差,提高系统的无差度。
即积分环节可以消除系统的稳态误差,提高系统的控制精度。
积分作用的强弱取决于积分时间常数Ti,Ti越大,积分作用越弱,反之则越强。
3.微分环节 能反映偏差信号的变化趋势(变化速率),并能在偏差信号值变得太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减小调节时间。
4.2单神经元结构
(1)神经元模型
在本文中研究的单神经元PID控制器中的单神经元模型如下图4-2所示。
单神经元的输出为:
其中xi,wi,分别对应神经元第i个输入、第i个输入所对应的连接权值,K为神经元的增益(比例系数),它对系统的快速跟踪和抗干扰能力有较大的影响[9]。
写为向量形式为:
。
其中X、W分别为输入向量、输入向量的连接权值向量。
(4.2)
(4.3)
经元控制器的输出:
(4.4)
(2)神经元的学习理论
①连接权的可塑性。
神经元的记忆、学习都是以神经网络结构的变化为基础的,神经网络结构的变化又是靠连接权的变化来实现的,这就是说,连接权有可塑性。
②Hebb假设。
关于神经元连接权的变化,心理学家赫布(D.o.Hebb)的假设是著名的,这个假设的内容是:
只有当神经元兴奋时,神经元的连接权值才被强化而增大。
③学习环境的信息构造。
神经元学习的好与坏,学习完成之后具有什么能力,与其所处的学习环境有关。
学习环境包括学习内容、教师的指导内容、学习内容出现的频度。
对于学习的神经元,学习环境相应地应包括:
输入信号向量、教师信号、输入信号向量重复出现的程度。
神经元学习规则
学习规则是修正神经元之间的连接强度或加权系数的算法,使获得的知识结构适应周围环境的变化,学习过程由学习期和