二阶倒立摆实验报告Word格式.docx
《二阶倒立摆实验报告Word格式.docx》由会员分享,可在线阅读,更多相关《二阶倒立摆实验报告Word格式.docx(17页珍藏版)》请在冰豆网上搜索。
同时系统具备抗噪声和干扰性,控制输入合理步骤:
1阶倒立摆->
2阶倒立摆。
一阶倒立摆建模
小车由电机通过同步带驱动在滑杆上来回运动,保持摆杆平衡。
电机编码器和角编码器向运动卡反馈小车和摆杆位置(线位移和角位移)。
小车在轨道上可以自由滑动。
单级倒立摆系统数学模型
N和P分别为小车与摆杆相互作用力的水平和垂直方向的分量。
分析小车水平方向所受的合力,可得到方程为:
由摆杆水平方向的受力进行分析可以得到下面等式:
把这个等式代入式中,得到系统的第一个运动方程:
为了推出系统的第二个运动方程,对摆杆垂直方向的合力进行分析,得到下面的方程:
力矩平衡方程如下:
方程中力矩的方向,,故等式前面有负号。
合并这两个方程,约去P和N,得到第二个运动方程:
假设与1(单位是弧度)相比很小,即,则可进行近似处理:
用代表被控对象的输入力,线性化后两个运动方程如下:
对方程(7)进行拉普拉斯变换,得到:
推导时假设初始条件为0则摆杆角度和小车位移的传递函数为:
摆杆角度和小车加速度之间的传递函数为:
摆杆角度和小车所受外界作用力的传递函数:
以外界作用力作为输入的系统状态空间表达式为:
以小车加速度作为输入的系统系统状态空间表达式:
2系统的可控性、可观测性分析
对于连续时间系统:
系统状态完全可控的条件为:
当且仅当向量组是线性无关的,或n×
n维矩阵的秩为n。
系统的输出可控条件为:
当且仅当矩阵
的秩等于输出向量y的维数。
应用以上原理对输入为加速度输出为摆杆与竖直方向的角度的夹角时的系统进行可控性分析即可。
二阶倒立摆建模
在忽略了空气流动,各种摩擦之后,可将倒立摆系统抽象成小车、匀质杆的系统,如图所示。
图1直线两级倒立摆物理模型
下面利用拉格朗日方程推导运动学方程。
拉格朗日方程为:
同样可以求出
因此,可以得到系统的总动能为:
系统的总势能为:
从而拉格朗日算子:
由于因为在广义坐标上均无外力作用,有以下等式成立:
对求解代数方程,得到以下两式
表示成以下形式:
取平衡位置时各变量的初值为零,
将(23)式在平衡位置进行泰勒级数展开,并线性化,令:
带入式,得到线性化之后的公式
将式在平衡位置进行泰勒级数展开,并线性化,令
带入(22)式,得到
即:
现在得到了两个线性微分方程,由于我们采用加速度作为输入,因此还需加上一个方程
取状态变量如下:
由(33),(41),(42)式得到状态空间方程如下:
其中直线两级倒立摆系统参数为:
小车质量 2.32kg
=0.3kg;
=0.2kg;
为摆杆1与垂直向上方向的夹角为摆杆2与垂直向上方向的夹角;
=1m;
=0.5m;
为作用在系统上的外力
由以上方程,将以下参数代入即可。
神经网络建模
本文采用的神经网络采用4-5-3结构的三层前馈网。
输入变量为
(0-1)
网络隐含层的局部诱导域和输出分别为
(0-2)
其中,w为隐含神经元的突触权值,w0表示神经元的偏置,Q为隐含神经元的节点数,隐含神经元的激活函数取双曲正切函数
(0-3)
网络输出层的诱导局部域和输出分别为
(0-4)
(0-5)
(0-6)
考虑到输出参数不能为负值,所以激活函数采用非负函数
(0-7)
控制率为
(0-8)
采用BP学习算法,对网络的突触权值进行迭代修正,并附加一个使搜索快速收敛的全局极小的动量项。
定义系统的代价函数为。
(0-9)
(0-10)
其中,yita是学习率,alpha是动量因子,根据微分链式规则,局部梯度可计算如下
(0-11)
由于输出对控制量的偏导未知,所以用符号函数近似表示,由此带来的计算不精确的影响尽量由调整学习率来补偿。
由控制方程不难得到
(0-12)
(0-13)
将所有公式整合,不难得到神经元k的局部梯度为
(0-14)
由此可得,网络输出层神经元的突触权值调整的修正公式为
(0-15)
同理,可得隐含层神经元的突触权值学习算法。
(0-16)
其中,神经元j的局域梯度为
(0-17)
至此,本文采用的神经网络原理已介绍完成,考虑到本次仿真过程采用的变时间步长仿真方式类似于连续仿真,故在上文公式中将神经网络中所有离散部分连续化。
现将网络工作过程归纳如下。
①初始化确定网络结构,确定输入层节点数M和隐含层节点数Q,并给出各层突触权值的初值,选择学习率和动量因子;
②采样得到xin和yout,并计算此时误差e;
③计算神经网络各层神经元的输入和输出,输出即为PID的三个可调参数Kp、Ki、Kd;
④计算控制器的输出u;
⑤进行神经网络的学习,在线调整突触权值矩阵,实现PID参数的自适应调整;
⑥进行下一步迭代运算直至仿真完成。
仿真结果
PID仿真曲线与神经网络PID实验仿真曲线为:
从仿真曲线来看两种控制方式都达到了预期目标。
两实验的仿真曲线都约在60s左右达到平衡位置,而后期结果来看,第一个仿真在120S左右不如第二个仿真结果。
16