基于LQR的一阶倒立摆最优控制系统研究.docx

资源描述

基于LQR的一阶倒立摆最优控制系统研究.docx

《基于LQR的一阶倒立摆最优控制系统研究.docx》由会员分享，可在线阅读，更多相关《基于LQR的一阶倒立摆最优控制系统研究.docx（9页珍藏版）》请在冰点文库上搜索。

基于LQR的一阶倒立摆最优控制系统研究.docx

基于LQR的一阶倒立摆最优控制系统研究

“最优控制”大作业

【摘要】介绍了最优控制基本概念和原理，分析了最优控制国内外现状。

针对线性二次型最优控制问题，以一阶倒立摆为对象，详细设计了LQR最优控制器。

仿真表明，该控制器具有方法简单、便于实现的优点，在响应速度和控制效果方面优于传统的PID控制。

【关键词】最优控制;倒立摆;LQR;PID控制

1最优控制基本概念与原理

1.1最优控制简介

最优控制理论是现代控制理论的核心。

近50年来，科学技术的迅速发展，对许多被控对象，如宇宙飞船、导弹、卫星和现代工业设备的生产过程等的性能提出了更高的要求，在许多情况下要求系统的某种性能指标为最优[1]。

这就要求人们对控制问题都必须从最优控制的角度去进行研究分析和设计。

最优控制问题就其本质来说，乃是一变分问题，而经典变分理论只能解决一类简单的最优控制问题。

为了满足工程实践的需要，20世纪50年代中期，出现了现代变分理论，其中最常用的方法是极大值原理和动态规划，这两种方法成为了目前最优控制理论的两个柱石[1,2]。

最优控制在被控对象参数已知的情况下，已经成为设计复杂系统的有效方法之一。

1.2最优控制问题求解方法

最优控制可分为静态最优和动态最优两类[3]。

（1）静态最优是指在稳定工况下实现最优，它反映系统达到稳定后的静态关系。

系统中各变量不随时间变化，而只表示对象在稳定工况下各参数之间的关系，其特性用代数方程来描述。

大多数的生产过程受控对象可以用静态最优控制来处理，并且具有足够的精度。

静态最优控制一般可用一个目标函数J=f（x）和若干个等式约束条件或不等式约束条件来描述，要求在满足约束条件下使目标函数J为最大或最小。

静态最优问题的目标函数是一个多元普通函数，求解静态最优控制问题经常采用经典微分法、线性规划、分割法（优选法）和插值法等。

（2）动态最优是指系统从一个工况变化到另一个工况的变化过程中，应满足最优要求。

在动态系统中，所有的参数都是时间的函数，其特性可用微分方程或差分方程来描述。

动态最优控制要求寻找出控制作用的一个或一组函数而不是一个或一组数值，使性能指标在满足约束条件下为最优值。

这样，目标函数不再是一般函数，而是函数的函数。

因此在数学上这是属于泛函求极值的问题。

根据以上最优控制问题的基本组成部分，动态最优控制问题的数学描述为：

在一定的约束条件下，受控系统的状态方程

xt=f[xt,ut,t]

（1）

和使目标函数

Ju·=Φxtf,tf+t0tfL[xt,ut,y]dt

（2）

为最小的最优控制向量u*（t）。

动态最优问题的目标函数是一个泛函，当控制无约束时，采用经典微分法或经典变分法；当控制有约束时，采用极大值原理或动态规划；如果系统是线性的，性能指标是二次型形式的，则可采用线性二次型最优控制问题求解。

1.3最优控制线性二次型理论

对于线性系统，若取状态变量和控制变量的二次型函数的积分作为性能指标函数，则这种动态系统最优问题成为线性系统二次型性能指标的最优控制问题，简称线性二次型最优控制问题[4]。

由于线性二次型问题的最优解可以写成统一的解析表达式和实现求解过程的规范化，且可导致一个简单的线性状态反馈控制率，易于构成闭环最优反馈控制，便于工程实现，因而在实际工程问题中得到了广泛的应用。

设给定线性定常系统的状态方程为

（3）

二次型性能指标函数：

（4）

式中，为n维状态向量，U为r维输入向量（控制向量），为m维输出向量，A，B，C，D分别是,,,维常数矩阵。

加权阵Q和R是用来平衡状态向量和输入向量的权重。

如果系统受到外界干扰而偏离零状态，应施加怎样的控制U，才能使系统回到零状态附近同时满足J达到最小，那么这时的U就称之为最优控制。

由最优控制理论可知，使式（5）取得最小值的最优控制律为：

（5）

式中是Riccati（黎卡提）方程的解，是线性最优反馈增益矩阵。

这时只需求解代数Riccati方程:

（6）

就可获得值以及最优反馈增益矩阵值。

（7）

2最优控制国内外现状

2.1最优控制研究现状

在当前的控制系统领域中，有几种最优控制方法应用的比较广泛，下面就将这些最优控制的方法和研究现状做一个简单的介绍。

（1）神经网络优化

神经网络优化方法的研究适用于判断网络的稳定性，主要是起源于Hopfield引入Lyapuov能量函数来判断的。

根据神经网络的理论，对应于系统稳定平衡点的是神经网络能量函数的极小点，这样我们就可以根据求系统的平衡点来求解能量函数的极小点。

要最终达到系统的平衡点也就是函数的极小值，就需要随着时间的变化，函数的运动轨迹是朝着能量函数减小的地方偏。

我们可以考虑将能量函数的较小点看成是网络动力系统的稳定吸引子，这样就可以使系统达到所期望的极小。

神经网络优化算法的基本原理就是将全局优化的理论用到控制系统中，并将木变函数达到我们所期望的值，也就是最小点[5]。

（2）鲁棒控制

鲁棒控制的理论主要是研究不确定性系统，通过对不确定性系统的控制系统的设计方案来描述系统。

在鲁棒控制理论的应用领域内，还可以对鲁棒控制系统的分析和设计方法等领域进行研究。

鲁棒控制理论发展的最突出的标志之一是H∞控制。

H∞控制从本质上可以说是频域内的最优控制理论。

鲁棒控制与最优控制结合解决许多如线性二次型控制、电机调速、跟踪控制、采样控制、离散系统的镇定、扰动抑制等实际问题[6]。

（3）预测控制

预测控制的本质特征是预测模型，反馈校正和滚动优化，又称为基于模型的控制。

预测控制是一类新的优化控制算法[7]。

（4）混沌优化控制

混沌优化控制的本质特征是其运动的路线是不稳定的，并且对扰动等外界干扰因素非常的敏感。

混沌运动是指不需要添加其他任意的一些随机因素，确定性非线性系统就可出现所期望的随机行为。

这种优化控制可以有效地避免系统陷入局部最小，因此混沌优化控制技术越来越受欢迎[8]。

2.2最优控制发展趋势

2.2.1在线优化方法

基于对象数学模型的离线优化方法,是一种理想化方法。

这是因为尽管工业过程（对象）被设计得按一定的正常工况连续运行，但是环境的变动、触媒和设备的老化以及原料成分的变动等因素形成了对工业过程的扰动，因此原来设计的工况条件就不是最优的。

解决此类问题的常见方法有

（1）局部参数最优化和整体最优化设计方法

局部参数最优化方法的基本思想是：

按照参考模型和被控过程输出之差来调整控制器可调参数，使输出误差平方的积分达到最小。

这样可使被控过程和参考模型尽快地精确一致[9]。

（2）预测控制中的滚动优化算法

预测控制，又称基于模型的控制（Model-basedControl），是70年代后期兴起的一种新型优化控制算法[5]。

但它与通常的离散最优控制算法不同，不是采用一个不变的全局优化目标，而是采用滚动式的有限时域优化策略。

这意味着优化过程不是一次离线进行，而是反复在线进行的。

可把大系统控制中分层决策的思想和人工智能方法引入预测控制，形成多层智能预测控制的模式。

这种多层智能预测控制方法的，将克服单一模型的预测控制算法的不足，是当前研究的重要方向之一[10]。

（3）稳态递阶控制

对复杂的大工业过程（对象）的控制常采用集散控制模式。

这时计算机在线稳态优化常采用递阶控制结构。

这种结构既有控制层又有优化层，而优化层是一个两级结构，由局部决策单元级和协调器组成。

由于工业过程较精确的数学模型不易求得，而且工业过程（对象）往往呈非线性及慢时变性，因此波兰学者Findesien提出：

优化算法中采用模型求得的解是开环优化解。

在大工业过程在线稳态控制的设计阶段，开环解可以用来决定最优工作点[11]。

2.2.2智能优化方法

对于越来越多的复杂控制对象，一方面，人们所要求的控制性能不再单纯的局限于一两个指标；另一方面，上述各种优化方法，都是基于优化问题具有精确的数学模型基础之上的。

但是许多实际工程问题是很难或不可能得到其精确的数学模型的。

这就限制了上述经典优化方法的实际应用。

随着模糊理论、神经网络等智能技术和计算机技术的发展。

（1）遗传算法[12]

遗传算法和遗传规划是一种新兴的搜索寻优技术。

它仿效生物的进化和遗传，根据“优胜劣汰”原则，使所要求解决的问题从初始解逐步地逼近最优解。

在许多情况下，遗传算法明显优于传统的优化方法。

研究表明，遗传算法是一种具有很大潜力的结构优化方法。

它用于解决非线性结构优化、动力结构优化、形状优化、拓扑优化等复杂优化问题，具有较大的优势。

（2）模糊优化方法[13]

最优化问题一直是模糊理论应用最为广泛的领域之一。

自从Bellman和Zadeh在20世纪70年代初期对这一研究作出开创性工作以来，其主要研究集中在一般意义下的理论研究、模糊线性规划、多目标模糊规划、以及模糊规划理论在随机规划及许多实际问题中的应用。

主要的研究方法是利用模糊集的a截集或确定模糊集的隶属函数将模糊规划问题转化为经典的规划问题来解决。

3最优控制应用举例

3.1一阶倒立摆系统

倒立摆小车系统如图1所示。

在忽略了空气流动，各种摩擦之后，一阶倒立摆系统可抽象成小车和匀质杆组成的系统。

倒立摆系统最终的控制目标是使这样一个不稳定的被控对象，通过引入适当的控制方法使之成为一个稳定的系统[9]。

假设:

为小车质量；为摆杆质量；为摆杆转动轴心到杆质心的长度；为摆杆的转动惯量；为加在小车上的力；为小车位置；为摆杆与垂直方向的夹角。

假定各项参数为M=1kg,m=0.1kg,l=1m,g=9.81m/s2。

图1倒立摆系统受力分析图

3.2系统的数学模型

运用牛顿动力学方法分别建立摆杆围绕其质心的转动运动方程、摆杆质心的水平运动方程、摆杆质心的垂直运动方程和小车的运动方程为：

Ms+N=F

N=ms+mlθcosθ-mlθ2sinθ

P-mg=-mlθsinθ-mlθ2cosθ

（8）

Plsinθ-Nlcosθ=Iθ

整理后的方程组为:

M+ms+mlθcosθ-mlθ2sinθ=F

I+mlθ+mlscosθ-mglsinθ=0

（9）

考虑到摆杆在设定点附近做微小的振动，对上式进行局部线性化，即用做近似处理后，可得

（10）

（M+m）s+mlθ=F

（I+ml2）θ-mglθ+mls=0

（11）

从而，推得传递函数为：

θ（s）F（s）=mlqs2s4+43bml2qs3-（M+m）mglqs2-bmglqs

其中，q=M+mI+ml2-（ml）2。

（12）

代入假定的参数有：

θ（s）F（s）=4.5455s2s4+0.1818s3-31.3118s2-4.4545s

（13）

因为I=13ml2，整理后，得倒立摆系统的运动方程为：

θ=3g（M+m）l（4M+m）θ+-3l（4M+m）F

s=-3mg4M+mθ+44M+mF

（14）

假设单级倒立摆的输入为作用于小车上的外力F，输出为小车位置s和摆杆与垂直方向的夹角θ。

现选择四个状态变量，分别为小车位移s,小车速度s、摆杆与垂直方向的夹角θ、摆杆角速度θ，建立系统的状态方程如下：

ssθθ=0100003gM+ml4M+m00001003gM+ml4M+m0ssθθ+044M+m0-3l（4M+m）u

sθ=10000010ssθθ

将倒立摆的各参数代入（12）式，可得系统状态方程的四个系数矩阵

A=010000-0.717800001007.89590，B=00.97560-0.7317，C=10000010，D=00

3.3基于LQR的仿真分析

针对倒立摆系统的状态方程，通过确定最优控制量U*=-KX的矩阵K，使闭环系统渐进稳定，同时使线性二次最优控制指标（4）式达到最小。

针对倒立摆系统的平衡问题，可引入全状态反馈，如图2所示。

E是施加在小车的阶跃输入。

当给系统施加阶跃输入时，找出满足系统性能要求的反馈增益矩阵K，使在其作用下将系统由初始状态驱动到零平衡状态。

y（t）（）

x（t）=Ax（t）+Bu（t）

y（t）=Cx（t）+Du（t）

u（t）

x（t）

图2状态反馈框图

目前确定加权知阵Q和R的普遍方法是仿真试凑法[14]。

经过反复选取Q和R后，决定取Q=1000005000，R=1。

利用Matlab来求取系统的反馈矩阵K。

仿真程序如下：

M=1;l=1;m=0.1;g=9.81;

A=[0100;00-3*m*g/（4*M+m）0;0001;00-3*（M+m）*g/（4*M+m）0];

B=[0;4/（4*M+m）;0;-3/l*（4*M+m）];C=[1000;0010];D=[0;0];

Uc=ctrb（A,B）;Vo=obsv（A,C）;

controllabilit=rank（Uc）;observability=rank（Vo）;

w11=10000;w33=500;Q=[w11000;0000;00w330;0000];R=1;

[K,P,r]=lqr（A,B,Q,R）

Ac=[（A-B*K）];Bc=[B];Cc=[C];Dc=[D];

T=0:

0.001:

10;

E=0.8*ones（size（T））;

figure

（1）;[Y,X]=lsim（Ac,Bc,Cc,Dc,E,T）;plot（T,Y）

legend（'小车位置','摇摆角度','Location','SouthEast'）;

xlabel（'Time（sec）'）;ylabel（'Response'）;

grid;

运行结果：

100.000056.6829-20.95052.3289

5.66831.60650.23290.1193

1.60651.08390.01270.0814

0.23290.01270.05910.0027

0.11930.08140.00270.0063

-11.9540+12.2026i

-11.9540-12.2026i

-1.3736+1.9439i

-1.3736-1.9439i

仿真后的结果如图3所示：

图3 LQR控制的响应曲线

由图3可以看出，采用LQR方法对倒立摆进行最优控制，调节时间ts=4s，小车的超调量与摆角的超调量都很小，系统的稳定性和快速性都很理想，该方案设计简单，实现起来比较容易。

系统拥有很好的抗扰能力，受到扰动后可以很快的恢复稳定。

3.4基于PID的仿真分析

3.4.1PID控制简介

常规PID控制是最早发展起来的一种控制方法，由于其算法简单、鲁棒性好、可靠性高，因而至今仍广泛应用于工业过程控制中。

该方法的主要思想是:

根据给定值与系统的实际输出值构成控制偏差。

然后将偏差的比例（P）、积分（I）和微分（D）三项通过线性组合构成控制量，对被控对象进行控制，故称为PID控制[15]。

3.4.2PID控制器设计与仿真

我们已经得到了倒立摆系统的开环传递函数：

（15）

θ（s）F（s）=4.5455s2s4+0.1818s3-31.3118s2-4.4545s

当给系统施加脉冲扰动,输出量为摆杆的角度时,系统框图如图4所示:

图4系统模拟仿真图

给系统加入一个阶跃扰动，通过示波器显示可得到系统的输出波形如图5所示：

图5加入阶跃扰动时输出的波形图6LQR、PID控制输出波形对比

由图5可知，系统的调节时间ts=7s，可知PID控制方法虽然可以使系统达到稳定状态，但是调节时间过长。

将两种方法得到的控制结果进行对比，如图6所示。

3.5最优控制与PID控制的对比

（1）PID控制器控制结构简单，但效果稍差。

究其原因，主要因为常规PID控制器实质上是一种线性控制器，只适用于单输入单输出的系统。

因此对于像倒立摆这样的非线性、不稳定系统，这种方法在控制效果上显得明显不足。

同时，由于PID控制器的三个参数较难选取，且较多依靠经验，而且，即使选择好一组参数能够控制住倒立摆，但当系统性能发生变化或者遇到很大干扰后，预先整定好的参数又显得无能为力。

（2）最优控制方法响应速度较快，控制效果较好，能够使系统的状态最终稳定并且达到最优。

而它的不足在于其控制器的反馈控制矩阵在开始前已经确定，控制中无法进行调整，不具备自适应能力。

4结束语

本文研究了倒立摆系统的两种控制策略，即:

LQR控制方法和PID控制方法，并分别设计了相应的控制器，以Matlab/Simulink为基础，做了相应的仿真研究。

最后，发现经过最优控制方法校正后的系统性能优于经典控制方法校正后的系统性能。

参考文献

[1]王青,陈宇.最优控制:

理论、方法与应用[J].高等教育出版社,2011.5:

10-15.

[2]陈宝林．最优化理论与算法[M]．北京：

清华大学出版社,2005:

30-35.

[3]刘豹.现代控制理论[M].北京:

机械工业出版社,2001：

20-22.

[4]强明辉,周鹏.利用遗传算法优化线性二次型调节器（LQR）[J].甘肃工业大学学报,1998,24（4）:

51-55.

[5]胖永新.球杆系统的建模、仿真与控制器设计[J].武汉大学学报:

工学版,2005，24（6）：

142-146.

[6]梅生伟,申铁龙,刘康志.现代鲁棒控制理论与应用[M].北京:

清华大学出版社,2003:

60-70

[7]黄忠霖.控制系统MATLAB计算及仿真[M].北京:

国防工业出版社,2001：

62-75.

[8]曾进，任庆生.基于改进遗传算法的时间最优控制问题求解.控制与决策.2002,17

（1）：

41-44.

[9]从爽,张东军.单级倒立摆三种控制方法的对比研究[J].系统工程与电子技术,2001,23

（1）:

47-49.

[10]刘金琨.先进PID控制及其MATLAB仿真[M].北京:

电子工业出版社,2003,15-25.

[11]Pontryaginetal.TheMathematicalTheoryofOptimalProcesses[J].IntersciencePublishers,NewYork,2012.100-120.

[12]WeiQF,DayawansaWP,LevineWS.NonlinearControllerforanInvertedPendulumHavingRestrictedTravel[J].Auto-matica,2012,31（6）:

841-850.

[13]ZhangLingbo,MaoJianqin．AnapproachforselectingtheweightingmatricesofLQoptimalcontrollerdesignbasedongeneticalgorithms[G]．ProceedingsofIEEETENCON’02，2002（3）:

1331-1334．

[14]Furuta,Hara,Mori.Aclassofsystemswiththesameobserver.IEEETrans.Auto.Contr,1976（8）,572-576.

[15]Gralimidi,A.R.andBarmish,B.R.TheconstrainedLyapunovproblemanditsaplicationtorobustoutputfeedbackstabilization.IEEETrans.Auto.Contr.1986，31（5）：

410-419.

展开阅读全文