monografía de control no lineal · key words: control no lineal, mpc, linealización exacta, uavs,...

UNIVERSIDAD DE LA REPÚBLICA

FACULTAD DE INGENIERÍA

Monografía de Control no Lineal

DOCUMENTACIÓN FINALTRACKING DEL MODELO REDUCIDO DE UN AVION EN SITUACIÓN DE

VUELO - DISTINTAS ESTRATEGIAS DE CONTROL

Tutor: Doc. Ing. Pablo Monzón

Integrantes del grupo

Rodrigo AlonsoGuzmán Hernández

Montevideo - UruguayMarzo 2009

Índice general

Índice general 1

1. Introducción 21.1. Introducción a la monografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2. Descripción del modelo reducido 32.1. Explicación del modelado realizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.2. Fuerzas involucradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.3. Modelo en variables de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3. Control lineal y gain scheduling 83.1. Trayectorias estacionarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.2. Respuesta del sistema sin controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.2.1. Prueba 1 sin controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.2.2. Prueba 2 sin controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.3. Control Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.4. Gain scheduling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.5. Simulaciones realizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.5.1. Simulaciones para el controlador lineal - pplace . . . . . . . . . . . . . . . . . . . . . 153.5.2. Simulaciones para el controlador lineal - LQR . . . . . . . . . . . . . . . . . . . . . . 19

4. Técnicas de control MPC 234.1. Control MPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.2. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

5. Linealización exacta 275.1. Control utilizando linealización exacta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275.2. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

6. Conclusión final 356.1. Control Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356.2. MPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356.3. Linealización exacta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356.4. Trabajo a futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

A. Acrónimos utilizados 37

Índice de figuras 38

Bibliografía 39

1

Capítulo 1

Introducción

ABSTRACTEn el presente trabajo proponemos el estudio de distintas técnicas de control de un sistema no lineal.

El modelo a controlar representa el vuelo de un avión restringido a un plano vertical en situación de simetría.Evaluamos la aplicación de estas estrategias de control mediante simulaciones y realizamos comparacionescon respecto a su rendimiento.

Key Words: Control no lineal, MPC, Linealización exacta, UAVs, Gain Schedulling, Tracking.

1.1. Introducción a la monografíaEl objetivo de este trabajo consiste en estudiar la aplicación de distintas técnicas de control para

lograr el seguimiento de trayectorias predeterminadas por parte de un avión en situación de vuelo, bajo lasimplificación de que el vuelo se encuentre restringido a un plano vertical. A su vez, este trabajo se enmarca ennuestro proyecto de fin de carrera que consiste en diseñar un control automático para lograr el vuelo autoguiadode un avión de aeromodelismo. Debido a la complejidad del modelo matemático que describe a este sistema,hemos decidido restringir nuestro estudio al caso en que el vuelo se desarrolla de manera simétrica en un planovertical, simplificando así el problema, logrando reducir a tres el número de grados de libertad del sistemafísico y, por lo tanto, a seis el número de variables de estado.

El problema de seguimiento al cual nos enfrentamos, planteado de manera genérica, resulta bastantecomplejo de resolver. Nos proponemos entonces una nueva simplificación del problema, en la cual planteamoslograr el seguimiento de trayectorias más sencillas; aquellas en las que el vuelo sucede en línea recta y avelocidad constante.

Comenzamos esta monografía con una descripción del modelo matemático bastante genérico de unavión en situación de vuelo, nuestro sistema a controlar. Formulamos este modelo en función de un conjuntode parámetros que dependen del avión particular bajo consideración, por lo que eventualmente podríamosestudiar el comportamiento físico de una gama de aviones razonablemente grande de la misma forma. Nuestraintención es que ninguno de los algoritmos de control implementados dependa del valor numérico específicode ninguno de estos parámetros de manera tal de posibilitar su futura implementación en cualquier sistemafísico cuyo comportamiento real sea razonablemnete bien aproximado por nuestro modelo matemático.

Luego de introducir nuestro modelo en variables de estado, elaboramos distintas técnicas de controly evaluamos mediante simulaciones su aplicación a nuestro sistema. Dentro de las estrategias de controlconsideradas se encuentran el control lineal alrededor de la linealización jacobiana del sistema, el controlmediante modelo de predicción y el control a partir de la linealización exacta.

Concluimos este trabajo resumiendo los resultados obtenidos y realizando una comparación entre losdesempeños de los distintos sistemas de control implementados. Además de esto, evaluamos la posibilidad deaplicar las estrategias de control aquí estudiadas al sistema completo.

2

Capítulo 2

Descripción del modelo reducido

El objetivo de este capítulo es presentar el modelo reducido de un avión en situación de vuelo, el cualrepresenta la base del trabajo que se presenta en este documento. El MVE que se obtiene luego de la fase demodelado para el sistema reducido es el de un sistema de tres grados de libertad y para el que utilizaremos seisvariables de estado. Además, en este capítulo describiremos los conceptos básicos respecto al vocabulario quese utilizará en las siguientes secciones.

2.1. Explicación del modelado realizadoAl referirnos al modelo reducido, queremos representar la situación bidimensional del avión cuyo

vuelo está contenido - o si se quiere, está restringido - en el plano (x, z). Tampoco consideramos en estemodelo las rotaciones respecto a cualquier recta contenida en dicho plano (x, z), con lo cual la única rotaciónque nos interesa tener en cuenta es la rotación respecto a una recta perpendicular al mencionado plano, elángulo de dicha rotación lo llamaremos θ de modo de ser consistentes con la bibliografía existente sobre eltema a.

Otro aspecto que debemos tratar en este punto es el que concierne a los sistemas de referencias quevamos a utilizar en esta descripción, o dicho de otra forma, las bases en que expresaremos las magnitudes.Como primer sistema de referencia se escogió el sistema (iI , kI), un sistema de referencia inercial fijo al quellamaremos Sistema Inercial (SI) y las magnitudes medidas en la base de ese referencial se notarán con elsubíndice I. El otro sistema de referencia que se utilizará es el sistema (iB, kB) al que llamaremos SistemaBody (SB), en este caso las magnitudes medidas en ese referencial se notarán con el subíndice B. Dado que,por ejemplo, el momento de inercia del avión es constante en el SB o que el SI es poco coveniente paraexpresar las fuerzas aerodinámicas que actuan sobre las superficies de vuelo, es de particular interés expresarlas maginitudes físicas y las distintas ecuaciones en la base del SB. A continuación en la figura 2.1 se puedeobservar un pequeño esquema de las coordenadas utilizadas y los sistemas de referencia involucrados.

El MVE con el que se trabajará es de la forma ~x = ~f(~x, ~u(t)); donde ~x es el vector de estados delsistema que como ya se mencionó anteriormente consta de seis variables de estado, ~u(t) el vector de entradasal sistemas y t el tiempo.

Como vimos en párrafos anteriores es de interes expresar las magnitudes en el SB, en particularobtener expresiones que relacionen la velocidad lineal ( ~vB) y la velocidad angular ( ~wB) con las coordenadas(x, y, θ) que se mostraron en la figura 2.1. Otra razón que hace importante obtener dicha expresión es quelas magnitudes que efectivamente podemos medir con los instrumentos de medida a bordo del avión son ~vBy ~wB, cuando lo que realmente nos interesa controlar son las variables (x, y, θ). Estas relaciones se extraenbásicamente de las relaciones existentes entre las bases del SB y el SI. Ambas velocidades lineales se expresanen las distintas bases como:

~vI = xiI + zkI (2.1)

~vB = vBxiB + vBzkB (2.2)aA la rotación de ángulo θ en el ambiente que concierne a la aeronáutica es llamada "pitch".

3

Figura 2.1: Ilustrativa de los distintos sistemas de referencia a utilizar y las coordenadas (x, y, θ)

Dado que se trata de la misma velocidad sólo que expresadas en distintas bases, podemos obtener lasiguiente relación matricial que formará parte de nuestro MVE:

(xz

)=

(cos θ sin θ− sin θ cos θ

)(vBxvBz

)(2.3)

Para las velocidades angulares la relación es bastante más simple pues sólo aceptamos rotacionesrespecto a un eje perpendicular al plano (x, z), es decir, según el eje jI que como se desprende facilmentede observar la figura 2.1 coincide con el eje jB en nuestro modelado. Como sabemos que ~wI = θjI y que~wB = wBy jB, entonces podemos obtener la siguiente relación que también formará parte de nuestro MVE:

θ = wBy (2.4)

Para completar este modelo debemos realizar un análisis sobre la dinámica del sistema físico. Lasecuaciones que se deducieron hasta el momento no nos dicen mucho sobre la dinámica del sistema, sino quesólo nos aportan relaciones cinemáticas entre distintas magnitudes físicas involucradas en el modelo. A efectosde modelar esta dinámica las herramientas utilizadas fueron las cardinales. En las siguientes ecuaciones se haráuso de la regla de derivación que se muestra en la ecuación 2.5, notar que recién aquí se hace explícito queel sistema SB rota con el avión. Esta ecuación vincula las derivadas temporales vistas desde los dos distintosreferenciales con la velocidad angular con la que se mueve uno respecto al otro, una cosa importante a hacernotar es que esta ecuación es completamente independiente de la base en que se exprese ~u .(

d~u

dt

)I

=

(d~u

dt

)B

+ ~wB × ~u (2.5)

Una vez obtenidas estas ecuaciones, que son las referidas al modelado de la dinámica del sistema,estamos en condiciones de afirmar que tenemos modelado el sistema. El conjunto de ecuaciones que aparecenrecuadradas en esta sección son las ecuaciones que utilizamos como MVE.

4

. 1o cardinal y 2o cardinal:

~FExtNeta =

d(m~vI)

dt= bm~vI = m[ ~vB + ~wB × ~vB] (2.6)

~TExtNeto =d( ~LG)

dt=d(IGB ~wB)

dt= bIGB ~wB + ~wB × IGB ~wB (2.7)

Para el modelo reducido que estamos explicando en esta sección, estas últimas expresiones se reducena las siguientes ecuaciones:

(˙vBx˙vBz

)= 1

m

[~FNeta −m

(wByvBz−wByvBx

)](2.8)

˙wBy =~TNetoIyy

(2.9)

2.2. Fuerzas involucradas

Las fuerzas involucradas en este modelo son el propio peso del avión, las fuerzas aerodinámicas ( ~Fa)que actuan sobre las superficies de vuelo y la fuerza que ejerce el motor ( ~Fp). Estas fuerzas son las que aportana los términos ( ~FNeta) y ( ~TNeto) que apareceren en las ecuaciones 2.8 y 2.9 y que dependen de las distintasvariables de estado y las entradas de la siguiente manera.

~FExtNeta = ~Fa(vBx, vBz, wBy, ~u(t)) + ~Fp(vBx, vBz, ~u(t)) +m~g (2.10)

~TExtNeto = ~Ta(vBx, vBz, wBy, ~u(t)) + ~Tp(vBx, vBz, ~u(t)) (2.11)

En este momento es conveniente explicar cual es el vector de entradas ~u(t) del que hemos estadoutilizando durante el desarrollo de esta sección. Las entradas a nuestro sistema son básicamente la deflexión delas superficies de vuelo y las revoluciones por minutos del motor. Resumiendo, al hablar del vector de entradas~u(t), nos estamos refiriendo al vector ~u(t) = (δe, n), siendo δe la posición del elevador y n las revolucionespor minuto a la que gira el motor.

Yendo un poco más al detalle en cuanto a las fuerzas aerodinámicas presentes en el modelo,observamos que éstas dependen - además de ~u(t) - de varios parámetros cuyos valores están bien definidos yque explicamos a continuación.

. ρ - Densidad del aire a la altura de vuelo.

. S - Superficie alar.

. c - Cuerda aerodinámica media.bAquí hemos hecho la suposición de que la masa del avión es constante, cosa que no es del todo cierta dado que existe una

pérdida de masa debido al consumo de nafta. Consideramos esta pérdida despreciables y modelable dentro de las parturbaciones alsistema.

5

Se puede observar entonces que la fuerza aerodinámica ~Fa se puede escribir en términos de la basedel SB como ~Fa = FxaiB + FzakB, y que el momento aerodinámico ~Ta como ~Ta = TyajB. En base a lasmagnitudes expresadas en el enumerado anterior, las entradas ~u(t) y el vector de estado ~x se obtiene que lasexpresiones para Fxa, Fza y Tya son:

Fxa =ρ(v2

Bx + v2Bz)S

2Cxa(vBx, vBz, wBy, ~u(t)) (2.12)

Fza =ρ(v2

Bx + v2Bz)S

2Cza(vBx, vBz, wBy, ~u(t)) (2.13)

Tya =ρ(v2

Bx + v2Bz)S

2Cma(vBx, vBz, wBy, ~u(t)) (2.14)

Siendo Cxa, Cza y Cma de la forma:

Cxa = Cxo + Cxαα + Cxα2α2 + Cxα3α3 + CxωcwBy√v2Bx+v

2Bz

Cza = Czo + Czαα + Czα3α3 + CzωcwBy√v2Bx+v

2Bz

+ Czδeδe

Cma = Cmo + Cmαα + Cmα2α2 + CmωcwBy√v2Bx+v

2Bz

+ Cmδeδe

(2.15)

Con:α = cf(vBx, vBz) = arctan

vBzvBx

(2.16)

Donde se conocen los valores para los parámetros c, S, ρ, Cxo, Cxα, Cxα2 , Cxα3 , Cxω, Czo, Czα, Czα3 ,Czω, Czδe , Cmo, Cmα, Cmα2 , Cmω y Cmδe [3]. Es de notar que todos los coeficientes C son adimensionados.

Finalmente, debemos hacer un análisis similar pero para la fuerza y el torque del motor. En este casose puede también escribir la fuerza del motor ~Fp en términos de la base del SB como ~Fp = FxpiB + FzpkB, ytambién el momento del motor ~Tp como ~Tp = TypjB. Procediendo con un esquema similar al realizado paralas fuerzas aerodinámicas tenemos que:

Fxp =ρ(v2

Bx + v2Bz)S

2Cxp(vBx, vBz, ~u(t)) (2.17)

Fzp =ρ(v2

Bx + v2Bz)S

2Czp(vBx, vBz, ~u(t)) (2.18)

Typ =ρ(v2

Bx + v2Bz)S

2Cmp(vBx, vBz, ~u(t)) (2.19)

Siendo Cxp, Czp y Cmp de la forma:

Cxp = Cxκκ+ Cxακ2ακ2

Czp = Czκκ

Cmp = Cmκκ

(2.20)

cα es llamado en ángulo de ataque, el cual es un ángulo fundamental para los análisis de mecánica de los fluidos que implicanlas fuerzas aerodinámicas.

6

Con:α = cf(vBx, vBz) = arctan vBz

vBx

κ = g(ρ, n, vBx, vBz) = C1 + C2

[2(a.n+b)

ρ(v2Bx+v2Bz)3/2

] (2.21)

Donde también se conocen los valores para los parámetros c, S, ρ, Cxκ, Cxακ2 , Czκ, Cmκ, a, b, C1 yC2 [3]. Nuevamente, es de notar que todos los coeficientes C son adimensionados.

2.3. Modelo en variables de estado

Por último, y para finalizar este capítulo, expondremos el MVE completo a modo de resumen. Éstees el modelo con el cual trabajaremos de aquí en más en el desarrollo de esta monografía. El MVE quedaentonces de la siguiente manera:

x = cos θ.vBx + sin θ.vBz

z = − sin θ.vBx + cos θ.vBz

θ = wBy

˙vBx = 1m

[Fxa(vBx, vBz, wBy, ~u(t)) + Fxp(vBx, vBz, ~u(t))−mg sin θ]− vBzwBy

˙vBz = 1m

[Fza(vBx, vBz, wBy, ~u(t)) + Fzp(vBx, vBz, ~u(t)) +mg cos θ] + vBxwBy

˙wBy = 1Iyy

[Tya(vBx, vBz, wBy, ~u(t)) + Typ(vBx, vBz, ~u(t))]

(2.22)

Y los valores para Fxa, Fza, Tya, Fxp, Fzp y Typ son los que se muestran en las ecuaciones 2.12, 2.13,2.14, 2.17, 2.18 y 2.19 respectivamente.

7

Capítulo 3

Control lineal y gain scheduling

El objetivo principal de este trabajo consiste en lograr resolver el problema de controlar el seguimientopor parte de un avión de trayectorias pre-definidas bajo la restricción simplificadora de que el vuelo seencuentre restringido a un plano vertical. Más específicamente, nuestro propósito es generar un sistema decontrol automático a partir del modelo en variables de estado presentado en la sección precedente, quepermita resolver este problema de tracking. Ahora bien, este problema, en su formulación mas genérica, essumamente complicado de resolver; no resulta ser una tarea en absoluto sencilla lograr el control de nuestrosistema alrededor de una trayectoria cualquiera. Es por este motivo que nos proponemos estudiar una versiónsimplificada de dicho problema, en la cual pretendemos generar, mediante la concatenación de trayectorias enlínea recta a velocidad constante, situaciones de vuelo en cierta forma más complejas. El motivo por el cualdecidimos trabajar alrededor de este tipo de trayectorias, y la obtención del primer controlador desarrolladoson abordados en el presente capítulo.

3.1. Trayectorias estacionariasComenzamos esta sección realizando una distinción entre las distintas ecuaciones que componen

el modelo en variables de estado. Llamamos ecuaciones dinámicas a aquellas que provienen del planteo delas cardinales en el sistema relativo, mientras que nos referimos como ecuaciones cinemáticas a aquellasque representan el cambio de base entre las velocidades en el sistema relativo y el absoluto. Denominamostrayectorias estacionarias a las que anulan las ecuaciones dinámicas del modelo en variables de estado, esdecir aquellas que cumplen:

vBx = 0vBz = 0w = 0

(3.1)

Si además imponemos θ = 0, nos encontramos con trayectorias en linea recta a velocidad constante enlas que el avión forma un ángulo fijo con la horizontal a medida que se desplaza, es decir que, salvo laposición del centro de masa (que se mueve con velocidad constante) todas las variables de estado se mantienenincambiadas en el tiempo. Se debe notar que no buscamos anular la derivada de la totalidad del vector deestados encontrando un punto fijo del sistema total. Esta solución corresponde al equilibrio mecánico total delsistema que representa la situación un tanto trivial (e imposible de lograr en ausencia de otra fuerza externa)en que el avión se encuentre en reposo con respecto al sistema absoluto. También observamos que, si el aviónparte de ciertas condiciones iniciales en estas últimas variables de estado, si se imponen valores constantes enlas entradas de manera de anular las ecuaciones dinámicas del MVE, el avión se mantendrá en una trayectoriaen línea recta a velocidad constante. Esto es posible debido a que estas ecuaciones no varían en el tiempodado que no dependen de la posición del centro de masa, las únicas variables que varían en el tiempo en esteesquema. Si el vector de estados para estas trayectorias esta dado por (xd(t), zd(t), θd, vBxd, vBzd, wd = 0)T y

8

las entradas como (δed, nd)T se debe verificar:

Fxneta(θd, vBxd, vBzd, wd = 0, δed, nd) = 0Fzneta(θd, vBxd, vBzd, wd = 0, δed, nd) = 0Tneto(θd, vBxd, vBzd, wd = 0, δed, nd) = 0

(3.2)

que, como dijimos, no depende del tiempo en tanto que el avión se mantenga en vuelo a velocidad constante.A su vez tenemos la relación entre la velocidad en el sistema relativo y el absoluto:

xd = cos θ.vBxd + sin θ.vBzd

zd = − sin θ.vBxd + cos θ.vBzd(3.3)

Nos referimos de aquí en adelante a la parte constante del vector de estados en estos casos comovalores estacionarios de las variables de estado y a los valores constantes de las entradas como punto deoperación del sistema. Observando 3.2, vemos que las relaciones que deben cumplir estas variables para queefectivamente ocurra el vuelo rectilineo definido en estos términos, implican que no es posible que este se dépara cualquier valor de θd dados ciertos valores de las velocidades. Esto se debe a que es necesario anulartres ecuaciones y sólo disponemos de dos variables de control. Por lo tanto, si queremos imponer el vuelo adeterminada velocidad, anular 3.2 fija el valor estacionario de θd y del punto de operación de las variables decontrol.

En resumen, si las condiciones iniciales y los valores de las entradas en el instante inicial verifican3.2, si se mantienen las variables de control en el punto de operación, el vuelo se desarrollará a la velocidadconstante expresada en el sistema inercial por la ecuación 3.3.

3.2. Respuesta del sistema sin controladorAntes de proceder a explicar y estudiar el comportamiento de los distintos sistemas de control que se

analizaron durante el transcurso de este trabajo, procederemos en esta sección a observar el comportamientodel sistema sin controladores y cómo reacciona dicho sistema sin perturbaciones y ante pertubaciones delas condiciones iniciales. Además, en este capítulo explicaremos las pruebas que utilizamos para testear losdistintos controladores y su rendimiento.

Para observar el comportamiendo de los distintos controladores, se definieron dos pruebas:

. Prueba 1 - La primera prueba consiste un vuelo en línea recta horizontal (paralelo al eje x) con velocidadconstante de 30m/s, al cual se le realizan ciertas perturbaciones. En este caso la perturbación al sistemaingresa en las condiciones iniciales del ángulo θ.

. Prueba 2 - La segunda prueba consiste en que el avión siga una trayectoria en el plano (x, y) de la formaque se muestra en la figura 3.1. La misma consta de un primer tramo de 20 segundos de vuelo rectilineohorizontal a velocidad constante de 30m/s. Luego un segundo tramo de 30 segundos de ascenso en línearecta también a velocidad constante, en este caso la velocidad es de ~vI = (30iB−3kB)m/s. Y finalmenteun último tramo de 50 segundos donde la trayectoria es nuevamente rectilinea, horizontal y a velocidadconstante a 30m/s.

A continuación, dado que interesa ver la respuesta del sistema sin controlador a las dos pruebasmencionadas anteriormente, explicaremos brevemente la forma en que realizamos dichas pruebas en laspróximas dos subsecciones.

9

Figura 3.1: Trayectoria a seguir para la prueba 2.

3.2.1. Prueba 1 sin controladorPara esta prueba lo que se hace es setear las entradas (δe, n) en sus valores estacionarios y se ingresa

una perturbación en las condiciones iniciales para el ángulo θ. En este caso los valores estacionarios de lasvariables de control (δe1, n1) son:

δe1 ≈ 0,1876radn1 ≈ 1300rpm

(3.4)

En la figura 3.2, se presentan las gráficas para la trayectoria descripta por el avión en el caso de noincluir perturbación y de incluir una perturbación de 0,5rad en las condiciones iniciales para el ángulo θ.

(a) Sin pertubación (b) Con perturbación de 0.5rad

Figura 3.2: Trayectorias obtenidas en el plano (x, z) como resultado de la prueba 1 sin controlador, con y sinperturbación en las condiciones iniciales de ángulo θ.

Se puede observar que para el caso de que no se introducen perturbaciones, la trayectoria que describeel avión es la desaeada (obsérvese que en el eje z es del orden de las 10 µm). La trayectoria que realiza el avión

10

es básicamente en línea recta horizontal. En cambio, la trayectoria descripta por el sistema sin controladorcon una pertubación de 0,5rad en las condiciones iniciales de θ presenta ondulaciones marcadas y se puedeobservar que la misma converge lentamente a una altura de ≈ 13m, cuando en el caso sin perturbacionesconvergía a ≈ 0m.

3.2.2. Prueba 2 sin controladorPara la prueba 2 sin controlador lo que hacemos es setear las entradas (δe, n) en sus valores

estacionarios tramo a tramo. Es de notar que en este caso la condiciones finales de un tramo entran comoperturbación a las condiciones iniciales del siguiente tramo. En este caso se utilizaron los siguientes valorespara el tramo 1, 2 y 3:

δe1 ≈ 0,1876rad δe2 ≈ 0,1820rad δe3 ≈ 0,1876radn1 ≈ 1300rpm n2 ≈ 2377rpm n3 ≈ 1300rpm

(3.5)

Es de notar que lo que se está haciendo es poniendo entradas u(t) al sistema de la forma escalón, puesu(t) se contruye poniedo tramo a tramo los valores de polarización para cada trayectoria estacionaria deseada.Para esta prueba los resultados obtenidos son los que se muestran en la figura 3.3.

Figura 3.3: Trayectoria obtenida mediante la realización de la prueba 2. Las variables de control u(t) se son de la formaescalón.

Podemos observar que el avión en cierta manera sigue la trayectoria requerida para la preuba 2. Porotro lado, los sobretiros obtenidos son grandes y la convergencia a la trayectoria deseada es lenta. Durante elprimer tramo, como no hubo perturbación inicial el sistema segue perfectamente a la trayectoria horizontal dedicho tramo.

Además, realizamos otra prueba para este sistema. Para el caso que se muestra en la figura 3.4 loque se hizo fue interpolar las funciones u(t) = (δe(t), n(t)) utilizadas en el caso anterior para las variables decontrol, de modo de tener funciones más "suaves"para las entradas. Como se desprende fácilmente de observardicha figura el resultado obtenido es poco satisfactorio. La trayectoria que describe finalmente el avión con lasentradas resultantes de la interpolación se aleja bastante de la trayectoria deseada.

Luego de haber observado durante el transcurso de esta sección la respuesta del sistema cuando

11

se aplican entradas u(t) en su valor estacionario para determinadas trayectorias, podemos decir que lastrayectorias obtenidas - si bien siguen de cierta manera las trayectorias pre-establecidas - no son del todosatisfactorias. En primer lugar, como vimos en la prueba 1, una perturbación en las condiciones iniciales delángulo θ puede generar un apartamiendo importante de la trayectoria que se desea seguir. Por otro lado, enla prueba 2 quedaron evidenciadas las ondulaciones que aparecen al cambiar de punto de operación de lasentradas como resultado de querer cambiar la trayectoria estacionaria a seguir. Para esta última prueba laconvergencia a las trayectorias deseadas es lenta.

Figura 3.4: Trayectoria obtenida mediante la realización de la prueba 2. Las variables de control u(t) se obtieneninterpolando la funciones utilizadas para u(t) en el caso anterior.

Este tipo de conclusiones sobre la respuesta del sistema a las entradas particulares que hemosingresado y en ausencia de controlador a, es que nos hace notar la necesidad de tener un sistema de control queevite los problemas evidenciados en el párrafo anterior. En las próximas secciones entraremos en detalle de losprimeros controladores diseñados y analizados para superar dichos problemas.

3.3. Control LinealEl problema de control comienza al reconocer que el sistema físico no se encontrará en el instante en

que se quiera iniciar el vuelo a velocidad constante en los valores estacionarios de las variables necesarios paraque esto suceda. Por ejemplo, se puede querer volar a una velocidad en el sistema inercial dada por (xd, zd),para las cuales, por la ecuación 3.2, es necesario θ = θd (y por supuesto w = 0), y en cambio las condicionesiniciales son de la forma (xo, zo, θo) = (xd + dx, zd + dz, θd + dθ). Esta diferencia en las condiciones inicialesdel valor estacionario requerido entra como una perturbación al sistema la cual puede evitar que el avión sigala trayectoria deseada.

De la misma forma el sistema físico real puede sufrir un apartamiento del recorrido deseado acausa de perturbaciones atmosféricas, o bien debido a inexactitudes u omisiones en el modelo con respectoal comportamiento real. Es necesario generar entonces un sistema de control que permita, manipulando lasentradas, inmunizar al sistema frente a estas perturbaciones y seguir lo mejor posible la trayectoria deseada.

aMás allá de que poner entradas de dicha forma es una manera muy primaria para implementar un controlador.

12

Una de las ventajas de estudiar el comportamiento del sistema alrededor de trayectorias en línea rectaa velocidad constante consiste en que, la linealización jacobiana del mismo alrededor de dichas trayectorias,permite aproximar la dinámica de los desplazamientos de las variables de estado alrededor de sus valoresestacionarios por un sistema lineal invariante en el tiempo. Esto es posible gracias a que el sistema en variablesde estado no depende de las componentes no constantes del vector de estados asociados a la trayectoria aseguir. Tomando nuevamente rd(t) = (xd(t), zd(t), θd, vBxd, vBzd, wd = 0)T como la expresion en variables deestado de la trayectoria de deseada y ud = (δed, nd)

T el punto de operación asociado a la misma, definimoslos desplazamientos de los estados y las entradas alrededor de dichas magnitudes como:

x(t) = x(t)− rd(t)u(t) = u(t)− ud(t)

(3.6)

donde de ahora en mas x(t) representa, no la posición horizontal del centro de masa en el sistema inercial,sino el vector de estados en su totalidad en el instante t y u(t) el vector de entradas. Consideremos ahora unaexpresión bastante más genérica de nuestro modelo:

x = f(x, u) (3.7)

Pretendemos aproximar la dinámica correspondiente a la evolución de el desplazamiento x, por lalinealización de la precedente ecuación alrededor de la trayectoria rd, es decir:

˙x = Ax+Bu (3.8)

siendo las matrices A y B:A = df

dx|rd,ud

B = dfdu|rd,ud

(3.9)

Obsevamos que, debido a que el sistema original no depende de la posición del centro de masa,tampoco dependen las matrices A y B de (xd(t), zd(t)), por lo que el sistema linealizado resulta ser invarianteen el tiempo. Se debe notar que esta aproximación resulta representativa del comportamiento del sistemasiempre que las perturbaciones x alrededor de la trayectoria a seguir y las acciones de control u por arriba delpunto de operación, sean lo suficientemente pequeñas. Trabajando entonces en términos de esta aproximaciónlineal para los desplazamientos x y u, reformulamos el problema de control propuesto como el de estabilizarel origen de la ecuación 3.8. El origen de este sistema corresponde a x(t) = xd(t), por lo que de lograr esteobjetivo se estaría resolviendo a su vez el problema de tracking original. Debido a que 3.8 es una aproximacióndel sistema original válida para perturbaciones "pequeñas", suponemos que, en principio, las estrategias decontrol desarrolladas alrededor de dicha simplificación serán efectivas en estabilizar el sistema alrededor delas trayectorias deseadas cuando las perturbaciones alrededor de las mismas sean "pequeñas".

En el desarrollo precedente se propuso la realización de la linealización del sistema alrededor de latotalidad del vector de estados correspondiente a la trayectoria deseada. Es posible también, realizar dichalinealización, dejando afuera del modelo de la forma de 3.7, las primeras dos ecuaciones del modeloen variables de estado, correspondientes al cambio de base. La diferencia radica que, mientras que en elesquema presentado en primer lugar se pretende seguir una trayectoria en particular, en este caso se pretendesimplemente lograr el vuelo a una determinada velocidad (en el sentido vectorial de la palabra). Nos referimosde ahora en adelante al primer modelo como linealización del modelo completo y a éste último comolinealización alrededor de las velocidades. Como se verá al presentar las simulaziones realizadas, los resultadosobtenidos a partir de cada uno de estos modelos difieren sustancialmente. Estas linealizaciones las hicimos demanera paramétrica, es decir, no es una linealización numérica sino que hallamos analíticamente la forma dela linealización en base a las variables de estado y los parámetros del modelo. Aún así, la forma del modelolineal es esencialmente la misma, por lo que a los efectos de la síntesis de un controlador el desarrollo quepresentamos a continuación se realiza de manera independiente a cual de los dos casos sea considerado.

La estrategia de control aplicada sobre 3.8 consiste en hallar, una realimentación de estados de la

13

forma u = −Kx, eligiendo la matriz de realimentación K de manera tal de estabilizar el origen del sistemarealimentado. El esquema de realimentación de estados implementado se resume esquemáticamente en lafigura 3.5.

Figura 3.5: Ilustrativa del esquema de realimentación de estado utilizado.

A los efectos de elegirK que cumpla con este propósito se adoptaron dos técnicas distintas, las cualesse explican a continuación.

La primer técnica aplicada consistió en elegir K de manera tal de ubicar los polos del sistemarealimentado en determinados lugares. Esta tarea fue realizada utilizando la rutina pplace.m de Matlab. Dicharutina obtiene, mediante un algoritmo de resolución numérica, la matriz de realimentación a partir de lasmatrices A y B del sistema lineal a controlar y la ubicación de donde se desean los polos del lazo cerrado. Unacontrapartida de esta técnica consiste en que no se tienen en cuenta las limitaciones físicas del rango en quepueden operar las entradas al sistema. La deflección del elevador sólo puede moverse dentro de ciertos ángulos,al igual que la velocidad del eje de giro tiene un límite superior de operación. Hemos observado mediantesimulaciones que un controlador generado de esta manera, ubicando los polos en lugares razonablementerápidos, reacciona utilizando señales de control muy por encima de los límites físicos de las entradas. Apesar de que para cualquier controlador que utilice una realimentación de estados en este esquema, es posibleencontrar una perturbación en las condiciones iniciales lo suficientemente grande, como para que las accionesde control tomen valores sustancialmente por encima de lo previsto físicamente, hemos encontrado una formade hallar la matriz K que alumbra mejores resultados en este sentido.

El segúndo método que adoptamos para calcular la matriz de realimentación consiste en la resolucióndel problema del regulador cuadrático lineal (LQR por sus siglas en inglés). Este problema de control óptimose trata de hallar la acción de control u(t) que minimiza el funcional costo definido por:

J =

∫ ∞to

xTQx+ uTRudt (3.10)

(donde Q y R son matrices cuadradas definidas positivas de las dimensiones adecuadas) bajo la restricción deque la dinámica del sistema se encuentra sujeta a la ecuación 3.8. La matriz K que produce la realimentaciónde estados que es solución de este problema de control óptimo es [10]:

K = −RBTP (3.11)

donde P es la matriz solución de la ecuación de Riccati:

ATP + PA+Q = PBR−1BTP (3.12)

Eligiendo las matrices Q y R de manera apropiada se puede decidir dar más peso en la minimización

14

tanto a (x) como a (u). En particular, hemos encontrado ciertos valores de dichas matrices que mejoransignificativamente el problema del tamaño de las señales de entrada al sistema, con la contrapartida de quela convergencia es en estos casos un poco mas lenta. Presentamos estos resultados en la sección simulacionesde este capítulo.

3.4. Gain schedulingEn esta sección describimos el método mediante el cual proponemos lograr el seguimiento de

trayectorias compuestas por la concatenación en el tiempo de distintas situaciones de vuelo en línea rectaa velocidad consante. Primeramente notamos que, dada una situación de vuelo deseada a lo largo de unatrayectoria estacionaria cualquiera especificada por rd(t) y ud(t), es posible calcular, de manera analítica y entérminos de los parámetros del modelo, la linealización (A,B) alrededor de dichos valores estacionarios de lasvariables de estado y del punto de operación. A partir de esta linealización es posible sintetizar un controladorlineal como fue descripto en la sección anterior. Ahora supongamos que al cabo de un determinado tiempo sedesea cambiar a seguir el vuelo a lo largo de otra trayectoria estacionaria (como puede ser el caso de la prueba2 que describimos anteriormente). En principio bastaría con cambiar el punto de operación al correspondientea esta nueva situación de vuelo. Sin embargo, el estado final de la situación de vuelo precedente, que será asu turno la condicion inicial de la nueva situación de vuelo, no coincidirá con los valores estacionarios de lasvariables de estado de la misma. Es decir, se producirá una perturbación en las condiciones iniciales del vueloen los mismos términos que fue descripta en la sección anterior. La solución a este problema requiere entoncesactualizar el controlador mediante la recalculación de la linealización alrededor de la nueva trayectoria (y laactualización del desplazamiento x

La técnica de gain scheduling consiste entonces en ir actualizando, en cada consecutiva situación devuelo, el punto de operación, la matriz de realimentación de estados (calculada a su vez a partir de las matricesA y B actualizadas) y el desplazamiento x con respecto al rd(t) correspondiente. Si la transición entre dostrayectorias consecutivas no es demasiado abrupta, es de suponer que tampoco será demasiado significativa laperturbación en las condiciones iniciales como para que el controlador lineal no pueda lograr el seguimiento dela curva deseada. En las siguientes secciones de este capítulo presentamos algunos resultados de la aplicaciónde esta técnica obtenidos en simulaciones.

3.5. Simulaciones realizadasEn las próximas dos sub-secciones mostraremos los resultados obtenidos para ambas técnicas de

obtención de la matriz K de realimentación de estados. Utilizaremos como base las pruebas 1 y 2 que yahemos explicado en secciones anteriores. Como también se explicó anteriormente, podemos trabajar con lalinealización completa o con la linealización alrededor de las velocidades. Se realizaron simulaciones de ambastécnicas para ambas linealizaciones las cuales exponemos a continuación.

3.5.1. Simulaciones para el controlador lineal - pplaceEn lo relativo a controlador que obtiene la matirz K de realimentación colocando los polos del

sistema realimentado en la ubicación que uno quiera, utilizando la función pplace de Matlab. Se realizaronlas siguientes simulaciones:

. Simulación 1 pplace - Prueba 1 con linealización alrededor de las velocidades.

En este caso decidimos ubicar los polos del sistema realimentado en las siguientes ubicaciones:

P1 = −1Hz P2 = −1,1HzP3 = −1,2Hz P4 = −1,4Hz

(3.13)

15

En la figura 3.6 se puede observar la trayectoria recorrida por el avión para esta simulación. El aviónestabiliza a una trayectoria rectilinea velozmente. Dado que la linealización para este caso es en torno a lasvelocidades, la altura a la cual converge el avión no tiene porque ser necesariamente cero. En este caso laaltura de vuelo converge a un valor de ≈ 100m. Esta diferencia de altura viene dada por la perturbación enlas condiciones iniciales en el ángulo θ (en este caso de 0,5rad). Otro comentario que podemos hacer es queefectivamente se converge a una velocidad constante ~vI = 30m/siI , es decir, con componente nula según ladirección kI y el valor constante deseado según la dirección iI .

Figura 3.6: Trayectoria en el plano (x, y) obtenida de la simulación 1 pplace.

El comportamiento que se puede observar en la figura 3.6 es típico del sistema linealizado en tornoa las velocidades. Éstas fueron las primera simulaciones que obtuvimos. En el siguiente punto se ilustra lamisma idea (la de linealizar en torno a velocidades) aplicado a la prueba 2.

. Simulación 2 pplace - Prueba 2 con linealización alrededor de las velocidades.

Con el objetivo de situar los polos del sistema realimentado en los mismo lugares que los que se indicóen el punto anterior, y también usando la linealización en torno a las velocidades se obtuvieron los resultadosque se puede ver en las figuras 3.7 y 3.8.

En esta última figura, la figura 3.7 se observa claramente que el sistema sólo logra converger envelocidad. Para esto se puede observar el último tramo de esta prueba en el cual si bien no se converge a laaltura deseada, si se converge a la velocidad constante deseada.

Cabe observar las acciones de control necesarias para seguir la trayectoria en el plano (x, z) descriptaen la figura 3.7. En este caso se puede observar en la figura 3.8 que estas acciones no tienen sentido físico,por ejemplo, alcanza con notar que las revoluciones por minuto de giro de la hélice deberían llegar a 8000rpm.

. Simulación 3 pplace - Prueba 1 con linealización completa.

A partir de esta simulación pasaremos a trabajar con la linealización completa del sistema. Dado quenuestro objetivo es seguir una determinada trayectoria en el plano (x, z) este es el modelo más adecuado parautilizar. En la figura 3.9 se puede ver la trayectoria que se logra utilizando el controlador diseñado en estainstancia.

16


(a) Evolución temporal de la acción de control δe para lasimulación 2 pplace.

(b) Evolución temporal de la acción de control n para lasimulación 2 pplace

Figura 3.8: Evolución temporal de las distintas acciones de control para la simulación 2 pplace.

Para este caso hemos incluido una perturbación en las condiciones iniciales del ángulo θ de 0,1rad,pues para un valor de 0,5rad la trayectoria divergía. Es de hacer notar en este punto que una perturbación de0,5rad es muy grande para nuestro sistema. En general cuando se trata de pasar de una trayectoria estacionariaa otra, las perturbaciones involucradas en el cambio de polarización son bastante menores.

Para este caso hemos colocado los polos del sistema realimentado en las siguientes ubicaciones:

P1 = −1Hz P2 = −5HzP3 = −8Hz P4 = −10HzP5 = −15Hz P6 = −20Hz

(3.14)

En la figura 3.9 que se mostró en la página anterior, se puede observar claramente que la trayectoriaconverge a la deseada, es decir, a una trayectoria en z = 0. También se puede observar que la convergencia esbastante véloz. Sin embargo, como contrapartida a esta convergencia rápida si observamos el comportamientode las acciones de control vemos que estás acciones se hacen particularmente grandes. Como se puede observaren la figura 3.10 el valor para la deflección del elevador δe alcanza valores de≈ 20rad, lo cual no tiene sentidofísico alguno pues no está dentro de los rangos de movimientos del elevador.

17


Figura 3.10: Evolución temporal para la acción de control δe obtenida de la simulación 3 pplace.

. Simulación 4 pplace - Prueba 2 con linealización completa.

Para completar las simulaciones del controlador diseñado ubicando los polos del sistema realimentadocon la función pplace de Matlab, mostramos a continuación el resultado para la prueba 2 utilizando lalinealización completa del sistema. Tanto la trayectoria recorrida en el plano (x, z) como la acción de controlδe se puede apreciar en la figura 3.11.

Las conclusiones de esta simulación son muy parecidas a la de la simulación que se mostró en el puntoanterior. El controlador logra converger a la trayectoria deseada con errores muy pequeños y ondulacionesmenores en el cambio de trayectoria estacionaria. Además, esta convergencia se obtiene de manera muy veloz.Sin embargo esto acarrea el problema de tener que ejercer acciones de control muy grandes, y que para elsistema físico que estamos modelando no tienen ningún sentido. Por ejemplo, en esta simulación deberíamospoder aplicar valores para δe de ≈ 15rad, lo cual no es posible.

18

(a) Trayectoria en el plano (x, y) para la simulación 4 pplace. (b) Evolución temporal para la acción de control δe para lasimulación 4 pplace

Figura 3.11: Resultados obtenidos para la simulación 4 pplace.

3.5.2. Simulaciones para el controlador lineal - LQRComo pudimos apreciar el principal problema que tenía la estrategia de control utilizando la matriz

de realimentación de estado K (que es obtenida mediante la función pplace de Matlab) es que las accionesde control necesarias quedan demasiado grandes, e incluso fuera de los límites físicos posibles para nuestrosistema. Para poder mejorar este problema es que decidimos analizar el comportamiento de un controladorlineal calculando la matriz K de realimentación de estados utilizando el método LQR que se explicó ensecciones anteriores. Poniendo cierto énfasis de la reducción del tamaño de la acciones de control hemoselegido las matrices Q y R de la siguiente manera:

Q = Id R = 100Id (3.15)

Para estas simulaciones nos centraremos principalmente en el estudio del comportamiento conla linealización completa del sistema. Incluiremos como último punto un breve comentario sobre elcomportamiento de este controlador frente al sistema linealizado en torno a las velocidades. A continuación seexplican las simulaciones realizadas.

. Simulación 1 LQR - Prueba 1 con linealización completa.

En este caso para esta prueba hemos ingresado nuevamente una perturbación de 0,5rad a lascondiciones iniciales del ángulo θ. En la figura 3.12 que aparece en la próxima carilla se puede observarlas trayectorias obtenidas en el plano (x, z).

Observando sólo la primer simulacion (de 50s) podría creerse que no estamos logrando el objetivode seguir la trayectoria deseada (z = 0) en este caso. Sin embargo, al realizar una simulación de 1000s sepuede apreciar que el problema es que la convergencia es lenta, pero que lentamente el avión intenta llegara la trayectoria a seguir. De nuevo, cabe destacar que una pertubación de 0,5rad es muy grande para nuestrosistema, en condiciones normales es de esperar perturbaciones menores y una convergencia a la trayectoriamás rápida. Estos comentarios quedarán evidenciados en el próximo punto donde veremos el comportamientoante la prueba 2.

Ahora bien, nuestro objetivo al analizar la estrategia LQR para obtener la matriz de realimentaciónde estados era poder achicar el valor de las acciones de control (δe, n), o por lo menos llevarlas a valores quefueran razonables según nuestro modelo y físicamente posibles. Si observamos la figura 3.13 que aparece a

19

continuación, podemos observar la evolución temporal de ambas variables.

(a) Simulación de 50s para la simulación 1 LQR. (b) Simulación de 1000s para la simulación 1 LQR.

Figura 3.12: Trayectoria en el plano (x, y) obtenida de la simulación 1 LQR.

(a) Evolución temporal de la acción de control δe para lasimulación 1 LQR.

(b) Evolución temporal de la acción de control n para lasimulación 1 LQR

Figura 3.13: Evolución temporal de las distintas acciones de control para la simulación 1 LQR.

Se puede observar claramente como el objetivo respecto a las acciones de control fue parcialmentecumplido utilizando este controlador; la variable n está restringida a un margen de acción posible quecorresponde al intervalo ≈ [1299rpm, 1309rpm]. Sin embargo la acción del elevador δe, si bien se redujonotoriamente al orden de los ≈ 7rad, aún no es aceptable dado las restricciones físicas reales que tenemos.De nuevo es de destacar que esta acción de control es necesaria dado que una perturbación de 0,5rad en lascondiciones iniciales de θ es muy grande para nuestro sistema.

. Simulación 2 LQR - Prueba 2 con linealización completa.

En una situación más real en cuanto a las perturbaciones existentes en el cambio de trayectoriasestacionarias, el sistema se comporta como se desprende de esta simulación. En la figura 3.14 se puede apreciar

20

que la trayectoria deseada es seguida de manera altamente aceptable. No se pueden apreciar dificultades desdeel punto de vista de la convergencia como se vio en el punto anterior. Sin embargo, la convergencia es máslenta que en el caso del controlador obtenido con la técnica pplace.

Figura 3.14: Trayectoria en el plano (x, y) obtenida de la simulación 2 LQR.

Pasando al análisis de la evolución temporal de las variables de control, podemos apreciar que lasmismas se encuentran dentro de rangos aceptables. La acción de control δe se encuentra dentro del intervalo≈ [−0,55rad, 0,1rad], mientras que la variable n está en el intervalo ≈ [1300rpm, 1950rpm]. Es de observar,que la evolución temporal para la variable n es más que razonable, dado que para lograr el ascenso que proponela trayectoria estacionaria del tramo 2 se debe aumentar la velocidad de giro de la hélice.

(a) Evolución temporal de la acción de control δe para lasimulación 2 LQR.

(b) Evolución temporal de la acción de control n para lasimulación 2 LQR

Figura 3.15: Evolución temporal de las distintas acciones de control para la simulación 2 LQR.

. Comportamiento del controlador LQR ante el sistema linealizado alrededor de las velocidades.

A modo de mostrar que el comportamiento frente al sistema linealizado en torno a las velocidadeses muy similar al que se mostró anteriormente para el controlador implementado con la técnica pplace, semuestran a continuación las imágenes correspondientes a las simulaciones correspondientes a la prueba 1 en

21

Figura 3.16: Trayectoria en el plano (x, y) obtenida de la simulación para el controlador LQR con el sistema linealizadoen torno a las velocidades para la prueba 1.

las figuras 3.16 y 3.17.

En este caso se logra converger en velocidad, pero no a la trayectoria en posición deseada. Esto es loque debería pasar dado que estamos trabajando con el sistema linealizado en torno a las velocidades. La alturade régimen a la que converge es de ≈ 4m.

(a) Evolución temporal de la acción de control δe para estasimulación.

(b) Evolución temporal de la acción de control n para estasimulación.

Figura 3.17: Evolución temporal de las distintas acciones de control obtenida de la simulación para el controlador LQRcon el sistema linealizado en torno a las velocidades para la prueba 1.

En este caso, como sólo se prentende converger a la velocidad deseada y no a una trayectoria enposición definida, se tiene que las acciones de control no son tan exigentes. En este caso las variables de controlse encuentran también dentro de los márgenes razonables, teniedo δe en el intervalo ≈ [−0,25rad, 0,4rad],mientras que el giro de la hélice n es casi constante y de valor≈ 1300rpm. Como contrapartida, no se convergea una trayectoria en posición deseada, pero si en velocidades.

22

Capítulo 4

Técnicas de control MPC

4.1. Control MPCEl control mediante modelo de predicción (MPC por sus siglas en inglés) es una estrategia en tiempo

discreto que consiste en generar señales de control a partir de la resolución consecutiva de problemas de controlóptimo de horizonte finito en lazo abierto. La función costo a minimizar para lograr la optimización es similara la utilizada en el problema LQR descripto anteriormente:

J =M∑k=1

x(k)TQx(k) +N∑k=1

u(k)TRu(k) (4.1)

donde la sucesión x(k) representa el error del vector de estados con respecto a la trayectoria deseada y u(k)la variación de la señal de control alrededor del punto de operación asociado a la trayectoria deseada, ambasobtenidas del muestreo de las magnitudes continuas correspondientes. A M se lo conoce como horizontede predicción y a N como horizonte de control. Q y R son dos matrices cuadradas definidas positivas dedimensiones apropiadas. La diferencia sustancial con respecto al caso descripto en la sección anterior radicaen que el costo a minimizar se computa durante un intervalo de tiempo finito de M períodos de muestreo.Por supuesto, la resolución del problema de control óptimo de hallar la sucesión de acciones de control queminimiza dicho costo está sujeta a la restricción de que la evolución del vector de estados está dada por ladinámica continua del sistema, que expresamos de manera genérica de la forma:

x = f(x, u) (4.2)

Esta ecuación es en nuestro caso no lineal, lo que complica la resolución del problema. Para superaresta dificultad apelamos al recurso utilizado anteriormente de aproximar dicha expresión por su versiónlinealizada alrededor de la trayectoria deseada y del punto de operación de las entradas, obteniéndose:

˙x = Ax+Bu (4.3)

donde x representa el desplazamiento del vector de estados alrededor de la trayectoria deseada y u eldesplazamiento de las entradas alrededor del punto de operación. A partir de esta ecuación es posible llegar auna relación en tiempo discreto para la actualización de los estados de la forma:

x(k + 1) = Φx(k) + Γu(k) (4.4)

la cual se conoce como modelo de predicción del sistema. Utilizando 4.4 se resuelve numéricamente laminimización de la función costo expresada en 4.1. Se debe notar que la solución de este problema dependede la condición inicial del sistema en el instante que comienza la optimización. La secuencia de entradas decontrol al sistema se obtiene entonces como la sucesión de entradas que minimiza la función costo partiendo

23

de esa condición inicial. El algoritmo de control en un esquema MPC resuelve este problema cada N períodosde muestreo, con N ≤M . Los pasos del proceso de control son los siguientes: en el instante inicial, el sistemaparte de una condición inicial, y, fijo el horizonte de predicción, se utiliza el modelo de predicción para hallarla sucesión de entradas que minimizan la función costo. De esas entradas se aplican las primeras N, llevando elsistema hacia determinado estado final. En este punto se vuelve a repetir el proceso de optimización partiendode esta nueva condición inicial, hallando nuevamente una serie de entradas de control de las cuales solo seaplican las primeras N, y así sucesivamente. Es por esto que a N se le llama horizonte de control; las accionesde control calculadas en cada optimización se aplican solo durante los siguientes N períodos de muestreo,lapso al cabo del cual se vuelve a calcular la optimización en las entradas a partir del estado actual del sistemacomo condición inicial. Es importante destacar que las sucesivas minimizaciones se realizan en tiempo real, esdecir, a medida que evoluciona el sistema a controlar.

A pesar de que, de manera similar a la descripta en la sección anterior para el problema LQR, esposible en este caso agregarle mas peso en la función de costo a las entradas eligiendo de manera apropiada lasmatrices Q y R (y así achicar ls entradas utilizdas), una de las ventajas de la formulación MPC del problemade control es que permite integrar al problema las restricciones físicas sobre las entradas de manera explícita.Es decir, al problema de minimización numérica de la función costo se le pueden imponer restricciones deltipo uMIN < u < uMAX . Esto es particularmente útil para nuestro caso debido a que, como detallamos en lasección anterior, existen restricciones físicas a los valores que pueden tomar las entradas; las deflecciones delelevador y la velocidad del eje de giro sólo pueden variar dentro de cierto rango. En resumen, el algoritmo decontrol MPC, resuelve de manera numérica, cada N períodos de muestreo el siguiente problema:

min[u(k)]J = min[u(k)]

M∑k=1

x(k)TQx(k) +N∑k=1

u(k)TRu(k) (4.5)

sujeto a:x(k + 1) = Φx(k) + Γu(k) (4.6)

uMIN < u < uMAX (4.7)

x(0) = xo (4.8)

Actualizando por supuesto la condición inicial del problema xo al estado en que se encuentra elsistema luego de transcurridos los N períodos de muestreo anteriores.

Observamos que en un esquema de control MPC existen varios parámetros que se pueden ajustarpara acercar el rendimiento del sistema al deseado. Al igual que en el caso expuesto en la sección anterior, esposible variar las matrices Q y R de la función costo para asignarle distintos pesos a cada término. También sepueden obtener distintos resultados ajustando el horizonte de predicción y el horizonte de control.

La ventaja principal que parecería exhibir este método con respecto al presentado en la secciónanterior consiste en que en esta formulación es posible introducir de manera explícita en la resolución delproblema las restricciones físicas existentes sobre las acciones de control.

Concluimos esta sección explicando como adaptar el mecanismo de control MPC a el esquema gainscheduling propuesto en la sección anterior. Para lograr este propósito, basta con cambiar, al cambiar de unatrayectoria estacionaria a la siguiente, el modelo de predicción utilizado por el algorítmo de control MPC, alcorrespondiente a la linealización del sistema alrededor de la nueva situación de vuelo.

4.2. SimulacionesEl propósito de la presente sección es presentar algunas de las simulaciones realizadas a los efectos

de probar las estrategias de control MPC recién expuestas, en nuestro modelo en variables de estado. Al igual

24

que en el capítulo anterior y el resto de este trabajo, todas las simulaciones fueron realizadas utilizando laherramienta SIMULINK de Matlab. Los controladores MPC utilizados se generaron utilizando la herramientaMPC toolbox de Matlab. Los modelos de predicción utilizados junto con esta herramiente fueron generados apartir de las rutinas de linealización del MVE que desarrollamos las cuales detallamos en el capítulo anterior.

La pruebas realizadas siguieron la misma línea que las expuestas en el cápítulo anterior. La primeraprueba consistió en ver como reaccionaron distintos sistemas de control MPC ante una perturbación alrededorde las condiciones iniciales de una trayectoria horizontal a velocidad constante de 30m/s. Esta prueba serealizó sobre distintos controladores MPC en los que se utilizaron distintos intervalos de muestreo (T ),horizontes de predicción (M ) y horizontes de control. Las trayectorias resultantes en el plano (x, z), parauna perturbaciones de 0,2rad y 0,5rad en θ para los distintos controladores se presentan en la figura 4.1. Entodos los casos expuestos en esta sección los parámetros de la función costo se eligieron de entre las opcionespropuestas por el toolbox de manera tal de favorecer la convergencia rápida del sistema sobre la minimizaciónde las entradas.

(a) T = 0,1s, M = 4 y N = 2.Perturbación de 0,2rad.

(b) T = 0,01s, M = 100 y N = 2.Perturbación de 0,2rad.

(c) T = 0,01s, M = 100 y N = 2.Perturbación de 0,5rad.

Figura 4.1: Respuestas del controlador MPC a distintas perturbaciones en las condiciones iniciales de vuelo

Observamos de estas simulaciones que para T = 0,1s, con M = 4 y N = 2 que el sistemadiverge. Aumentamos entonces la frecuencia de muestreo a T = 0,01s. Nuevamente para valores de M entre4 y 10 el sistema diverge. Aumentamos el orden de magnitud del intervalo de predicción tomando ahoraM = 100. Observamos que en este caso la convergencia es bastante rápida para una perturbación de 0,2radpero sumamente lenta para una perturbación de 0,5rad.

Figura 4.2: Trayectoria en el plano (x, y) obtenida de la Prueba 2 superpuesta a la trayectoria deseada en rojo pplace.

25

La segunda prueba que realizamos fue la que denominamos Prueba 2 en el capítulo anterior. Con estaprueba pretendemos verificar que tan bueno es el controlador MPC para lidiar con el tipo de perturbaciones quesurgen de pasar de una trayectoria estacionaria a otra. Los parámetros utilizados fueron T = 0,01s, M = 100y N = 2. El resultado de esta prueba se puede apreciar en la figura 4.2, donde presentamos nuevamente latrayectoria seguida en el plano (x, y) junto con la trayectoria deseda en rojo.

No incluimos gráficas de las entradas en función del tiempo pero verificamos que se comportan deacuerdo a lo esperado, es decir en ningún momento se escapan del rango en que son válidas físicamente. Eneste sentido, este controlador resulta ser superior a los controladores utilizados en los capítulos anteriores.

26

Capítulo 5

Linealización exacta

5.1. Control utilizando linealización exactaConsideramos para esta sección aquellos sistemas se que se pueden expresar de la forma:

x = f(x) + g(x)u (5.1)

es decir, donde la entrada u aparece de manera afín. En esta situación particular, aunque no demasiadorestrictiva, es que se puede aplicar la linealización exacta entrada-salida del sistema. Esta técnica consisteen encontrar un cambio de coordenadas que expresa dicho sistema de manera tal que es posible, en principio,llegar a una relación lineal entre la entrada (en realidad una nueva entrada al sistema) y ciertas salidas medianteuna realimentación de estados.

A los efectos de realizar la descripción del proceso de linealización exacta, cambiamos en esta secciónla notación utilizada por la siguiente:

x1 = xx2 = zx3 = θx4 = vBxx5 = vBzx6 = ωBy

(5.2)

No es el propósito de este trabajo realizar una descripción del proceso de linealización exacta enel caso general, sino que meramente nos limitamos, en esta sección, a una descripción esquemática de suaplicación a nuestro modelo. A su vez, debido a la complejidad de las cuentas involucradas, omitimos eldesarrollo explícito de éstas.

Dado que la linealización exacta entrada-salida sólo es posible para un número de salidas igual (omenor) al número de entradas al sistema [2][8], debemos elegir dos estados (o funciones de los estados) aconsiderar como salidas, alrededor de las cuales se efectuará la linealización exacta. Debido a que nuestrointerés es que el avión siga determinada trayectoria, lo que precisamos realmente es controlar la posición delcentro de masa. Elegimos entonces las variables de estado x1 y x2 como salidas alrededor de las cuales efectuarla linealización exacta. Con esto en mente, hacemos notar que aún así es necesaria la estabilidad de las otrasvariables de estado.

Otro aspecto importante de este procedimiento es el siguiente; luego de realizado el cambio decoordenadas y la realimentación de estados necesaria, la relación entre la nueva entrada al sistema y la salida nosólo es lineal, sino que toma una forma particular. Más específicamente, cada una de las salidas se obtiene dela aplicación de una cadena de determinada cantidad de integradores a una de las nuevas entradas en particular.

Antes de comenzar a aplicar este procedimiento debemos verificar que nuestro modelo en variablesde estado satisfaga las hipótesis necesarias, es decir que se pueda expresar de la forma 5.1. Observando dichomodelo, vemos que una de las entradas, n (la velocidad en rpm del eje de giro de la hélice) aparece elevada alcuadrado. Dado que por lo tanto esta entrada no aparece de manera afin, en principio no estaríamos dentro de

27

las hipótesis necesarias para aplicar linealización exacta. Por otro lado, nuestro propósito consiste en controlarel avión alrededor de trayectorias en línea recta a velocidad constante, para las cuales existe un punto deoperación no de la velocidad del eje de giro del sistema. Tomando dn como el deplazamiento alrededor de notenemos:

n = no + dn (5.3)

Elevando al cuadrado se obtiene:

n2 = (no + dn)2 = n2o + nodn+ dn2 (5.4)

donde podemos despreciar el término dn2 con respecto a los otros para valores de dn lo suficientemente chicos.Es por este motivo que, aunque estrictamente nos enfrentaríamos a un sistema de la forma:

x = f(x, no) + gδe(x)δe+ gdn(x, no)dn+ gdn2(x)dn2 (5.5)

en el cual la entrada no aparece de manera afín, podemos despreciar el término gdn2(x)dn2 obténiendo:

x = f(x, no) + gδe(x)δe+ gdn(x, no)dn (5.6)

Tomando dn y δe como las nuevas entradas, esta aproximación verifica las hipótesis necesarias.Trabajaremos sobre este nuevo modelo de ahora en adelante, teniendo presente que ésta es una buenarepresentación del comportamiento de nuestro sistema para valores pequeños (en comparación con no) dedn. De todas formas, será necesario probar aquellos controladores realizados en base a esta simplificación enel modelo completo, dado que éste representa de manera más fidedigna el comportamiento del sistema físicoreal.

Como mencionamos anteriormente, el paso inicial para lograr la linealización exacta consiste enencontrar un difeomorfismo que logre un cambio de coordenadas de manera tal de expresar al sistema deforma más favorable. Tomamos z como el nuevo conjunto de coordenadas en el cual expresamos el vector deestados, teniéndose un difeomorfismo Φ de manera tal que z = Φ(x). Específicamente:

z1 = Φ1(x)z2 = Φ2(x)z3 = Φ3(x)z4 = Φ4(x)z5 = Φ5(x)z6 = Φ6(x)

(5.7)

Empezamos tomando como primer nueva coordenada una de las salidas del sistema, haciendoz1 = Φ1(x) = h1(x) = x1. Derivando con respecto al tiempo se obtiene:

z1 = Lfh1(x) + Lgδeh1(x)δe+ Lgdnh1(x)dn (5.8)

donde Lfh1(x) representa la derivada de Lie de la función escalar h1(x) a lo largo del vector f(x). En virtudde los cálculos realizados sobre nuestro modelo en variables de estado, observamos que los términos Lgδeh1(x)y Lgdnh1 se anulan para todo x. Tomamos entonces z2 = Φ2(x) = Lfh1(x) como segunda nueva coordenaday derivamos con respecto al tiempo nuevamente:

z1 = z2 = LfLfh1(x) + LgδeLfh1(x)δe+ LgdnLfh1(x)dn (5.9)

28

Se observa ahora que o bien LgδeLfh1(x), o LgdnLfh1(x), no se anula para todo x. Hagamos ahora lomismo para h2(x). Tomando z3 = Φ3(x) = h2(x) = x2 y derivando con respecto al tiempo se obtiene:

z3 = Lfh2(x) + Lgδeh2(x)δe+ Lgdnh2(x)dn (5.10)

Una vez más tenemos que Lgδeh2(x) y Lgdnh2 se anulan para todo x. Por lo tanto es posible tomarz4 = Φ4(x) = Lfh2(x) y derivando una segunda vez con respecto al tiempo se llega a:

z1 = z2 = LfLfh2(x) + LgδeLfh2(x)δe+ LgdnLfh2(x)dn (5.11)

Calculando en la precedente ecuación todos los términos explicitamente, se observa que o bien LgδeLfh2(x),o LgdnLfh2(x), no se anula para todo x.

En resumen, con los cambios de coordenadas realizados hasta ahora, nos es posible expresar el sistemade la siguiente manera:

z1 = z2

z3 = z4(5.12)(

z2

z4

)= β(x) + α(x)u (5.13)

Con:

β(x) =

(LfLfh1(x)LfLfh2(x)

)(5.14)

α(x) =

(LgδeLfh1(x) LgdnLfh1(x)LgδeLfh2(x) LgdnLfh2(x)

)(5.15)

u =

(δedn

)(5.16)

Observando estas expresiones vemos que aplicando en la entrada u la realimentación de estadosu = α−1(x)(v − β(x)) y tomando v = (v1, v2)

T como nueva entrada al sistema se llega a la relación linealentrada-salida buscada:

z1 = x1 = v1

z2 = x2 = v2(5.17)

Por supuesto, será posible aplicar esta realimentación siempre y cuando la matriz α(x) sea invertible.Calculando explicitamente dicha matriz por si sola y durante simulaciones del comportamiento del sistemarealimentado de esta forma hemos verificado que existen intervalos bastante amplios de las variables de estadoen los que la invertibilidad se satisface.

Definimos el grado relativo asociado a una determinada salida como el mínimo número de veces quese debe derivar dicha salida con respecto al tiempo para que aparezca alguna de las entradas en la expresiónobtenida de las sucesivas derivaciones. En nuestro caso de múltiples salidas, definimos también el vector gradorelativo como r = [r1, r2], ri representando el grado relativo asociado a la i-ésima salida. Vemos que el gradorelativo se corresponde al número de integraciones que llevan de cada una de las nuevas entradas a su salidacorrespondiente, luego de realizada la linealización exacta. Para nuestro problema el vector grado relativo esr = [2, 2], es decir, luego de realizar la realimentación que linealiza el sistema, ambas entradas pasan pordos integradosres hasta llegar a las salida. El conjunto de pasos realizados hasta ahora y el resultado final seesquematizan en la 5.1. Es interesante notar también que el efecto de las entradas en las salidas ha quedadodesacolplado, es decir, que la entrada uno sólo influye en la salida uno y sucede de manera análoga para la dos.

Resta en este punto del desarrollo explicar como, utilizando la nueva relación lineal entrada salida,

29

Figura 5.1: Realimentación de estados que realiza la linealización exacta entrada salida.

resolvemos el problema de tracking. Tomando el desplazamiento de las variables x1 y x2 alrededor de susvalores deseados x1d(t) y x22d(t):

x1 = x1 − x1d

x2 = x2 − x2d(5.18)

Imponiendo a la entrada uno por ejemplo, v1 = x1d − K11x1 − K12x1, observamos que nosencontramos en la situación de controlar, mediante una realimentación de estados, el sistema lineal en eldesplazamiento de x1 alrededor de su trayectoria deseada:

¨x = −K11x1 −K12x1 (5.19)

Además, el sistema lineal de orden dos, al cual le estamos aplicando la realimentación de estados,toma una forma bastante particular, conocida como la forma canónica controlable, que no es otra cosa quela cadena de integradores a la que nos referimos anteriormente. Para elegir la matriz de realimentación K demanera tal de lograr la estabilización del origen de este sistema, y por lo tanto la resolución del problema detracking en x1, nos erferimos a las técnicas expuestas en el capítulo de control lineal. Finalmente, notamos quela situación en lo que respecta a x2 es completemanete análoga y se resuelve de la misma forma. Presentamosen la figura 5.1 una versión esquemática del diagrama de bloques correspondiente a la implementación de estecontrolador.

Figura 5.2: Realimentación de estados que estabiliza el sistema linealizado.

Ahora bien, a pesar de que las variables de estado que más interesa controlar son x1 y x22, es necesarioverificar que el comportamiento de las otras variables de estado es estable al realizar el control que resuelve elproblema de tracking para x1 y x22. En principio podríamos buscar completar el difeomorfismo Φ eligiendo

30

las funciones:z5 = Φ5(x)z6 = Φ6(x)

(5.20)

Estudiando la evolución de las variables z5 y z6, cuando el sistema se encuentra bajo los efectos delas acciones de control expuestas anteriormente, podríamos, deshaciendo el cambio de variable, estudiar elcomportamiento de las restantes variables en el vector de estados original. La evolución temporal de z5 y z6

está dada por:z5 = LfΦ5(x) + LgδeΦ5(x)δe+ LgdnΦ5(x)dnz6 = LfΦ6(x) + LgδeΦ6(x)δe+ LgdnΦ6(x)dn

(5.21)

Podríamos ver si es posible elegir Φ5(x) y Φ5(x) de manera tal que la entrada no aparezca en lasexpresiones de las derivadas de z5 y z6, de manera tal de que la evolución temporal de dichas variables se déde manera autónoma, y estudiarla solamente en términos de la evolución impuesta para z5 y z6 por parte delsistema de control. Sin embargo, esto implicaría hallar Φ5(x) y Φ5(x) que verifiquen:

LgδeΦ5(x) = 0LgdnΦ5(x) = 0LgδeΦ6(x) = 0LgdnΦ6(x) = 0

(5.22)

Estas relaciones constituyen un sistema de ecuaciones en derivadas parciales en Φ5(x) y Φ5(x) que, no sóloparece ser, en virtud de las expresiones de gδe y gdn bastante complejo de resolver, sino que además nopodemos asegurar la existencia de una solución. Para poder asegurarlo sería necesario, en virtud del teorema deFrobenius, verificar que existe algún entorno de algún punto xo del vector de estados, para el cual la distribucióndefinida por (gδe(x), gdn(x)) es involutiva. Esto de por si parece ser, nuevamente, debido a la complejidad degδe y gdn, bastante dificil de probar por lo que nos limitamos meramente a estudiar el comportamiento de lasvariables de estado restantes (aquellas que no son x1 y x2) bajo los efectos de las acciones de control, mediantesimulaciones.

Observando las simulaciones realizadas podemos apreciar que este método también tiene el defectode imponer en la entrada al sistema acciones de control por fuera de los límites físicos que pueden tomarestas magnitudes. De hecho, dichos límites son excedidos por un márgen varios órdenes de magnitud mayora lo que lo exceden los métodos prupuestos anteriormente en situaciones similares. Concluímos esta sección,entonces, proponiendo un método que pretende subsanar esta problemática mediante la combinación de lalinealización exacta entrada-salida con la técnica de control mediante modelo de predicción expuesta en elcapítulo anterior. El esquema de control MPC expuesto en la sección precedente, utiliza, como modelo depredicción para realizar la optimización, una aproximación lineal de la relación entrada-salida del sistema.Ahora bien, en este contexto podríamos decidir aplicar este esquema de control al sistema para el cual ya serealizó la linealización exacta entrada-salida, y utilizar como modelo de predicción el modelo de lineal que seobtuvo para esta relacíón. Esta formulación del problema MPC tiene como ventaja con respecto a la originalque, al estar considerando la relación entre la nueva entrada, que hemos denominado v, y las salidas x1 yx2, obtenemos un modelo de predicción para la dinámica entre estas magnitudes que es exactamente lineal;correspondiente a la cadena de integradores que fue expuesta anteriormente. Esto supone una ventaja conrespecto a la aproximación realizada en el esquema original de control MPC. Esta ventaja, sin embargo, vienecon una contrapartida; las restricciones estrictas de la forma uMIN < u < uMAX a las cuales sometíamos a laentrada u al sistema al momento de realizar la optimización, se deben formular ahora en términos de la nuevaentrada v, ya que es ésta la que se calcula de manera tal de minimizar el costo. Observando que la relaciónentre ambas señales es de la forma:

u = α−1(x)(v − β(x)) (5.23)

podemos escribir las restricciones físicas sobre las señales de entrada de la siguiente manera:

α(x)(uMIN + β(x)) < v < α(x)(uMAX + β(x)) (5.24)

31

Dado que α(x) y β(x) son funciones no lineales de los estados, las restricciones impuestas por5.24 dificultan de manera bastante considerable la resolución numérica del problema de minimización.Consideramos que este problema vá mas allá de los alcances de este trabajo y lo mencionamos simplementecomo una posible alternativa sobre al cual se podría trabajar en el futuro.

5.2. SimulacionesEn esta sección presentamos las simulaciones realizadas para probar el comportamiento del

controlador sintetizado a partir de la linealización exacta. Resulta sumamente importante notar que estassimulaciones se realizan sobre una versión simplificada del sistema en la que se elimina el término de laentrada que no aparece de manera afín. En el desarrollo de la aplicación de la linealización exacta al sistemasupusimos que este término iba a resultar ser despresciable si las entradas se mantenían dentro de cierto rango.Esto resulta no ser así, como veremos a continuación. Más adelante en esta sección examinamos la posiblilidadde aplicar este controlador al sistema sin esta simplificación.

Nuevamente, simulamos el comportamiento del sistema en la situaciones determinadas por laspruebas 1 y 2, como fueron definidas en los capítulos anteriores. El primer resultado que presentamos entonceses el comportmiento del sistema al intentar seguir la trayectoria definida en la Prueba 1. En este caso elegimosla matriz K de realimentación de estados de manera de ubicar los polos en P1 = −1,5Hz y P2 = −10Hz.Observamos que, a pesar de que el seguimiento de la trayectoria deseada tiene muy poco error (como se apreciaen la figura 5.4) las acciones de control llegan a valores sumamente grandes (como se ve en la figura 5.4),incluso varios órdenes de magnitud por arriba de los límites impuestos por el sistema físico.

Figura 5.3: Trayectoria en el plano (x, y) sin ninguna perturbación en las condiciones iniciales

Otro problema que apreciamos en esta simulación con respecto a este sistema de control es que lavariable θ se comporta de manera inestable. Diverge de manera muy rápida llegando a valores que resultanfísicamente imposibles si se considera un avión limitado a comportarse dentro de rangos de las variables decontrol físicamente razonables. Al aplicarse acciones de control de muchos órdenes de magnitud por encimade los límites físicos posibles sucede un comportamiento en la variable θ como el que se aprecia en la figura5.5.

Otro problema que ocurre debido a los valores inmensos que toman las señales de control concierne

32

(a) Evolución temporal de la acción de control δe. (b) Evolución temporal de la acción de control dn.

Figura 5.4: Evolución temporal de las distintas acciones de control para la prueba 1 sin perturbación en la condicióninicial. Se debe aclarar que el valor que parece ser constante cerca de cero debido a la escala, en realidad se encuentramuy por fuera de los márgenes requeridos.

Figura 5.5: Trayectoria en el plano (x, y) sin ninguna perturbación en las condiciones iniciales

a la posibilidad de aplicación de este controlador al sistema sin simplificar en que la entrada no aparece demanera afín. Observamos que, debido a que las entradas son demasiado grandes, no se cumple la hipótesisnecesaria para poder despreciar el término afín. Efectivamente, al simular el comportamiento del controladorsobre el sistema completo, observamos que este diverge.

En lo que respecta a la respuesta del sistema ante perturbaciones en las condiciones iniciales en elmarco de la Prueba 1, observamos en la figura 5.6, que este logra seguir rápidamente la trayectoria deseadafrente a una perturbación de 0,5rad. Por supuesto que el resto de las variables involucradas reproducentambién, en este caso, el comportamiento desfavorable exhibido en el caso sin perturbación.

Finalmente, exponemos la respuesta del sistema ante la Prueba 2. En este caso, decidimos elegirla realimentación de estados de manera tal de ubicar los polos del sistema linealizado realimentado enP11 = −0,1Hz y P2 = −1Hz, bajo la suposición que, de enlentecer la respuesta del sistema, las variablesde control en general disminuirían. En la figura 5.7 apreciamos que el seguimiento de la trayectoria deseada

33

Figura 5.6: Trayectoria en el plano (x, y) bajo una perturbación de 0.5 rad en las condiciones iniciales

es bastane cercano. Observamos además un sensible decrecimiento de las señales de entrada, pero aún seencuentran muy por afuera de los márgenes deseados.

Figura 5.7: Seguimiento en el plano (x,y) de la trayectoria deseada (en rojo).

34

Capítulo 6

Conclusión final

En este último capítulo presentamos las conclusiones obtenidas de todo el trabajo realizado.Evaluamos el desempeño de cada uno de los sistemas de control implementados y realizamos una comparaciónentre todos ellos. Por último, evaluamos la posibilidad de implementar algunos de estos métodos en el sistemacompleto en el marco de nuestro proyecto de fin de carrera y presentamos algunas posibilidades de trabajo afuturo.

6.1. Control LinealObservando el desempeño en las simulaciones de los controladores lineales implementados estamos

bastante conformes con su rendimiento. A pesar de que observamos que no logran estabilizar el sistemaalrededor de perturbaciones demasiado grandes en la Prueba 1, si son sumamente efectivos en la Prueba 2,pareciendo ser bastante efectivos en una situación de gain scheduling, asumiendo que las transiciones no sondemasiado abruptas. A pesar de que no incorporan de manera explicita las restricciones físicas de las entradasal sistema, encontramos que fue posible diseñarlos de manera tal de tener este efecto en cuenta hasta ciertopunto. Esto se dá, sin embargo, con la contrapartida de perder rapidez en la convergencia. En todo caso, susimplicidad de aplicación hace este método bastante más atractivo, por lo que sería necesario, a los efectos deevaluar su implementación dentro de nuestro proyecto, realizar más pruebas en el formato gain scheduling.

6.2. MPCPara el controlador implementado utilizando MPC, encontramos que su desempeño se asemeja

bastante al que muestra el control lineal en lo que respecta a la convergencia. Sin embargo, este método tiene laventaja de que incorpora de manera explícita en su funcionamiento las restricciones en las señales de entradaal sistema, de manera tal de que en ningún momento superan los límites establecidos. La contrapartida de estoes que posiblemente este método involucre mayor costo computacional en una implementación real (intuímosesto de el tiempo que demora la simulación en comparación con el caso lineal en las mismas condicones).El rendimiento de este controlador en la Prueba 2 parece bastante bueno, lo que nos motiva a evaluar suimplementación en nuestro proyecto y simular más a fondo su implementación junto con una estratégia degain scheduling. Sin embargo, esto significaría independizarnos de el toolbox de Matlab a los efectos de laminimización numérica, problema que podría ser complicado de afrontar.

6.3. Linealización exactaEl desempeño del controlador desarrollado alrededor de la linealización exacta es el que resultó más

insatisfactorio, largamente. La gigantesca complejidad de las cuentas involucradas en su implementación haceque su desarrollo sea sumamente arduo. Además, su desempeño en las simulaciones resultó en señales decontrol desproporcionadamente grandes y divergencia de las variables de estado no controladas, lo que haceprohibitiva su implementación en un sistema real. La única posibilidad que vemos de implementación de un

35

sistema de este tipo sería junto con una estrategia de control MPC, de manera de respetar las restriccionesexistentes en las entradas del sistema. Aún así, observamos que dichas restricciones expresadas en este marco,hacen que el problema de minimización numérica de la función costo sea sumamente complicado de resolver,por lo que desconfiamos que valga la pena continuar trabajando en esta dirección, en comparación con losresultados obtenidos con técnicas de control más simples.

6.4. Trabajo a futuroEn lo que respecta a la implementación de algunas de estas técnicas en el modelo completo

involucrado en nuestro proyecto de fin de carrera, vemos tanto las estrategias de control lineales como elMPC como buenas opciones. Aún así, creemos que es necesario un testeo más exhaustivo de ambas ténicas,así como una evaluación de el costo computacional de cada una de ellas, a los efectos de implementarlas en larealidad. En lo que respecta a trabajo futuro en otras direcciones, nos interesaría evaluar métodos que permitanhacer el control más robusto frente a diferencias entre nuestro modelo y el sistema real.

36

Apéndice A

Acrónimos utilizados

. CNL - Control No Lineal

. GS - Gain Scheduling

. LQR - Lineal Quadratic Regulator

. MPC - Model Predictive Control

. MVE - Modelo en Variables de Estado

. SB - Sistema Body - Sistema de referencia con base (iB, jB, kB)

. SI - Sistema Inercial - Sistema de referencia con base (iI , jI , kI)

. UAV - Unmanned Aerial Vehicle

37

Índice de figuras

2.1. Ilustrativa de los distintos sistemas de referencia a utilizar y las coordenadas (x, y, θ) . . . . . . . . . 4

3.1. Trayectoria a seguir para la prueba 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.2. Trayectorias obtenidas en el plano (x, z) como resultado de la prueba 1 sin controlador, con y sin

perturbación en las condiciones iniciales de ángulo θ. . . . . . . . . . . . . . . . . . . . . . . . . 103.3. Trayectoria obtenida mediante la realización de la prueba 2. Las variables de control u(t) se son de la

forma escalón. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.4. Trayectoria obtenida mediante la realización de la prueba 2. Las variables de control u(t) se obtienen

interpolando la funciones utilizadas para u(t) en el caso anterior. . . . . . . . . . . . . . . . . . . . 123.5. Ilustrativa del esquema de realimentación de estado utilizado. . . . . . . . . . . . . . . . . . . . . 143.6. Trayectoria en el plano (x, y) obtenida de la simulación 1 pplace. . . . . . . . . . . . . . . . . . . . 163.7. Trayectoria en el plano (x, y) obtenida de la simulación 2 pplace. . . . . . . . . . . . . . . . . . . . 173.8. Evolución temporal de las distintas acciones de control para la simulación 2 pplace. . . . . . . . . . . 173.9. Trayectoria en el plano (x, y) obtenida de la simulación 3 pplace. . . . . . . . . . . . . . . . . . . . 183.10. Evolución temporal para la acción de control δe obtenida de la simulación 3 pplace. . . . . . . . . . . 183.11. Resultados obtenidos para la simulación 4 pplace. . . . . . . . . . . . . . . . . . . . . . . . . . . 193.12. Trayectoria en el plano (x, y) obtenida de la simulación 1 LQR. . . . . . . . . . . . . . . . . . . . 203.13. Evolución temporal de las distintas acciones de control para la simulación 1 LQR. . . . . . . . . . . 203.14. Trayectoria en el plano (x, y) obtenida de la simulación 2 LQR. . . . . . . . . . . . . . . . . . . . 213.15. Evolución temporal de las distintas acciones de control para la simulación 2 LQR. . . . . . . . . . . 213.16. Trayectoria en el plano (x, y) obtenida de la simulación para el controlador LQR con el sistema

linealizado en torno a las velocidades para la prueba 1. . . . . . . . . . . . . . . . . . . . . . . . . 223.17. Evolución temporal de las distintas acciones de control obtenida de la simulación para el controlador

LQR con el sistema linealizado en torno a las velocidades para la prueba 1. . . . . . . . . . . . . . . 22

4.1. Respuestas del controlador MPC a distintas perturbaciones en las condiciones iniciales de vuelo . . . . 254.2. Trayectoria en el plano (x, y) obtenida de la Prueba 2 superpuesta a la trayectoria deseada en rojo pplace. 25

5.1. Realimentación de estados que realiza la linealización exacta entrada salida. . . . . . . . . . . . . . 305.2. Realimentación de estados que estabiliza el sistema linealizado. . . . . . . . . . . . . . . . . . . . 305.3. Trayectoria en el plano (x, y) sin ninguna perturbación en las condiciones iniciales . . . . . . . . . . 325.4. Evolución temporal de las distintas acciones de control para la prueba 1 sin perturbación en la condición

inicial. Se debe aclarar que el valor que parece ser constante cerca de cero debido a la escala, en realidadse encuentra muy por fuera de los márgenes requeridos. . . . . . . . . . . . . . . . . . . . . . . . 33

5.5. Trayectoria en el plano (x, y) sin ninguna perturbación en las condiciones iniciales . . . . . . . . . . 335.6. Trayectoria en el plano (x, y) bajo una perturbación de 0.5 rad en las condiciones iniciales . . . . . . 345.7. Seguimiento en el plano (x,y) de la trayectoria deseada (en rojo). . . . . . . . . . . . . . . . . . . . 34

38

Bibliografía

[1] Ingeniería de Control Moderna - Katsuhiko Ogata. Tercera edición 1998.

[2] Nonlinear Systems - H. K. Khalil. Segunda edición 1996.

[3] A Simulink Toolbox for Flight Dynamics and Control Analysis - Marc Rauw. Segunda edición 2001.

[4] Airplane Flight Dynamics and Automatic Flight Control, Parte I - Jan Roskam. Tercera edición 2001.

[5] Airplane Flight Dynamics and Automatic Flight Control, Parte II - Jan Roskam. Tercera edición 2001.

[6] A Simulink Toolbox for Flight Dynamics and Control Analysis - Marc Rauw. Segunda edición 2001.

[7] Applied Nonlinear Control - Jean-Jacques E. Slotine, Weiping Li. 1991.

[8] Nonlinear Control Systems - Alberto Isidori. Segunda edición. 1989.

[9] Constrained Control of Nonlinear Systems - Vesna Nevistic. 1997.

[10] Optimal Control Theory. An introduction - Donald. E. Kirk. 2004.

39

monografía de control no lineal · key words: control no lineal, mpc, linealización exacta, uavs,...

Documents