Portada Tesis de Maestria - repositorio.uniandes.edu.co

65
i Universidad de los Andes Facultad de ingenieria Departamento de ingenieria eléctrica y electrónica MAESTRIA EN INGENIERIA ELECTRONICA Y TELECOMUNICACIONES TESIS PARA OPTAR AL TITULO DE MAGISTER EN INGENIERIA ELECTRONICA CON ENFASIS EN CONTROL: MODELAMIENTO, DISEÑO Y SIMULACIÓN DE UN SISTEMA DE CONTROL PARA UN SISTEMA DE PÉNDULO DOBLE INVERTIDO. (SPDI) Autor: Ing. Mg. Germán Velandia Peláez [email protected] Asesor tesis: Phd Mauricio Duque [email protected] Bogotá, febrero 2007

Transcript of Portada Tesis de Maestria - repositorio.uniandes.edu.co

Page 1: Portada Tesis de Maestria - repositorio.uniandes.edu.co

i

Universidad de los Andes Facultad de ingenieria

Departamento de ingenieria

eléctrica y electrónica

MAESTRIA EN INGENIERIA ELECTRONICA Y TELECOMUNICACIONES

TESIS PARA OPTAR AL TITULO DE MAGISTER EN INGENIERIA ELECTRONICA CON ENFASIS EN

CONTROL:

MODELAMIENTO, DISEÑO Y SIMULACIÓN DE UN SISTEMA DE CONTROL PARA UN SISTEMA DE

PÉNDULO DOBLE INVERTIDO. ( S PD I )

Autor: Ing. Mg. Germán Velandia Peláez [email protected]

Asesor tesis: Phd Mauricio Duque [email protected]

Bogotá, febrero 2007

Page 2: Portada Tesis de Maestria - repositorio.uniandes.edu.co

ii

A mi hijo Germán Roberto, quien siendo un niño especial me enseña a entender la integralidad del universo.

Page 3: Portada Tesis de Maestria - repositorio.uniandes.edu.co

iii

TABLA DE CONTENIDO

Pag.

Resumen (abstract) ----------------------------------------------------------------------------------------------------- 1 Palabras claves ---------------------------------------------------------------------------------------------------------- 1 CAPITULO PRIMERO 1.- INTRODUCCIÓN ---------------------------------------------------------------------------------------------------- 2

1.1.- Presentación -------------------------------------------------------------------------------------------------- 2 1.2.- El Sistema de Péndulo Doble Invertido ---------------------------------------------------------------- 2 1.3.- Objetivos ------------------------------------------------------------------------------------------------------- 2

1.3.1.- Objetivo general -------------------------------------------------------------------------------------- 2 1.3.2.- Objetivos específicos ------------------------------------------------------------------------------- 2

CAPITULO SEGUNDO 2.- MARCO TEORICO -------------------------------------------------------------------------------------------------- 3

2.1.- La Teoría de Control Automático y los Sistemas Dinámicos ------------------------------------- 3 2.2.- Modelamiento matemático de Sistemas Dinámicos ------------------------------------------------ 5 2.3.- Análisis de Sistemas en el Espacio de Estados ----------------------------------------------------- 6

2.3.1.- Representación entrada-salida (E–S) ---------------------------------------------------------- 7 2.3.2.- Transformaciones canónicas --------------------------------------------------------------------- 7 2.3.3.- Controlabilidad y observabilidad en el espacio de estados ------------------------------- 7

2.3.3.1.- Controlabilidad completa del estado -------------------------------------------------- 8 2.3.3.2.- Observabilidad completa de estado --------------------------------------------------- 13

2.4.- Estabilidad de los Sistemas de Control ---------------------------------------------------------------- 16 2.4.1.- Teorema de Estabilidad de Lyapunov para sistemas estacionarios -------------------- 17

2.4.1.1.- Estabilidad Asintótica Global ------------------------------------------------------------ 19 2.4.1.2.- Inestabilidad --------------------------------------------------------------------------------- 19 2.4.1.3.- El Principio de Invariancia --------------------------------------------------------------- 20 2.4.1.4.- Región de Atracción ----------------------------------------------------------------------- 20 2.4.1.5.- Sistemas Lineales y Linealización ----------------------------------------------------- 21

2.4.2.- Teorema de Estabilidad de Lyapunov para sistemas inestacionarios ------------------ 24 2.4.2.1.- Sistema lineal inestacionario ------------------------------------------------------------ 25 2.4.2.1.- Teoremas Conversos ---------------------------------------------------------------------- 26

2.5.- Estrategia de control ----------------------------------------------------------------------------------------- 27 2.5.1.- Control Óptimo Cuadrático ------------------------------------------------------------------------- 27

CAPITULO TERCERO 3.- Modelamiento Matemático del Sistema ------------------------------------------------------------------------ 30

3.1.- Descripción del Sistema ------------------------------------------------------------------------------------ 30 3.2.- Ecuaciones dinámicas del péndulo doble invertido -------------------------------------------------- 32

3.2.1 Cálculo de la Energía Cinética y de la Energía Potencial del sistema de péndulo doble invertido ----------------------------------- 32 3.2.2 Ecuaciones de Euler-Lagrange --------------------------------------------------------------------- 35

CAPITULO CUARTO 4. Representación en el Espacio de Estados ---------------------------------------------------------------------- 38

4.1 Modelo de Estado no lineal ---------------------------------------------------------------------------------- 38 4.2 Modelo de Estado Lineal ------------------------------------------------------------------------------------- 42

4.2.1 Punto de operación ------------------------------------------------------------------------------------ 44 4.2.2.- Cambio de variables de estado ------------------------------------------------------------------- 46

Page 4: Portada Tesis de Maestria - repositorio.uniandes.edu.co

iv

4.3.- Parámetros para el ejercicio de simulación del sistema de péndulo doble invertido -------- 47 4.3.1. Relación entre los parámetros del sistema ----------------------------------------------------- 48 4.3.2. Matrices y ecuación característica del sistema ---------------------------------------------- 48

CAPITULO QUINTO 5. Control Óptimo -------------------------------------------------------------------------------------------------------- 48

5.1 Regulador Linear Cuadrático ------------------------------------------------------------------------------- 49 5.2. Determinación de las matrices de ponderación ------------------------------------------------------- 50

CAPITULO SEXTO 6. Resultados -------------------------------------------------------------------------------------------------------------- 50

6.1. Simulación del sistema en tiempo continúo ------------------------------------------------------------ 50 6.1.2. Resultados simulación sistema del péndulo doble invertido ------------------------------- 50

6.1.2.1. Modelo con fricción ------------------------------------------------------------------------- 50 6.1.2.2. Modelo con fricción despreciable ------------------------------------------------------- 55

6.2. Análisis simulación del sistema del péndulo doble invertido --------------------------------------- 57 6.2.1. Modelo no lineal en lazo abierto ------------------------------------------------------------------- 57 6.2.2. Modelo lineal en lazo abierto ----------------------------------------------------------------------- 57 6.2.3. Modelo no lineal en lazo cerrado ------------------------------------------------------------------ 58 6.2.4. Modelo lineal en lazo cerrado ---------------------------------------------------------------------- 58

6.3. Sistema en Tiempo Discreto -------------------------------------------------------------------------------- 59 6.3.1. Sistema discreto en lazo abierto ------------------------------------------------------------------- 59 6.3.2. Sistema discreto en lazo cerrado ------------------------------------------------------------------ 60

6.4 Simulación del sistema del péndulo doble invertido con fricción despreciable ----------------- 60 CAPITULO SEPTIMO 7. Conclusiones ----------------------------------------------------------------------------------------------------------- 60 BIBLIOGRAFIA ----------------------------------------------------------------------------------------------------------- 61

INDICE DE FIGURAS

Figura 2.1. Diagrama de un sistema dinámico -------------------------------------------------------------------- 3 Figura 2.2. Diagrama de un sistema de control de lazo cerrado --------------------------------------------- 5 Figura 2.3 Diagrama de bloques de un sistema en el espacio de estados -------------------------------- 6 Figura 2.4 Representación geométrica de los conjuntos para el teorema de Lyapunov --------------- 17 Figura 2.5 Curvas de nivel de una función de Lyapunov ------------------------------------------------------- 18 Figura 2.6. Sistema de control lazo cerrado ----------------------------------------------------------------------- 29 Figura 3.1. Sistema de Péndulo Doble Invertido ------------------------------------------------------------------ 31 Figura 3.2. Sistema del péndulo doble invertido montado en un carrito ------------------------------------ 34 Figura 4.1. Sistema lineal en variables de estado. Lazo abierto ---------------------------------------------- 47 Figura 5.1. Sistema lineal en variables de estado. Lazo cerrado --------------------------------------------- 49 Figura 6.1. Pulso de entrada ------------------------------------------------------------------------------------------- 50 Figura 6.2. Sistema no lineal en lazo abierto ---------------------------------------------------------------------- 57 Figura 6.3. Sistema lineal en lazo abierto -------------------------------------------------------------------------- 57 Figura 6.4. Sistema no lineal en lazo cerrado --------------------------------------------------------------------- 58 Figura 6.5. Sistema lineal en lazo cerrado ------------------------------------------------------------------------- 58 Figura 6.6. Respuesta en tiempo discreto. Lazo abierto ------------------------------------------------------- 59 Figura 6.7. Respuesta en tiempo discreto. Lazo cerrado ------------------------------------------------------ 60

Page 5: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 1 de 61

Modelamiento, diseño y simulación de un sistema de control para un sistema

de péndulo doble invertido. ( S P D I )

GERMAN VELANDIA PELAEZ

CODIGO 200418412 [email protected]

Resumen (abstract) – En este trabajo se realiza el modelamiento matemático, el diseño y simulación de un sistema de control para un sistema de péndulo doble invertido, (SPDI), de modo que pueda mantenerse en la posición vertical invertida ante posibles perturbaciones. El modelamiento esta basado en las ecuaciones de euler-lagrange obtenidas especificando el lagrangiano como la diferencia de la energía cinética y la energía potencial del sistema de péndulo doble invertido montado en un carrito que se desplaza en un riel horizontal de longitud limitada, obteniendo un sistemas de tres ecuaciones diferenciales de segundo orden, que se transforman a un formato de seis ecuaciones diferenciales ordinarias de primer orden. La estrategia de control seguida ha sido la de un sistema de control óptimo que minimiza un funcional de costo cuadrático probando un regulador lineal cuadrático (LQR). La simulación nos presenta un adecuado desempeño para el sistema de LQR, alrededor del punto de equilibrio: posición vertical invertida del péndulo doble; ante desviaciones de dicha posición del péndulo doble invertido. La simulación nos presenta un comportamiento tanto del modelo linealizado, como del modelo no lineal aceptable. Palabras claves: Grados de libertad (DOF), Sistema de péndulo doble invertido (SPDI), Modelo no lineal (MNL), Modelo linealizado (ML). Control Óptimo.

Page 6: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 2 de 61

CAPITULO PRIMERO 1.- INTRODUCCIÓN 1.1.- Presentación Nos proponemos con este trabajo la aplicación de los conocimientos adquiridos en los diversos estudios correspondientes a la maestría en ingeniería electrónica, en lo que se refiere a análisis y diseño de sistemas de control, por ello elegimos como sistema de estudio un sistema de péndulo doble invertido (SPDI). El SPDI representa un problema muy interesante desde el punto de vista de control ya que permite involucrarnos en varias de las dificultades asociadas con los problemas de control de los sistemas dinámicos, a su vez presenta particular interés académico, porque permite la aplicación de diversas técnicas de control e ilustrar su comportamiento. Son varias las universidades que tienen entre sus elementos de laboratorio este tipo de sistemas para probar diferentes estrategias de control. El péndulo simple invertido (PSI) es usado en laboratorios de control para demostrar la efectividad de los sistemas de control en analogía con el control de muchos sistemas reales, [1], [2] dada la conveniencia en investigar y verificar diferentes métodos de control para sistemas dinámicos con no-linealidades de orden superior. El SPDI es más difícil de estabilizar y controlar que el péndulo simple invertido (PSI), porque hay dos brazos de péndulo vinculados entre si y montados en un carrito. Controlar del SPDI, además de considerar el desplazamiento del carrito, exige considerar la dinámica de dos péndulos y esto aumenta la complejidad del problema. El SPDI es un sistema dinámico sub-actuado que tiene menos entradas de control que grados de libertad (DOF). Hay muchos sistemas similares al SPDI, como el Acrobot, el Pendubot, el robot de gimnasta de tres-eslabones, el péndulo triple invertido, etc. El SPDI también es diferente del péndulo invertido doble rotante. El SPDI pertenece a la clase de sistemas mecánicos sub-actuados que consiste en tres sistemas interconectados (dos péndulos y un carrito) con un sólo actuador: una fuerza usada para controlar tres grados de libertad. 1.2.- El Sistema de Péndulo Doble Invertido Desde la década de los 7O, la dinámica y control de péndulos invertidos ha llamado mucho la atención. Existe una bibliografía extensa sobre estabilización [10] de péndulos simple [6, 7], de péndulos dobles [1, 3, 4], y péndulos triples [5] invertidos. Hay varios estudios sobre el swing-up [2] (balanceo-arriba) de un péndulo simple invertido y del péndulo doble invertido [5, 7]. Desde la década anterior la dinámica y control de mecanismos sub-actuados ha estado bajo investigación. Algunos trabajos interesantes se han llevado a cabo en los manipuladores sub-actuados [8, 9, 10] y robots sub-actuados tales como el Acrobot [11] y el Pendubot [12]. Estos trabajos muestran el control de posición de las junturas pasivas vía su acoplamiento dinámico con las activas. Hay varios estudios sobre trayectorias de optimización para los robots industriales [13, 14], y muchos otros sistemas totalmente actuados. Estos estudios usan métodos de disparo y colocación así como la optimización cuadrática [15] para obtener la solución óptima del problema de las condiciones de frontera. Algunos de estos estudios también se han extendido a los sistemas sub-actuados [16] y han tenido éxito con ejemplos como el dos-DOF Acrobot, una cadena simple echada y un siete-DOF el buzo humano. El sistema de péndulo doble invertido es un sistema sub-actuado. Tiene un grado de libertad (DOF) actuado y dos DOF's no actuados. Es diferente de todas las plantas mencionadas antes, dado que tiene dos coordenadas pasivas generalizadas, que hace de él un desafío real [20] para diseñar controladores. 1.3.- Objetivos El procedimiento para el diseño de un sistema de control para un sistema dinámico, se basa esencialmente en dos aspectos: el primero es el análisis del comportamiento del sistema dinámico y el segundo es la síntesis del controlador. En el análisis de sistemas dinámicos se busca verificar diferentes propiedades del sistema, en especial lo que tiene que ver con la estabilidad. El proceso de síntesis apunta a la obtención de un controlador que cumpla con determinadas condiciones y garantice el desempeño deseado del sistema dinámico. En ambas situaciones se requiere el uso de un modelo o estructura matemática que formule la dinámica del sistema dinámico de manera apropiada, o sea, que represente el comportamiento de las variables de interés del la manera mas cercana (confiable) a su comportamiento real. Por ello nos hemos propuesto los siguientes objetivos: 1.3.1.- Objetivo general El objetivo principal es el modelamiento matemático, el diseño y simulación de un sistema de control para el sistema del péndulo doble invertido SPDI, de modo que pueda mantenerse en una posición vertical invertida ante posibles perturbaciones. 1.3.2.- Objetivos específicos 1. Reconocer el estado del arte del problema en el control de un péndulo doble invertido.

Page 7: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 3 de 61

2. Realizar el modelamiento matemático del péndulo doble invertido. 3. Especificar requerimientos de diseño. 4. Proponer un método de control por optimización cuadrática para el péndulo doble invertido 5. Validar el modelo matemático y sistema de control por medio de simulación.

CAPITULO SEGUNDO 2.- MARCO TEORICO 2.1.- La Teoría de Control Automático y los Sistemas Dinámicos Se define un sistema como la combinación de un conjunto de componentes que interactúan entre si y con el medio, para la realización de acciones que permitan alcanzar un objetivo determinado. Un sistema dinámico es aquel que cambia en el tiempo debido a la interacción con su entorno. La influencia del entorno sobre el sistema dinámico se expresa en términos de lo que llamamos variables de entrada (u(t)), las cuales producen cambios en el estado dinámico del sistema, que se manifiesta a través las que llamamos variables de estado,(x(t)) que nos permiten describir el comportamiento dinámico del sistema. Estos cambios en comportamiento dinámico del sistema se manifiestan en las que llamamos variables de salida que pueden ser medidas y que denominamos variables de salida medibles (y(t)). (Figura 2.1) La figura 2.1 muestra el diagrama general de un sistema dinámico. Para estos sistemas tenemos tres conceptos fundamentales: entrada, estado y salida. Las entradas son cantidades que pueden afectar la evolución tanto de los estados como de las salidas del sistema dinámico. El estado de un sistema son todos aquellos componentes dinámicos del sistema que permiten identificarlo en cualquier instante de tiempo dado. Las salidas del sistema dinámico son todas aquellas funciones del estado, tales como los propios estados o alguna combinación de ellos que puedan ser medibles. Las cantidades asociadas con las entradas al sistema pueden ser variables de control o variables de entrada actuantes ( )tu y entradas

inciertas o variables de perturbación ( )tw , el sistema dinámico esta representando por las variables de estado ( )tx y las variables de

salida están representadas por ( )ty .

Figura 2.1. Diagrama de un sistema dinámico En aplicaciones de control la dinámica de un sistema dinámico se representa por medio de ecuaciones diferenciales. En tiempo continuo, tenemos ecuaciones diferenciales ordinarias. En tiempo discreto, tenemos de ecuaciones en diferencias finitas. En aplicaciones de sistemas de control un sistema dinámico lo podemos representar de diversas formas. En la llamada teoría de control clásica que se desarrolló desde antes del advenimiento de las computadoras digitales y del concepto de estado de un sistema dinámico, la representación del sistema dinámico se establece en términos de sistemas vistos como sistemas entrada – salida, [18] (sistemas E–S), este enfoque se fundamenta en la obtención de ecuaciones diferenciales escalares de orden n, de una entrada y una salida, sistemas (SISO), que describen la dinámica del sistema en el sentido de la evolución de la salida debido a la entrada. Las técnicas de análisis de estos sistemas en su mayoría, emplean el método de convertir la ecuación diferencial en una ecuación algebraica por medio de la transformada de Laplace y se basan en el análisis en el dominio de la frecuencia.

SISTEMA DINAMICO

x(t)

w(t)

u(t) y(t)

Page 8: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 4 de 61

El desarrollo más reciente de la teoría de control, llamada teoría de control moderna, se fundamenta [18] en los métodos matriciales y los modelos en el espacio de estados, para describir de forma más general los sistemas dinámicos y donde están incluidos tanto los sistemas SISO como los sistemas de varias entradas y varias salidas, (sistemas MIMO). Las técnicas de análisis de estos sistemas, se basan en el análisis en el dominio del tiempo y en técnicas de tipo numérico y computacional que permiten manejar grandes sistemas de muchas entradas y muchas salidas. Estas técnicas emplean métodos fundamentados en vectores y valores característicos, en lugar de los métodos de la transformada de Laplace, aunque no se descarta su empleo. El modelo general de un sistema dinámico consta de dos conjuntos de ecuaciones: el primero formado por ecuaciones diferenciales ordinarias de primer orden y el segundo formado por ecuaciones algebraicas, ambos expresados en forma vectorial mediante:

( ) ( ) ( )

( ) ( ) ( )

t t t

t t t

x = f(x ,u )y = g(x ,u )

(2.1)

Donde ( ) ddt

. se emplea para significar la variación respecto al tiempo t, de una variable dada. Las ecuaciones (2.1) se conocen

como ecuación de estado y ecuación de salida respectivamente y en conjunto se conocen como las ecuaciones dinámicas de un sistema de control. En general ( ) ( )t tf(x ,u ) y ( ) ( )t tg(x ,u ) son funciones vectoriales con argumentos ( )tx y ( )tu , los cuales son variables vectoriales que dependen del tiempo. El problema general del control automático de un sistema dinámico consiste en determinar un algoritmo para generar la entrada de control (ley de control) ( )tu al sistema dinámico con el fin de alcanzar un comportamiento aceptable para los estados ( )tx dadas las especificaciones deseadas, a pesar de las perturbaciones que puedan presentarse. A la relación funcional para generar ( )tu se le conoce como controlador. El objetivo de diseño en control automático es encontrar la forma funcional para un controlador que producirá un comportamiento o desempeño aceptable (deseado) del sistema dinámico. Utilizaremos la denominación de entrada de comando y la notación (t)r para denotar las entradas externas al controlador; (t)r puede ser un vector de varias entradas de comando externas. Esta forma funcional puede variar dependiendo de la aplicación. En algunas aplicaciones [18] la forma funcional puede ser igual simplemente a la entrada de comando, es decir = (t)u r , o puede ser una función del tiempo y de la entrada de comando t(t),u = u(r ) . En estos casos la entrada de control o ley de control no depende explícitamente de la salida del sistema dinámico, esta forma de control se conoce como control de lazo abierto. En otras aplicaciones la forma funcional puede ser una función de la entrada de comando y la salida del sistema dinámico

(t), (t)u = u(r y ) . Esta situación donde la ley de control depende de la entrada de comando y la salida del sistema dinámico se conoce como control en lazo cerrado. El término lazo cerrado se refiere al hecho de que la salida es utilizada para realimentar la información de la medición como parte del algoritmo de control. El control en lazo cerrado se puede clasificar según la naturaleza de la señal de realimentación. Si la entrada de control depende explícitamente de la salida ( )ty , es decir (t), (t)u = u(r y ) , se denomina control por realimentación de salida. Si los estados del sistema dinámico se miden o se estiman mediante cualquier otro proceso y se realimentan hacia el sistema de modo que la entrada de control ( )tu dependa explícitamente de los estados del sistema, es decir (t), (t)u = u(r x ) , se denomina control de lazo cerrado por realimentación de estado. La característica principal y deseable de un sistema en lazo cerrado es la estabilidad del sistema, es decir, que si una entrada aplicada al sistema dinámico es finita, la salida o salidas producidas también sean finitas. Nos interesa en este proyecto el control automático en lazo cerrado. La figura 2.2 nos muestra un diagrama de bloques general de un sistema de control en lazo cerrado. La variable ( )te representa el error de control, que es la diferencia entre el valor deseado y el valor real de las variables a controlar (las cuales en este caso deben ser medibles).

Page 9: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 5 de 61

Figura 2.2. Diagrama de un sistema de control de lazo cerrado El problema fundamental del control automático esta asociado con el objetivo de alcanzar un desempeño determinado de las variables de estado ( )tx del sistema dinámico, dadas unas especificaciones deseadas, a pesar de las perturbaciones que puedan presentarse. Comúnmente, el desempeño de una variable se especifica por medio de un punto de ajuste o Set-point, el cual indica el valor deseado de la variable de interés en cualquier instante, que puede ser un valor constante o una trayectoria. De esta manera controlar significa entonces medir el valor de las salidas medibles y a partir de este conocimiento modificar las variables de control para evitar, corregir o limitar desviaciones del valor medido con respecto al punto de ajuste, causadas por perturbaciones presentes. Además, un sistema de control es una estructura externa que se adiciona a un proceso o planta para hacer que las salidas y/o los estados de éste, sigan una trayectoria de referencia (control de seguimiento) o se mantengan en una determinada franja de valores, alrededor de un punto de ajuste (regulación), a pesar de la presencia de perturbaciones. 2.2.- Modelamiento matemático de Sistemas Dinámicos Un modelo matemático es una descripción matemática de un sistema dinámico o proceso real, en la cual mediante relaciones y funciones matemáticas, se expresan las relaciones existentes entre las diversas variables que caracterizan e intervienen en el proceso dinámico [19]. Un modelo matemático permite expresar mediante relaciones y funciones matemáticas la dinámica del sistema al cual pertenece. En los sistemas dinámicos y en aplicaciones de control el modelo matemático se representa por medio de ecuaciones diferenciales ordinarias. El tratamiento de estas ecuaciones diferenciales proporciona información sobre el comportamiento dinámico del sistema con determinado grado de confiabilidad, que normalmente es utilizada en el análisis del sistema real, para aproximarnos al conocimiento de su evolución ante determinados cambios en el entorno. El conjunto de métodos y técnicas que permiten encontrar el modelo matemático de un sistema dinámico se llama modelamiento e identificación de sistemas dinámicos. En general, el modelo se compone de dos partes: la estructura generada por las relaciones entre las variables del sistema y los parámetros que hacen parte de ésta. El modelamiento de sistemas es el procedimiento que permite encontrar la estructura del modelo y la identificación de sistemas se encarga de seleccionar el valor de los parámetros para que el modelo pueda ser especificado. La estructura de un modelo puede representar varios sistemas físicos pero con la estimación del valor de los parámetros asociados se encuentra la representación específica del sistema de nuestro interés. Para la formulación del modelo matemático de un sistema dinámico, es necesario establecer supuestos y simplificaciones que establecen un compromiso entre la aproximación del modelo matemático obtenido al sistema dinámico real y la complejidad del mismo, puesto que justamente esa misma complejidad de los procesos reales, los modelos obtenidos pueden ser de dimensiones muy grandes y su análisis resulta muy dispendioso desde el punto de vista teórico y computacional. Cualquier modelo es una imitación de la realidad. El modelo obtenido dadas las suposiciones y simplificaciones establecidas, es una representación fiel de sólo algunas características del proceso, definidas según el problema presentado. Por lo tanto cualquier análisis del sistema real a través de su modelo es limitado y se deben esperar diferencias entre el comportamiento real del proceso y el comportamiento predicho por el modelo. La meta del modelamiento es entonces encontrar un modelo que represente satisfactoriamente (con un grado razonable de confiabilidad) el comportamiento dinámico de las variables importantes del proceso. Los sistemas dinámicos son inherentemente no lineales, en muchas aplicaciones hay que utilizar procesos de linealización del modelo matemático de los sistemas dinámicos alrededor de un punto de operación para así obtener un modelo lineal que refleje el comportamiento del sistema no lineal en una vecindad del punto de operación, donde es posible considerar que su comportamiento es lineal o aproximadamente lineal. El modelo linealizado permite su representación por medio de ecuaciones entrada – salida y/o en ecuaciones dinámicas en el espacio de estados y a partir de estas representaciones se realiza el análisis del sistema.

Planta Controlador

Sensor

r(t) u(t)

y(t) Comparador

e(t)

Page 10: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 6 de 61

2.3.- Análisis de Sistemas en el Espacio de Estados. La teoría de control moderna se fundamenta en tres conceptos fundamentales: estado, salida y entrada. El estado de un sistema son todos aquellos componentes dinámicos del sistema que permiten identificarlo en cualquier momento dado. Las salidas del sistema dinámico son todas aquellas funciones del estado, tales como los propios estados o alguna combinación de ellos que puedan ser medibles. Las entradas al sistema dinámico son cantidades que pueden afectar la evolución tanto de los estados como de las salidas del sistema dinámico. El modelo matemático de un sistema dinámico en el espacio de estados, se hace en términos de ecuaciones diferenciales de primer orden y de ecuaciones algebraicas, a partir de las cuales se realiza el análisis temporal de tales sistemas. Esta representación es aplicable tanto a sistemas SISO como a sistemas MIMO y comprende la representación de sistemas no lineales y variantes en el tiempo. El espacio de estados es el espacio n-dimensional definido por las variables de estado del sistema. El estado de un sistema dinámico esta

definido por el conjunto mínimo de variables, denominadas variables de estado, [ ]( ) ( ) ( ) ( )1 2T

t t t tnx x x=x , a partir de las cuales se puede conocer el comportamiento dinámico del sistema, en cualquier tiempo futuro a partir de las condiciones del momento actual (condiciones iniciales); es decir, conociendo su valor en 0tt = , 0( )tx , y el valor de las entradas de control, ( )tu , en el intervalo

de tiempo [ ]10 , tt es posible conocer el estado en cualquier instante 0 1( , )t t t∈ . La estructura matemática para la representación en el espacio de estado de un sistema dinámico lineal se presenta como:

( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

t t t t t

t t t t t

= += +

x A x B uy C x D u

(2.2)

donde: x es el vector de estados de orden n x 1, u es el vector de entradas de control de dimensión p x 1, y es el vector de salidas

medibles del sistema de orden m x 1, A es la matriz de estado de orden n x n asociada con la respuesta natural del sistema, B es la matriz de entrada de orden n x p asociada con la respuesta forzada del sistema, C es la matriz de salida orden m x n y D es la matriz de transmisión directa de orden m x p. Si las matrices A , B , C y D son matrices de elementos constantes, es decir no son función del tiempo (parámetros del sistema invariantes con el tiempo) el sistema es un sistema invariante en el tiempo. Ver figura 2.3.

1

n

x

x

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

x ; 1

p

u

u

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

u ; 1

m

y

y

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

y

11 1

1

n

n nn

a a

a a

⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

A =…

; 11 1

1

p

n np

b b

b b

⎛ ⎞⎜ ⎟

= ⎜ ⎟⎜ ⎟⎝ ⎠

B…

; 11 1

1

n

m mn

c c

c c

⎛ ⎞⎜ ⎟= ⎜ ⎟⎜ ⎟⎝ ⎠

C…

; 11 1

1

p

m mp

d d

d d

⎛ ⎞⎜ ⎟

= ⎜ ⎟⎜ ⎟⎝ ⎠

D…

Figura 2.3 Diagrama de bloques de un sistema en el espacio de estados

Page 11: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 7 de 61

La estructura matemática para la representación en el espacio de estado de un sistema dinámico lineal de parámetros lineales e invariantes en el tiempo es:

( ) ( ) ( )

( ) ( ) ( )

t t t

t t t

= += +

x Ax Buy Cx Du

(2.3)

2.3.1.- Representación entrada-salida (E–S) La representación entrada-salida de un modelo matemático se usa fundamentalmente para sistemas SISO. Esta forma de representación describe las relaciones dinámicas (no físicas) de la variable de salida del sistema respecto de la variable de entrada al mismo, a partir de una ecuación diferencial de enésimo orden, en la cual el orden esta determinado por el numero de estados del sistema dinámico.

( ) ( 1) ( ) ( 1)1 1 0 1 1 0

n n m mn m my a y a y a y b u b u b u b u− −− −+ + + + = + + + + ; con n m≥

A partir de esta ecuación diferencial y por la aplicación de los métodos de la transformada de Laplace se obtiene una función de transferencia para sistemas SISO o una matriz de transferencia para sistemas MIMO. Esta representación se logra esencialmente para sistemas lineales e invariantes en el tiempo bajo la suposición de condiciones iniciales iguales a cero. La función de transferencia obtenida por tales métodos, está expresada en función de la variable compleja s jσ ω= + , que se denomina la frecuencia compleja y por lo tanto el análisis se realiza por lo general en el dominio de la frecuencia.

2.3.2.- Transformaciones canónicas La elección de las variables de estado en un sistema dinámico no es única en general. La selección final se puede basar en factores físicos, pero a menudo se emplean métodos de transformaciones matemáticas para varios tipos de análisis. Se presentan dos formas canónicas [18] de las ecuaciones de estado, dependiendo de la elección del sistema coordenado, esto es de la elección de las variables de estado. Una representación desacopla las ecuaciones de estado y la otra conduce a una descripción del estado en términos de un sistema de entrada –salida de una sola ecuación diferencial de orden n. La representación más simple de un sistema en el espacio de estados se tiene cuando las ecuaciones de estado están desacopladas, esto es, cuando la matriz de estado A esta en forma diagonalizada:

1

1[ ,..., ]0

0n

n

λλ λ

λ

⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

A = diag

De modo que la evolución de cada una de las variables de estado depende solamente de si misma y de las entradas, pero no de las otras variables de estado. 2.3.3.- Controlabilidad y observabilidad en el espacio de estados1 Los conceptos de controlabilidad y observabilidad fueron introducidos por Kalman en el año 1960. Estos conceptos enfrentan respectivamente la relación que existe entre la entrada y el estado (la controlabilidad), y entre el estado y la salida (la observabilidad). La controlabilidad de un sistema responde a la siguiente pregunta: ¿Existe siempre una entrada de control ( )tu la cual puede transferir el sistema desde el estado inicial x0 a cualquier otro estado x1 deseado en un tiempo finito? Mientras que la observabilidad responde a la pregunta: ¿El estado inicial x0 del que parte un sistema, puede siempre identificarse mediante la observación de la salida ( )ty y de la entrada

( )tu sobre un tiempo finito t?

1 http://www.ib.cnea.gov.ar/~dsc/capitulo6/Capitulo6. Controlabilidad y Observabilidad

Page 12: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 8 de 61

Estas características del sistema pueden ser contestadas mediante las propiedades de las matrices A , B , C y D . Ya que las matrices A , y B , tienen que ver con la relación entre entrada y estado. A este par de matrices se las conoce como el par de controlabilidad y definen la matriz de controlabilidad. En cambio, como las matrices A y C involucran el estado con la salida, a estas dos matrices se las conoce como el par de observabilidad y por tanto definen la matriz de observabilidad. Se dice entonces, que un sistema es controlable en el instante t0 si es posible llevarlo de cualquier estado inicial x(t0) a cualquier otro estado x(t), empleando un vector de control no acotado, en un lapso finito. Y se dice que un sistema es observable en el tiempo t si, con el sistema en el estado x(t), es posible determinar dicho estado a partir de las mediciones de la salida con un retaso finito de tiempo. El trabajo pionero de R. Kalman en el año de 19602 introdujo los conceptos de controlabilidad y de observabilidad, que juegan un papel fundamental en el diseño de los sistemas de control usando las técnicas de estado espacio. Las condiciones de controlabilidad y de observabilidad determinan la existencia de una solución completa para el problema del diseño de un sistema de control. Tal vez no exista una solución a este problema si el sistema estudiado es no controlable. Aunque la mayoría de los sistemas físicos son controlables y observables, los modelos matemáticos correspondientes pueden no tener la propiedad de controlabilidad y//o de observabilidad. En tal caso, es esencial conocer las condiciones bajo las cuales un sistema es controlable y observable. Veamos primero el análisis de las condiciones de la controlabilidad y luego el análisis de las condiciones de la observabilidad. En cuanto a la controlabilidad, veamos primero la condición para la controlabilidad completa de estado y enseguida la condición para la controlabilidad de la salida. 2.3.3.1.- Controlabilidad completa del estado. Consideremos al sistema en tiempo continuo: = +x Ax Bu (2.4)

En las cuales por brevedad de escritura hemos omitido el subíndice temporal y en donde x = vector de estado (vector de orden n) u = vector de control (vector de orden p) A = matriz de orden n x n B = matriz de orden n x p Se dice que el sistema dado por la ecuación anterior es de estado controlable en t = t0 si es posible construir p señales de control sin restricción alguna que transfieran un estado inicial a cualquier otro estado finito en un intervalo de tiempo finito t0 ≤ t ≤ t1. Si todos los estados son controlables, se dice que el sistema es de estado completamente controlable. 2.3.3.1.1.- Condición para una controlabilidad completa de estado. Sin perder la generalidad, suponemos que el estado final es el origen en el espacio de estados y que el tiempo inicial es cero, o t0 = 0. La solución de la ecuación (2.4) es:

( )( ) (0) ( )

0

tt tt e e dτ

τ τ− −= + ∫A Ax x Bu (2.5)

Aplicando la definición de controlabilidad completa del estado recién establecida, tenemos:

11

1

( )( ) (0) ( )

00

t ttt e e dτ

τ τ− −= = + ∫ AAx x Bu

O sea que:

1(0) ( )

0

t te dτ τ−= −∫ Ax Bu (2.6)

2 ibid

Page 13: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 9 de 61

Según el Teorema de Cayley-Hamilton, podemos escribir te−A como:

1

( )0

kn

tk

ke τα

−−

=

= ∑A A , por tanto: 1

1

(0) ( ) ( )0

0

kn t

kk

dτ τα τ−

=

= −∑ ∫x A B u

Definimos: 1

( ) ( )0

t

k kdτ τα τ =∫ u U Donde kU es un vector columna de orden p. De esta manera la ecuación anterior se

convierte en:

1

(0)0

kn

kk

=

= −∑x A BU (2.7)

⎡ ⎤⎢ ⎥⎢ ⎥⎡ ⎤⎣ ⎦ ⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

0

1n-1(0)

n-1

UU

x = - B AB A BM

U

(2.8)

Si el sistema es de estado completamente controlable, entonces dado cualquier estado inicial x(0), la ecuación (2.8) se debe satisfacer.

Esto significa que el rango de la matriz de n filas y np columnas ⎡ ⎤⎣ ⎦n-1B AB A B sea de rango n, o que contenga n vectores

columna linealmente independientes. La matriz

⎡ ⎤⎣ ⎦n-1S = B AB A B (2.9)

Se conoce con el nombre de matriz de controlabilidad. 2.3.3.1.2.- Forma alternativa de la condición para la controlabilidad de estado Si los valores propios de la matriz A de la ecuación (2.4) son distintos, es posible encontrar una matriz de transformación P tal que:

1

2

0 00

0 n

λλ

λ

⎡ ⎤⎢ ⎥⎢ ⎥=⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

-1P AP (Matriz diagonal)

Es de notar que si los valores propios de A son distintos, los vectores propios de A también son distintos; no obstante, lo contrario no es verdad. Por ejemplo, una matriz simétrica real de n x n con valores propios repetidos, tiene vectores propios diferentes. Se debe considerar que cada columna de la matriz de transformación P es un vector propio de A asociado con ( 1, 2,..., )i i nλ = Para obtener la matriz diagonal definimos un nuevo vector de estado z, tal que: x = Pz (2.10) Sustituyendo en la ecuación (2.4) la ecuación (2.10) se obtiene

-1 -1z = P APz + P Bu (2.11)

Page 14: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 10 de 61

Si definimos (ij)f= =-1P B F , la ecuación la ecuación (2.11) se puede escribir, como:

1 1 11 1 12 2 1

2 2 21 1 22 2 2

1 1 2 2

.

.

.

p p

p p

n n n n np p

z f u f u f u

z f u f u f u

z f u f u f u

λ

λ

λ

= + + + +

= + + + +

= + + + +

Ahora bien, nótese que si todos los elementos de cualquier renglón de la matriz F de n x p son cero, entonces la variable de estado

asociada iz no es controlable por cualquiera de los controles iu .Por tanto, la condición de controlabilidad completa de estado se define como que, si los valores propios de A son distintos, el sistema es de estado completo controlable si y sólo si ningún renglón de

(ij)f= =-1P B F tiene todos sus elementos cero. Para aplicar la condición alterna de controlabilidad para analizar la controlabilidad completa de estado, debemos poner en forma diagonal a la matriz A de la ecuación (2.4), es decir desacoplar las variables de estado, mediante la matriz de transformación P. 2.3.3.1.3.- Forma canónica de Jordán Por otra parte, si la matriz A de la ecuación (2.4) presenta valores propios repetidos, la diagonalización es imposible. En tal caso, transformamos A en la forma canónica de Jordán. Por ejemplo, si A tiene valores propios λ1, λ1, λ1 ,λ4, λ4 y λ6; esto es tiene tres raíces iguales entre sí, otras dos iguales entre sí, distintas a la primeras y una sexta diferente de las anteriores, la forma de Jordán de A resulta ser:

1

1

1

4

4

6

1 0 00 10 0

10 0

0 0

λλ

λλ

λλ

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

J

Las submatrices cuadradas de la diagonal principal se denominan bloques de Jordán. Para obtener la forma canónica de Jordán hallamos una matriz M de transformación tal que:

-1M AM = J Y definimos un nuevo vector de vector de estado z mediante x = Mz (2.12) Sustituimos la ecuación (2.12) en la ecuación (2.4) y obtenemos:

= +-1 -1 -1z = M AMz + M Bu Jz M Bu (2.13) La condición para una controlabilidad de estado completo del sistema dado por (2.4) se enuncia del siguiente modo: El sistema es de estado completamente controlable si y sólo si:

Page 15: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 11 de 61

a) Dos bloques de Jordán en J de la ecuación (2.13) no están asociados con los mismos valores propios. b) Los elementos de cualquier renglón de M-1B que corresponden al último renglón de cada bloque no son todos cero y c) Los elementos de cada renglón de M-1B que corresponden a valores propios distintos no son todos cero. 2.3.3.1.4.- Condición para la controlabilidad completa de estado en el dominio de la frecuencia. La condición para una controlabilidad completa del estado se plantea también en términos de las funciones de transferencia o las matrices de transferencia. Una condición necesaria y suficiente para una controlabilidad completa de estado es que no ocurra una cancelación de polos en la función de transferencia o en la matriz de transferencia. Si ocurre dicha cancelación el sistema no puede ser controlado en la dirección del modo cancelado. Si ocurre una cancelación de un factor entre el numerador y el denominador de una función de transferencia, el orden del sistema se reduce en número igual al número de polos cancelados y se debería representar mediante una matriz A de orden n-1. Debido a dicha cancelación el sistema de orden n no es de estado completamente controlable. 2.3.3.1.5.- Forma canónica controlable en sistemas SISO. Para los sistemas SISO en el espacio de estados, existe una representación que puede conducir a la descripción del sistema en términos de una sola ecuación diferencial de orden superior. Se dice entonces que un sistema SISO esta en forma compañía si la matriz de estado A es una matriz compañía, de la forma:

1 2 3

0 1 0 00 0 1 0

0 0 0 1

na a a a

⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− − − −⎝ ⎠

A =

y la entrada de control escalar u solo entra en la ecuación de nx con la matriz columna de entrada B de la forma:

00

1

⎛ ⎞⎜ ⎟⎜ ⎟=⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

B

Ahora, un sistema SISO se puede convertir entonces en una única forma compañía si y solo si la matriz de controlabilidad, definida por:

2 n-1S = [B AB A B A B] es de rango completo, es decir la matriz S es de rango n. Si esta condición se satisface decimos que el sistema es completamente controlable. 2.3.3.1.6.- Controlabilidad de la salida de sistemas de tiempo continúo. En el diseño práctico de un sistema de control se pretende normalmente controlar la salida en lugar del estado del sistema. Una controlabilidad completa de estado no es necesaria ni suficiente para controlar la salida del sistema. Por dicha razón es útil definir una controlabilidad completa de la salida por separado. Considerar el sistema descrito por: = += +

x Ax Buy Cx Du

(2.14)

En donde

Page 16: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 12 de 61

x = vector de estado (vector de orden n) u = vector de control (vector de orden p) y = vector de salida (vector de orden m) A = matriz del sistema de orden n x n B = matriz de control de orden n x p C = matriz de salida de orden m x n D = matriz de transmisión directa de orden m x p Se dice que el sistema dado por (2.14) es de salida completamente controlable si es posible construir un vector de control u(t) no acotado, tal que transfiera cualquier salida inicial determinada y(t0) a cualquier salida final y(t1) en un intervalo de tiempo finito t0 ≤ t ≤ t1 Es factible demostrar que la condición para una controlabilidad completa de la salida es la siguiente: el sistema descrito mediante las ecuaciones (2.14) es de salida completamente controlable si y sólo si la matriz de orden m x (n + 1)p

⎡ ⎤⎣ ⎦2 n-1S = CB CAB CA B CA B D (2.15)

es de rango m. 2.3.3.1.7.- Controlabilidad completa de estado para sistemas en tiempo discreto Consideremos al sistema de control en tiempo discreto definido por

[( 1) ] ( ) ( )k T kT kT+ = +x Fx Gu (2.16)

( ) ( ) ( )kT kT kT= +y Cx Du (2.17) donde

( )kTx = vector de estado de orden n en el periodo k de muestreo ( )kTu = vector de control de orden p en el periodo k de muestreo ( )kTy = vector de salida de orden m en el periodo k de muestreo

F = matriz de estado de orden n x n, constante. G = matriz de control de orden n x p, constante. C = matriz de salida de orden m x n, constante. D = matriz de transmisión directa de orden m x p T = Periodo de muestreo. Se entiende que ( )kTu es constante para kT ≤ t ≤ (k+1)T. Por tanto el sistema en tiempo discreto dado por (2.16) es de controlabilidad

completa de estado si existen p secuencias de control continuo a trozos ( )kTiu definidas sobre un número finito de periodos de

muestreo, de tal manera que iniciando desde cualquier estado ( )kTx , este pueda ser transferido al estado deseado fx en n periodos de muestreo. Se demuestra que la condición para la controlabilidad completa de estado es que la matriz de n filas y np columnas:

2 -1n⎡ ⎤= ⎣ ⎦S G FG F G F G sea de rango n.

O bien que ( )2 -1nrango n⎡ ⎤ =⎣ ⎦G FG F G F G

2.3.3.1.8.- Controlabilidad de la salida de sistemas de tiempo discreto. El sistema de control dado por las ecuaciones (2.16) y (2.17) es controlable a la salida si la matriz de m filas por (n+1)p columnas

2 -1n⎡ ⎤= ⎣ ⎦S D CG CFG CF G CF G es de rango m.

Page 17: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 13 de 61

2.3.3.1.9.- Sistema estabilizable. Cuando un sistema no es controlable de estado completo, pero sucede que la parte no controlable es estable, se dice entonces que el sistema es estabilizable, aunque no sea controlable. Un sistema controlable de estado completo es siempre estabilizable. 2.3.3.2.- Observabilidad completa de estado. Analizaremos ahora la observabilidad de los sistemas lineales. Consideremos el sistema sin excitación descrito por las ecuaciones siguientes: ==

x Axy Cx

(2.18)

en donde x = vector de estado (vector de orden n) y = vector de salida (vector de orden m) A = matriz del sistema de orden n x n C = matriz de salida de orden m x n Se dice que el sistema es completamente observable si el estado x(t) se determina a partir de la medición de y(t) durante un intervalo de tiempo finito t0 ≤ t ≤ t1. Por tanto el sistema es completamente observable si todas las transiciones de estado afectan eventualmente a todos los elementos del vector de salida. El concepto de observabilidad es útil al resolver el problema de reconstruir señales o variables de estado no medibles a partir de variables que sí son medibles en un tiempo lo menor posible. Puesto que estamos considerando que el sistema es lineal e invariante en el tiempo; podemos sin perder generalidad suponer que t0 = 0. El concepto de observabilidad es muy importante porque, en el terreno práctico, la dificultad que se encuentra con el control mediante retroalimentación del estado es que algunas variables de estado no son asequibles para una medición directa, por lo que se hace necesario estimar las variables de estado no medibles para formar las señales de control. Se puede demostrar que tales estimaciones de las variables de estado son posibles si y sólo si el sistema es completamente observable. Para analizar las condiciones de observabilidad consideramos el sistema sin excitación como el que se obtiene mediante las ecuaciones (2.18), por una razón muy simple: si el sistema se describe mediante = += +

x Ax Buy Cx Du

Entonces:

( )( ) (0) ( )

0

tt tt e e dτ

τ τ−= + ∫A Ax x Bu y ( )

( ) (0) ( )0

tt tt e e dτ

τ τ−= + +∫A Ay C x C Bu Du

Dado que las matrices A, B, C y D se conocen al igual que u(t), los dos últimos términos del segundo miembro de la ecuación anterior son cantidades conocidas. Como estas cantidades se restan del valor observado y(t), para obtener una condición necesaria y suficiente para la observabilidad completa de estado, basta considerar el sistema descrito por las ecuaciones (2.18). 2.3.3.2.1.- Observabilidad completa de sistemas de tiempo continuo Considere al sistema dado por (2.18), vuelto a escribir como ==

x Axy Cx

el vector de salida y(t) es

( ) (0)t

t e= Ay C x

Page 18: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 14 de 61

Según el teorema de Cayley-Hamilton tenemos que: 1

( )0

kn

tk

ke τα

−−

=

= ∑A A

Por tanto: 1

( ) (0) ( ) (0)0

kn

tt k

ke τα

=

= =∑Ay C x CA x

es decir: 1

( ) ( ) (0) ( ) (0) ( ) (0)0 1 1n

t t t tnα α α −−= + + +y Cx CAx CA x (2.19)

Entonces el sistema es completamente observable, si dada la salida y(t) durante un intervalo de tiempo 0 ≤ t ≤ t1, x(0) se determina únicamente a partir de la ecuación (2.18). Se puede demostrar que esto requiere que el rango de la matriz de nm filas y n columnas:

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

n-1

CCA

O =

CA

sea n. La matriz O recibe el nombre de matriz de observabilidad.

2.3.3.2.2.- Condiciones para la observabilidad completa en el dominio de la frecuencia Las condiciones para la observabilidad completa de estado también se analizan en términos de las funciones de transferencia o las matrices de transferencia. La condición necesaria y suficiente para una observabilidad completa de estado es que no ocurra una cancelación en la función de transferencia o en la matriz de transferencia. Si ocurre una cancelación el modo cancelado no se puede observar en la salida. La función de transferencia o la matriz de transferencia no presenta cancelación si y sólo si el sistema de estado-espacio es de estado completamente controlable y completamente observable. 2.3.3.2.3.- Forma alternativa de la condición para la observabilidad completa Consideremos el sistema descrito por las ecuaciones (2.18), vueltas a escribir como: ==

x Axy Cx

Definimos la matriz de transformación P que transforma la matriz de estado A en una matriz diagonal V. Para obtener la matriz diagonal definimos un nuevo vector de estado z, tal que: x = Pz De esta manera las ecuaciones (2.18) quedan como:

-1z = P APzy = CPz

(2.20)

1

2

0 00

0 n

λλ

λ

⎡ ⎤⎢ ⎥⎢ ⎥= =⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

-1P AP V

Page 19: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 15 de 61

Por tanto

( ) (0)t

t e= Vy CP z O también:

11

22

(0)1

(0)2( ) (0)

(0)

0 00

0 nn

tt

tt

t

ttn

e zee ze

e ze

λλ

λλ

λλ

⎡ ⎤⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥= =⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥

⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

y CP z CP

El sistema es completamente observable si ninguna de las columnas de la matriz CP de orden m x n está formada sólo por ceros. Esto se debe a que si la columna j de CP está formada sólo por ceros, la variable de estado (0)jz no aparecerá en la ecuación de salida y, por

tanto, no puede determinarse a partir de la observación de y(t). En tal caso (0)x que se relaciona con (0)z mediante la matriz no singular P, no puede determinarse. Esta condición sólo es aplicable si los valores propios λi de A son diferentes. 2.3.3.2.4.- Observabilidad completa del estado para sistemas en tiempo discreto. Consideremos al sistema de control en tiempo discreto definido por

[( 1) ] ( ) ( )k T kT kT+ = +x Fx Gu (2.23)

( ) ( ) ( )kT kT kT= +y Cx Du (2.24) donde

( )kTx = vector de estado de orden n en el periodo k de muestreo ( )kTu = vector de control de orden p en el periodo k de muestreo

( )kTy = vector de salida de orden m en el periodo k de muestreo F = matriz de estado de orden n x n, constante. G = matriz de control de orden n x p, constante. C = matriz de salida de orden m x n, constante. D = matriz de transmisión directa de orden m x p T = Periodo de muestreo. Por comodidad y brevedad omitimos el periodo de muestreo T en las dos ecuaciones anteriores, por lo que es común que éstas se presenten como

( 1) ( ) ( )k k k+ = +x Fx Gu (2.23A)

( ) ( ) ( )k k k= +y Cx Du (2.24A) Se dice que el sistema dado por (2.23) y (2.24) es observable de estado completo si es posible determinar el estado (0)x a partir de las observaciones de ( )ky sobre un número finito de periodos de muestreo. El sistema es observable si cada transición de estado afecta eventualmente a la salida. Se puede demostrar que el sistema dado por (2.23) y (2.24) es completamente observable si la matriz de nm filas y n columnas:

Page 20: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 16 de 61

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

d

n-1

CCF

N =

CF

es de rango n. dN es la matriz de observabilidad, en tiempo discreto.

2.3.3.2.5.- Sistema detectable. Si un sistema es no observable de estado completo, pero su parte no observable es estable, entonces se dice que dicho sistema es solamente detectable. Un sistema observable de estado completo es siempre detectable. 2.3.3.2.6.- Forma canónica observable en sistemas SISO.. Si la matriz de estado A de un sistema dinámico se puede representar en la forma canónica:

1

2

3

0 0 01 0 00 1 0

0 0 1 n

aaa

a

−⎛ ⎞⎜ ⎟−⎜ ⎟⎜ ⎟−⎜ ⎟⎜ ⎟⎜ ⎟−⎝ ⎠

A =

Y la matriz de salida C para una sola salida, toma la forma:

[0 0 0 1]=C Tenemos así el sistema dinámico representado en forma canónica observable y por tanto podemos construir la matriz de observabilidad definida como:

⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

n-1

CCA

N =M

CA

Ahora, si la matriz N es de rango completo, es decir es de rango n, decimos entonces que el sistema dinámico es completamente observable. 2.4.- Estabilidad de los Sistemas de Control3 La teoría de estabilidad juega un rol central en teoría de sistemas e ingeniería. El requisito indispensable para todo sistema de control es la estabilidad en lazo cerrado del sistema global. Esto garantiza que algunas acciones de control aplicadas al sistema en determinados instantes de tiempo no produzcan respuestas que tiendan a crecer indefinidamente. De hecho el objetivo principal de un sistema de control sobre una planta es hacer que los puntos de operación deseados para ella sean equilibrios estables, de tal forma que si una perturbación saca al sistema de este punto, éste pueda regresar a él. La estabilidad de los puntos de equilibrio se caracteriza generalmente como estabilidad en el sentido de Lyapunov, un matemático e ingeniero ruso que estableció las bases de la teoría que hoy lleva su nombre. Aleksandr Lyapunov (1857-1918). Un punto de equilibrio (PE) se dice estable si todas las soluciones que se inicien en las cercanías del punto de equilibrio permanecen en las cercanías del punto de equilibrio; de otro modo el punto de equilibrio es inestable. Un punto de equilibrio se dice asintóticamente estable si todas las soluciones que se inicien en las cercanías del punto de equilibrio no sólo permanecen en las cercanías del punto de

3 http://www.eng.newcastle.edu.au/~jhb519/teaching/snolin/material/cap03.pdf. Estabilidad Según Lyapunov.

Page 21: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 17 de 61

equilibrio, sino que además tienden hacia el equilibrio a medida que el tiempo se aproxima a infinito. Los teoremas de estabilidad de Lyapunov dan condiciones suficientes para estabilidad de puntos de equilibrio. 2.4.1.- Teorema de Estabilidad de Lyapunov para sistemas estacionarios. ( )( 0)t =u Para el sistema estacionario, descrito por la ecuación:

( ) ( )t xx f= (2.25) donde : nf D → es un mapa localmente Lipschitz continuo4 desde un dominio en n nD ⊂ Supongamos que x D∈ es

un punto de equilibrio (PE) de (2.25), es decir ( ) 0xf = . Sin perder generalidad y por conveniencia asumimos que 0x = .

Entonces decimos que el PE 0x = de (2.25) es: a) Estable si para cada ε > 0 existe un ( )εδ δ= tal que: (0) x < δ ⇒ ( ) tx <ε b) Inestable si no es estable. c) Asintóticamente estable (AE) si es estable y δ puede elegirse tal que (0) x < δ ⇒ ( )lim 0tx = Teorema 2.4.1.1. Lyapunov. Sea el origen x = 0 un PE de (2.25) y sea nD⊂ un dominio que contiene el origen. Sea :V D → una función continuamente diferenciable tal que: V(0) = 0 y V(x) > 0 en D ― {0} (2.26)

(0) 0V ≤ en D (2.27) Entonces x = 0 es estable. Más aún si

(0)V < 0 en D ― {0}. (2.28) Entonces x = 0 es AE.

Demostración. Dado ε > 0, elijamos r Є (0, ε] tal que { }nrB x x r D= ∈ ≤ ⊂ .

Sea min ( )x r V xα == . Entonces 0α > por (2.26). Tomemos (0, )β α∈ y sea { ( ) }rx B V xβ βΩ = ∈ ≤ . Entonces

βΩ esta en el interior de rB , puesto que si no fuera así, existiría un punto p β∈Ω que se encuentra sobre la frontera de rB . En

este punto, ( )V p α≥ > β , pero para todo x β∈Ω , ( )V x β≤ lo cual seria una contradicción. Figura 2.1.

Figura 2.4 Representación geométrica de los conjuntos para el teorema de Lyapunov.

4 Lipschitz continúa. En matemática, una función f : M → N entre espacios métricos M y N es llamada Lipschitz continua (o se

dice que satisface una condición de Lipschitz) si existe una constante K > 0 tal que d(f(x), f(y)) ≤ K d(x, y) para todo x y y en M. En tal caso, K es llamada la constante Lipschitz de la función. La condición de Lipschitz es una hipótesis importante para demostrar la existencia y unicidad de soluciones para las ecuaciones diferenciales ordinarias.

Page 22: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 18 de 61

El conjunto βΩ tiene la propiedad de que toda trayectoria que comienza en βΩ en t = 0 permanece en βΩ para todo 0t ≥ . Esto

se deduce de (2.27) puesto que ( ) ( ) (0)( ) 0 ( ) ( ) , t 0t tV x V x V x β≤ ⇒ ≤ ≤ ∀ ≥ Como βΩ es un conjunto compacto /cerrado por definición y acotado porque esta contenido en rB ) se concluye que (2.25) tiene una

solución única definida para todo t ≥ 0 cuando (0)x β∈Ω . Como V es continua y V(0) = 0, existe un δ > 0 tal que

( )x V xδ≤ ⇒ < β Entonces rB Bδ β⊂ Ω ⊂ y (0) (0) ( ) ( ) , 0rx B x x t x t B tδ β β∈ ⇒ ∈Ω ⇒ ∈Ω ⇒ ∈ ∀ ≥ Por lo tanto (0)x < δ ( )x t⇒ < , 0r tε≤ ∀ ≥ lo que muestra que el PE en x = 0 es estable. Ahora veamos (2.28). Para establecer que (2.25) es asintóticamente estable (AE), debemos probar que ( ) 0x t → cuando t →∞ . Como V es continua y V(0) = 0, es suficiente mostrar que V(x(t))→0 cuando t →∞ . Como V(x(t)) es monotónicamente decreciente y acotada inferiormente por 0,

( )( ) 0tV x c→ ≥ cuando t →∞ Vamos a mostrar que c ≥ 0 por contradicción. Supongamos que c > 0. Por continuidad de V(x), existe d > 0 tal que d cB ⊂ Ω . El limite

( )( )tV x c→ > 0 implica que la trayectoria x(t) permanece fuera de la bola dB para todo t ≥ 0. Sea ( )d x rmax V xγ ≤ ≤− = , el

cual existe porque la función continua ( )V x alcanza un máximo sobre el conjunto compacto{ }d x r≤ ≤ . Sabemos que γ− < 0

por (2.28). Integrando ( )V x tenemos que:

( ) (0) ( ) (0)0

( ) ( ) ( ) ( )t

tV x V x V x d V x tτ τ γ= + ≤ −∫

Como el lado derecho se va a hacer negativo después de un cierto tiempo, la desigualdad contradice la suposición de que c > 0. Una función continuamente diferenciable que satisface (2.26) y (2.27), se denomina Función de Lyapunov. La superficie V(x) = c se denomina superficie de Lyapunov o superficie de nivel. La figura 2.2 da una interpretación intuitiva del Teorema de Lyapunov.

Figura 2.5 Curvas de nivel de un función de Lyapunov.

Page 23: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 19 de 61

La condición 0V ≤ implica que cuando la trayectoria cruza la superficie de Lyapunov V(x) = c se introduce en el

conjunto { ( ) }nc x V x cΩ = ∈ ≤ y nunca puede salir de él.

Cuando V < 0, la trayectoria se mueve de una superficie de Lyapunov a otra superficie de Lyapunov interior con un c menor. A medida que c decrece, la superficie de Lyapunov V(x) = c se achica hasta transformarse en el origen, mostrando que la trayectoria tiende al origen cuando t →∞ . Si sólo sabemos que 0V ≤ , no podemos asegurar que la trayectoria tienda al origen, pero podemos concluir que el origen es estable porque la trayectoria puede ser encerrada en cualquier bola Bε sólo con requerir que el estado inicial x(0) pertenezca a una superficie de Lyapunov contenida en dicha bola. Una función V(x) que satisface (2.26) se dice definida positiva. Si satisface la condición más débil ( ) 0V x ≥ para x ≠ 0, se dice semidefinida positiva. Una función se dice definida negativa o semidefinida negativa si -V(x) es definida positiva o semidefinida positiva, respectivamente. Si V(x) no tiene signo definido con respecto a alguno de estos cuatro casos se dice indefinida. El teorema de Lyapunov se puede enunciar, usando esta nueva terminología como: el origen es estable si existe una función definida positiva y continuamente diferenciable tal que

( )V x es semidefinida negativa, y es AE si ( )V x es definida negativa. Es decir; siendo V la forma cuadrática V(x) = xTPx donde P es una matriz real y simétrica. V(x) es (semi)definida positiva sí y solo si todos los autovalores de P son (no negativos) positivos, lo que vale sí y solo si todos los menores principales de P son (no negativos) positivos. Si V(x) = xTPx es (semi)definida positiva, decimos que la matriz P es (semi)definida positiva y escribimos (P ≥ 0) P > 0. 2.4.1.1.- Estabilidad Asintótica Global Teorema 2.4.1.2. Barbashin-Krasovskii. Sea x = 0 un PE de (2.25). Sea : nV → una función continuamente diferenciable tal que

(0) 0V = y V(x) > 0 , 0x∀ ≠ (2.29)

( )x V x→∞⇒ →∞ (2.30)

( )V x < 0, 0x∀ ≠ (2.31) entonces x = 0 es GAE asintóticamente estable globalmente 2.4.1.2.- Inestabilidad Vamos a ver un teorema que prueba que un PE es inestable. Sea :V D → una función continuamente diferenciable en un dominio

nD ⊂ que contiene al origen x = 0. Supongamos que V(0) = 0 y que hay un punto x0 arbitrariamente cercano al origen tal que V(x0) > 0. Elijamos r > 0 tal que la

bola { }nrB x x r= ∈ ≤ esté contenida en D, y sea

{ ( ) 0}rU x B V x= ∈ > (2.32)

El conjunto U es no vacío. Su frontera está dada por la superficie V(x) = 0 y la esfera x r= . Como V(0) = 0, el origen está sobre la frontera de U en el interior de Br. Teorema 2.4.1.3. Chetaev. Sea x = 0 un PE de (2.25). Sea :V D → una función continuamente diferenciable tal que V(0) = 0 y

V(x0) > 0 para algún x0 con x arbitrariamente pequeña. Definamos el conjunto U como en (2.32) y supongamos que ( ) 0V x > en U. Entonces x = 0 es inestable.

Page 24: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 20 de 61

Demostración. El punto x0 está en el interior de U y V(x0) = a > 0. La trayectoria x(t) que comienza en x(0) = x0 debe dejar el conjunto U. Para probar esto, notemos que mientras x(t) permanezca en U, V(x(t)) ≥ a porque ( ) 0V x > en U. Sea

min{ ( ) y ( ) }V x x U V x aγ = ∈ ≥

que existe porque la función continua ( )V x tiene un mínimo en el conjunto compacto

{ y ( ) } { ( ) }rx U V x a x B V x a∈ ≥ = ∈ ≥ Entonces 0γ > y

( ) (0) ( )0

( ) ( ) ( )t

t sV x V x V x ds a tγ= + ≥ +∫

Esta desigualdad muestra que x(t) no se puede quedar indefinidamente en U porque V(x) está acotada en U. Ahora, x(t) no puede dejar U a través de la superficie V(x) = 0 porque V(x(t)) ≥ a. Por lo tanto debe dejar U a través de la esfera x r= . Como esto pasa

para 0x arbitrariamente pequeña, el origen es inestable. 2.4.1.3.- El Principio de Invariancia. V(x(t)) debe decrecer a cero y en consecuencia x(t)→0 cuando t → ∞. Esta idea puede formalizarse en el llamado principio de Invariancia de LaSalle, el cual pasaremos a enunciar y demostrar una vez presentemos algunos conceptos. Sea x(t) una solución de (2.25). • Un punto p es un punto límite positivo de x(t) si existe una secuencia {tn}, con tn →∞ cuando n →∞ , tal que x(tn) → p cuando n

→ ∞. • El conjunto de todos los puntos límites positivos de x(t) se denomina el conjunto límite positivo de x(t). • Un conjunto M es un conjunto invariante con respecto a (2.25) si • (0) ( ) , x M x t M t∈ ⇒ ∈ ∀ ∈ • Un conjunto M es un conjunto invariante positivo si • (0) ( ) , 0x M x t M t∈ ⇒ ∈ ∀ ≥

• Decimos que x(t) tiende a M cuando t tiende a infinito si para cada ε > 0 existe T > 0 tal que: ( ( ), ) , dist x t M t Tε< ∀ >

donde dist(p,M) denota la distancia de un punto p a un conjunto M, es decir, ( , ) infx Mdist p M p x∈= − . Un PE AE es el conjunto límite positivo de toda solución que comience suficientemente cerca del PE. Un ciclo límite estable es conjunto límite positivo de toda solución que comience suficientemente cerca del ciclo límite. La solución tiende al ciclo límite cuando t → ∞ pero no necesariamente a algún punto específico del ciclo límite, es decir el lim ( )t x t→∞ no necesariamente existe. El PE y el ciclo límite son

conjuntos invariantes porque toda solución que comience sobre ellos se queda allí para todo t∈ . El

conjunto { ( ) }nc x V x cΩ = ∈ ≤ ( ) 0V x ≤ para todo cx∈Ω es un conjunto invariante positivo.

Lema 2.4.1.1.- Si una solución x(t) de (2.25) es acotada y permanece en D para todo t ≥ 0, entonces su conjunto límite positivo L+ es un conjunto invariante, no vacío y compacto. Además, x(t) → L+ cuando t → ∞. 2.4.1.4.- Región de Atracción Sea el origen x = 0 un PE AE del sistema no lineal descrito en (2.25) donde :f D → es localmente Lipschitz y nD ⊂ es un

dominio que contiene el origen. Sea ( , )t xφ la solución de (2.25) con estado inicial x en t = 0. La región de atracción (RA) del origen, RA, se define como:

Page 25: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 21 de 61

{ ( , ) 0 cuando }AR x D t x tφ= ∈ → →∞ El método de Lyapunov puede usarse para encontrar estimas de la RA. Por una estima de la RA entendemos un conjunto ARΩ⊂ tal

que toda trayectoria que comienza en Ω tienda al origen cuando t → ∞. 2.4.1.5.- Sistemas Lineales y Linealización El sistema lineal invariante: x = Ax (2.33) tiene un equilibrio en el origen, que es aislado sí y solo si det A ≠ 0. Si det A = 0, todo punto en el kernel o subespacio nulo de A es un PE. Un sistema lineal no puede tener múltiples PE aislados, porque si x y z son dos PE de (2.33), entonces, por linealidad, todo punto en la recta que conecta a x y z es un PE. Las propiedades de estabilidad del origen pueden caracterizarse mediante la ubicación de los autovalores de A. 2.4.1.5.1.- Teorema de la Estabilidad del Origen en Sistemas Lineales. El PE x = 0 de (2.33) es estable sí y solo si todos los autovalores de A tienen parte real no positiva y cada autovalor con parte real nula tiene un bloque de Jordán asociado de orden 1. El PE x = 0 es GAE sí y solo si todos los autovalores de A tienen parte real negativa. Cuando todos los autovalores de A tienen parte real negativa, se dice que A es una matriz de estabilidad o matriz Hurwitz. La estabilidad del origen puede también investigarse usando el método de Lyapunov. Consideremos la candidata a función de Lyapunov V(x) = xTPx donde P es una matriz real simétrica definida positiva. La derivada de V(x) sobre las trayectorias del sistema está dada por:

( ) ( ) -T T T T TV x x Px x Px x PA A P x x Qx= + = + = donde Q es una matriz simétrica definida por:

-TPA A P Q+ = (2.34) Si Q es definida positiva, podemos concluir por el Teorema de Lyapunov que el origen es AE. En el caso de sistemas lineales, es posible revertir los pasos del método de Lyapunov. Supongamos que comenzamos eligiendo Q como una matriz real simétrica definida positiva, y resolvemos (2.34) para encontrar P. Si (2.34) tiene una solución definida positiva, podemos nuevamente concluir que el origen es AE. La ecuación (2.34) se denomina ecuación de Lyapunov. Teorema 2.4.1.5.2. Una matriz A es Hurwitz, o sea, todos sus autovalores tienen parte real negativa, síí dada una matriz Q simétrica y definida positiva, existe una matriz P simétrica y definida positiva que satisface la ecuación de Lyapunov (2.34). Más aún, si A es Hurwitz, entonces P es la única solución de (2.34). Demostración. La suficiencia sigue del Teorema 1 con la función de Lyapunov V(x) = xTPx, como ya mostramos. Para probar la necesidad, supongamos que todos los autovalores de A tienen parte real negativa y consideremos la siguiente matriz P

0

TA t AtP e Qe dt∞

= ∫ (2.35)

El integrando es una suma de términos de la forma 1 itkt eλ+ con Re 0iλ < . Por lo tanto, la integral existe. La matriz P es simétrica. Para probar que es definida positiva, suponemos lo contrario, es decir, que existe un vector x ≠ 0 tal que xTPx = 0.

Page 26: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 22 de 61

Sin embargo,

00 0

0, 0 0

TT T A t At

At

x Px x e Qe xdt

e x t x

∞= ⇒ =

⇒ ≡ ∀ ≥ ⇒ =

porque teA es nosingular para todo t. Esta contradicción muestra que P es definida positiva. Sustituyendo (2.35) en (2.34) se obtiene:

0 0

0

0

T T

T

T

T A t At T A t At

A t At

A t At

PA A P e Qe Adt A e Qe dt

d e Qe Adt

e Qe Q

∞ ∞

+ = +

=

= = −

∫ ∫

lo que muestra que P es una solución de (2.34). Para mostrar que es la única solución, supongamos que existe otra solución ≠P P . Entonces, ( - ) ( - ) 0TP P A A P P+ =

Premultiplicando por te

TA y postmultiplicando por

teA, obtenemos

0 ( )TA t Atd e P P e

dt= −

Por lo tanto,

( ) constante TA t Ate P P e t− ≡ ∀

Evaluando en t = 0 y t = ∞ obtenemos P P= La resolución de la ecuación de Lyapunov (2.34) no es numéricamente más ventajosa que calcular los autovalores de A. La ventaja de este método es que nos provee de una función de Lyapunov cuando A es Hurwitz. Esto nos va a servir para sacar conclusiones sobre el sistema cuando el lado derecho Ax esté perturbado. Volvamos al sistema no lineal (2.25)

( ) ( )t xx f=

donde : nf D → es una función continuamente diferenciable desde un dominio nD ⊂ en n . Supongamos que el origen x = 0 está en el interior de D y es un PE del sistema; es decir f (0) = 0. Por el teorema del valor medio:

(0) ( )ii i i

ff f z xx∂

= +∂

(2.36)

donde iz es un punto sobre el segmento de línea que conecta x al origen. La igualdad (2.36) vale para todo punto x D∈ tal que el

segmento de línea que conecta x al origen esté totalmente contenido en D. Como f (0) = 0, podemos escribir ( )if x como:

Page 27: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 23 de 61

( ) (0) ( ) (0)i i i ii i i

f f f ff z x x z xx x x x

∂ ∂ ∂ ∂⎡ ⎤= = + −⎢ ⎥∂ ∂ ∂ ∂⎣ ⎦

Por lo tanto f(x) = Ax + g(x) donde

(0), ( ) ( ) (0)i ii i

f ff g x z xx x x

∂ ∂∂ ⎡ ⎤= = −⎢ ⎥∂ ∂ ∂⎣ ⎦A

La función ( )ig x satisface

( ) ( ) (0)i ii i

f fg x z xx x

∂ ∂≤ −

∂ ∂

Por continuidad de fx∂∂

vemos que

( )0, cuando x 0ig x

x→ →

Esto sugiere que en un entorno pequeño del origen podemos aproximar al sistema no lineal (2.25) por su linealización alrededor del origen

x = Ax donde (0)fx∂

=∂

A

El siguiente teorema, conocido como el método indirecto de Lyapunov, da condiciones para determinar la estabilidad del origen del sistema no lineal, a través del estudio de la estabilidad del sistema linealizado. Teorema 2.4.1.6. Método Indirecto de Lyapunov. Sea x = 0 un PE del sistema no lineal:

( ) ( )t xx f= donde : nf D → es una función continuamente diferenciable y nD ⊂ es un entorno del origen. Sea

0

( )x

f xx =

∂=∂

A

Entonces: 1. El origen es AE si todos los autovalores de A tienen parte real negativa. 2. El origen es inestable si uno o más autovalores de A tiene parte real positiva.

Page 28: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 24 de 61

Demostración. Para probar la primera parte, asumamos que A es Hurwitz. Por el Teorema 5 sabemos que dada cualquier Q > 0 simétrica, la solución P de (2.34) es definida positiva. Usamos V(x) = xTPx como candidata a función de Lyapunov para el sistema no lineal. La derivada de V(x) sobre las trayectorias del sistema está dada por

[ ][ ]

( ) ( ) ( )

( ) ( )

( ) 2 ( ) 2 ( )

TT

T T T T

T T T

T T

V x x Pf x f x Px

x P Ax g x x A g x Px

x PA A P x x Pg xx Qx x Pg x

= +

⎡ ⎤= + + +⎣ ⎦= + +

= − +

El primer término en el lado derecho es definido negativo, mientras que el segundo es, en general, indefinido. La función g(x) satisface:

22

2

( )0, cuando x 0

g xx

→ →

Por lo tanto, dado 0γ > existe r > 0 tal que 2 2, 2( )g x x x rγ< ∀ < Entonces

22 2

2( ) 2 , TV x x Qx P x x rγ< − + ∀ <

pero 2

min 2( )Tx Qx Q xλ≥

donde ( )minλ ⋅ denota el mínimo autovalor de una matriz. Notar que min ( )Qλ es real y positivo porque Q es simétrica y definida positiva. Por lo tanto

22 2min 2

( ) ( ) 2 , V x Q P x x rλ γ< − ⎡ − ⎤ ∀ <⎣ ⎦

Eligiendo min2

( )(2 )

QP

λγ ⎧ ⎫< ⎨ ⎬⎩ ⎭

aseguramos que ( )V x es negativa definida. Por el Teorema 1, el origen es AE.

2.4.2.- Teorema de Estabilidad de Lyapunov para sistemas inestacionarios. Consideremos el sistema inestacionario

( , )x f x t= (2.37) donde :[0, ) nf D∞ × → es seccionalmente continua en t y localmente Lipschitz en x en[0, ) nD y D∞ × ⊂ es un

dominio que contiene al origen x = 0. El origen es un PE de (2.37) para 0t = si (0, ) 0, 0f t t= ∀ ≥ . Un equilibrio en el origen puede ser la translación de un PE que no está en cero o, más generalmente, la translación de una solución no nula del sistema. Definición 2.4.2.1 (Estabilidad Uniforme). El PE x = 0 de (2,37) es: • Estable, si para cada 0ε > existe 0( , ) 0tδ δ ε= > tal que

0 0( ) ( ) , t tx t x tδ ε< ⇒ < ∀ ≥ (2.38)

Page 29: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 25 de 61

• Uniformemente estable, si para cada 0ε > existe ( ) 0δ δ ε= > , independiente de t0, tal que (2.37) se satisface. • Inestable, si no es estable. • Asintóticamente estable, si es estable y existe 0( )c c t= tal que ( ) 0x t → cuando t →∞ para todo 0( )x t c<

• Uniformemente asintóticamente estable, si es uniformemente estable y existe c > 0 independiente de t0 tal que para todo 0( ) , ( ) 0x t c x t< → cuando t →∞ , uniformemente en t0; es decir, para cada 0ε > existe ( )T T ε= tal que

0 0( ) , t t ( ), ( )x t T x t cε ε< ∀ ≥ + ∀ <

• Globalmente uniformemente asintóticamente estable, si es uniformemente estable y para cada par de números positivos ε y c, existe ( , )T T cε= tal que

0 0( ) , t t ( , ), ( )x t T c x t cε ε< ∀ ≥ + ∀ < Teorema 2.4.2.1 (Estabilidad Asintótica Uniforme). Sea x = 0 un PE de (2.37) y sea nD ⊂ un dominio que contiene al origen. Sea

:[0, ) nV D∞ × → una función continuamente diferenciable tal que

1 2( ) ( , ) ( )W x V x t W x≤ ≤ (2.39)

3( , ) ( )V V f x t W xt x

∂ ∂+ ≤ −

∂ ∂ (2.40)

0,t x D∀ ≥ ∀ ∈

donde ( )iW x son funciones continuas definidas positivas en D. Entonces x = 0 es uniformemente AE. Una función V(x,t) que satisface la desigualdad (2.39) se denomina definida positiva; una función V(x,t) que satisface la desigualdad (2.40) se denomina decreciente. Una función V(x,t) que satisface (2.39) y (2.40) se denomina función de Lyapunov. Corolario 2.4.2.2. (Estabilidad Asintótica Uniforme Global). Supongamos que las condiciones del Teorema 2.4.2.1 se satisfacen para todo nx∈ y 1( )W x es radialmente no acotada. Entonces x = 0 es globalmente uniformemente AE. El siguiente corolario da la versión para estabilidad exponencial. Corolario 2.4.2.3. (Estabilidad Exponencial Uniforme). Supongamos que las condiciones del Teorema 2.4.2.1 se satisfacen con

1 1( ) ,cW x k x≥ 2 2( ) ,cW x k x≤ 3 3( ) ,cW x k x≥ para ciertas constantes positivas k1, k2, k3 y c. Entonces x = 0 es exponencialmente estable. Más aún, si las condiciones valen globalmente, entonces x = 0 es globalmente exponencialmente estable. 2.4.2.1.- Sistema lineal inestacionario. El sistema lineal no estacionario

( )tx A x= (2.41) tiene un PE en x = 0. Sea A(t) continua para todo t ≥ 0. Supongamos que existe una matriz P(t) simétrica, continuamente diferenciable, acotada y definida positiva, es decir,

( )1 20 , 0tc I P c I t≤ ≤ ≤ ∀ ≥ que satisface la ecuación diferencial matricial

( ) ( ) ( ) ( ) ( )- Tt t t t tP P A A P Q= + +

Page 30: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 26 de 61

donde Q(t) es continua, simétrica y definida positiva; es decir,

( ) 3 0, 0tQ c I t≥ > ∀ ≥ Consideremos la candidata a función de Lyapunov

( )( , ) TtV x t x P x=

La función V(x,t) es definida positiva, decreciente y radialmente no acotada, ya que

2 2( , )1 22 2x tc x V c x≤ ≤

La derivada de V sobre las trayectorias del sistema (2.41) está dada por

( , ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

( )

23 2

( )

T T Tx t t t t

T Tt t t t t

Tt

V x P x x P x x P xx P P A A P x

x Q x

c x

= + +

= + +

= −

= −

Por lo tanto, ( , )x tV es definida negativa. Concluimos que el origen es globalmente exponencialmente estable. 2.4.2.1.- Teoremas Conversos El Teorema 2.4.2.1. y sus corolarios establecen estabilidad asintótica uniforme (o estabilidad exponencial) del origen requiriendo la existencia de una función de Lyapunov que satisfaga ciertas condiciones. Dos preguntas se nos ocurren inmediatamente: primero, ¿existe una función que satisfaga las condiciones del teorema? Y segundo, ¿cómo la encontramos si existe? Los teoremas conversos dan una respuesta afirmativa a la primera pregunta. Para responder a la segunda pregunta vamos a ver más adelante que vamos a tener que especializar el análisis a ciertas clases de sistemas no lineales. Teorema 2.4.2.2. Sea x = 0 un PE del sistema no lineal

( , )x f x t=

donde :[0, ) nf D∞ × → es continuamente diferenciable, { }nD x x r= ∈ < , y la matriz Jacobiana fx∂∂

es acotada

en D, uniformemente en t. Sean 0, k y rγ constantes positivas con 0rr k< . Sea 0 0{ }nD x x r= ∈ < . Supongamos

que las trayectorias del sistema satisfacen 0( )

0 0 0, 0( ) ( ) , ( ) 0t tx t k x t e x t D t tγ− −≤ ∀ ∈ ∀ ≥ ≥ Entonces existe una función 0:[0, )V D∞ × → que satisface las desigualdades:

2 21 2( , )c x V x t c x≤ ≤

23( , )V V f x t c x

t x∂ ∂

+ ≤ −∂ ∂

4V c xx

∂≤

Page 31: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 27 de 61

para ciertas constantes positivas c1, c2, c3 y c4. Más aún, si r = ∞ y el origen es globalmente exponencialmente estable, entonces V(x,t) está definida y satisface las desigualdades de arriba en todo n . Si el sistema es estacionario, V puede elegirse independiente de t. El siguiente teorema vincula la estabilidad exponencial del origen del sistema no lineal con la estabilidad exponencial de su linealización alrededor del origen. Teorema 2.4.2.3.- Sea x = 0 un PE del sistema no lineal

( , )x f x t=

donde :[0, ) nf D∞ × → es continuamente diferenciable,2

{ }nD x x r= ∈ < , y la matriz Jacobiana fx∂∂

es

acotada y Lipschitz en D, uniformemente en t. Sea

( )0

( , )tx

fA x tx =

∂=∂

Entonces el origen es un PE exponencialmente estable del sistema no lineal síí es un PE exponencialmente estable para el sistema lineal

( )tx A x= 2.5.- Estrategia de control 2.5.1.- Control Óptimo Cuadrático El objetivo del diseño de un sistema de control es obtener un comportamiento preestablecido del proceso o planta para el cual se aplica el sistema de control dado, es decir, que las variables de interés del proceso cumplan con ciertos requisitos. Al diseñar sistemas de control, con frecuencia nos interesa seleccionar el vector de control u(t) tal que un índice de desempeño determinado se minimice. Se puede demostrar [19] que un índice de desempeño cuadrático (J), en el que los límites de integración son 0 e ∞ , de modo que:

0dt

∞= ∫J L(x,u)

en donde L(x, u) es una función cuadrática o una función hermitiana de x y u, producirá la ley de control lineal; es decir

( ) ( )t t= −u Kx (2.42) Donde K es una matriz de r x n:

11 12 1 11

21 22 2 22

1 2

n

n

r r rn nr

k k k xuk k k xu

k k k xu

⎡ ⎤ ⎡ ⎤⎡ ⎤⎢ ⎥ ⎢ ⎥⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ =⎢ ⎥ ⎢ ⎥⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥

⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ ⎣ ⎦

Por lo que, el diseño de los sistemas de control óptimo y los sistemas reguladores óptimos basados en tales índices de desempeño cuadráticos se reducen [17, 19] a la determinación de los elementos de la matriz K. Una ventaja de usar el esquema de control óptimo cuadrático es que el sistema diseñado será estable, excepto en el caso que el sistema no sea controlable. Consideraremos el problema de determinar el vector de control u(t) óptimo para el sistema descrito mediante la ecuación: = +x Ax Bu (2.43)

Page 32: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 28 de 61

En las cuales por brevedad de escritura hemos omitido el subíndice temporal y en donde x = vector de estado (vector de orden n) u = vector de control (vector de orden p) y = vector de salida (vector de orden m) A = matriz del sistema de orden n x n B = matriz de control de orden n x p y el índice de desempeño obtenido mediante:

0( )dt

∞= ∫J x*Qx + u* Ru (2.44)

en donde Q es una matriz hermitiana o simétrica real definida positiva (o semidefinida positiva), R es una matriz hermitiana o simétrica real definida positiva y u no está restringida. En el análisis de los problemas de control óptimo cuadrático en general usamos los índices de desempeño cuadráticos complejos (índices hermitianos de desempeño). Para los sistemas con vectores reales y matrices reales, se presenta que:

0 0) )T Tdt dt

∞ ∞=∫ ∫x*Qx + u* Ru x Qx + u Ru (2.44A)

Por lo general, la estabilidad de los sistemas de control se examina una vez que estos se han diseñado. Sin embargo, también es posible formular primero las condiciones de estabilidad [19] para luego diseñar el sistema de control dadas las limitaciones así establecidas. La aplicación del segundo método de Lyapunov con el fin de asentar la base para el diseño de un controlador óptimo, confirma que el sistema de control funcione; es decir, que la salida del sistema se conduzca en forma continua hacia su valor deseado. Por lo tanto, el sistema diseñado tiene una configuración con características de estabilidad inherentes. Para una clase amplia de los sistemas de control, se puede mostrar una relación directa entre las funciones de Lyapunov y los índices cuadráticos de desempeño usados en las síntesis de los sistemas de control óptimo. Consideraremos el problema de control óptimo en el cual, dadas las condiciones del sistema descrito por la ecuación (2.43), se determina la matriz K del vector de control óptimo de la ecuación (2.42), a fin de minimizar el índice de desempeño

0( * * )dt

∞= ∫J x Qx + u Ru en donde Q es una matriz hermitiana o simétrica real definida positiva (o semidefinida positiva) y R es

una matriz hermitiana o simétrica real definida positiva. El segundo término del segundo miembro de la ecuación (2.44) considera el gasto de energía de las señales de control. Las matrices Q y R son las matrices de ponderación del sistema y determinan la importancia relativa del error y del gasto de este sistema. Por tanto, si se determinan los elementos desconocidos de la matriz K que minimizan el índice de desempeño J , entonces

( ) ( )t t= −u Kx es óptima para cualquier estado inicial x(0), es decir, la ley de control lineal obtenida mediante la ecuación (2.42) es la ley del control óptimo. El diagrama de bloques que muestra la configuración óptima aparece en la figura (2.5.1) Veamos el problema de la estabilización. Sustituimos la ecuación (2.42) dentro de la ecuación (2.43) y obtenemos: x = (A - BK)x (2.45) Suponemos que la matriz A - BK es estable, es decir, que los valores característicos de A - BK tienen todas sus partes reales negativas. Sustituimos la ecuación (2.42) dentro de la ecuación (2.44) y obtenemos:

0 0( * ) ( * )dt dt

∞ ∞= =∫ ∫J x*Qx + x* K RKx x* Q + K RK x

Se puede observar que:

Page 33: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 29 de 61

( * ) ( )ddt

= −x* Q + K RK x x* Px (2.46)

en donde P es una matriz hermitiana o simétrica real definida positiva. Así, obtenemos

( * ) * * *[ * ]= − − = − − + −x* Q + K RK x x Px x Px x (A BK) P P(A BK) x Comparando ambos miembros de esta última ecuación y considerando que la misma debe ser válida para cualquier x, requerimos que:

* ( * )− + − = −(A BK) P P(A BK) Q + K RK (2.47)

Figura 2.6 Sistema de control en lazo cerrado Dado el segundo método de Lyapunov, si −(A BK) es una matriz estable, existe una matriz P definida positiva que satisface la ecuación (2.47). Se trata por tanto, de determinar los elementos de la matriz P a partir de la ecuación (2.47) y verificar si es definida positiva. Existe más de una matriz P que puede satisfacer esta condición, en tanto el sistema sea estable. Es decir que si resolvemos la ecuación (2.47) y encontramos una matriz P definida positiva, el sistema es estable. Cualquier otra matriz P que satisfaga esta ecuación y no sea definida positiva debe descartarse. Dada la ecuación (2.46) el índice de desempeño J se calcula como:

( ) ( ) (0) (0)00

( * ) * * *dt∞ ∞

∞ ∞= = − = − +∫J x* Q + K RK x x Px x Px x Px

Puesto que hemos supuesto que todos los valores característicos de −(A BK) tienen partes reales negativas, tenemos que

( ) 0∞ →x , por tanto: (0) (0)*=J x Px . Así, el índice de desempeño J se obtiene en términos de la condición inicial (0)x y P. Para obtener la solución al problema de control óptimo cuadrático, avanzamos del modo siguiente: dado que se ha supuesto que R es una matriz hermitiana o simétrica real definida positiva, escribimos R = T*T en donde T es una matriz no singular. Así, la ecuación (2.47) se escribe como:

Page 34: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 30 de 61

* ( * * ) 0− + − + =(A BK) P P(A BK) Q + K T TK que puede reescribirse como

1 1 1* [ ( *) * ]*[ ( *) * ] * 0− − −+ + − − − + =A P PA TK T B P TK T B P PBR B P Q La minimización de J con respecto a K requiere de la minimización de

1 1*[ ( *) * ]*[ ( *) * ]− −− −x TK T B P TK T B P x con respecto a K. Dado que esta última expresión es no negativa, el mínimo ocurre cuando es cero, o sea cuando

1( *) *−=TK T B P Por tanto,

1 1 1( *) * *− − −= =K T T B P R B P (2.48) La ecuación (2.48) produce la matriz óptima K. Por lo tanto, la ley del control óptimo para el problema de control óptimo cuadrático es lineal cuando el índice de desempeño se obtiene mediante la ecuación (2.48) y se obtiene mediante:

1( ) ( ) ( )*t t t

−= − = −u Kx R B Px La matriz P de la ecuación (2.48) debe satisfacer la ecuación (2.47) o la ecuación reducida siguiente:

1* * 0−+ − + =A P PA PBR B P Q (2.49) La ecuación (2.49) se denomina ecuación matricial reducida de Riccati. Por tanto si la matriz −(A BK) es estable, la matriz K resultante es óptima y produce la ley del control óptima para el problema del control óptimo cuadrático.

CAPITULO TERCERO 3.- Modelamiento Matemático del Sistema. 3.1.- Descripción del Sistema Para la formulación del modelo matemático se hace entonces necesario establecer algunos supuestos y simplificaciones para lograr un compromiso entre la exactitud del modelo, la complejidad del mismo y el sistema dinámico real, ya que debido a la complejidad de los procesos reales los modelos resultantes suelen ser de dimensiones muy grandes y su análisis resulta muy dispendioso desde el punto de vista teórico y computacional. El sistema péndulo doble invertido es un sistema no lineal e inestable. En condiciones de su posición de equilibrio inestable (posición vertical), el péndulo doble se encuentra sin los elementos necesarios para mantener los brazos verticalmente. Se trata de un sistema con tres (3) grados de libertad DOF, como esta mostrado esquemáticamente en la Figura 3.1. El SPDI consiste en dos péndulos montados en un carrito. Cada péndulo gira en el plano vertical sobre el eje de una juntura articulada, definiendo dos DOFs, Ø1(t) y Ø2(t) (Fig. 3.1). No hay torque aplicado en el eje de Ø1(t) y de Ø2(t) qué son dos junturas pasivas. El carrito se maneja en un riel por un actuador que ejerce una fuerza U (Fig. 3.1) a lo largo del DOF de traslación x. Se considerará solamente el problema en forma bidimensional en el que el sistema de péndulo doble invertido se mueve exclusivamente en el plano XY.

Page 35: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 31 de 61

El primer péndulo tiene una masa m1 y una longitud L1, el segundo péndulo tiene una masa m2 y una longitud L2. La masa de cada péndulo se considera uniformemente distribuida a lo largo de su longitud, por lo tanto se asume concentrada en el centro de masa de cada brazo, ubicado en la mitad de la longitud de cada brazo del péndulo. Tal y como se ilustra en la figura 3.1

Figura 3.1: Sistema de Péndulo Doble Invertido Para nuestro sistema de péndulo doble invertido consideramos las siguientes definiciones:

k

p

E energia cinetica del sistemaE energia potencial del sistemaU Fuerza externa aplicada. Ley de control

===

0

1

21 1 1

1 1

1

m masa carritoaceleracion de gravedadmasa primer pendulo

1Momento de inercia primer pendulo respecto de su eje de rotacion12

2 longitud primer pendulodesplazamiento angular del pr

gm

I m L

L lθ

===

= =

= == imer pendulo respecto de la vertical

2

22 2 2

2 2

2

masa segundo pendulo1Momento de inercia segundo pendulo respecto de su eje de rotacion

122 longitud segundo pendulodesplazamiento angular del segundo pendulo respecto de la vertical

m

I m L

L lθ

=

= =

= ==

U

Ө1

Ө3

X

Y m1 , 2l1

m2 , 2l2

m

Ө2

Page 36: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 32 de 61

3.2.- Ecuaciones dinámicas del péndulo doble invertido Obtener el modelo matemático es el primer paso en el diseño de un sistema de control, ya que el diseño del sistema de control se hará basado en el modelo matemático. Para conocer la dinámica del sistema, podemos deducir su comportamiento a partir de las leyes físicas que lo rigen o a partir de técnicas de identificación de sistemas. En nuestro caso procederemos a obtener el modelo matemático del péndulo doble invertido a partir de las leyes físicas que gobiernan la dinámica de su movimiento. Para ello procederemos a encontrar la energía cinética y la energía potencial del sistema, a partir de las cuales obtenemos el Lagrangiano para luego aplicar las ecuaciones de Euler-Lagrange, que nos proporcionaran las ecuaciones diferenciales ordinarias que nos permitirán deducir el comportamiento dinámico del sistema de péndulo doble invertido. Para el cálculo de la energía cinética total del sistema sumamos las energías cinéticas del carrito y de cada uno de los dos brazos (péndulos) del sistema de péndulo doble invertido. Consecuentemente la energía potencial total del sistema es la suma de la energía potencial de sus partes. Tenemos en cuenta que, dado el nivel de referencia establecido, la energía potencial del carrito es igual a cero. Por tanto:

0 1 2k k k kE E E E= + + (3-1)

0 1 2p p p pE E E E= + + (3-2) Donde:

20 0 0

12

kE m v= Energía cinética del carrito

2 21 1 1 1 1

1 12 2

kE m v I w= + Energía cinética de traslación y angular brazo 1

2 22 2 2 2 2

1 12 2

kE m v I w= + Energía cinética de traslación y angular brazo 2

0 0pE = Energía potencial carrito = 0

1 1 1pE m gy= Energía potencial brazo 1

2 2 2pE m gy= Energía potencial brazo 2

( )0 tv Velocidad de traslación del carrito

( )1 tv Velocidad de traslación brazo 1

( )2 tv Velocidad de traslación brazo 2

( )1 tw Velocidad angular del brazo 1

( )2 tw Velocidad angular del brazo 2

( )1 ty Posición vertical del brazo 1

( )2 ty Posición vertical del brazo 2 Para el cálculo de la energía cinética total del sistema, debemos considerar la energía cinética de traslación del carrito y la energía cinética de traslación y angular de los centros de masa de cada brazo del sistema de péndulo doble invertido. 3.2.1 Cálculo de la Energía Cinética y de la Energía Potencial del sistema de péndulo doble invertido Para el cálculo de la energía cinética, y de la energía potencial primero debemos conocer la velocidad y la posición vertical, respectivamente, tanto del carrito como de los brazos del péndulo doble invertido.

Page 37: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 33 de 61

En la Figura 3.2 podemos ver un esquema simple del péndulo doble invertido y las variables a considerar para dicho cálculo. Así tenemos:

( )0 tx Posición horizontal del carrito

( )0 ty Posición vertical del carrito

( )1 tx Posición horizontal del brazo 1

( )1 ty Posición vertical del brazo 1

( )2 tx Posición horizontal del brazo 2

( )2 ty Posición vertical del brazo 2

( )1 tθ Posición angular brazo 1

( )2 tθ Posición angular brazo 2

( )0 tx Velocidad horizontal del carrito

( )0 ty Velocidad vertical del carrito

( )1 tx Velocidad horizontal del brazo 1

( )1 ty Velocidad vertical del brazo 1

( )2 tx Velocidad horizontal del brazo 2

( )2 ty Velocidad vertical del brazo 2

( ) ( )1 1t twθ = Velocidad angular del brazo 1

( ) ( )2 2t twθ = Velocidad angular del brazo 2 Las coordenadas de posición de cada una de las partes del sistema de péndulo doble invertido son:

( ) 1 11 0tx x l senθ= +

( ) 11 1 costy l θ=

( ) 1 1 2 22 0 Ltx x sen l senθ θ= + +

( ) 1 22 1 2L cos costy lθ θ= + Por tanto las velocidades del carrito y de los péndulos son: Velocidad del carrito:

ˆ(t)0(t) (t)0 0

dxv = i = xdt

(3-3)

Velocidades péndulo 1:

1ˆ ˆ ˆ ˆ=

(t) (t)1 1(t) (t) (t)1 1

(t) (t)1 1

dx dyv i + j = x i + y jdt dt

w = θ (3-4)

Page 38: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 34 de 61

Velocidades péndulo 2:

ˆ ˆ ˆ ˆ(t) (t)2 2(t) (t) (t)2 2 2

(t) (t)2 2

dx dyv = i + j = x i + y jdt dt

w = θ (3-5)

Es decir:

( ) ( )0 0ˆt tx i=v (3-6)

( ) ( ) 1( ) 1( ) 1( ) 1( )1 0 1 1ˆ ˆ( cos )t t t t t tx l i l sen jθ θ θ θ= + −v (3-7)

( ) ( ) 1( ) 1( ) 2( ) 2( ) 1( ) 1( ) 2( ) 2( )2 0 1 2 1 2ˆ ˆ( cos cos ) ( )t t t t t t t t t tx L l i L sen l sen jθ θ θ θ θ θ θ θ= + + − +v (3-8)

( )tt t

ddt

=1( ) ( )1 1

θw = θ (3.9)

( )tt t

ddt

=2( ) ( )2 2

θw = θ (3.10)

Figura 3.2: Sistema del péndulo doble invertido montado en un carrito

l2cosӨ2

Y

Nivel de referencia. Ep=0

l2sen Ө2 l1senӨ1

L1senӨ1

Y1=l1cosӨ1

L1cosӨ1

X2

X0 X1

U

Ө1

Ө2

X

m1 , 2l1

m2 , 2l2

m0

Y2Centro de masa brazo 1

Centro de masa brazo 2

w2

w1

I1

I2

Page 39: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 35 de 61

Así la energía cinética del carrito y de los dos péndulos es:

20 0 0

2 2 2( ) ( ) ( ) ( ) ( ) ( )1 1 0 1 1 1 1 1 1 1 1

2 2 2( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 2 0 1 1 1 2 2 2 1 1 1 2 2 2 2 2

121 1m [( cos ) ( ) ]2 21 1[( cos cos ) ( ) ]2 2

k

t t t t t tk

t t t t t t t t t tk

E m x

E x l l sen I

E m x L l L sen l sen I

θ θ θ θ θ

θ θ θ θ θ θ θ θ θ

=

= + + +

= + + + + +

(3-11)

La energía cinética total del sistema de doble péndulo invertido es:

2 2 2 2 2

0 0 1 1 2 21 1 2 21 1 1 1 12 2 2 2 2

kE m v m v I w m v I w= + + + + (3-12)

2 2 2 2

( ) ( ) ( ) ( ) ( ) ( )0 0 1 0 1 1 1 1 1 1 1 1

2 2 2 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 0 1 1 1 2 2 2 1 1 1 2 2 2 2 2

1 1 1m [( cos ) ( ) ]2 2 2

1 1[( cos cos ) ( ) ]2 2

k t t t t t t

t t t t t t t t t t

E m x x l l sen I

m x L l L sen l sen I

θ θ θ θ θ

θ θ θ θ θ θ θ θ θ

= + + + +

+ + + + + +

La energía potencial total del sistema de doble péndulo invertido es:

1 1 2 2pE m gy m gy= + (3-13)

1 1 1 2 1 1 2 2cos ( cos cos )pE m gl m g L lθ θ θ= + + (3-14) 3.2.2 Ecuaciones de Euler-Lagrange Obtenida la energía cinética y la energía potencial del sistema, procedemos a encontrar el Lagrangiano, que es la energía cinética menos la energía potencial del sistema. El Lagrangiano se define como:

( ) ( )( , )t tq q k pL E E= − (3-15)

Donde ( ) ( ) t tq y q son las coordenadas generalizadas del sistema de péndulo doble invertido definidas como:

( ) 0 ( ) 1( ) 2 ( ) 0 ( ) 1( ) 2 ( )

( ) 0 ( ) 1( ) 2 ( ) 0 ( ) 1( ) 2 ( )

[ ] [ ]

[ ] [ ]

T Tt t t t t t t

T Tt t t t t t t

q q q q x

q q q q x

θ θ

θ θ

= =

= = (3.16)

El lagrangiano para el sistema del péndulo doble invertido queda entonces definido como:

( ) ( )2 2 2 2

( , ) ( ) ( ) ( ) ( ) ( ) ( )0 0 1 0 1 1 1 1 1 1 1 1

2 2 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 0 1 1 1 2 2 2 1 1 1 2 2 2

1 1 1m [( cos ) ( ) ]2 2 2

1 [( cos cos ) ( ) ]2

t tq q t t t t t t

t t t t t t t t t

m q q l q q l q senq I q

m q L q q l q q L q senq l q senq

L = + + + +

+ + + + +

2( )2 2 1 1 1 2 1 1 2 2

1 cos ( cos cos )2

tI q m gl q m g L q l q+ − − +

(3.17)

Page 40: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 36 de 61

Las ecuaciones diferenciales de primer orden que describen el comportamiento dinámico del sistema las obtenemos a partir de las derivadas respecto de los vectores ( )tq y ( )tq y respecto del tiempo del Lagrangiano, es decir calculando las ecuaciones de Euler -

Lagrange e igualándolas a las fuerzas y momentos generalizados aplicados al sistema ( =Q U + F ). Las ecuaciones de Euler-Lagrange en notación vectorial están definidas como: dd t

⎛ ⎞∂ ∂− = =⎜ ⎟∂ ∂⎝ ⎠

L L Q U + Fq q

(3-18)

Donde k pL = E - E , [ 0 0 ]Tu=U y

00 1 1 2 2[ sg n ( ) sg n ( ) sg n ( ) ]Tq a bq N q B q q B qμ= − − −F

Donde, u es la entrada de control, F es el término de fricción para las junturas del sistema de péndulo doble invertido.

0qμ es la

constante de fricción de coulomb, N la normal al sistema de péndulo doble invertido, aB constante de fricción viscosa en la juntura

carrito - primer péndulo y bB constante de fricción viscosa en la juntura primer péndulo – segundo péndulo. La ecuación (3.18) es simplemente una forma diferente del Principio de D’Alambert o de las ecuaciones de movimiento de Newton, que escribiremos como funciones diferenciales de primer orden no lineales. Para lograrlo rescribiremos el lagrangiano como:

( ) ( )2 2 2 2 2 2

( , ) 0 1 2 0 1 1 2 1 1 1 2 2 2 2 1 1 2 1 0 1 1

2 2 0 2 2 2 1 2 1 2 1 2 1 1 2 1 1 2 2 2

1 1 1( ) ( ) ( ) ( ) cos2 2 2

cos cos( ) ( ) cos cos

t tq q m m m q m l m L I q m l I q m l m L q q q

m l q q q m L l q q q q m l m L g q m gl q

L = + + + + + + + + +

+ + − − + −

Veamos:

0

0Lq∂

=∂

1 1 2 1 0 1 1 2 1 2 1 2 1 2 1 1 2 1 11

( ) ( ) ( )L m l m L q q sen q m L l q q sen q q m l m L g sen qq∂

= − + − − + +∂

2 2 0 2 2 2 1 2 1 2 1 2 2 2 22

( )L m l q q sen q m L l q q sen q q m l g sen qq∂

= − + − +∂

0 1 2 0 1 1 2 1 1 1 2 2 2 20

( ) ( ) c o s c o sL m m m q m l m L q q m l q qq∂

= + + + + +∂

2 21 1 2 1 1 1 1 1 2 1 0 1 2 1 2 2 1 2

1

( ) ( ) c o s c o s ( )L m l m L I q m l m L q q m L l q q qq∂

= + + + + + −∂

22 2 2 22 2 2 0 2 2 1 2 1 1 2

2

( ) co s co s( )L m l I q m l q q m L l q q qq∂

= + + + −∂

Page 41: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 37 de 61

0 1 2 0 1 1 2 1 1 1 2 2 2 20

2 21 1 2 1 1 1 2 2 2 2

( ) ( ) co s co s

( )

d L m m m q m l m L q q m l q qd t q

m l m L q sen q m l q sen q

⎛ ⎞∂= + + + + +⎜ ⎟∂⎝ ⎠− + −

2 21 1 2 1 0 1 1 1 2 1 1 1 2 1 2 2 1 2

1

1 1 2 1 0 1 1 2 1 2 2 1 2 1 2

( ) co s ( ) co s ( )

( ) ( ) ( )

d L m l m L q q m l m L I q m L l q q qd t q

m l m L q q sen q m L l q q q sen q q

⎛ ⎞∂= + + + + + −⎜ ⎟∂⎝ ⎠− + − − −

22 2 0 2 2 1 2 1 1 2 2 2 2 2

2

2 2 0 2 2 2 1 2 1 1 2 1 2

co s co s( ) ( )

( ) ( )

d L m l q q m L l q q q m l I qd t q

m l q q sen q m L l q q q sen q q

⎛ ⎞∂= + − + +⎜ ⎟∂⎝ ⎠− − − −

Por consiguiente las ecuaciones de Euler – Lagrange quedan como:

0

0 1 2 0 1 1 2 1 1 1 2 2 2 20 0

2 21 1 2 1 1 1 2 2 2 2 0

( ) ( ) c o s co s

( ) sg n ( ) q

d L L m m m q m l m L q q m l q qd t q q

m l m L q sen q m l q sen q u q Nμ

⎛ ⎞∂ ∂− = + + + + +⎜ ⎟∂ ∂⎝ ⎠

− + − = −

2 21 1 2 1 0 1 1 1 2 1 1 1 2 1 2 2 1 2

1 1

22 1 2 2 1 2 1 1 2 1 1 1 1

( ) cos ( ) cos( )

( ) ( ) sg n ( ) a

d L L m l m L q q m l m L I q m L l q q qd t q q

m L l q sen q q m l m L gsenq q B q

⎛ ⎞∂ ∂− = + + + + + −⎜ ⎟∂ ∂⎝ ⎠

+ − − + = −

22 2 0 2 2 1 2 1 1 2 2 2 2 2

2 2

22 1 2 1 1 2 2 2 2 2 2

co s co s ( ) ( )

( ) sg n ( ) b

d L L m l q q m L l q q q m l I qd t q q

m L l q sen q q m l g sen q q B q

⎛ ⎞∂ ∂− = + − + +⎜ ⎟∂ ∂⎝ ⎠

− − − = −

En forma matricial compacta:

)(q ) (q , q ) (q ) q qM q + N q + G = Q ( , u (3.19) Donde:

1 2 31 2

2 4 51 1 2

3 5 62 1 2

M M cos M cosM cos M M cos( - )M cos M cos( - ) M

q qq q qq q q

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

M(q) =

M(q): Es una matriz simétrica y no singular y es llamada matriz de masa generalizada del sistema.

2 31 1 2 2

51 2 1 2

5 1 1 2 2

0 -M sen -M sen, 0 sgn( ) M sen( - )

0 -M sen( - ) sgn( )a

b

q q q qq B q q q

q q q q B

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

N(q q) =

Page 42: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 38 de 61

2 1

3 2

0-M gsen-M gsen

qq

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

G(q) =

1) 0

0

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

Q(q,q =

00sgn( ) qu q Nμ= −u Con:

1 0 1 2

2 1 1 2 1 1 2 1

3 2 2 2 2

2 2 24 1 1 2 1 1 1 2 1

M1M2

1M2

1M3

m m m

m l m L m m L

m l m L

m l m L I m m L

= + +

⎛ ⎞= + = +⎜ ⎟⎝ ⎠

= =

⎛ ⎞= + + = +⎜ ⎟⎝ ⎠

5 2 1 2 2 1 2

2 26 2 2 2 2 2

0 1 2 1

1M2

1M3

( ) M

m L l m L L

m l I m L

N m m m g g

= =

= + =

= + + =

(q)M : Matriz de Inercia generalizada (q , q )N : Término de Coriolis, explica la variación de la rapidez de los brazos del péndulo por la variación de su posición angular. (q )G : Término gravitacional

)(q , qQ : Matriz de Fuerzas y/o momentos generalizados aplicados.

CAPITULO CUARTO 4. Representación en el Espacio de Estados. 4.1 Modelo de Estado no lineal Nos encontramos frente a un sistema no lineal que puede ser descrito por un número finito de ecuaciones diferenciales ordinarias, dadas por la ecuación matricial:

-1 -1 -1q = -M N q + M Q u - M G (4.1) Representaremos las ecuaciones en una forma compacta no lineal por la ecuación diferencial vectorial de primer grado (ecuaciones de estado no lineales), que en sistemas continuos es de la forma:

Page 43: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 39 de 61

x = f(x,u) (4.2) Donde x es el vector columna de variables de estado y u es el vector columna de entradas de control. Para escribir nuestro sistema como (4.2), elegimos como variables de estado:

[ ] 6 Tq q= ∈x x Por consiguiente reformularemos las ecuaciones de Euler – Lagrange como un sistema en 6 de ecuaciones diferenciales ordinarias de primer orden, así:

⎡ ⎤ ⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ ⎣ ⎦

-1 -1 -1

0 I 0 0x = x + u +

0 -M N M Q -M G (4.3)

Donde:

11 12 13-1

21 22 23

31 32 33

m m mM m m m

m m m

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

12 13

-122 23

32 33

0 mn mnM N 0 mn mn

0 mn mn

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

11 11-1

21 21

31 31

mq mM Q mq m

mq m

⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥= =⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

11 12 21 13 31-1

21 22 21 23 31

31 32 21 33 31

mg m g m gM G mg m g m g

mg m g m g

+⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥= = +⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥+⎣ ⎦ ⎣ ⎦

Con:

2 211 4 6 5 1 2

12 2 6 1 3 5 2 1 2

1m M M M cos ( )

1m M M cos M M cos cos( )

[ ]

[ ]

q q

q q q q

= − −Δ

= − − −Δ

13 2 5 1 1 2 3 4 2

21 12

2 222 1 6 3 2

1m M M cos cos( ) M M cos

m m1m M M M cos

[ ]

[ ]

q q q q

q

= − −Δ

=

= −Δ

Page 44: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 40 de 61

23 1 5 1 2 2 3 1 2

31 13

32 23

2 233 1 4 2 1

1m M M cos( ) M M cos cos

m mm m

1m M M M cos

[ ]

[ ]

q q q q

q

= − − −Δ

==

= −Δ

2 2 2 2 2 21 4 6 2 3 5 1 2 1 2 3 4 2 1 5 1 2 2 6 1M M M 2M M M cos cos cos( ) M M cos M M cos ( ) M M cosq q q q q q q qΔ = + − − − − −

212 2 4 6 1 2 5 1 2 2 3 4 5 2 1 2 1

1 3 5 2 1 2 2 6 1

1mn M M M sen M M cos( )sen M M M cos sen( )

1 sgn( ) M M cos cos( ) M M cos

[ ]

[ ]a

q q q q q q q q

q B q q q q

= − − − − −Δ

+ − −Δ

213 3 4 6 2 3 5 1 2 1 2 5 6 1 1 2 2

2 2 5 1 1 2 3 4 2

2 222 2 6 1 1 2 3 5 2 1 2 1 5 1 2 1 2 1

1mn M M M sen M M cos( )sen M M M cos sen( )

1 sgn( ) M M cos cos( ) M M cos

1mn M M cos sen M M M cos sen(2 ) M M cos( )sen( )

[ ]

[ ]

[ ]

b

q q q q q q q q

q B q q q q

q q q q q q q q q q

= − − − + −Δ

+ − −Δ

= − − + − −Δ

2 21 1 6 3 2

223 2 3 6 1 2 3 5 2 1 1 5 6 1 2 2

2 2 3 1 2 1 5 1 2

232 2 5 1 2 2 3 4 2 1 1 4

1 sgn( ) M M M cos

1mn M M M cos sen M M cos sen M M M sen( )

1 sgn( ) M M cos cos M M cos( )

1mn M M cos sen M M M cos sen M M

[ ]

[ ]

[ ]

[

a

b

q B q

q q q q q q q

q B q q q q

q q q q

+ −Δ

= − + −Δ

+ − −Δ

= − − +Δ 5 1 2 1

1 2 3 1 2 1 5 1 2

2 233 2 3 5 1 1 2 3 4 2 2 1 5 1 2 1 2 2

2 22 1 4 2 1

M sen( )

1 sgn( ) M M cos cos M M cos( )

1mn M M M cos sen( 2 ) M M cos sen M M cos( )sen( )

1 sgn( ) M M M cos

]

[ ]

[ ]

[ ]

a

b

q q q

q B q q q q

q q q q q q q q q q

q B q

+ − −Δ

= − + − − −Δ

+ −Δ

2 211 11 4 6 5 1 2

21 21 2 6 1 3 5 2 1 2

31 31 2 5 1 1 2 3 4 2

1mq m M M M cos ( )

1mq m M M cos M M cos cos( )

1mq m M M cos cos( ) M M cos

[ ]

[ ]

[ ]

q q

q q q q

q q q q

= = − −Δ

= = − − −Δ

= = − −Δ

Page 45: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 41 de 61

2 211 2 6 1 1 2 3 5 1 2 1 2 3 4 2 2

221 1 2 6 1 2 3 2 1 2 1 3 5 1 2 2

231 1 2 5 1 2 1 2 3 1 1 2 1 3 4

1mg M M g cos sen M M M cos( )sen( ) M M cos sen

1mg M M M gsen M M cos sen( ) M M M cos( )sen

1mg M M M cos( )sen M M cos sen( ) M M M sen

[ ]

[ ]

[

q q g q q q q g q q

q g q q q g q q q

g q q q g q q q g

= − − + +Δ

= − − − − −Δ

= − − − −Δ 2 ]q

Por tanto, como:

[ ] [ ]0 1 2 0 1 2 1 2 3 4 5 6 T Tq q q q q q x x x x x x= =x y [ ] [ ]0 1 2 0 1 2 1 2 3 4 5 6 T Tq q q q q q x x x x x x= =x Entonces, las ecuaciones diferenciales de primer orden no lineales, quedan:

0 1( )

1 2( )

2 3( )

0 11 0 12 1 13 2 11 11 4( )

1 21 0 22 1 23 2 21 21 5( )

2 31 0 32 1 33 2 31 31 6( )

mn mn mn mq mg

mn mn mn mq mg

mn mn mn mq mg

q f

q f

q f

q q q q f

q q q q f

q q q q f

=

=

=

= − − − + − =

= − − − + − =

= − − − + − =

x,u

x,u

x,u

x,u

x,u

x,u

u

u

u

Y las ecuaciones diferenciales ordinarias de primer orden del sistema no lineal de péndulo doble invertido son:

1 1( ) 4x f x= =x,u

2 2( ) 5x f x= =x,u

3 3( ) 6x f x= =x,u

2 24 4( ) 2 4 6 2 2 5 2 3 3 3 4 5 3 2 3 5

5 2 6 2 3 5 3 2 3 5

23 4 6 3 3 5 2 3

1 [M M M sen( ) M M cos( )sen( ) M M M cos( )sen( )]

1 sgn( )B [M M cos( ) M M cos ( )cos( )]

1 [M M M sen( ) M M cos(

a

x f x x x x x x x x

x x x x x x

x x x

= = − − − −Δ

+ − −Δ

+ − −Δ

x,u

22 2 5 6 2 2 3 6

6 2 5 2 2 3 3 4 3 6

2 22 6 2 2 2 3 5 2 3 2 3 3 4 3 3

)sen( ) M M M cos( )sen( )]

1 sgn( )B [M M cos ( )cos( ) M M cos ( )]

1 [M M g cos ( )sen( ) M M M gcos( )sen( ) M M gcos( )sen( )]

b

x x x x x

x x x x x x

x x x x x x x x

+ −

− − −Δ

− − − − +Δ

2 24 6 5 2 3

1 [M M M cos ( )]x x+ − −Δ

u

Page 46: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 42 de 61

2 2 25 5( ) 2 6 2 2 2 3 5 3 2 3 1 5 2 3 2 3 5

2 25 3 3 1 6 5

22 3 6 2 3 3 5 3

1 [M M cos( )sen( ) M M M cos( )sen(2 ) M M cos( )sen( )]

1 sgn( )B [M cos ( ) M M ]

1 [M M M cos( )sen( ) M M cos( )s

a

x f x x x x x x x x x x

x x x

x x x

= = − − − + − −Δ

+ −Δ

− −Δ

x,u

22 1 5 6 2 3 6

6 2 3 2 3 1 5 2 3 6

21 2 6 2 2 3 3 2 3 1 3 5 2 3 3

en( ) M M M sen( )]

1 sgn( )B [M M cos ( )cos( ) M M cos( )]

1 [M M M gsen( ) M M gcos( )sen( ) M M M gcos( )sen( )]

b

x x x x

x x x x x x

x x x x x x x

+ −

− − −Δ

+ − − − −Δ

2 6 2 3 5 3 2 31 [M M cos ( ) M M cos( ) cos( )]x x x x− − −Δ

u

2 2

6 6( ) 2 5 2 3 2 3 4 3 2 1 4 5 2 3 5

5 2 3 2 3 1 5 2 3 5

22 3 5 2 2 3 3 4

1 [M M cos( )sen( ) M M M cos( )sen( ) M M M sen( )]

1 sgn( )B [M M cos( )cos( ) M M cos( )]

1 [M M M cos( )sen( 2 ) M M c

a

x f x x x x x x x

x x x x x x

x x x

= = − + −Δ

− − −Δ

− − +Δ

x,u

2 23 3 1 5 2 3 2 3 6

2 26 1 4 2 2 6

21 2 5 2 3 2 2 3 2 2 3 1 3 4 3

os( )sen( ) M M cos( )sen( )]

1 sgn( )B [M M M cos ( )]

1 [M M M g cos( )sen( ) M M gcos( )sen( ) M M M gsen( )]

b

x x x x x x x

x x x

x x x x x x x

− − −

− −Δ

− − − − −Δ

2 5 2 2 3 3 4 31 [M M cos ( ) cos( ) M M cos( )]x x x x+ − −Δ

u

2 2 2 2 2 2

1 4 6 2 3 5 2 3 2 3 3 4 3 1 5 2 3 2 6 2M M M 2M M M cos(x )cos(x )cos(x x ) M M cos x M M cos (x x ) M M cos xΔ = + − − − − − Y así las ecuaciones diferenciales en términos de las variables de estado elegidas, se presenta como:

1( )1

2 ( )2

3( )3

4 ( )4

5 ( )5

6 ( )6

fxfxfxfxfxfx

⎡ ⎤⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥

⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

x,u

x,u

x,u

x,u

x,u

x,u

( )x = f x,u 6 y x u∈ ∈ (4.4)

El sistema del péndulo doble invertido está ahora descrito bajo la forma de la ecuación (4.2). 4.2 Modelo de Estado Lineal El modelo de estado representado por las ecuaciones (4.4) es efectivamente un modelo no lineal, característica común de la mayoría de los sistemas físicos. Cuando disponemos del modelo no lineal de un sistema físico es importante proceder a la linealización del modelo matemático obtenido del sistema.

Page 47: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 43 de 61

El proceso de linealizar sistemas no lineales es importante, porque permite aplicar numerosos métodos de análisis lineal que proporcionan información acerca del comportamiento dinámico de los sistemas no lineales. El procedimiento de linealización que se utilizará aquí se basa en la expansión de la función no lineal en series de Taylor alrededor de un punto de operación y la retención solo del término lineal. No se consideran los términos de orden superior de dicha expansión. Los términos no considerados son lo suficientemente pequeños; dado que las variables consideradas sólo se desvían ligeramente de la condición de operación. En nuestro caso estamos interesados en el comportamiento de la ecuación no lineal para una entrada y un estado de operación apenas perturbado de los valores nominales. Por lo que el sistema se comporta linealmente si lo operamos en un punto apenas perturbado de los valores de referencia o sea cerca de la condición de equilibrio eqx con u = 0 , tal que satisfaga la ecuación: eq (x , 0)eqx = f que es la posición de equilibrio del sistema. Esto es: eqx = 0

De forma que para (t) (t) (t)u = u +δu y 0 0 0(t) (t) (t)x = x +δx con (t)δu y 0 (t)δx lo suficientemente pequeños

para 0t t≥ . Si aceptamos que la solución permanece cercana a la nominal, en términos de la ecuación de estado no lineal, tenemos:

(x + δx, u + δu)x +δx = f (4.5) Con

0 0(t ) (t )0 0x +δx = x +δx Sabiendo que (x, u)f es diferenciable, usamos la serie de Taylor alrededor de x y u y como ya dijimos tomamos solo los términos de primer orden para la componente i de f. Por tanto:

1 2 61 2 6

( , ) ( , ) ( , ) ( , )( , ) ( , ) i i i i

i ix u x u x u x u

x x u u x uf f f ff f x x x u

x x x uδ δ δ δ δ δ+ +

∂ ∂ ∂ ∂= + + + + +

∂ ∂ ∂ ∂

Entonces para todos los con i=1,...,6if y tomando la notación vectorial:

∂ ∂+ +

∂ ∂(x, u) (x, u)

(x, u)f fx +δx = f δx δu

x u (4.6)

Donde la notación ∂∂(x, u)fx y

∂∂(x, u)fu representa la Matriz Jacobiana (4.7), del vector f con respecto al vector x y u

respectivamente. El modelo de estado representado por la ecuación (4.4) se aproxima al modelo lineal de la forma:

δx = Aδx + Bδu con −δx = x x y δu = u - u

Donde: ( )t∂

=∂ eq

eq

x=xu=u

fAx y ( )t

∂=∂ eq

eq

x=xu=u

fBu

Page 48: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 44 de 61

Y por tanto:

1 1 1 1 1 1

1 2 3 4 5 6

2 2 2 2 2 2

1 2 3 4 5 6

3 3 3 3 3 3

1 2 3 4 5 6

4 4 4 4 4 4

1 2 3 4 5 6

5 5 5 5 5 5

1 2 3 4 5 6

6 6 6

1 2

f f f f f fx x x x x xf f f f f fx x x x x xf f f f f fx x x x x xf f f f f fx x x x x xf f f f f fx x x x x xf f fx x

∂ ∂ ∂ ∂ ∂ ∂∂ ∂ ∂ ∂ ∂ ∂

∂ ∂ ∂ ∂ ∂ ∂∂ ∂ ∂ ∂ ∂ ∂

∂ ∂ ∂ ∂ ∂ ∂∂ ∂ ∂ ∂ ∂ ∂∂∂ ∂ ∂ ∂ ∂ ∂∂∂ ∂ ∂ ∂ ∂ ∂

∂ ∂ ∂ ∂ ∂ ∂∂ ∂ ∂ ∂ ∂ ∂∂ ∂ ∂∂ ∂

fx

1

2

3

4

5

66 6 6

3 4 5 6

y

fufufufufuff f fux x x x

⎡ ⎤∂⎡ ⎤⎢ ⎥

⎢ ⎥⎢ ⎥ ∂⎢ ⎥⎢ ⎥ ∂⎢ ⎥⎢ ⎥⎢ ⎥∂⎢ ⎥⎢ ⎥⎢ ⎥ ∂⎢ ⎥⎢ ⎥

∂ ⎢ ⎥∂⎢ ⎥⎢ ⎥⎢ ⎥ ∂∂ ⎢ ⎥⎢ ⎥ ∂⎢ ⎥⎢ ⎥⎢ ⎥∂⎢ ⎥⎢ ⎥⎢ ⎥ ∂⎢ ⎥⎢ ⎥⎢ ∂ ⎥⎢ ⎥∂ ∂ ∂ ⎢ ⎥⎢ ⎥ ⎢ ⎥∂⎣ ⎦∂ ∂ ∂ ∂⎢ ⎥⎣ ⎦

fu

(4.7)

El sistema de matrices lineales (4.7) resulta no estacionario cuando se trata de una trayectoria nominal, pero cuando se trata del punto de operación, el sistema lineal resulta estacionario, es decir ( )t =A A y ( )t =B B 4.2.1 Punto de operación El punto de operación que nos interesa en nuestro sistema es el aquel donde el péndulo doble se encuentra en su posición vertical invertida, es decir en un punto de equilibrio inestable, en el cual tenemos que [ ]1 0 0 0 0 0 y 0x= =x u Un punto x = xeq en el espacio de estado es un punto de equilibrio de (4.2) con u(t) = 0, si tiene la propiedad de que cuando el estado inicial del sistema es xeq, el estado permanece en dicho punto en todo tiempo futuro. Buscamos entonces xeq tal que:

0=eq (x , 0)eqx = f , (4.8) De modo que:

1 0f = , 2 0f = 3 0f = 4 0f = , 5 0f = y 6 0f = .

O sea que: ( ,0,0,0,0,0)cx=eqx (4.9) Ahora obtenido el punto de equilibrio xeq, linealizamos el sistema alrededor de dicho punto de operación cual es la estabilidad del péndulo doble invertido en forma vertical, utilizando

∂ ∂+ +

∂ ∂(x, u) (x, u)

(x, u)f fx + δx = f δx δu

x u (4.10)

y obtenemos: 1 4

2 5

3 6

4 2 3 5 2 6 2 3 2 5 3 4 3 2 6 3 5 5

23 4 2 5 6 4 6 5

2 25 2 1 6 3 2 3 2 3 1 5 3 3 1 6 5

1 5 2 3

1 1 1M M M M M M M M M M M M M M

1 1 M M M M M M M

1 1 1M M M M M M M M M M M M

1 M M M M

( ) ( ) ( )

( ) ( )

( ) ( ) ( )

( )

al l l

bl l

al l l

bl

f xf xf x

f g x g x B x

B x u

f g x g x B x

B x

===

= − + − + −Δ Δ Δ

+ − + −Δ Δ

= − + − + −Δ Δ Δ

+ −Δ 6 3 5 2 6

1 M M M M( )l

u+ −Δ

Page 49: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 45 de 61

26 2 2 3 1 5 2 3 1 4 2 3 1 5 2 3 5

22 1 4 6 2 5 3 4

1 1 1M M M M M M M M M M M M M

1 1 M M M M M M M

( ) ( ) ( )

( ) ( )

al l l

bl l

f g x g x B x

B x u

= − + − + −Δ Δ Δ

+ − + −Δ Δ

2 2 2

1 4 6 2 3 5 3 4 1 5 2 6M M M 2M M M M M M M M MlΔ = + − − − Las salidas del sistema se establecen como:

1 1

2 2

3 3

y xy xy x

===

(4.11)

Quedando de esta forma el sistema lineal totalmente definido a partir de las ecuaciones de estado:

(t) (t) (t)

(t) (t) (t)

x = Ax + Buy = Cx + Du (4.12)

Donde:

42 43 45 46

52 53 55 56

62 63 65 66

0 0 0 1 0 00 0 0 0 1 00 0 0 0 0 10 00 00 0

a a a aa a a aa a a a

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

A , 41

51

61

000

bbb

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

B ,

1 0 0 0 0 00 1 0 0 0 00 0 1 0 0 0

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

C y

000

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

D

Con:

42 2 3 5 2 6 43 3 2 5 3 4

45 2 6 3 5 46 3 4 2 5

252 2 1 6 3 53 3 2 3 1 5

255 3 1 6

1 1M M M M M M M M M M

1 1M M M M M M M M

1 1M M M M M M M M M

1 M M M

( ) ( )

( ) ( )

( ) ( )

( )

l l

a bl l

l l

al

a g a g

a B a B

a g a g

a B

= − = −Δ Δ

= − = −Δ Δ

= − = −Δ Δ

= −Δ 56 1 5 2 3

262 2 2 3 1 5 63 3 1 4 2

265 1 5 2 3 66 2 1 4

1 M M M M

1 1M M M M M M M M M

1 1M M M M M M M

( )

( ) ( )

( ) ( )

bl

l l

a bl l

a B

a g a g

a B a B

= −Δ

= − = −Δ Δ

= − = −Δ Δ

Page 50: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 46 de 61

241 4 6 5

51 3 5 2 6

61 2 5 3 4

1 M M M

1 M M M M

1 M M M M

( )

( )

( )

l

l

l

b

b

b

= −Δ

= −Δ

= −Δ

4.2.2.- Cambio de variables de estado. Si observamos la figura 4.2, en ella consideramos el ángulo del segundo péndulo ( ( )2 2 tq θ= ) con respecto a la vertical y la velocidad angular correspondiente, como dos de nuestras variables de estado. Sin embargo se tiene que nos interesamos en conocer la deflexión angular y su correspondiente velocidad angular, del segundo péndulo respecto del primer péndulo, por tanto lo que requerimos conocer es la diferencia entre la deflexión angular del segundo péndulo respecto del primer péndulo y la respectiva velocidad angular, es decir:

( ) ( ) ( ) ( ) ( )3 2 1 2 1t t t t tq q q θ θ= − = − y ( ) ( ) ( ) ( ) ( )3 2 1 2 1t t t t tq q q θ θ= − = − , Esto nos conduce a definir un nuevo conjunto de variables de estado para nuestro sistema de péndulo doble invertido, así:

1 0 2 1 3 3 4 0 5 1 6 3, , , , y z q z q z q z q z q z q= = = = = = Para aplicar estas nuevas variables de estado definimos una matriz T de transformación de similitud, como sigue: x = Tz (4.13) Con:

[ ]0 1 3 0 1 3Tq q q q q q=z (4.14)

Donde:

1 0 0 0 0 00 1 0 0 0 00 1 1 0 0 00 0 0 1 0 00 0 0 0 1 00 0 0 0 1 1

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥−

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥

−⎢ ⎥⎣ ⎦

T (4.15)

Entonces, el modelo linealizado final, dadas estas nuevas variables de estado se presenta como: z = Az + Bu

y = Cz + Du (4.16)

Ecuaciones (4.19) en las cuales, las matrices , , yA B C D están definidas como sigue:

1

1

A = TAT

B = TB

C = CT

D = D

Page 51: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 47 de 61

Es decir:

42 43 43 45 46 46

52 53 53 55 56 56

52 53 62 63 53 63 55 56 65 66 56 66

0 0 0 1 0 00 0 0 0 1 00 0 0 0 0 10 00 00 0

a a a a a aa a a a a a

a a a a a a a a a a a a

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥+ +⎢ ⎥⎢ ⎥+ +⎢ ⎥

− − + + − + − − + + − +⎢ ⎥⎣ ⎦

A

41

51

51 61

000

bb

b b

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥− +⎢ ⎥⎣ ⎦

B ,

1 0 0 0 0 00 1 0 0 0 00 1 1 0 0 0

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

C y

000

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

D

Figura 4.1. Sistema lineal en variables de estado. Lazo abierto 4.3.- Parámetros para el ejercicio de simulación del sistema de péndulo doble invertido Obtenido el modelo matemático del sistema de péndulo doble invertido, pasaremos ahora a determinar los parámetros del sistema. Respecto de las masas y longitudes de los elementos del sistema de péndulo doble, se tomó como referencia el trabajo realizado por Eltohamy y Kuo [4] sobre la estabilización de un péndulo triple invertido, quienes utilizaron los resultados experimentales obtenidos por Furuta y Okutami en su trabajo sobre un control digital para un péndulo doble invertido en un riel inclinado. Se realizaron varias pruebas con valores similares a los presentados en [4] y escogieron como parámetros de simulación los siguientes valores:

20 1 2 1 21.0 Kg, 0.4 Kg, 0.2 Kg, 0.2 m, 0.4 m, 9.8 /m m m L L g m s= = = = = =

Respecto de la fricción de coulomb y la viscosa estas son importantes para la estabilidad del sistema, además las fricciones no son linealizables. La simulación inicialmente se realizó tomando valores comunes para la fricción de coulomb y la viscosidad y luego a modo de prueba y por comparación se realizó la simulación considerando las fricciones despreciables.

Page 52: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 48 de 61

Los valores escogidos para estas fricciones fueron: 0 0.15, 0.2 N-s/ma bB Bμ = = = 4.3.1. Relación entre los parámetros del sistema Para la selección de los valores de parámetros más adecuados para la simulación y validación del sistema de péndulo doble invertido, se hicieron varias pruebas con diferentes valores para tales parámetros, al realizar estas pruebas encontramos algunas relaciones interesantes entre ellos.

• Para el adecuado desempeño de la simulación del sistema de péndulo doble invertido se requiere que siempre sea la masa del primer péndulo (m1) mayor que la masa del segundo péndulo (m2).

• Aunque no necesariamente de manera simultanea se requiere para el adecuado desempeño de la simulación del sistema, que

la longitud del primer péndulo (L1) sea menor que la longitud del segundo péndulo (L2). • Así de manera concluyente y para garantizar un buen desempeño de la simulación del sistema, los valores de los parámetros

se escogieron atendiendo a estas dos circunstancias simultáneamente. 4.3.2. Matrices y ecuación característica del sistema. Los valores numéricos de las matrices del sistema en lazo abierto son:

0 0 0 1 0 00 0 0 0 1 00 0 0 0 0 10 4.3377 0.4820 0 0.9836 0.24590 96.3934 43.3770 0 13.5246 22.13110 115.6721 110.8525 0 1.2295 56.5574

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥− −⎢ ⎥⎢ ⎥− −⎢ ⎥

− −⎢ ⎥⎣ ⎦

A,

000

0.90166.1475

7.3770

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥−⎢ ⎥⎢ ⎥⎣ ⎦

B,

1 0 0 0 0 00 1 0 0 0 00 1 1 0 0 0

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

C ,

000

⎡ ⎤⎢ ⎥= ⎢ ⎥⎢ ⎥⎣ ⎦

D

Las raíces del sistema del péndulo doble invertido las obtenemos a partir de la matriz A .

[ ]3.43 1.80 0 0 15.3 60.0λ = − − El sistema del péndulo doble invertido es inestable, debido a la presencia de dos raíces características positivas. La matriz de controlabilidad es de rango completo por lo tanto el sistema es totalmente controlable. La descomposición en valores singulares de la matriz de controlabilidad, nos da seis valores diferentes de cero, numero igual a los estados definidos del sistema.

9 46.2911 7.4713 15.1658 0.6487 0.6229 0.1462e eσ + +⎡ ⎤= ⎣ ⎦

La medida de controlabilidad del sistema linealizado la podemos conocer a partir del número de condición de la matriz de controlabilidad, el cual se obtiene por la razón entre el mayor y el menor valor singular. Esto es; número de condición de controlabilidad: 4.3028 e+10. Entre más grande sea este número [4], [15] menos controlable es el sistema. Este número da una indicación de la dificultad inherente a la estabilización del sistema.

CAPITULO QUINTO 5. Control Óptimo Para obtener la ley de control, las ecuaciones de Euler-Lagrange se reformularon en un sistema de seis ecuaciones diferenciales ordinarias de primer orden. El diseño de control óptimo para sistemas no lineales como es el caso del SPDI, requiere por lo general una solución numérica [20] que llega a ser prohibitiva computacionalmente.

Page 53: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 49 de 61

Figura 5.1. Sistema lineal en variables de estado. Lazo cerrado 5.1 Regulador Linear Cuadrático El diseño de control óptimo se dirige a estabilizar el SPDI minimizando un funcional de costo cuadrático:

0dt

∞= ∫J L(x,u) (5.1)

en donde L(x, u) es una función cuadrática o una función hermitiana de x y u, y producirá la ley de control lineal:

( ) ( )t t= −u Kx (5.2) Donde K es una matriz de p x n:

1 11 12 1 1

2 21 22 2 2

1 2

n

n

p p p pn n

u k k k xu k k k x

u k k k x

⎡ ⎤ ⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥=⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥

⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎣ ⎦⎣ ⎦ ⎣ ⎦

y el índice de desempeño cuadrático se obtiene mediante:

0( )dt

∞= ∫J x*Qx + u* Ru (5.3)

en donde Q es una matriz hermitiana o simétrica real definida positiva (o semidefinida positiva), R es una matriz hermitiana o simétrica real definida positiva y u no está restringida. El diseño de los sistemas de control óptimo y los sistemas reguladores óptimos basados en tales índices de desempeño cuadráticos se reducen a la determinación de los elementos de la matriz K. Una ventaja de usar el esquema de control óptimo cuadrático es que el sistema diseñado será estable, excepto en el caso que el sistema no sea controlable. El sistema de control óptimo se basa en minimizar el índice de desempeño. Para los sistemas con vectores reales y matrices reales, se

presenta que:0 0

( ) ( )T Tdt dt∞ ∞

=∫ ∫x*Qx + u* Ru x Qx + u Ru

Por lo que el índice de desempeño cuadrático se escribe como:0

( )J dt∞

= ∫ T 2x Qx + Ru (5.4)

El regulador cuadrático lineal produce una solución óptima cuando la dinámica del sistema es lineal. Como ya vimos el SPDI no es lineal, pero lo linealizamos alrededor del punto de operación [ ]1 0 0 0 0 0 y 0x= =x u , por lo que es posible derivar una solución lineal aproximada para el problema de control optimo.

Page 54: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 50 de 61

La solución continua del LQR se obtiene por: ( ) ( )t t= −u Kx , donde: 1 T−=K R B P , en donde P es la solución de estado estable de la ecuación diferencial de Riccati. 5.2. Determinación de las matrices de ponderación No existe ciertamente una guía para la selección de las matrices de ponderación Q y R, excepto determinarlas por intuición y experiencia [4]. En este sentido se realizaron diferentes pruebas con distintos valores para tales matrices, siendo la mejor selección encontrada, la siguiente:

[ ]400 1000 500 0 0 50diag=Q y 2=R Conviene notar que en la bibliografía consultada nos encontramos con diferentes valores para estas matrices. Por ejemplo en el citado trabajo de Alexander Bogdanov, [20] se ponderan todas las variables de estado con distintos valores diferentes de cero, en tanto que en los trabajos, también citados de J. Rubi, A. Rubio y A. Avello [15] y en el de Eltohamy y Kuo [4], se ponderan algunas variables de estado con distintos valores diferentes de cero. En todos los casos, las variables ponderadas con valores diferentes de cero son justamente la posición del carrito y la posición del primer y segundo péndulo. Con la selección encontrada obtuvimos por simulación en matlab, la matriz de ganancias siguiente:

[ ]14.1421 338.6128 650.9943 31.9772 28.4131 23.1808=K y las raíces de la ecuación característica de lazo cerrado, siguientes:

[ ]1.74 1.48 1.78 5.49 13.9 70.6jλ = − ± − − − −

CAPITULO SEXTO 6. Resultados 6.1. Simulación del sistema en tiempo continúo. La simulación del sistema de Péndulo Doble Invertido en un carrito, se realizo con el programa Simulink. Las figuras presentadas abajo nos presentan los resultados de esta simulación. Para la simulación del sistema no lineal y lineal, en tiempo continuo, lazo cerrado, se utilizó un pulso de duración de 2 segundos como señal de entrada. Figura 6.1.

0 1 2 3 4 5 6 7 8 9 10

0

0.2

0.4

0.6

0.8

1Signal 1

Time (sec)

modelonolineal/Signal Builder : Group 1

Figura 6.1. Pulso de entrada

6.1.2. Resultados simulación sistema del péndulo doble invertido 6.1.2.1. Modelo con fricción: Ba=0.2;Bb=0.2;u0=0.15; Lazo abierto Eigenvalue Damping Freq. (rad/s) 3.43e+000 -1.00e+000 3.43e+000

Page 55: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 51 de 61

1.80e+000 -1.00e+000 1.80e+000 0.00e+000 -1.00e+000 0.00e+000 0.00e+000 -1.00e+000 0.00e+000 -1.53e+001 1.00e+000 1.53e+001 -6.00e+001 1.00e+000 6.00e+001 Matriz de controlabilidad

0 0.902 -7.861 377.043 -21054.118 1239842.3430 -6.148 246.406 -13646.091 798970.628 -47651063.0830 7.377 -424.785 25856.546 -1554747.144 93359495.546

0.902 -7.861 377.043 -21054.118 1239842.343 -74042187.086-6.148 246.

con =

406 -13646.091 798970.628 -47651063.083 2855069742.0387.377 -424.785 25856.546 -1554747.144 93359495.546 -5603521742.658

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

Sistema en tiempo continuo controlable Descomposición por valores singulares de la matriz de controlabilidad 6291132157.161787 74712.975072 15.165841 0.648690 0.622998 0.146211 Condición de controlabilidad = 4.30276 e+010 Sistema en tiempo continuo observable Regulador linear cuadrático. Matriz de ponderación K = 14.1421 338.6128 650.9943 31.9772 28.4131 23.1808 Lazo cerrado Eigenvalue Damping Freq. (rad/s) -1.74e+000 + 1.48e+000i 7.61e-001 2.28e+000 -1.74e+000 - 1.48e+000i 7.61e-001 2.28e+000 -1.78e+000 1.00e+000 1.78e+000 -5.49e+000 1.00e+000 5.49e+000 -1.39e+001 1.00e+000 1.39e+001 -7.06e+001 1.00e+000 7.06e+001

Figuras obtenidas en Matlab

Modelo lineal lazo abierto Modelo lineal lazo cerrado

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2-6

-4

-2

0

2

4

6

tseg

salid

a y

0 5 10 15

-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

0.06

0.08

tseg

salid

a

Figuras obtenidas en Simulink

Page 56: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 52 de 61

Modelo no lineal lazo abierto

x9

x8

x7

0.1

x60x6

0.1

x50x5

0.1

x40

x4

0.1

x30

x3

0.1

x20

x2

0.1

x10

x1

tiempo

To Workspace

U

X1

X2

X3

X4

X5

X6

Out1

Out2

Out3

Out4

Out5

Out6

Modelo No lineal

10

Clock

Page 57: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 53 de 61

Modelo no lineal lazo cerrado

x9

x8

x70.1

x60x6

0.1

x50x5

0.1

x40

x4

0.1

x30

x3

0.1

x20

x2

0.1

x10

x1

tiempo

To WorkspaceSignal 1

Signal Builder

U

X1

X2

X3

X4

X5

X6

Out1

Out2

Out3

Out4

Out5

Out6

Modelo No lineal

K* u

Gain

0

Clock

Page 58: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 54 de 61

Modelo lineal lazo abierto

tiempo

To Workspace

ScopeC.I.

Péndulo

0.1

Constant

2

Clock

Modelo lineal lazo cerrado

y

tiempo

To Workspace

Signal 1

Signal Builder u

C.I.

y 1

Péndulo

1

Constant

20

Clock

Page 59: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 55 de 61

6.1.2.2. Modelo con fricción despreciable Ba=0;Bb=0;u0=0; Lazo abierto: Eigenvalue Damping Freq. (rad/s) 1.32e+001 -1.00e+000 1.32e+001 5.69e+000 -1.00e+000 5.69e+000 0.00e+000 -1.00e+000 0.00e+000 0.00e+000 -1.00e+000 0.00e+000 -5.69e+000 1.00e+000 5.69e+000 -1.32e+001 1.00e+000 1.32e+001 Matriz de controlabilidad

0 0.902 0 30.222 0 4695.3530 -6.148 0 -912.577 0 -154284.0390 7.377 0 1528.863 0 275038.003

0.902 0 30.222 0 4695.353 0-6.148 0 -912.577 0 -154284.039 07.377 0 1528.863 0 275038.003 0

con

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

Sistema en tiempo continuo controlable Descomposición por valores singulares de la matriz de controlabilidad 315396.0733069650 315396.0733069650 48.1048959632 48.1048959632 0.6226166211 0.6226166211

Page 60: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 56 de 61

Condición de controlabilidad = 5.06565 e+005 Sistema en tiempo continuo observable Regulador linear cuadrático. Matriz de ponderación K = 14.1421 69.1120 212.9823 15.6436 26.7540 28.6047 Lazo cerrado Eigenvalue Damping Freq. (rad/s) -1.68e+000 + 1.51e+000i 7.44e-001 2.26e+000 -1.68e+000 - 1.51e+000i 7.44e-001 2.26e+000 -5.24e+000 + 4.18e+000i 7.82e-001 6.70e+000 -5.24e+000 - 4.18e+000i 7.82e-001 6.70e+000 -5.27e+000 1.00e+000 5.27e+000 -4.15e+001 1.00e+000 4.15e+001

Modelo lineal lazo abierto Modelo lineal lazo cerrado

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1-6

-4

-2

0

2

4

6

tseg

salid

a y

0 1 2 3 4 5 6 7 8

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1

tseg

salid

a

Modelo no lineal lazo abierto Modelo no lineal lazo cerrado

Modelo lineal lazo abierto Modelo lineal lazo cerrado

Page 61: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 57 de 61

6.2. Análisis simulación del sistema del péndulo doble invertido 6.2.1. Modelo no lineal en lazo abierto La figura 6.2 nos enseña el comportamiento del sistema no lineal en lazo abierto. Los integradores en la simulación se ajustaron condiciones iniciales diferentes de cero, es decir se parte de un sistema ligeramente perturbado. A saber: [ ](0) 0.1 0.1 0.1 0.1 0.1 0.1=x . El tiempo de simulación considerado fue de 10 segundos. El carrito se mueve a una posición arbitraria pero definida. El péndulo inferior (línea roja) cae hacia π radianes, es decir busca la posición de equilibrio estable (péndulo no invertido) en tanto que el péndulo superior (línea azul) se mueve en dirección contraria al primer péndulo y busca alinearse formando un ángulo de cero grados (00) con el primer péndulo. Recuérdese que se esta tomando el ángulo del segundo péndulo respecto del primer péndulo.

Figura 6.2. Sistema no lineal en lazo abierto

6.2.2. Modelo lineal en lazo abierto La simulación del sistema linealizado en lazo abierto, figura 6.3, presenta un sistema inestable, siendo evidente después de aproximadamente 200 milisegundos.

Figura 6.3. Sistema lineal en lazo abierto

Page 62: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 58 de 61

6.2.3. Modelo no lineal en lazo cerrado Ahora veamos el sistema en lazo cerrado. La figura 6.4 nos presenta la simulación del comportamiento de las trayectorias del carrito y de cada uno de los péndulos, el inferior y superior, una vez se aplica al sistema no lineal la matriz de ganancias K obtenida en la estabilización optima del sistema.

Figura 6.4. Sistema no lineal en lazo cerrado

Para la simulación se aplicó un pulso de duración 2 segundos como el mostrado en la figura 6.1 y a los integradores para cada una de las variables de estado se les dieron condiciones iniciales diferentes de cero, así: [ ](0) 0.1 0.1 0.1 0.1 0.1 0.1=x De esta manera consideramos el sistema no lineal inicialmente perturbado y simulamos su comportamiento aplicando el regulador lineal cuadrático. El tiempo que se consideró para la simulación del sistema no lineal en lazo cerrado fue de 60 segundos.

La simulación nos muestra inicialmente un sobrepaso importante en el carrito pero luego de 15 segundos aproximadamente disminuyen la amplitud de sus oscilaciones y se mantiene oscilando a derecha e izquierda garantizando la estabilidad del péndulo. A partir de los 10 segundos, el sistema no lineal alcanza su asentamiento, alrededor del punto de operación considerado. 6.2.4. Modelo lineal en lazo cerrado La simulación del sistema lineal en lazo cerrado, figura 6.5, presenta un similar comportamiento que en caso del sistema no lineal.

Figura 6.5. Sistema lineal en lazo cerrado

Page 63: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 59 de 61

No obstante para el sistema lineal el asentamiento se presenta aproximadamente a partir de los 4 segundos de simulación. El tiempo que se consideró para la simulación del sistema lineal en lazo cerrado fue de 10 segundos. 6.3. Sistema en Tiempo Discreto Como se vio antes la simulación en tiempo continuo en lazo cerrado nos presentó una máxima frecuencia de 70.6 (rad/s). De acuerdo al criterio de nyquist, consideramos un tiempo de muestreo Ts= 0.001 s para la discretización del sistema. Respecto de las matrices de ponderación consideramos los mismos valores con los que simulamos el sistema en tiempo continuo.

[ ]400 1000 500 0 0 50diag=Q

2=R Matrices en tiempo discreto Las matrices del sistema obtenidas una vez la discretización son las siguientes:

6 7 3 7 7

5 4 5

5 7 4

3 4 4 4

2 2 1 2

1

1 2.1486 2.2953 1.0 4.8883 1.17030 1 2.1189 0 9.9329 1.08030 5.6743 1 0 5.8167 9.7227

=0 4.2770 4.4779 1 9.7470 2.28230 9.4497 4.1888 0 9.8663 2.13500 1.1241

e e e e ee e e

e e ee e e e

e e e ee

− − − − −

− − −

− − −

− − − −

− − − −

− −−

−− −

−−

G

1 3 11.0775 0 1.1308 9.4507e e e− − −

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

y

7

6

6

4

3

3

4.4952e3.0332e

3.6188e=

8.9777e6.0265e

7.1689e

⎡ ⎤⎢ ⎥−⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥−⎢ ⎥⎢ ⎥⎣ ⎦

H

Los valores obtenidos por simulación en matlab de la matriz de ganancias para la estabilización del sistema en tiempo discreto, son los siguientes:

[ ]13.9653 334.3388 643.5271 31.5844 28.0649 22.8717=K 6.3.1. Sistema discreto en lazo abierto. La simulación del sistema en tiempo discreto como se aprecia en la figura 6.6 nos enseña el sistema inestable.

0

0.02

0.04

0.06

To: O

ut(1

)

-1

-0.5

0

To: O

ut(2

)

0 500 1000 1500 2000 2500-0.1

0

0.1

0.2

To: O

ut(3

)

Impulse Response

Time (sec)

Amplitu

de

Figura 6.6. Respuesta en tiempo discreto. Lazo abierto

Page 64: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 60 de 61

6.3.2. Sistema discreto en lazo cerrado. En lazo cerrado la simulación del sistema en tiempo discreto, figura 6.7, manifiesta un comportamiento similar al de tiempo continuo, en cuanto al hecho que inicialmente se presentan ligeras oscilaciones del carrito y de los dos péndulos, pero luego después de aproximadamente 3500 instantes de muestreo, el sistema alcanza su asentamiento alrededor del punto de operación determinado.

-5

0

5

10x 10

-5

To: O

ut(1

)

-1

0

1

2x 10

-4

To: O

ut(2

)

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000-5

0

5x 10

-5

To: O

ut(3

)

Impulse Response

Time (sec)

Amplitu

de

Figura 6.7. Respuesta en tiempo discreto. Lazo cerrado

6.4 Simulación del sistema del péndulo doble invertido con fricción despreciable La simulación del sistema de péndulo doble invertido montado en un carrito, considerando las fricciones de coulomb y viscosa despreciables, presenta resultados similares a los anteriores tanto en tiempo continuo como en tiempo discreto. Por supuesto varían los tiempos de establecimiento y las condiciones de oscilación de los péndulos, en especial en la simulación del sistema no lineal y lineal en lazo cerrado. Los resultados de esta simulación se presentan igualmente en este trabajo.

CAPITULO SEPTIMO 7. Conclusiones 1. La estrategia de control que seguimos para la estabilización del SPDI, de control óptimo fue una acertada elección, aunque presentó

distintas dificultades, en particular en cuanto al modelamiento matemático, la elección de las matrices de ponderación del funcional de costo cuadrático y la determinación de los mejores valores de los parámetros de simulación particularmente los de las fricciones de coulomb y viscosa.

2. Los resultados obtenidos tanto en para el sistema linealizado como para el sistema no lineal y tanto en tiempo continúo como en

tiempo discreto son adecuados y por lo menos en la simulación nos presentan una estabilización del sistema adecuada. 3. El modelamiento matemático obtenido del sistema es valido y se concilia de manera importante y acertada, con los modelos

matemáticos encontrados en la bibliografía consultada. 4. La simulación del sistema no lineal en lazo abierto en tiempo continúo, valida adecuadamente el modelo matemático y permite

predecir la dinámica del sistema no lineal con suficiente precisión. 5. El trabajo realizado aunque solo interviene en lo que es modelamiento, control y simulación de sistemas resulta para la Universidad

de los Andes en una importante contribución en la introducción al estudio de los sistemas de péndulos invertidos. 6. En nuestro caso no se consideró la necesidad de diseñar observadores de estado, en particular porque el sistema siendo

completamente observable tanto en tiempo continúo, como en tiempo discreto, todos los estados del sistema son medibles.

Page 65: Portada Tesis de Maestria - repositorio.uniandes.edu.co

TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL

GERMAN VELANDIA PELAEZ Código 200418412 Pag. 61 de 61

BIBLIOGRAFIA [1] M. Yamakita, K. Nonaka, Y. Sugahara, K. Furuta, Robust state transfer control of double pendulum," IFAC Symposium Advances in

Control Education 1994 (ACE'94), Tokyo, Japan, pp. 205 - 208, 1995. [2] A. Bradshaw, J. Shao, Swing up control of inverted pendulum systems," Robotica, vol. 14, pp. 397 - 405, 1996. [3] SAHBA. M.: ‘Computer-aided design of feedback controllers for nonlinear systems with applications to control of a double-inverted

pendulum’, IEE Proc D, 1983,130, (6), pp 350-358. [4] ELTOHAMY, K G , and KUO, C Y. ‘Real time stabilization of a triple link inverted pendulum using single control input’, IEE Proc.,

Control Theory Appl., 1997, 144, (5), pp. 498-504. [5] FURUTA, K., YAMAKITA, M., and KOBAYASHI, S.: ‘Swing-up control of inverted pendulum using pseudo-state feedback’, J. Syst.

Control Eng., 1992, 206, pp. 263-269 [6] WJCKLUND, M., KRISTENSON, A,, and ASTROM, K.J.: ‘A new strategy for swinging up an inverted pendulum’. Proceedings of

IFAC 12th World Congress, 1992, Vol. 9, pp. 151-154. [7] ASTROM, K.J., and FURUTA, K.: ‘Swinging up a pendulum by energy control’. IFAC 13th World Congress, San Francisco,

California, 1996. [8] SCHERM, N., and HEIMANN, B.: ‘Dynamics and control of underactuated manipulation systems: A discrete-time approach’, Robot.

Auton. Syst. 2000, 30, pp. 237-248 [9] BERGEMAN, M., LEE, C., and XU, Y.: ‘Experimental study of an underactuated manipulator’. Proceedings of 1995 IEEE/RSJ

International Conference on Intelligent robots and systems, Pittsburgh, USA, August 1995, Vol. 2; pp. 317-322. [10] BERGEMAN, M., and XU, Y.: ‘Optimal control sequence for underactuated manipulators’. Proceedings of 1996 International

Conference on Robotics and automation, Minneapolis, USA, 1996, pp. 3714-3719. [11] SPONG, M.W.: ‘The swing up control problem for the Acrobot’, IEEE Control Syst. Mag., 1995, 15, pp. 49-55 [12] SPONG, M.W., and BLOCK, D.J.: ‘The Pendubot: a mechatronic system for control research and education’. 34th IEEE Conference

on Decision and control, New Orleans, USA, December 1995, pp. 555-556. [13] HEIM, A,, and VON STRYK, 0.: ‘Trajectory optimization of industrial robots with application to computer-aided robotics and robot

controllers’ Optimization, 2000, 47, pp. 407-420. [14] WANG, C.-YE., TIMOSZYK, W.K., and BOBROW, J.E.: ‘Weightlifting motion planning for a Puma 762 robot’. Proceedings of 1999

IEEE international conference on Robotics and automation, Detroit, Michigan, 1999, pp. 480-485. [15] J. RUBI, A. RUBIO and A. AVELLO. ‘Swing-up control problem for a self-erecting double inverted pendulum’ IEE Proceedings -

Control Theory and Applications - March 2002 - Volume 149, Issue 2, p. 169-175 [16] SOHL, G.A., and BOBROW, J.E.: ‘Optimal motions for underactuated manipulators’. Proceedings of DETC’99, ASME Design

Engineering Technical Conferences, Las Vegas, Nevada, USA, September 1999 [17] KIRK Donald E. Optimal Control Theory. An Introduction. PRENTICE HALL. 1970 [18] W. J. GRANTHAM Y T. L. VINCENT. ‘Sistemas de control moderno, analisis y diseño’. Limusa. Noriega editores. Primera edición.

1998. [19] KATSUHIKO OGATA. ‘Ingenieria de Control Moderna’. Pearson Educación. Prentice may. Tercera edición. 1997. [20] BOGDANOV Alexander. Optimal Control of a Double Invertid Pendulum, Departamento of computer science & Electrical

Engineering OGI School of Science & Engineering. OHSU. Technicel Report CSE-04-006. December 2004.