Modelagem e Controle de uma Classe de Sistemas Multi-Corpos ...

Eric Conrado de Souza

Modelagem e Controle de uma Classe deSistemas Multi-Corpos Móveis

Tese apresentada a Escola Politécnica da

Universidade de São Paulo para obtenção

do Título de Doutor em Engenharia Mecâ-

nica

São Paulo

Março 2008

Eric Conrado de Souza

Modelagem e Controle de uma Classe deSistemas Multi-Corpos Móveis

Tese apresentada a Escola Politécnica da

Universidade de São Paulo para obtenção

do Título de Doutor em Engenharia Mecâ-

nica

Área de Concentração:

Engenharia de Controle e Automação

Mecânica

Orientador:

Prof. Dr. Newton Maruyama

São Paulo

Março 2008

Agradecimentos

Ao Prof. Dr. Newton Maruyama por toda a jornada de acompanhamento, orientação e

amizade.

A Profa. Dra. Naomi Ehrich Leonard pela co-orientação, introdução à geometria e

incentivo durante o ano de 2005.

Ao Prof. Dr. Pedro Tonelli pela disponibilidade de conversar sobre assuntos relacionados

aos meus estudos e pela oportunidade do seminário no IME-USP.

Aos Prof. Dr. Jair Koiller e Prof. Dr. Agenor de Toledo Fleury pela forma atenciosa

com que se dispuseram a me receber algumas vezes para conversar sobre o trabalho que

realizava.

Aos colegas de sala e laboratório pela convivência, amizade e ajuda.

A CAPES pela concessão das bolsas de Doutorado e PDEE.

A minha família pelo apoio. Dedico este trabalho a minha família.

A Deus, pela força, pela motivação, por mais um degrau galgado; sem Ele “nada que se

fez, se fez”.

Resumo

No que segue, propõe-se uma classe de sistemas robóticos multi-corpos, cujos corpos

componentes estão fisicamente acoplados através de juntas rotativas ativas. Os sis-

temas da classe considerada possuem mobilidade irrestrita no espaço plano uma vez

que propulsores distribuídos ao longo dos corpos do sistema. A modelagem dinâmica

destes sistemas é apresentada sob as abordagens Hamiltoniana e Lagrangiana da mecâ-

nica analítica. A descrição destes métodos de modelagem, assim como os modelos por

eles obtidos, é realizada com ênfase na interpretação geométrica da matemática envol-

vida. Alguns exemplos de parametrizações do espaço de fase do sistema são discutidos e

exemplos de modelagem em função destas parametrizações são obtidos. Ademais, alguns

critérios de análise de controlabilidade não-linear são revisados e aplicados aos modelos

do sistema com a estrutura de entradas considerada. Alguns casos de estabilização da

classe de sistemas são também discutidos. Resultados de simulação de estabilização são

obtidos para sistemas através de estudos de casos. Sistemas completamente controlados

no espaço de estados podem ser linearizados através de uma técnica de linearização

por realimentação e estabilizados com uma realimentação de estados. Para os sistemas

cuja controlabilidade é deficiente, propõe-se a modificação de um método de controle

de sistemas sub-atuados e uma lei de controle por realimentação é obtida pela teoria de

estabilidade de Lyapunov. A classe de sistemas aqui discutida possui grande potencial

de aplicação nos ambientes espacial e submarino.

Abstract

In the following, a class of multi-body robotic systems is proposed in which its system

component bodies are physically coupled by active rotating joints. The systems be-

longing to the proposed class have unrestricted mobility on the plane since thrusters

are distributed along the system. System dynamical modeling is obtained through the

analytic mechanical Hamiltonian and Lagrangian methods. The presentation of these

methods, as well as the dynamical models obtained by them, is realized with an empha-

sis in the geometrical interpretation of the corresponding mathematics. A few different

system phase space parameterizations approaches are discussed and modeling examples

are presented under these parameterizations. Additionally, some nonlinear controllabi-

lity analysis criteria are reviewed and applied to system dynamical models composed

by the input structure mentioned above. A few stabilization case studies for the class

of systems are also discussed and simulation results are presented. Totally controlled

systems in the phase space can be linearized by feedback linearization techniques and

stabilized through a state feedback. For partially controllable systems a modification of

a stabilization method for under-actuated systems is proposed which renders feedback

control via Lypunov stability theory. The class of systems discussed has great potential

for space and underwater applications.

iii

Sumário

Resumo ii

Abstract iii

Sumário iii

Lista de Figuras vii

1 Introdução 11.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Sistemas Multi-Articulados . . . . . . . . . . . . . . . . . . . . . 21.1.2 Revisão da Literatura Técnica . . . . . . . . . . . . . . . . . . . . 3

1.2 Proposta de uma Classe de Sistemas Robóticos Móveis . . . . . . . . . . 41.3 Objetivos de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3.1 Contribuições do Trabalho . . . . . . . . . . . . . . . . . . . . . . 71.3.2 Justificativa do uso da Teoria Geométrica . . . . . . . . . . . . . 81.3.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3.4 Organização da Tese . . . . . . . . . . . . . . . . . . . . . . . . . 10

Lista de Símbolos 1

2 Elementos da Mecânica Geométrica 122.1 Geometria Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.1.1 Campos vetoriais e Espaços Tangentes . . . . . . . . . . . . . . . 132.1.2 Distribuições de Campos Vetoriais . . . . . . . . . . . . . . . . . 16

2.2 Mecânica Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2.1 Grupos e Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . 172.2.2 Mecânica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . 202.2.3 Mecânica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . 21

2.3 Sistemas Mecânicos Simples . . . . . . . . . . . . . . . . . . . . . . . . . 252.4 Sistemas com Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.4.1 Redução de Sistemas com Simetria . . . . . . . . . . . . . . . . . 302.5 Espaços Fibrados e Conexões . . . . . . . . . . . . . . . . . . . . . . . . 30

2.5.1 A Conexão de Ehresmann . . . . . . . . . . . . . . . . . . . . . . 312.5.2 A Conexão Principal . . . . . . . . . . . . . . . . . . . . . . . . . 332.5.3 Curvatura do Fibrado Tangente . . . . . . . . . . . . . . . . . . . 34

SUMÁRIO iv

3 Mecânica não-Holonômica 353.1 Mecânica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.1.1 Princípio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . 363.1.2 Sistemas com Restrições . . . . . . . . . . . . . . . . . . . . . . . 363.1.3 Princípio de Lagrange-d’Alembert . . . . . . . . . . . . . . . . . 383.1.4 Equações de Lagrange-d’Alembert . . . . . . . . . . . . . . . . . 383.1.5 Não-holonomicidade do Sistema . . . . . . . . . . . . . . . . . . . 40

3.2 A Conexão Mecânica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.3 Princípio Variacional Reduzido . . . . . . . . . . . . . . . . . . . . . . . 433.4 Reconstrução da Dinâmica . . . . . . . . . . . . . . . . . . . . . . . . . . 443.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4 Modelagem do Sistema Multi-Corpo 484.1 Cinemática do Sistema no Espaço Completo . . . . . . . . . . . . . . . . 49

4.1.1 Simetria do Sistema e Redução . . . . . . . . . . . . . . . . . . . 534.2 Modelo do Sistema no Espaço Cotangente . . . . . . . . . . . . . . . . . 56

4.2.1 Modelagem da Entrada do Sistema . . . . . . . . . . . . . . . . . 594.2.2 Sistema de Controle Multi-Corpos . . . . . . . . . . . . . . . . . 624.2.3 Exemplo: o sistema de 2-corpos . . . . . . . . . . . . . . . . . . . 64

4.3 Modelagem da Dinâmica no Fibrado Principal . . . . . . . . . . . . . . . 664.3.1 O Fibrado Principal . . . . . . . . . . . . . . . . . . . . . . . . . 664.3.2 Exemplos de Parametrizações da Configuração . . . . . . . . . . 67

4.4 Modelagem Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 794.4.1 Exemplo: o sistema de 2-corpos (θcm = θ1) . . . . . . . . . . . . 79

4.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5 Análise do Sistema e Controlabilidade 855.1 Equilíbrio e Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.1.1 Equilíbrio do Sistema Multi-corpos . . . . . . . . . . . . . . . . . 865.2 Fases Geométricas: Análise . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.2.1 O Contexto Geométrico . . . . . . . . . . . . . . . . . . . . . . . 925.3 Análise de Controlabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 93

5.3.1 Álgebra e Distribuição de Acessibilidade de Sistemas Afim . . . . 965.3.2 Controlabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 995.3.3 Controlabilidade do Sistema de Dois Corpos . . . . . . . . . . . . 101

5.4 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

6 Estabilização e Planejamento de Trajetórias 1136.1 Estabilização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1146.2 Linearização por Realimentação . . . . . . . . . . . . . . . . . . . . . . . 115

6.2.1 Linearização por Realimentação Dinâmica . . . . . . . . . . . . . 1236.2.2 O Sistema Multi-Articulado . . . . . . . . . . . . . . . . . . . . . 125

6.3 Controle de Sistemas Sub-atuados . . . . . . . . . . . . . . . . . . . . . . 1286.3.1 O Sistema de 2-Corpos . . . . . . . . . . . . . . . . . . . . . . . . 130

6.4 Planejamento de Trajetórias e Controle Ótimo . . . . . . . . . . . . . . . 1386.4.1 Controle Ótimo do Modelo Cinemático . . . . . . . . . . . . . . . 140

6.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

SUMÁRIO v

7 Conclusões 1467.1 Sugestões para Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . 147

Referências Bibliográficas 149

Apêndices 153

A Fundamentos Gerais 154A.1 Aplicações e Conjuntos Usuais na Mecânica Geométrica . . . . . . . . . 154A.2 Representações Espaciais com a Álgebra do Grupo . . . . . . . . . . . . 156

A.2.1 Representações entre Referenciais . . . . . . . . . . . . . . . . . . 156A.2.2 O Grupo SE(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

B Resultados Auxiliares 161B.1 Superfície de Energia Constante para o Sistema de 2-corpos . . . . . . . 161B.2 Desacoplamento dos Componentes da se(2) . . . . . . . . . . . . . . . . 162B.3 Equação da Conexão Horizontal e Holonomia . . . . . . . . . . . . . . . 163B.4 Curvatura da Conexão . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164B.5 Constantes estruturais da álgebra se(2) . . . . . . . . . . . . . . . . . . . 167B.6 Espaço Tangente à Órbita do Grupo . . . . . . . . . . . . . . . . . . . . 167

B.6.1 Gerador Infinitesimal de SE(2) . . . . . . . . . . . . . . . . . . . 168

C Modelagem Complementar 171C.1 O Corpo Rígido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171C.2 Sistema Multi-Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

C.2.1 Matriz de Inércia do Sistema . . . . . . . . . . . . . . . . . . . . 174C.2.2 Modelo do sistema de 3-corpos . . . . . . . . . . . . . . . . . . . 176C.2.3 Modelo do sistema de 5-corpos . . . . . . . . . . . . . . . . . . . 177C.2.4 Modelo Cinemático do Sistema . . . . . . . . . . . . . . . . . . . 178C.2.5 Modelagem Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . 179

vi

Lista de Figuras

1.1 Sistema robótico multi-articulado móvel, como N corpos, sob ação deforças fi e de torques das juntas Tj . . . . . . . . . . . . . . . . . . . . . . 6

2.1 Difeomorfismos f entre variedades, levantamentos tangentes Tf em es-paços tangentes TmM e levantamentos cotangentes T ∗f em espaços co-tangentes T ∗nN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 O espaço de configuração Q, o espaço tangente e o seu dual em q, e aforça f(vq) em T ∗q Q. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.3 Levantamento cotangente T ∗f das ações de grupo f . Os campos vetoriaisX|Q e X|S são definidos, respectivamente, em Q e S. . . . . . . . . . . . 19

2.4 Equivariância da aplicação momento J equivale a comutação das ações. . 252.5 Trajetórias da dinâmica de rotação do corpo rígido no espaço tridimen-

sional. A intersecção da superfície de conservação do momento angular,dada por esferas concêntricas ao centro de massa do corpo, com a superfí-cie representativa da conservação de energia, descrita por elipsóides (nãoilustrados) fornece as possíveis trajetórias do corpo no espaço de variáveis. 29

2.6 Espaço tangente total TqQ, espaço tangente sobre B e o levantamento daprojeção π. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.7 O fibrado principal. Φg(q) corresponde a órbita da ação de g ∈ G em q,Seção A.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.1 Em geral, o pareamento dos elementos duais de TQ e T ∗Q é não nulo.Na mecânica, no entanto, as forças de restrições fc são perpendiculares avelocidade, pois não realizam trabalho. . . . . . . . . . . . . . . . . . . . 39

3.2 Diagrama definindo a conexão mecânica. . . . . . . . . . . . . . . . . . . 41

4.1 O i-ésimo sistema de coordenadas é especificado, através da posição dasua origem ri e orientação θi, em relação ao i− 1-ésimo referencial. . . . 50

4.2 Trajetórias da dinâmica de rotação do sistema de dois corpos no plano.As trajetórias são determinadas pela intersecção da superfície cilíndrica,devida à conservação do momento angular do sistema µ1 + µ2, com oelipsóide, representativo da conservação de energia H. Ver Seção B.1. . . 55

4.3 Efeito das forças de propulsão nas juntas de rotação. . . . . . . . . . . . 604.4 Entradas relativas aos propulsores no referencial móvel do sistema de

2-corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

LISTA DE FIGURAS vii

5.1 Mudança de fase do sistema de três corpos. A mudança de fase foi cal-culada a partir de (5.2.9), para um caminho fechado no espaço de baseB parametrizado por α, β = 3. As coordenadas do espaço de base sãodadas por (φ1, φ2) = (θ12, θ23). . . . . . . . . . . . . . . . . . . . . . . . 94

5.2 Curvatura B relativa à conexão principal do sistema de três corpos. Acurvatura da conexão A dada em (5.2.9) foi obtida a partir de (5.2.10). . 95

5.3 Cinemática do sistema de dois corpos. . . . . . . . . . . . . . . . . . . . 101

6.1 Resultados da estabilização da configuração no ponto (−9.90,−5.10,−1.55, 2.00,−2.00) do sistema de 3-corpos, através de linearização por realimentação. 121

6.2 Resultados da estabilização do momento do sistema de 3-corpos, atravésde linearização por realimentação. . . . . . . . . . . . . . . . . . . . . . . 122

6.3 Estabilização da velocidade do sistema de 2-corpos. . . . . . . . . . . . . 1336.4 Planejamento de trajetória do sistema de 2-corpos. . . . . . . . . . . . . 1366.5 Resultados de simulação em malha aberta do planejamento de trajetória

do sistema de 2-corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1376.6 Resultados de estabilização de posição e velocidade pela composição das

leis de controle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1396.7 Resultados do controle ótimo aplicado ao modelo cinemático do sistema

de dois corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1436.8 Resultados do controle ótimo aplicado ao modelo cinemático do sistema

de dois corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

C.1 O corpo rígido com dois propulsores no SE(2). . . . . . . . . . . . . . . 171C.2 Esquema para a modelagem da matriz de inércia do sistema multi-articulado

J. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

Lista de Símbolos

0(.) vetor de zeros ou matriz1N vetor coluna de N unsA conexão de EhresmanA conexão principalB curvatura da conexão de Ehresman AB curvatura da conexão principal AR Matriz de rotação, elemento do grupo de Lie SO(n)f campo vetorial da dinâmica livre de um sistemaf(.) força de propulsãog elemento do Grupo de Lie G ou campo vetorial de entrada de um sistemaB Espaço de baseG Grupo de LieG inércia generalizada, isomorfismo da métrica de Riemanng álgebra de Lie do grupo de Lie GJ Matriz de inércia do sistemaJ Aplicação momentoH Hamiltoniano de um sistemaKE Energia cinética de um sistemaL Lagrangiano de um sistemaLX(F ) derivada direcional da função F na direção do campo vetorial XM variedade diferenciável genéricam número de entradas ou restriçõesn dimensão do espaço de estados ou de faseN número de corpos componentes do sistemaq configuração do sistema, q ∈ QQ variedade ou espaço de configuraçãop elemento de uma variedade diferenciável genérica M ou elemento do espaço de fasede momento de um sistema, p ∈ T ∗q QX campo vetorial genéricox difeomorfismo ou parametrização de uma variedade diferenciável ao Rn

z elemento do espaço de fase T ∗Q, z = (q, p)〈〈., .〉〉 métrica de Riemann[., .] colchete de Lie dos elementos da álgebra ou de Jabobi-Lie para campos vetoriaisV função de Lyapunovv vetor velocidade, elemento do espaço tangente de uma variedader coordenada genérica do espaço de base Bs coordenada genérica do espaço de grupo G

LISTA DE FIGURAS ix

Caracteres Gregos

θ orientação com relação a um referencial inercialφ ângulo de juntaω velocidade rotational do sistema mecânicoµ momento rotacional do sistema mecânicoτ entrada do sistema mecânicoξ elemento da álgebra de Lie genérica ou novas coordenadas do processo de linearizaçãopor realimentação

Superscrito

∗ - referente a massa total do sistemaext - referente às forças externas

Subscrito

p - referente aos propulsorest - referente aos torques das juntas rotativasB - referente ao referencial móvelS - referente ao referencial inercialcm - referente ao centro de massa do sistemax - referente ao eixo das abscissas do referencial inercialy - referente ao eixo das ordenadas do referencial inercialc - referente a cinemática do sistema

1

Capítulo 1

Introdução

1.1 Contextualização

O projeto de sistemas robóticos, em particular os sistemas móveis, segue uma constante e

irreversível crescente em termos da complexidade de inteligência e de reação ao ambiente,

do projeto do desempenho dinâmico e de interação com o ambiente.

A modelagem da dinâmica do corpo rígido compreende uma descrição dos movimentos

de translação e rotação sob a ação de esforços externos. Para o sistema analisado a

seguir, assim como para todos os sistemas que são compostos por mais de um corpo

rígido, por exemplo, faz-se importante descrever a posição relativa entre os seus elemen-

tos componentes, em conjunto com a descrição da translação e rotação de um ponto

representativo do sistema. Sistemas deste tipo, cujo a dinâmica de muitos corpos es-

tão envolvidos na descrição do mesmo, são denominados sistemas multi-corpos. A

complexidade relativamente maior da dinâmica destes sistemas reside nesta premissa,

uma vez que é necessário um número maior de variáveis para descrever a evolução no

tempo dos graus de liberdade adicionais. Por outro lado, um maior número de graus

de liberdade envolvidos permite incrementar a variabilidade de desempenho do sistema

pois é possível realizar uma maior quantidade de manobras no espaço de movimento.

Um típico exemplo do aumento da inteligência diz respeito aos atributos que conferem

ao sistema maior autonomia, ou seja, capacidade de tomada de decisões, cuja implemen-

tação segue da estruturação de vários níveis hierárquicos ou cooperativos na arquitetura

1.1. CONTEXTUALIZAÇÃO 2

do sistema de controle. Quanto a dinâmica de movimento, uma variedade de técnicas

de controle estão disponíveis que possibilitam projetar trajetórias de movimentos com

margens de estabilidade e de rejeição aos distúrbios bem determinadas e que, em mui-

tas circunstâncias, são estabelecidas através de relações de compromisso. Além disso,

muitos sistemas móveis são dotados de partes móveis internas ou de manipuladores, o

que permite expandir as possibilidades de desempenho, ao passo que, e concomitante-

mente, tornam mais complexos os projetos dinâmico e dos subsistemas que garantem

a autonomia do sistema, (Yuh e West, 2001) e (UUVMP Committee, 2004). Sistemas

desta categoria não apenas realizam tarefas de monitoramento, inspeção ou segurança,

mas operam alterando ativamente o seu meio de atuação ou simplesmente reagindo ao

ambiente.

1.1.1 Sistemas Multi-Articulados

Os sistemas multi-articulados são particularizações dos sistema multi-corpos defini-

dos acima, cujos corpos estão acoplados fisicamente entre si por articulações planas ou

esféricas. Sistemas deste tipo possuem aplicação variada, como a espacial, onde o ônibus

espacial e a estação espacial internacional (ISS) constituem exemplos típicos de veículos

tripulados, e aquática, como nos veículos submarinos tripulados ou não, que possuem

manipuladores, entre outros. Neste último exemplo, com o projeto de veículos operando

com velocidades cada vez mais maiores, ocorre um aumentando do acoplamento dinâ-

mico entre veículo e manipulador através das forças hidrodinâmicas (McLain, Rock e

Lee, 1995). Isto demanda maior capacidade de desempenho do sistema de controle e

dos atuadores do sistema.

No presente trabalho, investiga-se técnicas de modelagem dinâmica, análise da controla-

bilidade dinâmica e cinemática, geração de trajetória e controle para um sistema mecâ-

nico articulado restrito ao plano. O sistema mecânico mencionado consiste em múltiplos

corpos rígidos articulados entre si através de juntas rotativas de um grau de liberdade.

Tal idealização é representativa de sistemas físicos como sistemas mecânicos complexos

ou uma rede de robôs ou veículos móveis acoplados através de manipuladores. Exem-

plos recentes de estudos com sistemas multi-corpos no espaço (3D) e acoplados através

de juntas de rotação podem ser encontrados em (Dubowsky e Papadopoulos, 1993),

(Walsh e Sastry, 1995), (Koningstein e Cannon Jr., 1995), (Rui, Kolmanovsky e Mc-

Clamroch, 2000), entre outros.

1.1. CONTEXTUALIZAÇÃO 3

Um exemplo de aplicação do sistema pode ser representado pela construção e instalação

de estruturas submarinas com auxílio de veículos autônomos, como os AUVs1 dotados

de manipuladores, por exemplo. Neste caso, o movimento simultâneo e coordenado do

veículo e manipulador(es) é considerado acoplado e determinado para atender a diversos

cenários de operação.

O grupo de veículos, componentes do sistema multi-corpo, é passível da variação da

geometria de formação, ou seja, a orientação relativa entre os corpos é variável, visando

o interesse no desempenho de movimento dos corpos de forma coordenada. A atuação

sobre o sistema é realizada através de entradas (ou atuadores) internos e externos,

segundo a nomenclatura de sistemas robóticos. Atuadores internos são responsáveis

pela orientação relativa entre os corpos. Esforços externos, como distúrbios por exemplo,

alteram a dinâmica do sistema em relação a um referencial inercial.

1.1.2 Revisão da Literatura Técnica

Os sistemas robóticos multi-corpos, como os manipuladores robóticos e robôs bípedes,

são uma presente realidade e durante várias décadas vem sendo empregados como auxílio

de produção nos processos industriais e como tema de estudo nas atividades de ensino

e pesquisa. Publicações variadas sobre a teoria de modelagem envolvida, o projeto e

construção, controle ou tendências experimentais tem sido produzidas; dentre estas,

pode-se mencionar a referência pioneira (Wittenburg, 1977), além das citadas na seção

anterior, entre outras.

Mais recentemente, sistemas multi-articulados são estudados com vista a aplicação es-

pacial, em particular no controle de atitude de satélites artificiais. Apresentou-se em

Sreenath (1987) a modelagem de um sistema multi-articulado no plano sob um tra-

tamento geométrico. Em Reyhanoglu e McClamroch (1991) pode-se encontrar uma

discussão sobre a controlabilidade e estabilização de sistemas multi-corpos com a restri-

ção de invariância do momento angular. Dubowsky e Papadopoulos (1993) apresentou

a dinâmica e controle de sistemas robóticos espaciais totalmente controláveis no espaço

tridimensional. O controle não-linear da atitude e da forma de um sistema composto por

apêndices articulados e rodas de inércia foi discutido em Rui et al. (2000). Shen (2002)

dissertou sobre o controle de sistema multi-corpos através da variação de forma. Como

aplicação submarina, Melli, Rowley e Rufat (2006) apresentam um algoritmo para a1Do inglês: Autonomous Underwater Vehicles.

1.2. PROPOSTA DE UMA CLASSE DE SISTEMAS ROBÓTICOS MÓVEIS 4

geração de trajetórias de translação pelo controle de forma do sistema multi-articulado

em um meio fluido.

A mecânica geométrica, como no contexto apresentado em Marsden (2004) e nas refe-

rências ali citadas, entre outras, é aqui utilizada para modelagem do sistema, elaborada

por uma descrição segundo a mecânica clássica através da linguagem devido a geome-

tria diferencial (Spivak, 1999). Como será discutido ao longo do texto, as ferramentas

disponíveis a partir do ramo da geometria, mais especificamente da geometria diferen-

cial, permitem fragmentar a dinâmica de sistemas, possibilitando sua análise de forma

elegante e consistente com o intuito de identificar características de movimento. Estas,

por sua vez, permitem organizar e minimizar os cálculos de modelagem e de solução das

equações diferenciais do modelo. Referências adicionais são feitas a seguir.

O estudo da controlabilidade de sistemas mecânicos não-lineares ganhou nova motivação,

nas três últimas décadas, com o surgimento de ferramentas baseadas em resultados

conhecidos da geometria diferencial. Em particular, este avanço se aplica na análise da

estrutura dos campos vetoriais que descrevem as equações de dinâmica, pela álgebra

determinada pelo colchete de Jacobi-Lie dos campos vetoriais, (Sussmann, 1987).

Em função das mesmas ferramentas de análise empregadas na determinação da con-

trolabilidade, as técnicas de linearização por realimentação da dinâmica de estado

(Isidori, 1995), utilizadas para a estabilização de sistema completamente controláveis,

foram desenvolvidas por Brockett, Respondek, Krener e Isidori, entre outros. Nos sis-

temas que apresentam medidas de controlabilidade deficientes, outros métodos de es-

tabilização devem ser utilizados como, por exemplo, técnicas cujas leis de controle não

são infinitamente diferenciáveis nas variáveis do estado ou, mesmo, técnicas de controle

variantes no tempo. A teoria de estabilidade proposta por Lyapunov, (Khalil, 2002),

pode ser empregada com esta finalidade.

1.2 Proposta de uma Classe de Sistemas Robóticos Móveis

Uma das contribuições deste trabalho consiste em propor uma classe de sistemas ro-

bóticos móveis e multi-articulados, no qual o sistema propulsor está distribuído pelos

elementos, ou corpos, do sistema ao invés de se concentrarem apenas no corpo base ou

veículo.


Uma apresentação inicial da modelagem de um sistema multi-articulado no plano foi

realizada em Sreenath (1987), através de uma abordagem Hamiltoniana.2 No entanto, a

modelagem e análise do sistema considerados naquele estudo compreendiam um sistema

desprovido de uma configuração de entradas que permitisse a sua movimentação no

plano. O sistema aqui considerado, em contraste, e como será proposto a seguir, possui

entradas dispostas de maneira a possibilitar que este seja manobrado por todo o espaço

de variáveis do plano.

Diferentemente, uma abordagem segundo uma visão Lagrangiana não é, até o presente

momento, empregada de maneira freqüente na modelagem de sistemas multi-articulados.

Exceções a esta afirmação são encontradas na modelagem do Elroy’s Benie - sistema

composto por dois corpos articulados no centro comum de massa e, portanto, mais

simples do que o considerado aqui - discutido em Ostrowski (1995),Ostrowski (1999)

e do sistema com restrições não-holonômicas denominado snakeboard, (Bloch, Krishna-

prasad, Marsden e Murray, 1996; Bloch, 2003). Uma das possíveis razões para o uso

não freqüente desta, deve-se a relativa complexidade da teoria em comparação com a

alternativa Hamiltoniana. No entanto, a modelagem sob uma abordagem Lagrangiana

permite, em geral, um melhor detalhamento da geometria da dinâmica envolvida.

Define-se, a seguir, a classe de sistemas multi-corpos considerada neste trabalho:

Definição 1.2.1 (Sistema multi-articulado móvel). Define-se a classe de sistemas multi-

corpos móveis, como aquele composto por mais de um corpo rígido, acoplados fisica-

mente entre si através de juntas rotativas e em que os seus atuadores, responsáveis pela

sua mobilidade em relação a um referencial inercial, estão distribuídos nos corpos que

o compõe, Fig. 1.1.

A qualidade de ser móvel na definição acima, em princípio, abrange o espaço físico tri-

dimensional. No entanto, as discussões do presente trabalho restringem-se ao caso em

que a mobilidade do sistema limita-se ao plano bidimensional. Como será visto nos

capítulos de modelagem e análise, as juntas rotativas podem ser tomadas como ativas

ou passivas. No presente capítulo, apresenta-se uma evolução em relação a acionamento

dos sistemas multi-articulados apresentados em Sreenath (1987), por exemplo, no que

diz respeito à capacidade de auto-manobra no espaço pela ação de propulsores. Estes2Algumas correções de um resultado, no que diz respeito ao algoritmo para determinação da inércia

do sistema multi-corpos, desta referência são apresentadas na Seção C.2.1 do Apêndice C do presente

trabalho.


Centro deMassa

T1 T2

f1

f2

fN

TN−1corpo 1

corpo N

corpo 2

Figura 1.1: Sistema robótico multi-articulado móvel, como N corpos, sob ação de forças

fi e de torques das juntas Tj .

propulsores podem ser realizados por jatos de gases sob pressão ou provenientes de com-

bustão, como encontrados em sistemas espaciais, ou pelo empuxo relativo de um fluído

por uma hélice, como encontrado nos sistemas aquáticos, submarinos e aéreos. Observe,

também, que a classe de sistemas definida acima difere dos considerados em Dubowsky

e Papadopoulos (1993), em que os acionamentos de translação do sistema estão todos

localizados em um único corpo rígido, denominado veículo base, por exemplo.

O sistema de interesse neste trabalho é, de maneira geral, caracterizado pelos seguintes

atributos, e formalmente definidos nos próximos capítulos:

• Dinâmica livre não-linear e autônoma;

• Dinâmica representada na forma afim3;

• Sistema Lagrangiano, determinado apenas pela energia cinética;

• Sistema Hamiltoniano (Marsden e Ratiu, 1999), (Nijmeijer e van der Shaft, 1990);

• Configuração descrita por um grupo de Lie definido por N cópias do SE(2), onde

N é o número de corpos do sistema;4

• Sistema invariante à esquerda nas variáveis do referencial móvel;

• Sistema com restrição não-holonômica na velocidade e determinada pela conser-

vação do momento angular total na ausência de esforços externos;3Muitos sistemas mecânicos possuem esta propriedade.4Note que o conceito de configuração, como definido no próximo capítulo é, por definição, distinto

da relativa ao estado, podendo esta última incluir a configuração do sistema - composto pela posição,

orientação e variáveis de forma - além das variáveis de velocidade.

1.3. OBJETIVOS DE PESQUISA 7

• Sistema de controle sobre-atuado, atuado ou sub-atuado, dependendo do número

de entradas estipulado.

1.3 Objetivos de Pesquisa

Ambas as abordagens analíticas da mecânica, segundo Hamilton e Lagrange, são utiliza-

das na modelagem do sistema proposto. Como será visto, estas abordagens se alternam

em permitir uma melhor elucidação da física do problema. Por exemplo, quando da ca-

racterização de restrições não-holonômicas para um sistema, é usual deparar-se com um

desenvolvimento Lagrangiano. Alternativamente, a abordagem Hamiltoniana permite

obter de maneira direta as equações de movimento, adequando-se melhor à análise de

controlabilidade.

O foco principal de aplicação da teoria relativa aos métodos geométricos são empregados,

na presente pesquisa, à modelagem, analise da dinâmica, planejamento de trajetórias

e síntese de controle em malha fechada de sistemas mecânicos, em particular dos sis-

tema multi-corpos como apresentado acima. Neste contexto, apresentam-se a dinâmica

e técnicas de controle para um robô móvel e composto por corpos rígidos articulados

com interesse no desempenho de tarefas de forma coordenada e autônoma. Uma das

principais motivações para o presente trabalho consiste na investigação do aumento de

desempenho do sistema robótico móvel proposto, ou sistema multi-corpos, em relação

aos robôs móveis na forma como geralmente são utilizados, ou seja, composto por um

único corpo rígido. Estas medidas de desempenho podem ser determinados para otimi-

zação do comprimento da trajetória, variáveis temporais, esforço de controle ou consumo

energético.

1.3.1 Contribuições do Trabalho

Dentre as principais contribuições deste trabalho, podem-se destacar as seguintes:

• Proposta de uma classe de robôs móveis multi-articulados;

• Modelagem dinâmica fundamentada na teoria geométrica sob as abordagens La-

grangiana e Hamiltoniana. Modelagem das entradas do sistema, como descrito na

definição da classe de sistemas acima, Fig. 1.1;


• Análises de controlabilidade de exemplos de sistemas da classe proposta;

• Estabilização por regulação do sistema mediante um método de linearização por

realimentação, aliado a realimentação do estado, e através da teoria de estabilidade

de Lyapunov.

Dentre os principais resultados obtidos neste trabalho, os seguintes são notáveis:

• Apresenta-se a modelagem da dinâmica do sistema através de diferentes parame-

trizações do espaço de configuração Q;

• Apresenta-se a modelagem das entradas de propulsão do sistema;

• A análise de controlabilidade mostra que um sistema multi-articulado de N -corpos,

com pelo menos dois propulsores, é sempre acessível e controlável dos pontos de

equilíbrio:

– Mostra-se que o sistema é sempre linearizável por realimentação quando o nú-

mero de entradas iguala-se à dimensão do espaço de configuração Q. Neste

caso, pode-se estabilizar o sistema através de uma realimentação suave do

estado, dada uma matriz de ganhos do compensador projetada adequada-

mente;

• Nos casos em que a controlabilidade é deficiente, obtém-se uma extensão de um

resultado de estabilização para sistemas sub-atuados (Fantoni, Lozano, Mazenc e

Pettersen, 1999).

1.3.2 Justificativa do uso da Teoria Geométrica

Como mencionado acima, o caminho seguido para abordar o tema proposto baseia-se

nos métodos geométricos para a mecânica clássica, ramo da matemática que agrega

elementos do cálculo diferencial, álgebra linear e topologia, denominada geometria di-

ferencial. Neste contexto, a modelagem do sistema é realizada através da obtenção

dos campos vetoriais, que nada mais representam que um sistema de EDOs autôno-

mas descritas adequadamente. De maneira bastante simplista pode-se dizer que estes

métodos geométricos correspondem a uma especialização do ramo da mecânica denomi-

nado mecânica analítica5, que por sua vez permitem uma análise do sistema como um5Formalmente, esta analogia não é aceita, não sendo endossada por muitos autores.


todo, em contraste da abordagem Newtoniana, que trata do estudo individual de cada

componente do sistema.

De maneira mais abrangente, a geometria diferencial permite estabelecer uma associ-

ação entre a análise e a geometria, permite ainda “sintetizar figuras” da geometria do

problema em estudo, o que garante potencial heurístico na inferência de certas pro-

priedades inerentes ao sistema dinâmico e que podem ser rapidamente verificadas. Isto

pode traduzir-se em uma “simplificação” do ferramental matemático necessário à análise

do objeto de estudo além de uma compreensão mais fundamental da física do mesmo

(Schutz, 1980).

Além disso, a geometria diferencial consiste em um dos canais possíveis através dos quais

essas vantagens acima apresentadas podem ser extrapoladas do espaço físico para o es-

paço de variáveis. A modelagem do sistema baseia-se, neste contexto, na possibilidade

de tradução do comportamento dinâmico dos sistemas físico em modelos matemáticos

correspondentes e na análise destes de maneira independente de um sistema de coorde-

nadas (Lanczos, 1977). A formulação conceitual da mecânica analítica é, por exemplo,

realizada desta maneira. Neste sentido, a mecânica analítica caracteriza-se por ser mais

versátil, permitindo uma generalização das coordenadas em contraste com o espaço de

coordenadas físicas da formulação Newtoniana, (Meirovitch, 1970). Ademais, a inclusão

da dinâmica de subsistemas adicionais na abordagem analítica é realizada de maneira

direta e sistemática. Esta representa uma nítida vantagem de aplicação ao sistema

proposto. A teoria geométrica possui difundida aplicação especificamente na teoria de

controle. Logo, o emprego da teoria da mecânica geométrica ganha motivação extra

com as ferramentas de análise e síntese de sistemas de controle. Como visto a seguir,

estas estão fortemente baseadas na teoria geométrica, especialmente no caso de sistemas

não-lineares.

A motivação de escolha da mecânica geométrica abrange estas explicações acima junta-

mente com um interesse pessoal do autor em expandir o conhecimento, mesmo que de

maneira introdutória, nas disciplinas da matemática relacionadas aos sistemas dinâmi-

cos.


1.3.3 Aplicações

Outras áreas de aplicação do sistema aqui considerado, em adição às aplicações já citadas

nas seções anteriores, resumem-se nas seguintes:

Robótica: sistemas distribuídos swarm; por exemplo, operação de vários robôs mó-

veis atuando em conjunto para a realização de tarefas - http://www.work.caltech.

edu/ling/, http://payman.caltech.edu/sis/program.html;

Medicina: modelagem e controle de agulhas utilizadas na instrumentação médica

(Kallem e Cowan, 2007) - http://glacier.me.jhu.edu/ vinutha/research.html;

Química: modelagem e análise de reações químicas em sistemas poliatômicos (4 a 7

átomos) - http://www.cds.caltech.edu/ koon/project/;

Biologia: modelagem do movimento de microorganismos (Shapere e Wilczeck, 1987).

1.3.4 Organização da Tese

O presente trabalho está organizado nos seguintes capítulos:

Capítulo 2 Uma breve fundamentação teórica dos conceitos relativos à modelagem,

análise e controle que são realizados nos capítulos subseqüentes são apresentados.

Em síntese são revistos os conceitos de grupos, simetria, aplicação momento J,

conexão principal, decomposição do espaço de fase do sistema no fibrado princi-

pal. Em particular, a configuração de um corpo rígido no plano é completamente

especificada pelas coordenadas do grupo SE(2), que é um grupo definido por um

produto semi-direto.

Capítulo 3 Apresentação do princípio de Lagrange d’Alembert para sistemas não-

holonômicos. Descrição e teoria à modelagem Lagrangiana através do relaciona-

mento entre a inércia, a simetria e o momento generalizado do sistema denominado

por conexão mecânica. Discussão sobre a redução do sistema para obtenção da

dinâmica relativa, reconstrução da dinâmica completa do sistema no espaço de

fase TQ.

Capítulo 4 Modelagens Hamiltoniana e Lagrangiana:


• Descrição e obtenção da matriz de inércia do sistema, determinação da função

Hamiltoniano em função da inércia do sistema, modelagem da dinâmica do

sistema;

• Equações da dinâmica reduzida e de reconstrução da dinâmica completa do

sistema no espaço de fase TQ, sob o ponto de vista de Lagrange;

• Modelagem da entrada e do sistema de controle com N corpos sob ambas as

abordagens Hamiltoniana e Lagrangiana.

Capítulo 5 Exposição do equilíbrio dinâmico do sistema. Análise das fases geométricas

do sistema multi-articulado. Apresentação da teoria e análise da controlabilidade

do sistema.

Capítulo 6 Apresentação da teoria, análise e discussão do problema de estabilização do

sistema multi-corpos através de linearização por realimentação e síntese de controle

por realimentação através da teoria de Lyapunov. Apresenta-se um resultado do

planejamento de trajetória através do controle ótimo.

Capítulo 7 Conclusão dos principais resultados e discussões do trabalho. Apresentam-

se, também, alguns temas sugestivos para o prosseguimento deste trabalho.

Além destes, três capítulos estão organizados como Apêndice.

O primeiro capítulo do Apêndice apresenta uma breve recapitulação da teoria envolvida.

Em particular, as definições de alguns conceitos básicos da geometria diferencial e da

mecânica geométrica são revisadas. Estas definições serão utilizadas corriqueiramente

no trabalho.

O segundo capítulo do Apêndice contém resultados da mecânica geométrica utilizados

no curso do texto principal. Estes resultados podem não ser encontrados na literatura

que trata do assunto ou são detalhamentos, de resultados de algumas referências, para

o tratamento aqui pretendido.

O terceiro capítulo do Apêndice apresenta um modelo do corpo rígido no plano e modelos

do sistema multi-articulado. Em particular, apresentam-se resultados complementares

de modelagem dos sistemas de 3 e 5 corpos.

12

Capítulo 2

Elementos da Mecânica Geométrica

Conceitualmente, a mecânica Lagrangiana resume-se na descrição da dinâmica de um

sistema em uma variedade diferencial denominada espaço de configuração em conjunto

com uma função escalar, o Lagrangiano, definida no espaço tangente ao espaço de

configuração. A mecânica Hamiltoniana estende a teoria de Lagrange com a introdução

de mais estrutura à geometria do sistema. Esta é definida em uma variedade de dimensão

par e caracterizada por uma estrutura simplética não degenerada chamada espaço de

fase, que usualmente corresponde ao dual do espaço tangente ao espaço de configuração.

Um sistema Hamiltoniano é completamente determinado com a especificação do espaço

de fase com uma estrutura simplética e com o Hamiltoniano definido neste espaço de

fase. Nos parágrafos a seguir, os elementos essenciais destas duas abordagens serão

revistos com ênfase dada à descrição da geometria envolvida.

Vale destacar que os resultados discutidos a seguir valem - mas em geral não são ne-

cessariamente exclusivos - ao caso de dimensão finita. E, finalmente, a convenção do

somatório de Einstein é subentendida ao longo do texto quando o símbolo do somatório

não é explicitamente empregado, como de costume em textos de física ou mecânica.

2.1 Geometria Diferencial

Uma variedade M é um conjunto em que, para cada elemento de M , existe uma aplicação

bijetora e contínua que transforma pontos de um aberto que contém este elemento a um

2.1. GEOMETRIA DIFERENCIAL 13

aberto do Rn, para algum natural n.1 Mais precisamente, uma variedade é um espaço

métrico onde para cada p ∈ M com um aberto U de p e um inteiro n ≥ 0 tal que

existe um homeomorfismo ϕ que parametriza U a Rn (Spivak, 1999). Uma variedade

n-dimensional (finita) M é denominada uma variedade diferencial quando possui um

atlas de cartas (ϕi, Ui), i > 1, ao Rn, cujos ϕi são aplicações suaves (C∞) ou de classe

Ck, k > 1. A variedade M é dita suave se os ϕi forem aplicações suaves.

2.1.1 Campos vetoriais e Espaços Tangentes

Um campo vetorial X em M é uma regra atribuindo um vetor vp a cada ponto p ∈M . O conjunto de todos os vp define um espaço vetorial de dimensão n denominado

espaço tangente a M em p e representado por TpM . Um vetor vp ∈ TpM também

é representado como Xp = X(p). O fibrado tangente TM é uma variedade 2n-

dimensional composta pela união dos espaços tangentes TpM , para cada ponto p ∈ M :

TM =⋃

p∈M

TpM (2.1.1)

com coordenadas (p, vp) = (p, p). Logo, um campo vetorial X induz uma aplicação

X : M → TM : p 7→ (p, vp). Dada uma parametrização (x,U) em M , onde x : U ⊂M → Rn, uma base de TpM , em torno de p ∈ U , é dada por

∂

∂x1

∣∣∣∣p

, . . . ,∂

∂xn

∣∣∣∣p

(2.1.2)

e o campo vetorial em M pode ser escrito nas coordenadas da base dada acima

X(p) =n∑

i=1

ai(p)∂

∂xi

∣∣∣∣p

(2.1.3)

Um campo vetorial completo é aquele cuja curva integral pode ser estendida infinita-

mente aos tempos futuro e passado.

Similarmente, pode-se definir um espaço dual ao espaço tangente TpM , chamado de

espaço cotangente T ∗M . Os elementos do espaço T ∗p M são denominados de covetores,

conhecidos também como 1-formas. Definido um ponto p ∈ M , o espaço T ∗p M possui

base dx1|p, . . . , dxn|p. O fibrado cotangente T ∗M é definido analogamente a TM .1A definição de variedade feita aqui possui uma conotação local. Quando de uma definição

concernente às propriedades globais, deve-se considerar os axiomas da contabilidade e Hausdorff

(Mather, 2005).


Sejam M e N duas variedades e um difeomorfismo f : M → N : m 7→ f(m) = n,

para m ∈ M e n ∈ N . A aplicação tangente correspondente Tmf : TmM → Tf(m)N

transforma os vetores v ∈ TmM em u ∈ TnN , Figura 2.1. O levantamento cotangente

T ∗mf : TnN → Tf−1(n)M , onde f−1(n) = m, é definido pelo seguinte pareamento

〈T ∗f(un), vm〉 = 〈un, T f · vm〉

O conceito relativo ao levantamento cotangente será importante quando da reparame-

trização das coordenadas da dinâmica do sistema multi-articulado e da descrição das

suas forças de entrada no contexto geométrico.

ψ(V )

RdNRdM

φ(U)

N

U

ψ

V

f

ψ f φ−1

TpM

T ∗p M

φ M

p

Xp

f(p)

f∗ = Tpf

f ∗p (ωf(p))

vp

πp

f ∗ = T ∗p f

ωf(p)

T ∗f(p)N

Tf(p)N

f∗(vp)

FL(vp)

Figura 2.1: Difeomorfismos f entre variedades, levantamentos tangentes Tf em espaços

tangentes TmM e levantamentos cotangentes T ∗f em espaços cotangentes T ∗nN .


Derivada direcional e Colchete de Lie

Seja uma função F : M → R. Lembrando que o diferencial de F , escrito na base dx|p,é dado por

dF (p) =∂F (p)

∂xdx

a derivada direcional de F ao longo do campo vetorial X é definida por

LXF = X[F ] = dF ·X (2.1.4)

Em coordenadas locais, isto é, para a carta (x,U ⊂ M) em torno de p, tem-se que

X[F ](p) = dF (p) ·X(p) = Xi(x(p))∂F (x(p))

∂xi∈ R (2.1.5)

O colchete de Jacobi-Lie de dois campos vetoriais X, Y é definido pela operação LXY ,

ou seja, a diferenciação segundo Lie de um campo vetorial Y ao longo de X. Quando

aplicado à função F , o colchete de Jacobi-Lie de X, Y confere a seguinte expressão

[X,Y ][F ] = X[LY F ]− Y [LXF ] = X[Y [F ]]− Y [X[F ]]

A representação local, ou seja, em coordenadas, do colchete de Jacobi-Lie

[X, Y ] = DY ·X −DX · Y = (X · ∇)Y − (Y · ∇)X (2.1.6)

onde o operador D simboliza a matriz Jacobiana relativo à diferenciação de um vetor

com relação ao estado e ∇ é o operador divergente de uma função. Denominando por

X(M) o espaço de todos os campos vetoriais suaves em M , o colchete de Jacobi-Lie

pode ser visto como uma aplicação [·, ·] : X(M)×X(M) → X(M). Como será visto nos

próximos capítulos, o colchete de Jacobi-Lie representa uma importante ferramenta na

avaliação de controlabilidade de sistemas de controle.

Álgebras de Lie

Uma álgebra de Lie V é um espaço vetorial em R dotado de uma operação bilinear

[·, ·] : V × V → V e satisfazendo, para todo ξ, η, ζ ∈ V , as seguintes propriedades

anti-comutatividade : [ξ, η] = −[η, ξ]

Identidade de Jacobi : [ξ, [η, ζ]] + [η, [ζ, ξ]] + [ζ, [ξ, η]] = 0


onde [·, ·] é também chamado de colchete ou comutador de Lie. Como será visto a seguir,

o espaço tangente na identidade de um grupo de Lie, TeG, é um espaço vetorial típico

do cenário definido acima. Campos vetoriais em uma variedade munida do colchete

de Jacobi-Lie formam uma álgebra de Lie, (Marsden e Ratiu, 1999). Uma álgebra de

Lie é dita abeliana se a operação com o colchete de Lie resultar no elemento nulo para

quaisquer dois elementos de V .

2.1.2 Distribuições de Campos Vetoriais

Uma distribuição d-dimensional Dp em M é uma atribuição suave de um subespaço

m-dimensional Dp = D(p) contido em TpM a todo p ∈ M .

Uma distribuição D, definida em um conjunto ou variedade aberta M , é não singular

ou regular se constituir um subespaço de dimensão constante, ou, alternativamente,

se o posto da matriz construída, em coordenadas locais, pelos campos vetoriais da

distribuição for constante, para todo p ∈ M . Uma distribuição é dita singular, caso

contrário. Um ponto p′ ∈ M é denominado um ponto regular da distribuição D, se

existir uma vizinhança U de p′ com a propriedade que Dp′ é não singular em U .

Um campo vetorial X pertence à distribuição D se X(p) ∈ D(p) para todo p ∈ M . A

distribuição D é dita involutiva se [X, Y ] ∈ D para todos X,Y ∈ D.

Uma subvariedade N ⊂ M é dita uma variedade integrável de D se D(p) = TpN para

todo p ∈ N . Alternativamente, se D(p) induzir uma variedade integrável para todo p ∈M , então D é dita integrável. Involutividade e integrabilidade estão relacionadas através

do Teorema de Frobenius, (Isidori, 1995), no qual se estabelece que uma distribuição

regular é integrável se e somente se esta for involutiva. A determinação da involutividade

de uma distribuição d-dimensional D(p) = span X1(p), . . . , Xd(p) é equivalente ao

problema de verificação da integrabilidade da mesma, segundo o Teorema de Frobenius.

Determinar se uma distribuição é integrável significa encontrar n− d funções f∗(p) que

são diferenciais perfeitas, ou seja, que possuem a seguinte estrutura

f∗j (p) =∂λj

∂x

onde λ : M → R são funções suaves e j = 1, . . . , n− d, tal que seja possível determinar

n− d soluções independentes para as seguintes equações diferenciais

∂λj

∂x[X1(p) · · ·Xd(p)] = 0

2.2. MECÂNICA GEOMÉTRICA 17

onde j = 1, . . . , n− d.

2.2 Mecânica Geométrica

Define-se por configuração a generalização da posição e atitude de um sistema. Repre-

senta-se o espaço ou variedade de configuração por Q, com elementos q. Os vetores

velocidade do mesmo são representados como elementos do espaço tangente TqQ.

A força externa total f é geralmente definida por uma aplicação C∞ no fibrado tangente

e função do tempo f : R × TQ → T ∗Q : (t, vq) 7→ f(t, vq), ver Figura 2.2. Uma força

f é denominada básica quando existir um campo vetorial dual C∞ representado por

f ′ em Q tal que f(t, vq) = f ′(q). Uma variedade Riemanniana (Q, 〈〈., .〉〉) consiste de

Q

TqQ

T ∗q Q

f

vq

Figura 2.2: O espaço de configuração Q, o espaço tangente e o seu dual em q, e a força

f(vq) em T ∗q Q.

uma variedade diferenciável Q e de um campo tensorial (0, 2) em Q, ou, simplesmente,

uma métrica quadrática, simétrica e definida e positiva, 〈〈., .〉〉 : TQ × TQ → R. Uma

métrica é sempre definível para sistemas mecânicos e será utilizada para definir a energia

cinética destes sistemas a seguir. Sejam (Q, 〈〈., .〉〉1) e (Q, 〈〈., .〉〉2) duas variedades de

Riemann. Uma isometria é um isomorfismo suave ϕ : Q → Q onde ϕ∗〈〈., .〉〉2 = 〈〈., .〉〉1.

2.2.1 Grupos e Grupos de Lie

Um grupo G é definido como um conjunto munido de uma operação binária (·) : G×G 3(a, b) 7→ a · b ∈ G, para todo a, b, c ∈ G, com as seguintes propriedades:


associatividade: a · (b · c) = (a · b) · c;

existência do elemento identidade: ∃ e ∈ G tal que a · e = e · a = a;

existência do elemento inverso: ∃ a−1 ∈ G tal que a · a−1 = a−1 · a = e.

Um grupo é denominado abeliano quando a operação do grupo for comutativa. Em

símbolos: o grupo G é abeliano se a · b = b · a, para a, b ∈ G.

Um grupo de Lie G é um grupo caracterizado por ser também uma variedade dife-

rencial tal que, para todo a, b ∈ G, as operações de grupo (a, b) 7→ a · b e a operação

de inversa a 7→ a−1 são aplicações suaves. Dado um natural n ∈ N, os seguintes são

exemplos de grupos de Lie em que a operação de grupo é a multiplicação usual de

matrizes:

• SO(n): Grupo Ortogonal especial representado por matrizes do tipo:

SO(n) = R ∈ Rn×n | RTR = In, det(R) = +1 (2.2.1)

onde R são matrizes de rotação. Para n = 3, as aplicações lineares R que preser-

vam a norma Euclideana são utilizadas para descrever rotações de corpos rígidos

no espaço. Quando n = 2, as rotações restringem-se aos movimentos no plano, o

grupo Ortogonal Especial no plano. O grupo SO(2) é abeliano, no qual a operação

de grupo comuta para quaisquer R1,R2 ∈ SO(2).

• SE(n): O grupo Euclideano especial consiste em elementos do tipo

SE(n) =

[R r

01×n 1

]∈ R(n+1)×(n+1)

∣∣∣∣∣R ∈ SO(n), r ∈ Rn

(2.2.2)

A operação de grupo entre os elementos de SE(n) é dado por:[

R1 r1

01×n 1

]·[

R2 r2

01×n 1

]=

[R1R2 R1r2 + r1

01×n 1

]

Logo, SE(n) é dado por um produto semi-direto2 entre os elementos do grupo

SO(n) e o espaço vetorial Rn. Em símbolos, SE(n) = SO(n)sRn, Seção B.2.

O SE(2) é denominado grupo Euclideano especial no plano e o grupo SE(3)

corresponde ao conjunto de deslocamentos rígidos no espaço.2Em contraste com o produto cartesiano ou direto.


A ação de um grupo de Lie G em uma variedade Q é definida pela aplicação Φ : G×Q →Q

Φg(q) = Φ(g, q) = Φq(g) (2.2.3)

Exemplos de ações à esquerda de grupos são a aplicação de translação à esquerda e a

conjugação. Uma translação à direita é uma ação à direita de grupo. Um grupo de Lie

é denominado abeliano se a operação (·) envolvendo os seus elementos for comutativa.

Dada uma G-ação à esquerda Φ em Q, o levantamento à esquerda da ação Φ é definida

por

〈T ∗g−1qΦg(u), v〉 = 〈u, TqΦg · v〉

para v ∈ TqQ e u ∈ T ∗Φg(q)Q. Alternativamente, o levantamento à direita é dado por

〈T ∗gqΦg−1(u), v〉 = 〈u, TqΦg−1 · v〉

Diz-se que G age em T ∗Q pelo levantamento cotangente, Figura 2.3, quando G age em

Q por isometrias.

TQπQ -¾X|Q

Q ¾π∗Q

T ∗Q

TS

Tf

?¾ X|S

πS

- S

f

?

f−1

6

¾π∗S

T ∗S

T ∗f

6

Figura 2.3: Levantamento cotangente T ∗f das ações de grupo f . Os campos vetoriais

X|Q e X|S são definidos, respectivamente, em Q e S.

Álgebras de Grupos de Lie

Sejam ξ, η os elementos de TeG para um dado grupo de Lie G. Os campos vetoriais em

G correspondentes, de maneira que sejam invariantes à esquerda, são Xξ e Xη, onde

Xξ(g) = TeLgξ e g ∈ G, para o qual o colchete de Jacobi-Lie é definido. A álgebra


de Lie g do grupo G, como na Seção 2.1.1, é definida pelo colchete de Jacobi-Lie dos

campos vetoriais associados e avaliado na identidade e ∈ G, ou seja:

[ξ, η] := [Xξ, Xη](e) = X[ξ,η](e) (2.2.4)

onde a operação [·, ·] representa o colchete da álgebra de Lie g. Note que, como TeG

possui a estrutura de uma álgebra de Lie, os espaços TeG e g são isomórficos. Uma

álgebra de Lie g de G é dita abeliana se [ξ, η] = 0, ou seja, quando o colchete da álgebra

de Lie se anula para quaisquer ξ, η ∈ g.

Proposição 2.2.1 ((Marsden e Ratiu, 1999)). Se G é um grupo de Lie abeliano então

sua álgebra de Lie g é abeliana. A implicação inversa é verdadeira apenas quando G é

conexo.

2.2.2 Mecânica Lagrangiana

Seja um corpo rígido3 no espaço R3. Qualquer ponto do corpo, em coordenadas do

corpo, pode ser especificado por X. Dado a distância r do sistema de coordenadas

do corpo em relação ao sistema inercial, então a posição inercial de qualquer ponto do

corpo é dada por x = r + RX. A energia cinética KE de um corpo no instante t, tem

a forma

KE(t) =12

∫

B‖r(t) + R(t)X‖2dµ

Avaliada para um corpo no plano, a energia cinética toma a seguinte forma (Sreenath,

1987):

KE =12

∫

Bρ(X)‖x‖2d2X

O Lagrangiano L é uma função escalar no fibrado tangente L : TQ → R, definida pela

diferença entre a energia cinética KE e a energia potencial.4 A dinâmica de movimento

de um sistema livre de restrições pode ser obtida em função do Lagrangiano através

da equação de Euler-Lagrange, por exemplo, como discutido no próximo capítulo. Em

termos da métrica de Riemann 〈〈., .〉〉, o Lagrangiano de um sistema mecânico pode ser

escrito como

L(q, q) =12〈〈q, q〉〉G =

12〈Gq, q〉 (2.2.5)

3Formalmente definido por (B, µ), onde B ⊂ R3 é compacto e µ é uma medida de Borel finita e

equivalente a ρdV , sendo ρ a densidade e dV uma medida infinitesimal do volume do corpo, (Bullo e

Lewis, 2005).4A função Lagrangiano é usualmente definida por L = KE − Vpot, onde Vpot representa a energia

potencial. Similarmente a função Hamiltoniano, quando invariante no tempo, é definida como H =

KE + Vpot. Neste trabalho, no entanto, considerada-se Vpot = 0.


onde q ∈ Q, 〈〈., .〉〉G corresponde à métrica induzida pela energia cinética e G representa

a matriz de inércia generalizada do sistema, definida por

Gij =∂2KE

∂qi∂qj, i, j = 1, . . . , n

onde q ∈ TqQ. A métrica de Riemann permite que a manipulação dos elementos geo-

métricos, para modelagem, por exemplo, seja realizada de forma independente da pa-

rametrização escolhida. A modelagem do sistema multi-articulado, a ser apresentada

nos capítulos a seguir, é feita sob este contexto, juntamente com alguns exemplos de

parametrizações de Q.

2.2.3 Mecânica Hamiltoniana

O Lagrangiano é dito hiper-regular quando é possível utilizar-se de um difeomorfismo

para definir a função escalar Hamiltoniano H : T ∗Q → R. Este difeomorfismo é conhe-

cido como a transformada de Legendre FL : TQ → T ∗Q, onde FL indica a operação

de diferenciação no espaço tangente sobre Q. O campo vetorial de um Hamiltoniano

H define a aplicação XH : T ∗Q → T (T ∗Q) : z 7→ (z), ou seja, XH(z) ∈ Tz(T ∗q Q) via

Equações de Hamilton.

O espaço cotangente ou dual T ∗Q, também chamado de espaço de fase do momento

para sistemas mecânicos, é uma variedade de Poisson, uma vez que possui uma estrutura

simplética. Este é, muitas vezes, chamado de espaço de estados de sistemas mecânicos.

Variedades de Poisson

O par (P, ., .), onde P é uma variedade e o colchete ., . definido pela aplicação

., . : F(P )×F(P ) → F(P ), (2.2.6)

é denominado de variedade de Poisson se, para as funções F, G, H ∈ F(P ), as seguintes

condições são satisfeitas:

bilinearidade F,G é bilinear em F e G

anti-comutatividade F,G = −G,F

Identidade de Jacobi F, G,H+ H, F, G+ G, H, F = 0


Derivação de Leibniz FG,H = FG,H+ F, HG

Observe que as variedades de Poisson (P, ., .) possuem a estrutura de uma álgebra de

Lie. Localmente, isto é, nas coordenadas de z ∈ P , o colchete toma a seguinte forma

F, G(z) =2n∑

i,j=1

wi,j(z)∂F

∂zi(z)

∂G

∂zj(z) (2.2.7)

onde [wi,j ](z) é uma matriz anti-simétrica. O colchete de Poisson é não degenerativo

quando rank[wi,j ](z) = 2n para todo z ∈ P .

Aplicações de Poisson

Seja ϕ uma aplicação entre duas variedades de Poisson (P1, ., .1) e (P2, ., .2) e duas

funções reais F,H ∈ F(P2). Uma aplicação ϕ é dita uma aplicação de Poisson se

ϕ∗F, H2 = ϕ∗F,ϕ∗H1 (2.2.8)

Para sistemas autônomos, o fluxo ϕt de XH é uma aplicação de Poisson e deixa o

Hamiltoniano H invariante: H ϕt = H; indicando conservação de energia quando as

trajetórias do sistema são dadas pelo fluxo de um campo vetorial Hamiltoniano XH .

Variedades Simpléticas

Uma variedade simplética (P, Ω) é (sempre) uma variedade de Poisson5 de dimensão

par cuja estrutura Ω é uma 2-forma diferencial fechada6 e não degenerada, ou seja,

Ω(XH(q), vq) = 0, ∀H ∈ F(P ) ⇒ vq = 0 (2.2.9)

onde vq ∈ TqQ, veja (Marsden e Ratiu, 1999) e (Arnold, 1989). O espaço de fase de um

sistema mecânico possui naturalmente uma estrutura simplética. Portanto, P ≡ T ∗Q

e o levantamento cotangente, visto acima, é sempre uma aplicação simplética. Para

as coordenadas (qi, pi) da variedade simplética T ∗Q, onde i = 1, . . . , n, a 2-forma fica

determinada por

Ω = dqi ∧ dpi (2.2.10)5A implicação inversa não é verdadeira, em geral.6Uma forma diferencial Ω é dita fechada quando sua derivada exterior, operação simbolizada por d,

for nula, ou dΩ = 0.


onde ∧ representa o produto exterior. O colchete de Poisson, dado por (2.2.7), das

funções F e G, para z = (q, p) ∈ T ∗q Q, fica

F, G(z) = Ω(XF (z), XG(z))

=n∑

i=1

∂F

∂qi

∂G

∂pi(z)− ∂G

∂qi

∂F

∂pi(z)

= dF ·M∇G

onde M corresponde a matriz simplética dada na Seção A.2.2. Uma aplicação suave

ϕ : P1 → P2 é simplética se, dadas duas variedades simpléticas (P1, Ω1) e (P2, Ω2),

satisfizer

ϕ∗Ω2 = Ω1

Toma-se H ∈ F(P ). Restrito a uma variedade simplética, a dinâmica de movimento é

dada pelas equações de Hamilton que, nas variáveis canônicas zi = (qi, pi), adquire a

forma

qi =∂H

∂pi

pi = −∂H

∂qi⇔ z =M∇H(z)

Um campo vetorial Hamiltoniano XH em T ∗Q é aquele dado por z = XH(z). Logo, a

função suave definida em P , representada por F(P ), que corresponde ao campo vetorial

Hamiltoniano é a função H. Segundo (2.2.11), esta aplicação é um anti-homomorfismo.7

A definição de um campo vetorial é dependente do contexto; se este é definido em um

espaço vetorial simplético, uma variedade simplética ou em uma variedade de Poisson.

Dado um Hamiltoniano H a equação da dinâmica escrita em função do colchete de

Poisson é dada por F = F,H, para F ∈ F(P ).

Proposição 2.2.2 ((Marsden e Ratiu, 1999)). O colchete de Poisson de funções suaves

definidas em uma variedade, ou espaço vetorial, simplética define uma álgebra de Lie.

A operação nesta álgebra é denominada de álgebra de Poisson.

Corolário 2.2.3 ((Marsden e Ratiu, 1999)). O colchete Jacobi-Lie de campos vetoriais

de Hamiltonianos definidos em uma variedade, ou espaço vetorial, simplética define uma

sub-álgebra de Lie.7Dadas duas funções F, H ∈ F(P ), a aplicação F(P ) → X(P ) : H 7→ XH é um anti-homomorfismo

da álgebra de Lie, ou

[XH , XF ] = −XH,F (2.2.11)

para XH ∈ X(P ).


Aplicação Momento

Seja a ação de uma álgebra de Lie g em uma variedade de Poisson P , definida pelo

gerador infinitesimal ξP , isto é, um campo vetorial de uma curva definida em P por

indução de um caminho na álgebra g através da aplicação exponencial, refira a Seção

A.1 do Apêndice A. A aplicação momento J : P → g∗ é uma grandeza que, em geral8,

permanece constante com a dinâmica de sistemas Hamiltonianos, ou seja, permanece

inalterada quando avaliada ao longo do fluxo dos campos vetoriais XH , quando H é

invariante a ação de G.9 A aplicação J caracteriza-se pela propriedade em que a função

〈J, ξ〉, definida pelo pareamento entre as álgebras de Lie duais, é calculada através da

expressão

X〈J,ξ〉 = ξP , ξ ∈ g

onde ξP é o gerador infinitesimal em P . No lado Hamiltoniano, a aplicação J é uma

aplicação de Poisson no espaço cotangente T ∗Q

J : P = T ∗Q → g∗

definida a partir da expressões de levantamento cotangente10 das ações de grupo, como

〈J, ξ〉(pq) = 〈pq, ξQ(q)〉

Uma aplicação momento é denominada equivariante11 quando satisfaz a relação:

Ad∗g−1 J = J Φg

para g ∈ G e onde Φg é uma ação à esquerda de G em P . Aplicações momento

equivariantes, Figura 2.4, são aplicações de Poisson e, portanto, homomorfismos de

álgebras de Lie, preservando a operação com colchetes de Poisson. Esta propriedade será

explorada nas expressões de modelagem geométrica no próximo capítulo. Similarmente,

no lado Lagrangiano, a aplicação J : TQ → g∗, definida no fibrado tangente TQ, é

avaliada através de

〈J(vq), ξ〉 = 〈FL(vq), ξQ(q)〉

onde FL : TQ → T ∗Q representa a diferenciação no espaço tangente sobre Q.8Exceção feita quando da presença de restrições não-holonômicas; assunto a ser revisado no próximo

capítulo.9Veja a Seção 2.4.10Ver expressão (A.2.7) da Seção A.1 no Apêndice.11Ou, também, Ad-equivariante.

2.3. SISTEMAS MECÂNICOS SIMPLES 25

Q T ∗QJ - g∗

Q

Φg

6................................

T ∗Q

T ∗Φg

?

J- g∗

Ad∗g−1

?

Figura 2.4: Equivariância da aplicação momento J equivale a comutação das ações.

Estratificação Simplética de Variedades de Poisson

Diz-se que uma variedade de Poisson forma uma foliação simplética. Toda folha em P

constitui uma subvariedade injetivamente imersível e regular, ou seja, uma variedade de

Poisson corresponde a uma foliação de folhas simpléticas, conexas e integráveis12. Este

resultado é formalizado no seguinte Teorema.

Teorema 2.2.4 (Estratificação Simplética (Marsden e Ratiu, 1999)). Seja P uma va-

riedade de Poisson de dimensão finita. Então P é a união disjunta de suas folhas

simpléticas, onde cada folha é uma subvariedade de Poisson com a propriedade que esta

é uma subvariedade definida por uma imersão13 injetiva e onde a estrutura de Pois-

son em cada folha é induzida pela estrutura simplética da folha. A dimensão da folha

passante pelo ponto z ∈ P é determinada pelo posto da estrutura de Poisson neste ponto.

2.3 Sistemas Mecânicos Simples

O termo Sistema Mecânico Simples é empregado para designar uma variedade e,

no entanto, bem definida classe de sistemas mecânicos. Muitos autores têm-se utilizado

desta terminologia (Nijmeijer e van der Shaft, 1990), (Marsden, 2004), (Bullo e Lewis,

2005), entre outros. Na descrição a seguir, tentou-se manter a notação utilizada nesta úl-

tima referência. Um sistema mecânico simples é uma 7-upla (Q, 〈〈., .〉〉G, Vpot, fext,D,F , U)

onde:12No sentido de Frobenius.13Aplicação cujo posto se iguala, de maneira global, a dimensão do domínio.

2.4. SISTEMAS COM SIMETRIA 26

• Q é a variedade ou espaço de configuração,

• 〈〈., .〉〉G é a métrica de Riemann em Q relativa à energia cinética,

• Vpot é a função potencial em Q utilizada na definição do Lagrangiano - não em-

pregada neste trabalho,

• fext é uma resultante de força em Q devido ao distúrbio externo não-controlável,

• D é uma distribuição correspondente a restrição de velocidades,

• F = F 1, F 2, . . . , Fm é uma coleção de campos vetoriais completos em Q e

referentes a entrada do sistema,

• U ⊂ Rm é conjunto de controle, muitas vezes próprio14.

Um sistema de controle na forma afim (Q, f, g1, . . . , gm, U), para o campo vetorial da

dinâmica f e onde g1, . . . , gm são os campos vetoriais de controle em Q, é dado por

z(t) = f(z(t)) +m∑

j=1

gj(z(t))uj(t) (2.3.1)

com m canais de entrada ou controle.

Um sistema Hamiltoniano simples, (Nijmeijer e van der Shaft, 1990), em uma variedade

de Poisson P , é aquele em que os campos vetoriais são determinados a partir dos Ha-

miltonianos H0(q, p) and Hj(q, p) do sistema, onde Hj(q, p) = Hj(q). Sejam as funções

H0,H1, . . . ,Hm ∈ C∞(P ) e z ∈ P . Para um colchete de Poisson não-degenerado, o

Sistema de controle Hamiltoniano Afim é definido em T (T ∗Q) como:

z = XH0(z)−m∑

j=1

XHj (z)uj (2.3.2)

yj = Hj(z) (2.3.3)

No sistema acima, toma-se F j = XHj e yj são os canais de saída do sistema. No caso

de colchetes degenerados, o sistema (2.3.2) é chamado de Poisson.

2.4 Sistemas com Simetria

Dá-se o nome simetria às grandezas de sistemas dinâmicos que são conservadas, isto é,

às constantes de movimento que podem ser observadas. A invariância da dinâmica do14O conjunto U é dito próprio se 0 ∈ int(conv)(U), Seção 5.3.1


movimento associada se traduz em uma invariância do Hamiltoniano, ou Lagrangiano,

que modela o sistema.

Revisa-se, primeiramente, o conceito de invariância sob a ação de um grupo. Dada uma

ação à esquerda Φ de um grupo de Lie G em Q e os campos vetoriais X,Y ∈ C∞ em Q,

valem as seguintes relações, para todo g ∈ G e q ∈ Q:

• A função f : M → R é invariante se Φ∗gf = f , ou seja, f Φg = f

• O campo vetorial avaliado em q: X(q) é invariante se TqΦgX(q) = X(Φgq);

equivalentemente, uma distribuição D em M é invariante se TqΦg(Dq) = DΦg(q)

• Um aplicação no fibrado F : TM → T ∗M sobre eQ é equivariante se Φ∗g(F (X)) =

F (Φ∗gX)

Feitas as observações acima, pode-se dizer que simetrias são ações de grupo que deixam

invariantes a estrutura do espaço e, portanto, as dinâmicas nela definidas. Dado um

sistema dinâmico, os grupos de simetria ou invariância do sistema, correspondem ao

conjunto de grupos pelos quais as simetrias observadas podem-se descritas. Formal-

mente, a ação suave Φ de um grupo de Lie G à esquerda representa uma simetria do

sistema (Q, 〈〈., .〉〉G, fext,D,F , U) se Φ for uma isometria de (Q, 〈〈., .〉〉G), se D e F são

invariantes, e se F é equivariante.

Teorema de Noether

A aplicação momento J é uma grandeza conservada em sistemas com simetria. Sob

o ponto de vista Lagrangiano, a aplicação momento J é constante no tempo, para

soluções da equações de Euler-Lagrange do sistema. Alternativamente, o teorema pode

ser enunciado no lado Hamiltoniano:

Teorema 2.4.1. Seja ação de um grupo de Lie G em uma variedade de Poisson P

através do gerador infinitesimal, Seção A.1. Considere um Hamiltoniano H que é G-

invariante em P , onde ϕt é o fluxo do campo vetorial XH . Então J é uma constante

de movimento ao longo das trajetórias de XH , isto é, J ϕt = J.

Demonstração. Seja z ∈ P um ponto da variedade de Poisson P dado por z = (q, p) ∈P ≡ T ∗Q. A invariância da função H, segundo a translação de z por g, traduz-se em


H(g·z) = H(z). Restringindo o sistema Hamiltoniano ao caso autônomo e diferenciando

esta expressão em relação a g na direção ξ no ponto g = e, tem-se que

∂

∂g

∣∣∣∣g=e

H(g · z) · ξ =∂

∂g

∣∣∣∣g=e

H(z) · ξ

∂H(z)∂z

· ∂Φg(z)∂g

∣∣∣∣g=e

· ξ = 0, (H(g · z) = H(z)) (2.4.1)

Mostra-se que o segundo termo da última linha é dado pelo gerador infinitesimal ξP .

A função exponencial em g dada por exp(tξ) = γξ(t) ∈ G gera um subgrupo uni-

parametrizado por t ∈ R, para todo ξ ∈ g. Da definição do gerador infinitesimal da

Seção A.1, tem-se, utilizando a regra da cadeia para a diferenciação, que

ξP (z) :=d

dt

∣∣∣∣t=0

Φexp(tξ)(z) =∂Φg(z)

∂g

∣∣∣∣g=e

· dΦexp(tξ)(z)dt

∣∣∣∣t=0

= TzΦg(γ′ξ(0) · z)

Observe que γξ(0) = e e que γ′ξ(0) = ξ. Logo, da última igualdade de (2.4.1), segue que

dH(z) · ξP (z) = 0

Sabe-se, no entanto, que outra maneira de definir o gerador infinitesimal ξP (z) é através

do campo vetorial X〈J,ξ〉(z), onde o pareamento, dado por 〈J, ξ〉, entre a aplicação

momento J : TQ → g∗ e elementos da álgebra ξ ∈ g, representa uma função real em z.

Logo, segue que

dH(z) ·X〈J,ξ〉(z) = 0

d〈J, ξ〉(z) ·XH(z) = 0

H, 〈J, ξ〉 = 0

d〈J, ξ〉(z) ·XH(z) = 0

onde ., . representa o colchete de Poisson, XH(z) =M∇H(z) e o vetor ∇H(z) ∈ TzP

representa o gradiente da função H, dado por

∇H(z) =[

∂H(z)∂q

∂H(z)∂p

]T

Como, em geral, XH representa uma dinâmica não nula, tem-se que d〈J, ξ〉(z) = 0, ou

seja, 〈J, ξ〉(z) se mantém constante ao longo das trajetórias do campo XH(z).

O Teorema de Noether, enunciado aqui no contexto geométrico, traduz-se nos Teoremas

da conservação de momento linear e da conservação de momento angular da mecânica

clássica Newtoniana.


Exemplo 2.4.2. Considere um corpo rígido no espaço tridimensional. Suponha que

este possa girar livremente em torno dos três eixos do referencial fixo cujo a origem

está localizada no seu centro de massa. O espaço de configuração do corpo rígido é

dado pelo grupo SO(3) e seu momento angular µ ∈ T ∗q SO(3) ≈ R3. Pelo Teorema

de Noether, e na ausência de torques, o corpo mantém seu movimento indefinidamente

nas trajetórias determinadas pelas curvas integrais do campo vetorial que modela a sua

dinâmica. Algumas destas trajetórias são ilustradas na Figura 2.5, (Marsden e Ratiu,

1999).

Figura 2.5: Trajetórias da dinâmica de rotação do corpo rígido no espaço tridimensio-

nal. A intersecção da superfície de conservação do momento angular, dada por esferas

concêntricas ao centro de massa do corpo, com a superfície representativa da conserva-

ção de energia, descrita por elipsóides (não ilustrados) fornece as possíveis trajetórias

do corpo no espaço de variáveis.

2.5. ESPAÇOS FIBRADOS E CONEXÕES 30

2.4.1 Redução de Sistemas com Simetria

Em geral, a simetria do sistema permite uma redução de ordem do seu modelo dinâmico

associado. A motivação por traz de uma redução de ordem do sistema muitas vezes recai

na necessidade de simplificação das equações diferenciais que modelam a dinâmica, nos

procedimentos de análise da dinâmica, ou na aplicação de ferramentas de planejamento

de trajetória. Alguns métodos de redução, no contexto geométrico de simetria, são

apresentados e discutidos em Marsden e Ratiu (1999) e (Bloch, 2003).

A Estrutura Principal e Simetria do Sistema

Como será detalhado na Seção a seguir, o espaço de configuração Q é localmente iso-

mórfico ao produto do espaço de base com espaço de grupo, ou fibra, G:

Q ' Q/G×G (2.4.2)

Assume-se, neste trabalho, que o grupo de simetria e a estrutura de grupo do fibrado

principal coincidem. O espaço completo Q, e o fibrado principal são relacionados pela

aplicação projeção do fibrado: π : Q → Q/G.

2.5 Espaços Fibrados e Conexões

Apresenta-se, nesta seção, uma descrição mais detalhada da estrutura geométrica do

relacionamento entre variedades e seus espaços tangentes, veja (Bloch, 2003; Bullo e

Lewis, 2005).

Um espaço fibrado é uma 4-upla (Q, π, B, F ) em que Q, B, e F são variedades C∞denominadas de espaço total, espaço de base e espaço de fibra, respectivamente, e a

aplicação π : Q → B projeta pontos q ∈ Q a r ∈ B. A fibra sobre b ∈ B é π−1(r).

Ademais, existe um atlas (Ua, φa)a∈A para B tal que o fibrado é localmente trivial, ou

π−1(Ua) é homeomórfico ao espaço produto Ua × F . As coordenadas do elemento q no

fibrado Q são dadas por qi = (rα, sa), onde rα ∈ B e sa descrevem a fibra localmente.

O espaço vertical Vq ⊂ TqQ é definido como sendo o núcleo da aplicação Tqπ para

todo ponto q. Denomina-se Tqπ como a aplicação tangente, corresponde a π em todo


ponto q ∈ Q. Faz-se importante especificar uma conexão ou um relacionamento entre

o fibrado tangente ao espaço de base TB e um subespaço do TQ detalhado a seguir.

As conexões são utilizadas para isolar o que se denominam direções horizontais que,

para todo q ∈ Q, definem um espaço horizontal suave Hq ⊂ TqQ tal que TqQ = Hq⊕Vq

e Hq são G-invariantes, ou seja, TqΦgHq = Hgq para todo g ∈ G. Logo, para qualquer

vetor vq ∈ TqQ, pode-se escrever:

vq = hor vq + ver vq

onde a aplicação hor : TQ → H devolve a componente horizontal do vetor vq e corres-

ponde a um elemento do espaço horizontal Hq em q; analogamente, ver vq ∈ Vq.

2.5.1 A Conexão de Ehresmann

Uma conexão de Ehresmann A corresponde a uma 1-forma no fibrado Q que retorna

um vetor em TQ tal que, para cada q ∈ Q, os seguintes se verificam:

• A(q) = Aq : TqQ → Vq é uma aplicação linear e vertical;

• A(vq) = vq é uma projeção, para todo vq ∈ Vq.

Define-se, a partir da conexão A acima, o espaço horizontal por Hq = kerAq. Seja

vq ∈ TqQ. Na base de TqQ, vq é escrito como

vq = rβ ∂

∂rβ+ sb ∂

∂sb

e ωa(q) a estrutura local da 1-forma da conexão A em q dado por

ωa(q) = dsa + Aaα(r, s)drα (2.5.1)

então a conexão A em vq fornece, em coordenadas, a expressão

A(vq) = (ωa(q) · vq)∂

∂sa= (sa + Aa

αrα)∂

∂sa(2.5.2)

O subespaço horizontal definido pela conexão é isomórfico ao espaço tangente do espaço

de base: Hq ' TrB. Para mostrar esta afirmação basta aplicar o levantamento tangente

da projeção π a elementos do espaço vertical para determinar o elemento nulo em TB

e vice-versa, aplicar Tπ a elementos de Hq para obter TB. O levantamento tangente


de π é dado por Tqπ : TqQ → TrB : q = (s, r) 7→ (0, r), vide Figura 2.6. A implicação

direta fica evidente observando, a partir de (2.5.2), que

Tqπ(Vq) = Tqπ(Aq) = Tqπ((s + Aq r)∂

∂s) ≡ 0

A implicação contrária deve-se ao fato que Tqπ é a aplicação identidade para elementos

de Hq.

TqπVq

TrB

Aq

TqQvq

vr ≡ 0vVq

Figura 2.6: Espaço tangente total TqQ, espaço tangente sobre B e o levantamento da

projeção π.

Seja um campo vetorial X(q(t)), onde X(q(t0)) = v0, para uma curva parametrizada

pelo tempo q(t) ∈ Q. Diz-se que o campo vetorial X(q(t)) é transportado paralelamente

se este permanecer paralelo a v0 para todo tempo t quando a curva q(t) é percorrida,

refira a (Schutz, 1980; Marsden e Ostrowski, 1998; Bloch, 2003) para detalhes.15 Este

deslocamento paralelo de X(q) recebe o nome de movimento geodésico ao longo da

curva q(t) e é descrito pela seguinte dinâmica

qa + Γabcq

bqc = 0 (2.5.3)

onde Γabc representam os símbolos de Christoffel. Seja uma métrica de Riemann

〈〈., .〉〉 em uma variedade Q, e seja x ∈ Rn a representação (local) em coordenadas do

ponto q ∈ Q, então Γabc são determinados por

Γabc =

12〈〈., .〉〉ad

∂〈〈., .〉〉bd

∂xc+

∂〈〈., .〉〉ac

∂xb− ∂〈〈., .〉〉bc

∂xd

(2.5.4)

O movimento de um sistema mecânico simples como definido na Seção 2.3, com ou sem

restrições, é descrito por equações de geodésicas.15Um vetor vq é horizontal se satisfazer A(vq) = 0. Para o fibrado tangente (q, vq) ∈ TQ, vq é

transportado paralelamente ao longo da curva q(t) se o vetor vq é deslocado ao longo das direções

horizontais com relação à conexão.


π Q/G

q

Φg(q)Q

r

Figura 2.7: O fibrado principal. Φg(q) corresponde a órbita da ação de g ∈ G em q,

Seção A.1.

2.5.2 A Conexão Principal

Seja um grupo de Lie G que age propriamente no espaço de configuração Q. O espaço

Q é isomórfico ao produto do espaço de quociente Q/G com o espaço do grupo ou fibra

G: Q ' G × Q/G. Se o espaço do produto possui esta estrutura globalmente, este é

chamado de trivial. Observe que o espaço de base B é dado pelo espaço quociente Q/G

através de uma relação de equivalência, onde dados q1, q2 ∈ Q e g ∈ G, tem-se que

q1 ∼ q2 ⇔ q2 = g · q1. O espaço de base Q/G é também conhecido como o espaço

de formatos pois define a forma de sistemas multi-corpos, estabelecendo as posições

relativa entre os seus componentes. Um elemento do espaço Q, dado pelo produto com

a estrutura acima, tem coordenadas (g, r), onde r ∈ Q/G ≡ B.

A aplicação π : Q → Q/G é uma projeção no segundo componente. Toma-se a ação de G

como uma translação à esquerda do primeiro componente. A estrutura (Q, π, Q/G, G)

descrita acima, cuja fibra G é um grupo de Lie, é chamada de fibrado principal,

Figura 2.7. Se G age livre e propriamente, o espaço de forma Q/G é uma variedade

suave e Tπ é uma aplicação sobrejetora.

Define-se a conexão principal A em um fibrado principal π como uma 1-forma com

valores na álgebra de Lie, de maneira que, para todo, q ∈ Q e ξ ∈ g, A(ξQ(q)) = ξ e

A(TqΦg(vq)) = AdgA(vq), ou seja, A é Ad-equivariante, para uma ação Φq do grupo de

Lie G em Q.16

16Note que A é equivariante com relação a g ao passo que J, em relação a g∗.


2.5.3 Curvatura do Fibrado Tangente

A curvatura da conexão principal A, representada por B, é uma aplicação à álgebra de

Lie, determinada por

B(X, Y ) = −A([horX, horY ])

onde [., .] são os colchetes de Jacobi-Lie. Para os campos vetoriais invariantes à esquerda

X,Y , pode-se escrever

B(X, Y ) = X[A(Y )]− Y [A(X)]− [A(X),A(Y )] (2.5.5)

onde [., .] são os colchetes da álgebra de Lie. Nas coordenadas locais (s, r), calcula-se a

curvatura da conexão através da expressão

Bb(X,Y ) = BbαβXαY β (2.5.6)

onde

Bbαβ =

(∂Ab

α

∂rβ− ∂Ab

β

∂rα+Aa

α

∂Abβ

∂sa−Aa

β

∂Abα

∂sa

)

35

Capítulo 3

Mecânica não-Holonômica

3.1 Mecânica Lagrangiana

A discussão da estrutura do fibrado principal apresentada neste capítulo segue dos

resultados provenientes de Ostrowski (1995) além das referências adicionais Bloch et al.

(1996) e da referência conjunta Bloch (2003).

Na mecânica não-holonômica aqui considerada atenção é voltada aos sistemas mecânicos

sujeitos à restrições na velocidade que não são deriváveis das restrições de posição ou,

mais genericamente, da configuração. Nestas condições, a simetria do sistema não mais

necessariamente corresponde às grandezas sendo conservadas1 mas, ao invés, à equação

de momento generalizada, (Bloch et al., 1996). Em geral, a não-holonomicidade é

encontrada sempre que a forma de Pfaff das restrições de um sistema não puder ser

transformada na forma de um diferencial perfeito que, porventura, permite ser integrada.

Para uma explanação mais detalhada do assunto, ver (Meirovitch, 1970).

Como mostrado em Bloch et al. (1996), utiliza-se o princípio de Lagrange-d’Alembert

como ferramenta para equacionar esta classe de sistemas. Em geral, o princípio de

Lagrange-d’Alembert é também aplicável a outros casos, como sistemas sem restrições

com forças externas, sistemas holonômicos com ou sem forças externas e, como menci-

onado acima, a sistemas não-holonômicos com ou sem forças externas.1Ou leis de conservação, como o Teorema da Conservação do Momento Angular da mecânica clássica,

ou a aplicação momento J.

3.1. MECÂNICA LAGRANGIANA 36

3.1.1 Princípio de Hamilton

Recorda-se que a variação infinitesimal δ de uma curva q(t) ∈ Q é dada por

δq(t) =∂

∂εq(t, ε)

∣∣∣∣ε=0

A variação infinitesimal da curva δq, também conhecida como deslocamento virtual,

pode ser imaginada como uma mudança infinitesimal da coordenadas da curva que são

consistentes com as restrições do sistema mas que, em caso contrário, são arbitrárias

(Meirovitch, 1970). Seja o Lagrangiano L : TQ → R com coordenadas (qi, qi), para

i = 1, . . . n, onde dimQ = n. Para sistemas sem restrições, ou seja, livre de vínculos as

equações da dinâmica podem ser obtidas a partir do Princípio de Hamilton:

δ

∫ b

aL

(qi(t), qi(t)

)dt = 0, i = 1, . . . n (3.1.1)

para variações arbitrárias δ. Sabe-se que, na ausência de restrições e de forças externas,

as equações de Euler-Lagrange são condições necessária e suficiente para que a dinâmica

do sistema atenda ao Princípio de Hamilton.

3.1.2 Sistemas com Restrições

Para um sistema n-dimensional, consideram-se dados m restrições (m < n), ou víncu-

los, nas velocidades. Estas restrições podem ser classificadas em duas categorias. As

restrições holonômicas correspondem a sub-espaços integráveis do fibrado tangente à

variedade de configuração do sistema, TQ. Esta noção de integrabilidade é a mesma

presente no contexto do Teorema de Frobenius e é avaliada com relação à distribuição

associada à restrição do sistema, no fibrado tangente TQ.

As restrições de juntas rotativas de sistemas interconectados, como as presentes em

manipuladores, representam um típico exemplo de vínculos holonômicos. Por exemplo,

o movimento de um sistema com N corpos fica completamente definido com as equações

da dinâmica livre juntamente com a descrição de m = 2N − 2 equações de vínculos2.

Para o caso holonômico, as coordenadas generalizadas qi são independentes, porque as

restrições são integráveis e, portanto, redutíveis a m diferenciais perfeitas em TQ.

A conexão de Ehresmann é, em geral, utilizada para definir as restrições cinemáticas.

Nas considerações que se seguem, é conveniente empregar uma distribuição de restrições2Duas equações para cada junta de corpos adjacentes: uma equação de velocidade e outra de posição.


correspondente D ⊂ TqQ para descrever estes vínculos. Logo, uma distribuição das

restrições em Q é um subconjunto de TQ das direções admissíveis da dinâmica do

sistema, definido para cada q ∈ Q.

Restrições Não-Holonômicas

Quando da existência de restrições não-holonômicas, a distribuição de restrição não

é mais integrável. Neste caso, as quantidades conservadas de um sistema dinâmico,

relacionadas às simetrias correspondentes, e que podem ser entendidas como a aplicação

de uma conexão principal, constituem em um exemplo de restrição não-holonômica. Na

teoria não-holonômica, as coordenadas generalizadas qi não são mais independentes,

mas sujeita a restrições.

Alguns casos usuais em que restrições tomam forma são as lineares e afins. A restrição

linear, ou homogênea, nas velocidades do sistema é equivalente a uma restrição hori-

zontal, ou seja, A(q)q = 0. Seja a configuração com estrutura principal q = (g, r) ∈ Q,

como apresentada na Seção 2.5. Logo, para uma restrição horizontal:

q ∈ Hq ⇒ qi = (rα, sa) = (rα,−Aaαrα) (3.1.2)

As restrições cinemáticas são geralmente realizadas por restrições lineares. Portanto, a

distribuição da restrição Dq

Dq = q ∈ TqQ | A(q) · q = 0 = kerAq

onde Aq ≡ A(q) é a conexão de Ehresmann no espaço Q, em q ∈ Q. Logo, a restrição é

especificada por um subespaço horizontal associado à conexão A, (Bloch, 2003). Maiores

detalhes a respeito de como as restrições influenciam o movimento do sistema multi-

articulado através das fases geométricas serão vistos na Seção 5.2.

As equações de Lagrange-d’Alembert representam uma extensão geral das equações de

Euler-Lagrange para inclusão de restrições não-holonômicas via o Princípio de Lagrange-

d’Alembert 3.3As equações de Lagrange-d’Alembert simplificam, ou equivalem, às equações de Euler-Lagrange

quando da presença de vínculos holonômicos apenas.


3.1.3 Princípio de Lagrange-d’Alembert

O Principio de Lagrange-d’Alembert é empregado para quantificar os efeitos de forças de

entradas ou de restrições na dinâmica de um sistema através da modificação das equações

de Euler-Lagrange. Faz-se importante mencionar que a mecânica não-holonômica não

é variacional como observado na teoria de controle ótimo, uma vez que as restrições de

movimento não são impostas a velocidade q mas apenas a variação δq, ver (Bloch, 2003)

e suas referências. Para um sistema com configuração q ∈ Q, as restrições cinemáticas

são descritas pela distribuição m-dimensional D, onde Dq ⊂ TqQ para todo q ∈ Q. A

dinâmica do sistema é completamente definida através de n equações diferenciais de

segunda ordem - que podem ser reescritas nas Equações de Hamilton como 2n equações

de primeira ordem - e com a subvariedade D, que define m equações de vínculos ou

restrições na velocidade q.

Definição 3.1.1. Para toda curva t ∈ [a, b] 7→ q(t) em Q, o princípio de Lagrange-

d’Alembert estabelece que

δ

∫ b

aL(q(t), q(t)) dt = 0 (3.1.3)

onde a variação δq(t) da curva q(t) satisfaz δq(t) ∈ Dq(t). Esta variação desaparece nos

pontos extremos, ou seja, δq(a) = δq(b) = 0 e a curva q(t) preserva as restrições.

Na definição acima, toma-se a variação da curva previamente a imposição das restri-

ções; ou seja, as restrições na família de curvas são impostas apenas após a variação δq.

Estas duas operações não comutam em geral mas representam justificativa conceitual

à mecânica não-holonômica não constituir em um problema variacional. Conseqüente-

mente, as variações, ou deslocamentos virtuais, associadas a δqi não são independen-

tes mas devem satisfazer a distribuição das restrições Dq(t),4 ou seja, são horizontais

δqi = (δrα,−Aaαδrα).

3.1.4 Equações de Lagrange-d’Alembert

As equações da dinâmica de um sistema sujeito a restrições lineares nas velocidades,

derivadas a partir do Princípio de Lagrange-d’Alembert, são dadas por:

d

dt

∂L

∂q− ∂L

∂q= λA(q), A(q)q = 0

4Observe que a curva q(t) ∈ Q satisfaz as restrições se q(t) ∈ Dq(t).


onde λ são os multiplicadores de Lagrange e A, a conexão que define as restrições de

velocidade do sistema. Note que no caso holonômico a curvatura da conexão Bbαβ = 0,

o que é equivalente a afirmar que a diferenciação externa da 1-forma da conexão A(q)

que define a restrição se anula, ou seja, dωb = 0. Isto corresponde a situação em que

a distribuição é totalmente integrável no sentido de Frobenius, como esperado quando

apenas restrições holonômicas são presentes. No caso geral, o caso não-holonômico, tem-

se Bbαβ 6= 0,5 o que traduz em esforços adicionais a serem considerados nas equações de

movimento obtidas a partir do Princípio de Lagrange-d’Alembert.

Q

TqQ vq

T ∗q Qfc

Figura 3.1: Em geral, o pareamento dos elementos duais de TQ e T ∗Q é não nulo. Na

mecânica, no entanto, as forças de restrições fc são perpendiculares a velocidade, pois

não realizam trabalho.

Quando forças externas fext são presentes, como às entradas de um sistema por exemplo,

o Princípio de Lagrange-d’Alembert é formulado com a restrição adicional de que as

forças não realizam trabalho na direção da variação δq, Figura 3.1. Dada a curva

t ∈ [a, b] 7→ q(t) em Q, tem-se que

δ

∫ b

aL(q(t), q(t)) dt +

∫ b

afext(q(t), q(t)) · δq dt = 0 (3.1.4)

para uma dada variação δq que se anula nos pontos extremos. A expressão acima

permite obter as equações modificadas de Euler-Lagrange:

d

dt

∂L

∂q− ∂L

∂q= λA(q) + fext

onde λ são os multiplicadores de Lagrange e A, a conexão das restrições.5A curvatura da conexão de uma restrição B serve como uma medida de falta de integrabilidade.

3.2. A CONEXÃO MECÂNICA 40

3.1.5 Não-holonomicidade do Sistema

Sabe-se, da mecânica clássica ou pelo Teorema de Noether, que na ausência de torques

externos um sistema mantém o seu momento angular conservado. Neste caso, a con-

servação do momento angular representa uma restrição, ou vínculo, não-holonômica do

sistema (Fernandes, Gurvits e Li, 1994). Observe que a conservação do momento é uma

restrição dinâmica. Pode-se adiantar que o sistema em estudo é conhecidamente não-

holonômico, porque possui uma restrição nas velocidades, dado pelo momento angular,

não-integrável no sentido de Frobenius. Um sistema sujeito a restrições cinemáticas, no

entanto, representa um caso diferente. Neste caso as equações de Lagrange d’Alembert

regem a dinâmica do sistema sob as restrições lineares na velocidade, como apresen-

tado acima. Neste trabalho, o sistema em consideração não sofre ação de restrições

cinemáticas.

A seguir, apresentam-se as expressões de um dos casos de reconstrução da dinâmica no

espaço de configurações total Q, a saber, a conexão mecânica6.

3.2 A Conexão Mecânica

A utilidade da conexão mecânica resume-se na sua aplicação à teoria de redução de

sistemas com simetria e sem restrições. No que se segue, descreve-se os principais

elementos envolvidos neste contexto.

Seja q = (r, g) ∈ Q. O tensor de inércia travado7 I, que induz a aplicação equivariante

I(q) : g → g∗, pode ser definido pela expressão que iguala o pareamento entre elementos

da álgebra g e sua correspondente dual com a métrica de Riemann, em Q, dos geradores

infinitesimais correspondentes:

〈I(q)η, ζ〉 = 〈〈ηQ(q), ζQ(q)〉〉G, q ∈ Q (3.2.1)

onde η, ζ ∈ g e 〈〈., .〉〉G é a métrica devido a energia cinética do sistema em Q. A aplica-

ção induzida pelo tensor de inércia travado I(q) possui a propriedade de ser equivariante,

ou seja:

I(q) = Ad∗gI(Φgq)Adg

6Alguns outros casos importantes neste contexto, mas não utilizados no presente estudo, são os

relativos às conexões cinemática e não-holonômica.7Traduzido diretamente do inglês: “locked”, (Marsden, Montgomery e Ratiu, 1990).


Utiliza-se esta propriedade para determinar a versão local da inércia Iloc que é indepen-

dente da fibra G:

Iloc(r) = I(r, e) = Ad∗gI(q)Adg (3.2.2)

Note que Iloc(r) é uma trivialização local da expressão para o tensor de inércia travado

em Q/G.

Recorda-se que a aplicação momento J : TQ → g∗, quando definida no fibrado tangente

TQ, é dada por

〈J(q, vq), ξ〉 = 〈〈ξQ(q), vq〉〉 =⟨

∂L(q, q)∂q

, ξQ(q)⟩

, ξ ∈ g (3.2.3)

Note que a aplicação momento J fornece valores na álgebra g∗ cujos elementos corres-

pondem ao momento do sistema no referencial inercial e simbolizados por µS , ou seja:

J(q, vq) 7→ µS ∈ g∗, onde g representa a álgebra de Lie dos elementos invariantes à di-

reita. Logo, a versão no referencial móvel da aplicação J pode ser obtida pela aplicação

coadjunta Ad∗, consulte as seções do Apêndice A, através da expressão

JB = Ad∗gJ (3.2.4)

Neste caso JB(q, vq) 7→ µB ∈ g∗, para a álgebra de Lie g dos elementos invariantes à

esquerda.

T ∗QJ - g∗

TQ

FL(q)

6

A(q)- g

I(q)

6

Figura 3.2: Diagrama definindo a conexão mecânica.

Definição 3.2.1 (Conexão Mecânica). A conexão mecânica no fibrado principal Q →Q/G é definida pela aplicação principal A : TQ → g que atribui, Figura 3.2, para

todo (q, vq) ∈ TQ, a velocidade angular correspondente ao sistema “travado” a partir

da aplicação momento J segundo a expressão:

A(q) · vq = A(q, vq) = I−1(q)J(q, vq) (3.2.5)


Observe que o espaço horizontal, como definido na Seção 2.5, determinado pela conexão

mecânica A(q) é obtido pela subespaço (q, vq) ∈ TQ | J(vq) = 0, ou seja, subespaço

de TQ que rende momento nulo. Note também que, por ser uma conexão principal, a

conexão mecânica resulta em uma 1-forma, como apresentado em (2.5.1):

A(r, g) = dgg−1 +Aloc(r, g)dr

Para obter a versão da expressão da conexão A(q) no referencial móvel,

A(r, g) = dgg−1 +Aloc(r, g)dr

= Adg(g−1dg +Aloc(r)dr)

= AdgAB(r, g) (3.2.6)

Observe, no entanto, que a 1-forma AB(r, g) não é uma conexão. Define-se por Ω a

velocidade no espaço vertical Vq obtida pela conexão no referencial móvel através da

relação

Ω = g−1g +Aloc(r)r

= ξB +Aloc(r)r (3.2.7)

onde ξB representa a velocidade devido ao movimento somente na fibra. A partir de

(3.2.2), a conexão em TQ pode ser construída conforme o seguinte

A(q) · q = I−1(q)J(vq) = I−1(q)µS

= (AdgI−1loc(r)Ad

∗g)µS

= Adg(I−1loc(r)Ad

∗g µS)

A partir da última linha acima e utilizando a definição da conexão no referencial móvel

em (3.2.6), verifica-se que Ω = I−1loc(r)Ad

∗g µS . A expressão de Ω, construída apenas com

elementos definidos no referencial móvel, fica determinada por

Ω = I−1loc(r)Ad

∗gµS = I−1

loc(r)µB (3.2.8)

De (3.2.7) e (3.2.8) segue a expressão do momento do sistema no referencial móvel, dado

por

µB = Iloc(r)(ξB +Aloc(r)r) (3.2.9)

ou, invertendo a expressão acima, pode-se obter ξB a partir de µB

ξB = −Aloc(r)r + I−1loc(r)µB (3.2.10)

3.3. PRINCÍPIO VARIACIONAL REDUZIDO 43

3.3 Princípio Variacional Reduzido

Seja L um Lagrangiano G-invariante, como definido na Seção 2.4. Pode-se mostrar que

o fibrado tangente reduzido TQ/G é isomórfico ao espaço g × TB que, por sua vez,

induz um Lagrangiano reduzido l em TQ/G com coordenadas ξ ∈ g e r ∈ TB. Logo,

a partir de um Lagrangiano L invariante à esquerda, o Lagrangiano reduzido l é obtido

segundo

l(r, r, ξB) := L(r, e, r, g−1g) = L(r, g−1g, r, g−1g) = L(Lg(r, g), TLg(r, g))

onde ξB é um elemento da álgebra de Lie correspondente sistema de referência móvel e

l é função da álgebra de Lie g do referencial móvel parametrizada pela velocidade ξB.

As forças e torques correspondem às entradas de um sistema mecânico e, como apre-

sentado na Seção 2.2, são elementos do espaço T ∗q Q e, portanto, são covetores e sujeitas

a estrutura geométrica de Q. As entradas são representadas por τ . O particionamento

da entrada τ na estrutura do fibrado trivial, segundo os componentes nas direções dos

espaços de fibra e base, é realizado de maneira análoga à decomposição da configuração

q. Desta maneira, tem-se

τ = τedge + τidri ∈ T ∗q Q

onde τe ∈ T ∗g G corresponde aos componentes da entrada τ relativos às direções da fibra

G e τi ∈ T ∗r B, os componentes relativos às direções no espaço de base B. Pode-se levar

os covetor τ à álgebra dual correspondente a g através da expressão do levantamento

cotangente da ação de grupo Φg aplicado a τe ∈ T ∗g G, onde τe é a restrição de τ nas

direções da fibra G, obtendo-se τeg ∈ T ∗e G ≡ g∗.

Em termos da métrica 〈〈., .〉〉G, o Lagrangiano reduzido do sistema l : TQ/G → R fica

l =12

[ξT rT

][G11 G12

G21 G22

] [ξ

r

](3.3.1)

Similarmente, um L invariante à direita confere um Lagrangiano l função da álgebra de

Lie representado por coordenadas inerciais ξS .

Define-se o momento generalizado do sistema no referencial móvel em função do La-

grangiano reduzido l, a partir de (3.2.9), como

µB :=∂l

∂ξB= Iloc(r)(ξB +Aloc(r)r) (3.3.2)

3.4. RECONSTRUÇÃO DA DINÂMICA 44

Ao usar (3.3.2) para definir uma restrição da velocidade de um ponto do sistema ξB,

induz-se uma função em TB × g∗ denominada Lagrangiano reduzido da restrição lc:

lc(r, r, µB) = l(r, r, ξB)|ξB

No que se segue, reproduz-se as expressões da dinâmica do sistema reduzida do espaço

de fase de velocidade TQ para o espaço quociente TQ/G segundo a ação de G em Q.

Para um Lagrangiano L invariante a ação de G, a projeção do princípio variacional

em TQ/G induz um Lagrangiano reduzido l e o princípio variacional reduzido

correspondente. Este processo de redução, propicia um particionamento da dinâmica

no espaço fibrado definido pela álgebra de Lie concatenado ao fibrado tangente da base

(g×TB) e regida pelas equações de Lagrange-Poincaré, ver (Marsden e Scheurle, 1993)

e (Ostrowski, 1995) para detalhes adicionais.

Proposição 3.3.1 ((Ostrowski, 1995)). As equações reduzidas definidas em g×TB, com

restrições não-holonômicas, relativas ao princípio variacional são dadas pelas expressões

d

dt

(∂l

∂ξa

)− ad∗ξ

∂l

∂ξa= λcω

cbg

ba + τbg

ba (3.3.3)

d

dt

(∂l

∂ri

)− ∂l

∂ri= λcω

ci + τi (3.3.4)

onde a, b = 1, . . . ,dimG e i = 1, . . . , dimB.

Note que τbgb, para a, b = 1, . . . ,dimG, é dado pela expressão do levantamento cotan-

gente da ação de grupo calculado nos componentes da fibra G de τ .

Note que a primeira equação, definida em g, corresponde à equação de Euler-Poincaré

forçada. A partir destas expressões gerais é possível obter as equações diferenciais que

regem as dinâmicas do momento generalizado, do espaço de base do sistema e uma

expressão da reconstrução da cinemática na fibra. Estas três últimas equações acima

serão apresentadas na próxima seção por ocasião da modelagem do sistema.

3.4 Reconstrução da Dinâmica

A trajetória no espaço total Q pode ser recuperada a partir de um caminho percorrido no

espaço de base Q/G, em conjunto com as restrições em D, o momento total generalizado


e com a equação de momento do sistema. Este processo, inverso da redução, recebe o

nome de reconstrução.8

O modelo da dinâmica total de um sistema com simetria pode ser apresentado da

seguinte maneira (Bloch, 2003):

g−1g = −A(r)r + B(r)p

p = rT H(r)r + rT K(r)p + pT D(r)p

M(r)r = δ(r, r, p) + τ

onde a primeira expressão corresponde à equação de reconstrução que modela a cinemá-

tica do sistema em função do elemento de grupo g ∈ G, a segunda expressão representa a

equação de momento em T ∗G, para o momento p ∈ T ∗g G em coordenadas do referencial

móvel, e a terceira equação apresenta a dinâmica do sistema no espaço de base Q/G

em função da configuração r. Em geral, os esforços externos τ da representação acima

afetam apenas as variáveis de forma em B; sendo, portanto, G-invariantes. No entanto,

as entradas do sistema que será definido no capítulo seguinte, possui componentes que

afetam, além das variáveis de forma, as variáveis da fibra G.

Com os elementos acima, tem-se condições de estabelecer as equações de reconstrução

no referencial móvel, ver (Ostrowski, 1995; Murray, 1997). Estas são deduzidas a partir

do princípio não-holonômico variacional reduzido, resultando nas expressões:

g = g(−Aloc(r)r + I−1

loc(r)µB

)

µB = ad∗ξ µB + τ (3.4.1)

M(r)r + rT C(r)r + N = X (r)τ

onde define-se a matriz de inércia reduzida M(r) como

M(r) = G22(r)−ATloc(r)Iloc(r)Aloc(r), (3.4.2)

e as forças centrípeta e de Coriolis são determinadas a partir do seguinte tensor da

métrica Riemanniana

Cijk(r)rj rk =12

(∂Mij

∂rk+

∂Mik

∂rj− ∂Mkj

∂ri

)rj rk (3.4.3)

Note que os coeficientes Cijk dos termos acima são dados pelos símbolos de Christoffel,

definidos em (2.5.4), avaliados apenas no espaço de base B. O termo da dinâmica N ,8No caso não-holonômico mais geral, o processo de reconstrução deve considerar a interação entre

as restrições e a simetria do sistema. Neste caso, a dinâmica reduzida do sistema em D/G é elevada ao

subconjunto do espaço total D ∈ TQ.


responsável pela incorporação da dinâmica do momento do sistema µB à dinâmica no

espaço de base B, é dado pela expressão

N(.) = ad∗ξB

∂l

∂ξBAloc(.) +

∂l

∂ξB

(dAloc(r, .) +

12

∂I−1locµB

∂r(.)

)(3.4.4)

onde ∂l/∂ξB representa o momento no referencial móvel definido em (3.2.9) e (.) assume

valores em TB.

Observação 3.4.1. Observe que um dos termos da expressão da dinâmica N(.) deve-se

à derivada exterior do componente local da 1-forma relativo a conexão principal A,

e dado por dAloc(r, .), como definida na Seção 2.5.3. Note também que, pelo fato do

componente local da conexãoAloc não ser função das coordenadas da fibra G mas apenas

das coordenadas do espaço de base B, a derivada exterior implica a seguinte 2-forma

em B:

dAloc(r, δr) =(

∂Alocα

∂rβ− ∂Alocβ

∂rα

)rαδrβ

uma vez que o termo dependente do colchete de Jacobi-Lie se anula. Vale mencionar

que o resultado, avaliado nos vetores r e δr, corresponde a um elemento na álgebra g e,

portanto, de dimensão igual à dimensão da fibra G.

A contribuição das entradas τ = (τe, τi) na equação do momento é dada por τa = τbgba,

onde gba representa a ação do grupo G, no componente da entrada relativa a fibras τe ∈

T ∗g G, elevada ao espaço cotangente através da ação de translação dual do levantamento

cotangente T ∗e Lg, veja Seção A.1 para detalhes. Na equação do movimento na base, a

parcela da força τ é determinada pela aplicação da 1-forma X , função da conexão A, a

τ :

(X (r)τ)i = τi − τe(Aloc(r))ei

As equações acima expressas em função das coordenadas do referencial inercial são

apresentadas abaixo. Observe que AdgAloc(r) = Aloc(r, g), e que nas coordenadas

inerciais, tem-se (Murray, 1997):

g = g(−Aloc(r, g)r + I−1(r, g)µS

)

µS = Ad∗gτ

M(r)r + rT C(r)r + NS = X (r)τ

onde M(r) e C(r) são dadas pelas mesmas expressões quando no referencial móvel. A

função NS , por outro lado, toma a seguinte forma

NS =⟨

µS ;AdgadξBAloc(.) + AdgdAloc(r, .) +

12

∂I−1µS

∂r(.)

⟩(3.4.5)

3.5. CONCLUSÃO 47

Uma evidente vantagem de se escrever a dinâmica do sistema no referencial móvel se

revela no desacoplamento na equação de momento das variáveis do grupo g ∈ G, facili-

tando a obtenção do movimento na fibra pela integração da equação de momento, dada

uma curva r(t) no espaço de base. Esta característica não é observada quando função

das coordenadas inerciais. Entretanto, a conservação do momento é verificada apenas

no referencial inercial.

3.5 Conclusão

A modelagem Lagrangiana de um sistema segue das equações de Lagrange, quando

livre de restrições ou vínculos de velocidade. Estas equações foram aqui apresentadas

sob a mesma decomposição da estrutura principal da Seção 2.5 e serão utilizadas na

modelagem do sistema multi-articulado sem restrições no próximo capítulo.

48

Capítulo 4

Modelagem do Sistema

Multi-Corpo

No presente capítulo apresenta-se a modelagem do sistema multi-articulado no plano.

O cenário utilizado para a formulação da modelagem da dinâmica do sistema, segue

de Sreenath (1987) e Marsden e Ratiu (1999), para a dinâmica Hamiltoniana, e de

Ostrowski (1995), para uma abordagem Lagrangiana.

Como mencionado no capítulo introdutório, a classe de sistemas multi-articulados aqui

definida apresenta uma evolução em relação aos sistemas multi-articulados encontra-

dos na literatura. Esta evolução diz respeito à incorporação dos esforços externos, ou

entradas às equações de movimento do sistema. Em particular, os sistemas consistem

de representações de sistemas veículo-manipulador considerados “ativos” no sentido de

usufruírem da capacidade de auto-manobra no espaço de configuração pela ação de

propulsores distribuídos pelo sistema. No caso plano, aqui considerado, os veículos são

dotados de manipuladores com inércia não desprezível de um grau de liberdade, a saber,

a rotação em torno do eixo perpendicular ao plano. Estes sistemas podem ser vistos

como uma rede interconectada de corpos rígidos. À medida que o número de corpos e

conexões entre estes corpos aumentam, o número de variáveis aumenta, e o modelo da

dinâmica do sistema se torna altamente complexo.

Ao longo deste capítulo, e nos que se seguem, assume-se a modelagem do sistema

negligenciando-se a existência de forças potenciais, como a gravidade ou magnéticas,

e dissipativas, como o atrito ou arrasto de fluidos, por exemplo. Adota-se também,

4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 49

juntas rotativas ideais quando da conexão dos corpos. Quando presentes, as forças de

propulsão são tomadas como agentes nos centros de massa do corpo correspondente.

Além disso, não são consideradas forças vetorizadas, o que simplifica as expressões so-

bremaneira.

4.1 Cinemática do Sistema no Espaço Completo

Para um sistema restrito ao plano composto por N corpos livres, o espaço de configu-

ração é dado por

Qlivre = SE(2)× . . .× SE(2) (N -vezes)

onde SE(2) é o grupo Euclideano especial no plano1. Porque o grupos SE(n) e SO(n)×Rn são isomórficos entre si, para qualquer n ∈ N, a seguinte aplicação é naturalmente

definida como

SE(n) 3[

R r

01×n 1

]7→ (R, r) ∈ SO(n)× Rn

onde R representa uma matriz de rotação e r, o vetor posição em relação a um refe-

rencial, conforme a Fig. 4.1. Portanto, identificam-se os elementos de SE(n) com os

elementos de SO(n)× Rn. Logo:

q = (qi) = ((R1, r1), (R2, r2), . . . , (RN , rN )) ∈ Qlivre

onde qi = (Ri, ri), para i = 1, . . . , N , ou, em forma vetorial,

q =

(r1,R1)T

...

(rN ,RN )T

∈ Qlivre

No caso de sistema multi-corpos interconectados, os corpos são fisicamente acoplados

dois-a-dois entre si por juntas de rotação. Neste caso define-se uma restrição de junta2

através da relação:

rj+1 = rj + R(θj)dj+1j −R(θj+1)d

jj+1 1 ≤ j < N

1O grupo SE(n) é o produto semi-direto SO(n)sRn, como visto na Seção 2.2.1.2Derivada da premissa que dois corpos articulados por meio de uma junta rotativa sempre mantém

contato em um mesmo ponto. Portanto, o ponto onde se localiza a junta rotativa é o mesmo se visto a

partir dos referenciais móveis em ambos os corpos.


ReferencialInercial

x1

θ1

θi

xi

ri

r1

θ∗

θcmrcm

θk

rk xk

yI

xI

y1

yi

yk

Figura 4.1: O i-ésimo sistema de coordenadas é especificado, através da posição da sua

origem ri e orientação θi, em relação ao i− 1-ésimo referencial.

onde dj+1j é a posição da junta entre os j-ésimo e (j + 1)-ésimo corpos em relação à

origem do sistema referencial do j-ésimo corpo. Portanto, o espaço de configuração do

sistema interconectado Q, onde Q ⊂ Qlivre, simplifica a:

Q = R2 × SO(2)× . . .× SO(2) (N -vezes) (4.1.1)

Ademais, pode-se identificar os grupos SO(2) e S1 devido ao seguinte isomorfismo:

SO(2) 3 R 7→ (x1, x2) ∈ S1 ⊂ R2,√

x21 + x2

2 = 1

Adicionalmente, o círculo S1 pode ser parametrizado através do difeomorfismo f :

[0, 2π] ∪ [−π, π] → S1 : θ 7→ (cos θ, sin θ).3 Logo, determina-se um ponto em S1 por

θ podendo-se escrever (4.1.1) como:

Q = R2 × S1 × . . .× S1 (N -vezes)

e, conseqüentemente

q = (r, (θi)) = (r, θ1, θ2, . . . , θN ) ∈ Q.

3O domínio do difeomorfismo em questão é estabelecido pela projeção estereográfica do círculo S1

no eixo dos reais, (Spivak, 1999; Mather, 2005).


onde r é a posição de um ponto (qualquer) do sistema em relação ao referencial inercial.

Do exposto acima, pode-se parametrizar Ri = R(θi) ∈ SO(2) por θi ∈ S1. Seja q ∈ Q.

A ação de translação do sistema por r pode ser explicitada como

r · q = r · ((R1, r1), (R2, r2), . . . , (RN , rN ))

= ((R1, r + r1), (R2, r + r2), . . . , (RN , r + rN ))

Por outro lado, rotacionando-se o sistema em torno de qualquer ponto pertencente ao

sistema por R = R(θ) ∈ SO(2), o seguinte mostra que todos os corpos são rotacionados

igualmente:

R · q =R · ((R1, r + r1), (R2, r + r2), . . . , (RN , r + rN ))

=((RR1, r + r1), (RR2, r + r2), . . . , (RRN , r + rN ))

=((R(θ + θ1), r + r1), (R(θ + θ2), r + r2), . . . , (R(θ + θN ), r + rN ))

Observe, pela última igualdade, que os elementos pertencentes a SO(2) comutam, tor-

nando explícito o homeomorfismo abeliano do grupo.

As equações de movimento da dinâmica do sistema são definidas no espaço de estados.

Toma-se o espaço de estados como sendo o fibrado tangente TQ sobre o espaço de

configuração, o espaço de fase de velocidade, ou como o espaço de fase de momento,

dado pelo espaço cotangente T ∗Q sobre Q, dependendo de uma abordagem Lagrangiana

ou Hamiltoniana. Para a configuração q = (Ri, ri), para i = 1, . . . , N , o espaço de fase

TQ é dado por

(Ri, ri) ∈ TqQ = Tq1SE(2)× . . .× TqN SE(2) (N -vezes)

O vetor velocidade angular ω fica determinado por

ω =

ω1

ω2

...

ωN

=

θ1

θ2

...

θN

(4.1.2)

Pode-se escrever o vetor q ∈ TqQ, em q, em função das coordenadas (r, θ).

Lagrangiano do Sistema

O Lagrangiano do sistema L é determinado apenas pela energia cinética do sistema,

devido à ausência, aqui considerada, de forças potenciais ou dissipativas. Logo, as


equações da movimento são governadas somente por dinâmicas inerciais. A energia

cinética total KE do sistema plano, composto por N corpos, é obtida pela soma das

energias cinéticas individuais, (Bullo e Lewis, 2005). Conforme notação apresentada na

Seção 2.2, segue de (2.2.2) que

L = KEk=

12

∫

Bk

ρ(Xk)‖rcmk‖2d2Xk, k = 1, . . . , N

No contexto de Riemann, com estrutura definida por (Q, 〈〈., .〉〉), a métrica da energia

cinética pode ser definida através da métrica 〈〈., .〉〉G, onde G é a matriz de inércia

generalizada, definida a seguir. Denominando-se por rcm ∈ R2 o centro de massa do

sistema, tem-se, no referencial inercial, que:

L(q, q) = 〈〈q, q〉〉G =12〈Gq, q〉 =

12

qTG q =12

ωT Jω +12

m∗‖rcm‖2 (4.1.3)

onde q ∈ TqQ, m∗ é a massa total do sistema e ω foi definido em (4.1.2) e

G =

[m∗I2 02×2

02×2 J

]

A matriz de inércia J é simétrica e definida e positiva e dada por, Seção C.2.1:

J = J(θ) =

I1 λ12 · · · λ1N

λ12 I2 · · · λ2N

......

. . ....

λ1N λ2N · · · IN

(4.1.4)

onde o momento de inércia expandido do k-ésimo corpo Ik pode ser calculado como

Ik = Ik +N∑

j=1

mj‖bjk‖2, (4.1.5)

o momento de inércia relativo entre os k-ésimo e o j-ésimo corpos λlj é dado por

λlj(θlj) =

[N∑

k=1

mk〈bkj ,bkl〉]

cos(θlj) +

[N∑

k=1

mk|bkj × bkl|]

sin(θlj) (4.1.6)

e onde o ângulo relativo entre os k-ésimo e o j-ésimo corpos é

θlj = θl − θj

Quando l = j−1, diz-se que θlj representam os ângulos de junta. Nas expressões (4.1.5)

e (4.1.6), b(.,.) ∈ R2 representa o equivalente da distância “linear” entre quaisquer dois

corpos do sistema e as operações do produto interno 〈.〉, produto vetorial × e norma de

um vetor |.| são tomadas como usuais em R2.


Hamiltoniano do Sistema

Aplicando-se a transformada de Legendre FL : TQ → T ∗Q, ao vetor q, obtém-se p ∈T ∗q Q. Fixadas as coordenadas de configuração q, o espaço cotangente tem coordenadas

canônicas (qi, pi), para i = 1, . . . , N , onde o momento conjugado p fica determinado

por:

FL(q) = FL

rcm

θ1

...

θN

7→

pcm

µ1

...

µN

= p (4.1.7)

onde p é definido por

p :=∂L(q, q)

∂q

A partir da transformação no espaço tangente acima, especificam-se os elementos do

espaço cotangente: o momento angular µ é definido por µ = Jω e o momento linear

do centro de massa pcm ∈ R2 é obtido por pcm = m∗rcm, onde m∗ é a massa total do

sistema.

Como visto na Seção (4.1), o elemento do espaço tangente TqQ fica determinado por

(Ri, ri) ∈ TqQ. Por outro lado, um ponto no espaço de fase de momento T ∗Q é dado

por

(µi,pcm) ∈ T ∗q Q = T ∗q1SE(2)× . . .× T ∗qN

SE(2) (N -vezes)

Como a matriz de inércia do sistema J é definida e positiva, J é invertível e o Hamilto-

niano do sistema H : T ∗Q → R fica definido por

H(q, p) = H(θ, rcm, µ,pcm) =12µT J−1µ +

‖pcm‖2

2m∗ (4.1.8)

Como H independe de rcm, o Hamiltoniano pode ser escrito como H(q, p) = H(θ,µ,pcm).

4.1.1 Simetria do Sistema e Redução

Pode-se mostrar que a classe de sistemas aqui considerada possui grupo de simetria

G = SE(2), o que traduz em invariância da dinâmica, como discutido na Seção 2.4.

Para a ação de levantamento à esquerda TΦg, a invariância da função Lagrangiano

pode ser verificada através da relação

Φ∗gL(q, vq) = L(Φg(q), TqΦg(vq)) = L(q, vq) (4.1.9)


No que se segue, descreve-se brevemente a redução da dinâmica do sistema que resulta

na dinâmica relativa do sistema. Primeiramente, devido a estrutura do produto semi-

direto do grupo S = SE(2), a redução de Q por S pode ser realizada em etapas, como

elucidado a seguir. A redução ao centro de massa do sistema é realizada primeiro,

através da redução do movimento de translação pelo espaço vetorial V = R2, obtendo-

se Q/V . O espaço de fase de momento parcialmente reduzido em Q/R2 rende PV =

P/R2 ' T ∗(S1 × . . . × S1). Em seguida, prossegue-se com a redução da orientação

inercial devido ao grupo G = SO(2), que corresponde a redução ao referencial do corpo.

O espaço de fase resultante em (Q/V )/G = Q/SE(2), obtido pela redução de PV por

SO(2), fica PS = PV /S1 = T ∗(S1 × . . . × S1)/S1. Maiores detalhes são discutidos em

Marsden e Ratiu (1999) e suas nas referências.

Logo, a invariância translacional e rotacional é observada e a dinâmica relativa entre os

corpos fica inalterada quando o sistema como um todo é deslocado no plano, na ausência

de esforços externos. Como comentado anteriormente, esta invariância corresponde a

conservação do momento. Mesmo sob a ação de torques devido aos atuadores localizados

nas juntas rotativas entre os corpos que compõe o sistema, o momento angular não sofre

alteração4. A atuação destes torques são internos ao sistema e contribuem apenas para

a variação de energia do sistema. Sob o enfoque geométrico, esta variação corresponde

à mudança de trajetória pertencente ao elipsóide de energia inicial para o elipsóide

de energia correspondente a variação. Um comportamento dinâmico distinto aparece

nos casos em que as juntas são rotacionadas devido aos esforços de propulsão. Neste

caso, pelo fato dos esforços de propulsão atuarem externamente ao sistema, não há

necessariamente conservação do momento angular. A modelagem das entradas de torque

e propulsão é realizada na Seção 4.2.1.

A função Hamiltoniano reduzida H do sistema é

H(q, p) =12µT J−1µ +

‖pcm|B‖2

2m∗ (4.1.10)

onde pcm|B representa o momento linear do centro de massa do sistema em coordenadas

do referencial móvel (Manikonda, 1998) e m∗ é a massa total do sistema. O campo

vetorial Hamiltoniano associado é XH .

Analogamente, o espaço da dinâmica reduzida do sistema pode ser decomposta em4Os torques nas juntas rotativas alteram os momentos angulares dos corpos individualmente; o

momento angular total do sistema se mantém constante uma vez que os incrementos de momentos dos

corpos devido aos torques internos se cancelam.


folhas simpléticas. Conforme a expressão dada acima, a dinâmica reduzida é invariante

a ação do grupo SE(2). O espaço reduzido é um espaço de Poisson de três dimensões,

parametrizado por (φ, µ1, µ2). A especificação de cada folha simplética é feita fixando

um valor do momento angular total µ = µ1 + µ2. A dinâmica em cada folha pode

ser parametrizada pelas variáveis (φ, ν), onde ν = µ2 − µ1. A Figura 4.2 ilustra as

trajetórias da dinâmica do sistema de 2-corpos no plano restrita às folhas simpléticas

cilíndricas. Refira à Seção 4.2 e (Sreenath, 1987) para detalhes da construção das folhas

simpléticas e à Seção B.1 para detalhes da construção da superfície de energia constante

do sistema de dois corpos no plano.

Figura 4.2: Trajetórias da dinâmica de rotação do sistema de dois corpos no plano.

As trajetórias são determinadas pela intersecção da superfície cilíndrica, devida à con-

servação do momento angular do sistema µ1 + µ2, com o elipsóide, representativo da

conservação de energia H. Ver Seção B.1.

4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 56

Decomposição da Configuração na Estrutura Principal

Os ângulos de junta φi, ou a orientação relativa entre dois corpos consecutivos, são

dados por

φi = θi+1,i, i = 1, . . . , N − 1

e definem as coordenadas r do espaço de base B tomado como o espaço quociente Q/G.

Por determinarem a “forma” do sistema, fixando a orientação relativa entre os corpos, os

φi são também denominados variáveis de forma do sistema, e o espaço B, similarmente,

é chamado de espaço de forma do sistema. Devido à invariância da matriz de inércia

J em relação à orientação absoluta dos corpos, J é função apenas das coordenadas do

espaço de base. Conseqüentemente, os termos de J podem ser escritos como função

apenas das φi. Logo, agrupando todos os φi em um único vetor φ, segue de (4.1.4) que

J = J(φ)

4.2 Modelo do Sistema no Espaço Cotangente

A determinação das equações de movimento do sistema livre (sem entradas) com N -

corpos, no espaço cotangente sobre o espaço de configuração Q, é realizada em função

do Hamiltoniano H dado em (4.1.8).

Em se tratando de um sistema de Poisson, pode-se utilizar de uma particularização do

colchete de Poisson para o sistema e chegar a estrutura simplética. O colchete de Poisson

levanta a trajetória ao espaço dual sobre a configuração do sistema Q e que corresponde

ao espaço cotangente T ∗Q. Logo, para as coordenadas z = (q, p) = (rcm, θ,pcm, µ) ∈T ∗Q e H(z) = H(θ,pcm, µ), as equações de movimento do sistema ficam determinadas

por:

z = z, H = XH(z) ⇒

rcm = rcm,Hpcm = pcm,H

θi = θi, Hµi = µi,H

Avaliando-se, primeiramente, o colchete de Poisson das duas primeiras equações, a di-


nâmica de translação do centro de massa do sistema é obtida por:

rcmx =∂H

∂pcmx

(4.2.1)

rcmy =∂H

∂pcmy

(4.2.2)

pcmx = − ∂H

∂rcmx

= 0 (4.2.3)

pcmy = − ∂H

∂rcmy

= 0 (4.2.4)

onde rcm = (rx, ry) e pcm = (px, py). As duas últimas expressões se anulam devido

a invariância de H em relação às coordenadas de posição rcm, confirmando, segundo

Noether, a conservação do momento linear. A dinâmica rotacional do sistema segue das

seguintes equações

θi =∂H

∂µi

µi = −∂H

∂θi, i = 1, 2, . . . , N (4.2.5)

A dinâmica acima é definida em uma variedade de Poisson, como pode-se atestar pelo

colchete de Poisson não-degenerado5. Apesar disto, como pode ser observado, a estru-

tura das equações de movimento do sistema multi-articulado de N corpos é simplética e o

espaço de fase T ∗Q da sua dinâmica tem dimensão par, dada por n = 2(N +2) = 2N +4.

A estrutura simplética também pode ser observada na subvariedade de Q relativo à di-

nâmica no espaço de base B.

Observação 4.2.1. Como introduzido na Seção 2.2.3, uma variedade de Poisson é dada

pela união disjunta de folhas simpléticas. Logo, a dinâmica do sistema pode ser para-

metrizada em cada elemento da foliação da estrutura principal. Cada folha do fibrado

principal é especificada pelos momentos linear e angular do sistema, que são corres-

pondentes às direções da fibra SE(2). Como a dinâmica do sistema multi-articulado é

simplética, as equações de movimento acima descrevem a dinâmica de cada folha como

exemplificado a seguir. A dinâmica de movimento fica totalmente especificada na folha

fixados valores dos momentos linear pcm e angular total µ do sistema. Fixado valores

do momento de translação e rotação do sistema µS , sua dinâmica permanece invariante

a uma folha da variedade de Poisson, dado que, na ausência de esforços externos, o

momento não tem o seu valor alterado como enunciado pelo Teorema de Noether. Note

que a estrutura simplética do movimento de translação é degenerada pois pcm = 0 e,

portanto, trivial, como apresentado em (4.2.1). Para o sistema de 2-corpos, a dinâmica5Ou, não identicamente nulo.


rotacional em cada folha simplética é uma subvariedade de Poisson de três dimensões

(4.2.1).

Observação 4.2.2. Note que a dinâmica da classe de sistemas em consideração, salvo

os sistemas de um único corpo rígido, não representa uma dinâmica de Lie-Poisson,

veja (Marsden e Ratiu, 1999), uma vez que o espaço de configuração Q não se resume

simplesmente ao grupo de simetria G e, portanto, o espaço reduzido não pode ser

reduzido simplesmente a álgebra de Lie g correspondente.

Reparametrizando as equações (4.2.5) em função de ângulos relativos θi,i−1, onde i =

1, . . . , N , pode-se mostrar utilizando o colchete de Poisson, (Sreenath, 1987), que a

dinâmica de rotação do sistema segue conforme

θi,i−1 =∂H

∂µi− ∂H

∂µi−1, i = 2, . . . , N

µ1 =∂H

∂θ2,1

......

µi =∂H

∂θi+1,i− ∂H

∂θi,i−1, i = 2, . . . , N − 1

......

µN = − ∂H

∂θN,N−1(4.2.6)

As equações acima correspondem a dinâmica reduzida do sistema multi-articulado,

como pode-se perceber pela ausência de uma variável que caracterize a orientação do

sistema em relação ao referencial inercial, além da dinâmica de translação. Esta ausên-

cia de variáveis de deslocamento e orientação é conseqüência da invariância do sistema

em relação ao grupo de simetria SE(2). As equações de movimento do sistema redu-

zido, provém da expressão do Hamiltoniano (4.1.10). Observe, também, que embora a

dinâmica ainda permaneça em um espaço de Poisson, as equações do sistema reduzido

possuem a estrutura simplética no espaço de variáveis presente em (4.2.5). É possível,

no entanto, recuperar a informação adicional da orientação do sistema em relação ao re-

ferencial inercial e determinar a atitude do sistema, bastando apenas adicionar à (4.2.6)

uma expressão da forma

θi =∂H

∂µi

Incorporando-se a configuração do estado θ1, por exemplo, à dinâmica no espaço de

base acima, em função das coordenadas φ, é possível descrever a dinâmica completa

no fibrado principal. Logo, o espaço de estados do sistema compreende uma espaço


2N -dimensional, composto por N cópias de (S1 × R) com a seguinte dinâmica:

θ1

φ1

...

φi−1

...

φN−1

=

∂H∂µ1

∂H∂µ2

− ∂H∂µ1

...∂H∂µi

− ∂H∂µi−1

...∂H∂µN

− ∂H∂µN−1

(4.2.7)

acrescida da dinâmica dos momentos µi.

4.2.1 Modelagem da Entrada do Sistema

As entradas físicas, consideradas atuantes no modelo do sistema plano de N -corpos,

compreendem as forças de propulsão fi, para i = 1, . . . , mp, onde mp 6 N . O ponto

de aplicação de cada fi dá-se no centro de massa do i-ésimo corpo. Adicionalmente as

juntas rotativas planas são consideradas ativas. Os torques que atuam nas juntas são

simbolizados por Tj , para j = 1, . . . ,mt, onde mt 6 N −1. Portanto, o número máximo

de entradas do sistema corresponde a N + (N − 1) = 2N − 1.

Como discutido na Seção 2.2 e no Capítulo 3, a entrada do modelo do sistema τ pode

ser identificada geometricamente como um elemento do espaço tangente dual T ∗q Q. Na

forma afim, como apresentado na Seção 2.3, a expressão da entrada τ é escrita como

τ = g1(z)u1 + g2(z)u2 + · · ·+ gm(z)um, i = 1, . . . , m

onde gi(z) são os campos vetoriais da entrada do sistema e u = (u1, . . . , um) ∈ U ⊂ Rm

são funções parametrizadas pelas forças fi e torques Tj . A função u é detalhada nas

próximas seções através de exemplos.

A modelagem da entrada do sistema é feita em duas etapas. Primeiramente, determina-

se a influência das forças externas fi por todo sistema multi-articulado através dos

diagramas de corpo livre de cada um dos corpo componentes. A modelagem dos

torques Tj é considerada posteriormente. A justificativa desta modelagem por etapas

deve-se ao princípio da superposição, isto é, escolhido um ponto do sistema, somam-se

as forças e torques com origens distintas.

Os componentes da entrada τ responsáveis pela translação do centro de massa do sis-

tema, em relação ao referencial inercial, são representados por τx e τy, nas direções dos


eixos das abscissas e ordenadas, respectivamente, como indicam os subscritos. Neste

caso, dadas N forças fi, os componentes τx e τy são obtidos projetando as fi nos eixos

do sistema inercial através das matrizes de rotação Ri = Rθi de cada um dos corpos,

conforme a expressão: [τx

τy

]=

N∑

i=1

Ri

[0

fi

](4.2.8)

Nesta etapa de modelagem, os componentes de rotação da entrada τ correspondem aos

torques que derivam de forças fi e que atuam rotacionando os corpos do sistema. Como

os corpos estão conectados através de articulações, ou juntas rotativas, ideais, estas não

transmitem torque, mas apenas força. Logo, o torque no i-ésimo corpo, i = 1, . . . , N−1,

correspondente a uma força fk atuante no k-ésimo corpo, i 6 k, de um sistema de N

corpos, é dado por6

T exti = −

k∑

i

((k − i)

Ndi

i+1 ×Rθk,i

[0

fk

]+

(k − i + 1)N

di+1i ×Rθk,i

[0

fk

])

= −k∑

i

((k − i)

Ndi

i+1 cos(θk,i)fk +(k − i + 1)

Ndi+1

i cos(θk,i)fk

)(4.2.9)

onde di+1i é o vetor do baricentro do i-ésimo corpo à junta entre os copos i e i+1, dado

no referencial do i-ésimo corpo, conforme indica a Figura 4.3, e ‖d‖2 = d.

fkcorpo i

k−iN

cos(θk,i)fk

k−i+1N

cos(θk,i)fk

corpo kdk+1

kcorpo i− 1

k−iN

cos(θk,i−1)fk

Figura 4.3: Efeito das forças de propulsão nas juntas de rotação.

Exemplo 4.2.1. Para um sistema em que os dois corpos são idênticos, com compri-

mento 2l, os torques nos corpos 1 e 2 são obtidos por[τµ1

τµ2

]=

[−l/2 l cos(θ21)/2

−l cos(θ21)/2 l/2

][f1

f2

]

6Os passos intermediários do desenvolvimento da expressão do torque devido a força de propulsão

serão aqui omitindos. Apresenta-se aqui apenas o resultado final.


Observação 4.2.3. Note que quando o sistema está totalmente estendido θ21 = 0 e

f1 = f2, o sistema apenas translada, não havendo rotação inercial do sistema ou rotação

relativa entre os corpos.

Exemplo 4.2.2. Analogamente, para um sistema com 5 com corpos idênticos, os torques

obtidos são

τµ1

τµ2

τµ3

τµ4

τµ5

= l

−45

25 cos(θ21) 1

5 cos(θ21 + θ32)

−75 cos(θ21) −1

5 cos(θ32)

− cos(θ21 + θ32) − cos(θ32) 0

−35 cos(θ21 + θ32 + θ43) −3

5 cos(θ32 + θ43) − cos(θ43)

−15 cos(θ21 + θ32 + θ43 + θ54) −1

5 cos(θ32 + θ43 + θ54) −15 cos(θ43 + θ54)

15 cos(θ21 + θ32 + θ43) 1

5 cos(θ21 + θ32 + θ43 + θ54)35 cos(θ32 + θ43) 3

5 cos(θ32 + θ43 + θ54)

cos(θ43) cos(θ43 + θ54)15

75 cos(θ54)

−25 cos(θ54) 4

5

f1

f2

f3

f4

f5

Observação 4.2.4. Note que quando o sistema acima é acionado apenas por f3, ou de

forma simétrica f1 = f5 e f2 = f4, o corpo do meio não sofre rotação.

A modelagem do acionamento dos ângulos de junta pelos torques Ti pode ser realizada

de duas maneiras. A primeira considera o efeito das forças de propulsão fi no ângulo

de junta no modelo do sistema em conjunto com os Tj . A entrada de rotação τµi do

i-ésimo corpo, para i = 1, . . . , N , é:

τµi = Ti−1 − Ti + T exti , (T0, TN = 0)

Na segunda, os torques Ti representam valores líquidos de acionamento das juntas. Neste

segundo caso, os Ti neutralizam os efeitos das forças de propulsão e são responsáveis pelo

acionamento direto das juntas. Isto pode ser justificado fisicamente, quando deseja-se

manter um ângulo de junta φ constante mesmo quando a junta está submetida a ação

de forças que tendem a variar o ângulo de junta. Considere o acionamento da junta

rotativa por meio de um motor elétrico de corrente contínua (CC). Acionando-se, por

exemplo, o motor com uma tensão de armadura a 50% do duty-cycle, a junta mantém

o seu ângulo inalterado. O cancelamento do efeito das forças fi é obtido escolhendo-se

um motor projetado para conduzir uma corrente elétrica no campo de modo a gerar um

torque maior que o torque produzido pelas fi. Esta idealização permite a modelagem

sem a consideração explícita dos efeitos das forças fi. Conseqüentemente, trabalha-se


com uma nova parametrização dos torques Ti segundo:

T ′j = Tj + T extj (fk)

onde a função T extj contabiliza os efeitos de propulsão de todas as forças fk na j-ésima

junta, para 1 6 k 6 N .

Observe que, por causa da entrada τ , a simetria do sistema é quebrada em geral, ou seja,

a aplicação momento J não mais permanece invariante à ação do grupo. Logo, para

entradas não nulas, os momentos lineares e angulares não permanecem necessariamente

constantes com o movimento do sistema. Faz-se importante observar, entretanto, que

os toques Tj , por serem internos ao sistema, deixam a aplicação momento J invariante,

não contribuindo para a alteração dos momentos linear ou angular, como estabelecido

pelo Teorema de Noether. Estes contribuem apenas na variação da energia do sistema.

Fixados valores de magnitude arbitrários em malha aberta para as forças de propulsão,

as direções de fi são tomadas como básicas, como definido na Seção 2.2. Ou seja, a

direção das entradas de propulsão só dependem da configuração q ∈ Q do sistema e não

são funções da velocidade vq ∈ TqQ do mesmo. Em malha fechada, e diferentemente da

descrição acima, as forças de propulsão obtidas através da lei de controle de realimen-

tação podem ser funções da velocidade vq do sistema. Similarmente, para entradas de

torque arbitrários, que atuam diretamente no espaço de base B, os Tj não dependem da

configuração Q, uma vez que sempre atuam nas juntas de rotação entre os corpos com-

ponentes do sistema. Em malha fechada, os torques Tj podem ser funções da velocidade

vq, assim como ocorre com as forças fi.

4.2.2 Sistema de Controle Multi-Corpos

Renomeando o Hamiltoniano H relativo à dinâmica livre para H0(q, p), o Hamiltoniano

do sistema de controle fica determinado por:

H(q, p, u) = H0(q, p)−m∑

j=1

Hj(q, p)uj (4.2.10)

onde uj são as entradas generalizadas e Hj são funções usualmente chamadas de Ha-

miltonianos de acoplamento ou de interação (Nijmeijer e van der Shaft, 1990). Como

o sistema multi-articulado proposto é um sistema mecânico simples, Seção 2.3, sabe-se

que Hj(q, p) = Hj(θ). Para i = x, y, a expressão geral do movimento do centro de


massa do sistema fica

rcmi =∂H0

∂pcmi

−m∑

j=1

∂Hj

∂pcmi

uj =∂H0

∂pcmi

(4.2.11)

pcmi = − ∂H0

∂rcmi

+m∑

j=1

∂Hj

∂rcmi

uj =m∑

j=1

∂Hj

∂rcmi

uj (4.2.12)

uma vez que

∂H1∂rcmx

∂H2∂rcmx

∂H1∂rcmy

∂H2∂rcmy

=

[cos(θ1) cos(θN )

sin(θ1) sin(θN )

],

[∂Hj

∂pcmi

]= 02×m

e onde os componentes de entrada uj correspondem a forças f e torques T externos, con-

forme discutido na Seção 4.2.1. Entretanto apenas as forças contribuem na translação,

como dado em (4.2.8), portanto:

τtrans =

[τx

τy

]=

∂H1∂rcmx

· · · ∂HN∂rcmx

∂H1∂rcmy

· · · ∂HN∂rcmy

f1

...

fN

Observe que o ângulo absoluto θN pode ser determinado fazendo-se

θN = θ1 +N−1∑

j=1

φj (4.2.13)

A dinâmica rotacional (4.2.5) não reduzida é escrita como

θi =∂H0

∂µi

µi = −∂H0

∂θi+ Ti + T ext

i , i = 1, 2, . . . , N (4.2.14)

Considerando entradas externas e internas atuando nas dinâmicas de rotação, tem-se

θi,i−1 =∂H0

∂µi− ∂H0

∂µi−1, i = 2, . . . , N

µ1 =∂H0

∂θ2,1− T1 + T ext

1

......

µi =∂H0

∂θi+1,i− ∂H0

∂θi,i−1− Ti + Ti−1 + T ext

i , i = 2, . . . , N − 1

......

µN = − ∂H0

∂θN,N−1+ TN−1 + T ext

N (4.2.15)


Observe que (4.2.15) representa a dinâmica rotacional reduzida forçada. O vetor de

entradas que acionam a dinâmica de rotação τrot é dado por

τrot =

τµ1

τµ2

τµ3

...

τµi

...

τµN−1

τµN

=

−1 0 0 . . . 0 . . . 0 0

1 −1 0 . . . 0 . . . 0 0

0 1 −1 0 0 . . . 0 0... · · · ...

. . .... · · · ...

...

0 0 0 . . . −1 0 0 0...

...... · · · · · · . . .

......

0 0 0 . . . 0 . . . 1 −1

0 0 0 . . . 0 . . . 0 1

T1

T2

T3

...

Ti

...

TN−2

TN−1

+

T ext1

T ext2

T ext3...

T exti...

T extN−1

T extN

(4.2.16)

para i = 1, . . . , N e que τ = [0N+2, τtrans, τrot]T , onde τ é dado pelos campos vetoriais

de entrada gj e pelas funções u ∈ U ⊂ Rm, de acordo com a Seção 4.2.1.

4.2.3 Exemplo: o sistema de 2-corpos

A função Hamiltoniano para o sistema de 2-corpos é dada por

H0 =12µT J−1(φ)µ (4.2.17)

onde a matriz de inércia J é dada em (4.4.2) e o ângulo relativo entre os corpos é

φ = θ2 − θ1. Tomando a definição para o determinante de J

∆ = det J = I1I2 − (ελ)2

a função H acima toma a seguinte expressão

H0 =1

2∆

[µ1 µ2

] [I2 −ελ

−ελ I1

][µ1

µ2

]

=1

2∆[I2µ

21 − 2ελµ1µ2 + I1µ

22] (4.2.18)

As equações de movimento são dadas abaixo em função das entradas obtidas no pará-

grafo acima; as expressões da dinâmica linear são

rx =px

m1 + m2=

px

2m(m1 = m2 = m)

ry =py

m1 + m2=

py

2m(m1 = m2 = m)

px = − sin(θ1)f1 + sin(θ1 + φ)f2

py = cos(θ1)f1 + cos(θ1 + φ)f2


ao passo que, a dinâmica rotacional do sistema na fibra fica definida por

θ =∂H0

∂µ1=

µ1I2 − µ2ελ

∆(4.2.19)

e pela dinâmica rotacional reduzida, nas coordenadas θ2,1 = φ do espaço de base B,

através de

φ =∂H0

∂µ2− ∂H0

∂µ1=

µ1(ελ + I2)− µ2(ελ + I1)∆

µ1 =∂H0

∂φ− T + T ext

1

= εd1d2 sin(φ)(µ2ελ− µ1I2)(µ1ελ− µ2I1)

∆2− T + T ext

1

µ2 = −∂H0

∂φ+ T + T ext

2

= −εd1d2 sin(φ)(µ2ελ− µ1I2)(µ1ελ− µ2I1)

∆2+ T + T ext

2

Os torques externos T ext1 e T ext

2 são funções da força de propulsão fi de cada corpo e da

distância do centro de massa do sistema ao centro de massa do respectivo corpo, onde

localiza-se o ponto de atuação do efeito de propulsão. Logo, usando a notação e análise

do diagrama de corpo livre da Seção 4.2.1 e d21 = d1

2 = l, tem-se:

T ext1 = − l

2f1 + l2 cos(θ2,1)f2

T ext2 = − l

2 cos(θ2,1)f1 + l2f2

Observação 4.2.5. A dinâmica do sistema de N -corpos degenera-se ao do corpo rígido,

cujo modelo é apresentado no Apêndice C, quando os ângulos de junta φ são mantidos

constantes. Isto será detalhado a seguir.

As equações da dinâmica do sistema de dois corpos idênticos, para f = (rx, ry, θ, φ, px, py, µ1, µ2)T ,

ou seja, no referencial inercial, são dadas a seguir:

f =

px/m

py/m

(µ1I − µ2K cos(φ))/(I2 −K2 cos2(φ))

(µ2 − µ1)/(I −K cos(φ))

0

0

K sin(φ)(µ1I − µ2K cos(φ))(µ2I − µ1K cos(φ))/(I2 −K2 cos2(φ))2

−K sin(φ)(µ1I − µ2K cos(φ))(µ2I − µ1K cos(φ))/(I2 −K2 cos2(φ))2

(4.2.20)

4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 66

onde K = εd21d

12 e os campos vetoriais relativos às entradas (f1, f2, T )

g1 =

0

0

0

0

− sin(θ)

cos(θ)

−l/2

−(l/2) cos(θ2,1)

, g2 =

0

0

0

0

− sin(θ + φ)

cos(θ + φ)

l/2 cos(θ2,1)

l/2

, g3 =

0

0

0

0

0

0

−1

1

(4.2.21)

As últimas duas linhas do campo vetorial referente à dinâmica livre f correspondem às

taxas dos momentos angulares µ1, µ2. Observe que a taxa de variação temporal do mo-

mento angular total, dado por µ1 + µ2, é nulo, como previsto pelo Teorema de Noether.

Note, também, que, apesar das dinâmicas livres de µ1 e µ2 serem linearmente depen-

dentes, é possível controlá-las de modo independente devido à estrutura dos campos

vetoriais de entrada g1, g2.

Considerando fixa a posição relativa dos dois corpos (φ = 0), na posição totalmente

extendida (φ = 0), tem-se que µ1 = µ2. Nesta condição, é possível mostrar que as

equações da dinâmica do sistema multi-corpos (4.2.20) degeneram-se às equações do

corpo rígido (C.1.1). Tomando-se a equação de movimento da orientação em relação ao

referencial inercial tem-se:

θ = (µ1I − µ2K cos(φ))/(I2 −K2 cos2(φ))

= (µ1I − µ2K)/(I2 −K2)

= µ1/(I + 2K) = µ1/(I + 2εL2)

Note que a última expressão acima corresponde à divisão do momento angular total do

sistema µ1 + µ2 = 2µ1 pelo momento de inércia total do sistema 2(I + 2εL2).

4.3 Modelagem da Dinâmica no Fibrado Principal

4.3.1 O Fibrado Principal

Por causa da restrição da dinâmica do sistema ao plano, o grupo de simetria G é, para

a classe de sistemas aqui considerada, o grupo Euclidiano especial no plano SE(2).


Como comentado previamente, este é o produto semi-direto G∗sV = SO(2)sR2. O

espaço de coordenadas gerado pelo SE(2) é tridimensional e, portanto, dimQ = n e

dim(Q/G) = n− 3.

Na estrutura do fibrado principal (2.4.2), o espaço (N + 2)-dimensional Q possui coor-

denadas

q = (s, r) = (g, φ), φ ∈ Q/G, g ∈ G, (4.3.1)

onde φ é o vetor, com (N − 1) elementos, relativo a orientação entre os corpos consecu-

tivos do sistema. O vetor q ∈ TqQ, dado na estrutura acima, fica (r, g) = (φ, g). Logo,

(φ, g, φ, g) ∈ TQ.

O fibrado tangente sobre o espaço reduzido T (Q/G), que corresponde a N − 1 cópias

do S1 × R, possui coordenadas (r, r) = (φ, φ) ∈ T (Q/G). O fibrado tangente reduzido

(TQ)/G é uma espaço vetorial sobre o fibrado tangente do espaço de base T (Q/G) cuja

fibra é isomórfica a álgebra de Lie g e, portanto, T (Q/G)× g.

O espaço (TQ)/G possui coordenadas (r, r, g−1g) = (φ, φ, ξB) ∈ (TQ)/G, onde ξB ∈ g.

Este compreende, no caso sistemas invariantes a esquerda, por exemplo, as velocidades

lineares e angulares em coordenadas do referencial móvel.

O espaço de fase de velocidade, com esta estrutura principal, no ponto q = (g, r) =

((rcm, θ),φ) é dado por

(rcm, θ∗, φ) ∈ TqQ ' T (R2 × S1 × . . .× S1),

onde θ∗ é a orientação de um ponto arbitrário do sistema, e o espaço de fase de momento,

por

(pcm, pθ∗ , pφ) ∈ T ∗q Q ' T ∗(R2 × S1 × . . .× S1)

4.3.2 Exemplos de Parametrizações da Configuração

Dinâmica com nova definição para θcm

Definição 4.3.1. A orientação do referencial fixo ao centro de massa do sistema em

relação ao sistema de coordenadas inercial é definida pela expressão

θcm = (θ1 + θN )/2 (4.3.2)


A expressão para θcm acima juntamente com o vetor dos ângulos relativos entre os

corpos φ estabelece o seguinte difeomorfismo entre as diferentes parametrizações de Q

[θcm

φ

]= P (θ), ⇒ [P ] =

1/2 0 · · · 1/2

−1 1 0 · · ·0 −1 1 · · ·... · · · · · · ...

0 · · · −1 1

(4.3.3)

Observação 4.3.1. A definição da orientação θcm acima é satisfatória pois é canônica,

ver (Lanczos, 1977) para detalhes, e independente das variáveis de forma φ e, por esta

razão, não incorpora o movimento exclusivamente realizado no espaço B. A matriz

que define a mudança de coordenadas P é definida e positiva e, portanto, invertível.

Adicionalmente, note que por ser uma transformação linear, P é, conseqüentemente,

um difeomorfismo global. Observe, também, que o determinante de [P ] é unitário,

permitindo preservar o volume entre os elementos das duas parametrizações. Pode-se

mencionar ainda que P diagonaliza a matriz de inércia do sistema J.

Observação 4.3.2. Uma definição igualmente possível para a orientação do referencial

móvel pode ser dada por

θcm =1N

N∑

i=1

θi (4.3.4)

A transformação P deve ser utilizada para gerar a transformação equivalente entre as

coordenadas de momento do sistema e, desta maneira, definir o levantamento cotangente

sob as novas coordenadas do espaço cotangente sobre o espaço principal. Desta maneira,

e utilizando a transformada de Legendre e a igualdade dos Hamiltonianos sob ambas as

parametrizações, tem-se que o momento angular, obtido para Q com (θcm,φ), fica

µ(θcm,φ) = (P T )−1µθ (4.3.5)

e a matriz de inércia J escrita sob a nova parametrização de Q fica

J(θcm,φ) = (P T )−1JθP−1 (4.3.6)

Observe que, como esperado a partir de (A.2.7) no Apêndice A, a matriz que traduz o

levantamento cotangente da transformação P , em função da matriz correspondente [P ],

é a matriz transposta ou [P ]T .


Exemplo: o sistema de 2-corpos

Para um sistema composto por dois corpos interconectados, o espaço completo 4-

dimensional Q iguala-se a R2 × SO(2) × SO(2). Um elemento genérico do fibrado

tangente é (q, q) = ((rcm, θ1, θ2), (rcm, θ1, θ2)) ∈ TQ. Utilizando a decomposição pro-

vida pela estrutura do fibrado principal, as coordenadas são q = (g, r) = (g, φ), onde a

coordenada no espaço de base φ ∈ Q/G é a orientação relativa entre os corpos. As coor-

denadas no espaço tangente reduzido são (r, r, g−1g) = (φ, φ, ξB) ∈ (TQ)/G, e ξB ∈ g.

O fibrado tangente sobre Q/G possui coordenadas (r, r) = (φ, φ) ∈ T (Q/G) = S1 × R.

O difeomorfismo entre os sistemas de coordenadas de variáveis canônicas apresentado

acima, neste caso, é dado por

[P ] =

[1/2 1/2

−1 1

](4.3.7)

Observação 4.3.3. Pode-se verificar que, como mencionado anteriormente, P diagonaliza

a matriz de inércia J, a despeito das propriedades físicas dos dois corpos. Para corpos

com características inerciais distintas, J pode ser diagonalizada tomando-se

[P ] =

[h1 h2

−1 1

], (4.3.8)

onde h1 = (I2 + K cos(φ))−1 e h2 = (I1 + K cos(φ))−1. Neste caso, entretanto, os

elementos na diagonal principal de J são dados por funções racionais.

A matriz de inércia generalizada G é definida por

G =

m∗I2 02×1 02×1

01×2 1TNJ1N J†

01×2 J† J‡

onde J† = (I2 − I1)/2 e J‡ = (I1 + I2 − 2ελ)/4.

Pode-se obter φ pelas equações de Hamilton

φ =∂H(φ, g, pφ, µS)

∂pφ

=12

(pθcm(I1 − I2) + 2pφ(I1 + 2K cos(φ) + I2))(I1I2 −K2 cos(φ)2)

=2pφ

(I −K cos(φ)), (I1 = I2 = I) (4.3.9)


Alternativamente, a equação do momento pφ segue de

pφ = −∂H(φ, g, pφ, µS)∂φ

= −K sin(φ)

(14

p2θcm

(I + K cos(φ))2− p2

φ

(I −K cos(φ))2

)(4.3.10)

A orientação do referencial móvel, localizado no centro de massa, é dada por

θcm =∂H(φ, g, pφ, µS)

∂pφ

=14

(pθcm(I1 − 2K cos(φ) + I2) + 2pφ(I1 − I2))(I1I2 −K2 cos(φ)2)

(4.3.11)

=12

pθcm

(I + K cos(φ)), (I1 = I2 = I)

Partindo da parcela relativo a dinâmica rotacional do sistema na expressão do Lagran-

giano e tomando iguais as velocidades de rotação dos corpos ω1 = · · · = ωN = ω,

tem-se:

L(q, q) =12ωT Jω =

12ω1T

NJω1N =12Itω

2

onde It = It(φ) é definido por 1TNJω1N , ou seja, a soma de todos os elementos da

matriz de inércia J e corresponde à inércia total em relação ao centro de massa do

sistema. Observe que It corresponde ao elemento (3, 3) do tensor de inércia travado Iloc

em (4.4.4). Para o sistema de dois corpos idênticos, It é dado por:

It(φ) = 1TNJ1N

= J11 + 2J12 + J22, (J simétrica)

= I1 + I2 + 2ελ(φ)

= 2(I + ελ(φ)), (I1 = I2 = I)

Modelo do referencial no centro de massa

Neste caso, o campo vetorial da dinâmica livre, pode ser escrito tanto em função

da velocidade do ângulo de junta φ como em função do momento angular relativo

ao mesmo ângulo. As variáveis de momento no referencial móvel são definidas por

(pu, pv, pθcm) = (µB1 , µB2 , µB3). No primeiro caso, o campo vetorial f escrito em co-

ordenadas do referencial móvel localizado no centro de massa do sistema, é dado por

(rx, ry, θcm, φ, µB1 , µB2 , µB3 , vφ)T , onde vφ = φ e vφ é dado por

vφ =K sin(φ)

((ελ(φ))2 − I2I1)1

(I1 + 2ελ(φ) + I2)

((ελ(φ) + I1)(ελ(φ) + I2)v2

φ + µ2B3

)

(4.3.12)


No segundo caso, escrito no mesmo referencial, o campo vetorial z = (rx, ry, θcm, φ, pu, pv,

pθcm , pφ)T , onde z ∈ T ∗q Q, fica

f =

1m∗ (µB1 cos(θ)− µB2 sin(θ))1

m∗ (µB1 sin(θ) + µB2 cos(θ))

(4.3.11)

(4.3.9)µB2

(2µB3−J†φ)

2m∗1TNJ1N

−µB1(2µB3

−J†φ)

2m∗1TNJ1N

0

(4.3.10)

(4.3.13)

Consultar Souza e Maruyama (2007), no Apêndice C, para detalhes da obtenção das

expressões escritas com coordenadas do referencial móvel.

Modelagem das Entradas

Utiliza-se aqui a decomposição da entrada τ na estrutura principal7 τ = [τ |G, τ |B], onde

τG e τB representam as entradas que atuam exclusivamente no espaço de grupo G e no

espaço de base B, respectivamente.

Observação 4.3.4. Observe que a parametrização das entradas físicas (fi, Tj) é realizada

de maneira a verificar dimG = dim τG.

Obtém-se, primeiramente, a entrada no referencial móvel, fixo ao centro de massa do

sistema, Fig. 4.4; em seguida, escreve-se a entrada em relação ao referencial inercial. As

entradas no referencial móvel são G-invariantes à esquerda com relação ao referencial

móvel localizado no centro de massa do sistema. A entrada τ ∈ g∗ dada nas coordenadas

do espaço cotangente fica τ = (τu, τv, τθcm , τφ) ∈ T ∗Q. Os componentes que afetam o

momento linear são[τu

τv

]= R(−φ/2)

[0

f1

]+ R(φ/2)

[0

f2

]=

[− sin(φ/2)(f2 − f1)

cos(φ/2)(f2 + f1)

]

Observe que, quando φ = 0, o sistema possui a mesma estrutura de entradas do corpo

rígido com dois propulsores localizados simetricamente em relação ao centro de massa

e, portanto: [τu

τv

]=

[0

(f1 + f2)

]

7Discutida no Capítulo 3.


ReferencialInercial

L

T

φ

x

CM

−θcm

y

f2

f1

z1

z2

Figura 4.4: Entradas relativas aos propulsores no referencial móvel do sistema de 2-

corpos.

A entrada na direção rotacional da fibra G, para corpos idênticos, fica

τθcm = L cos2(φ/2)(f2 − f1)

Observe que, evitando termos que combinam funções trigonométricas e quadráticos

pode-se aliviar a carga computacional quando do cálculo de distribuições, realizado no

próximo capítulo. Utilizando a relação trigonométrica fundamental sin2(.)+cos2(.) = 1

em conjunto com a expressão cos(φ) = cos2(φ/2)− sin2(φ/2), mostra-se que

cos2(φ/2) =12(cos(φ) + 1)

Utilizando o lado direito da igualdade acima, na expressão do campo vetorial para a

entrada τθcm , permite simplificar o cálculo das distribuições do sistema de controle,

reduzindo a carga computacional e, conseqüentemente, o tempo de cálculo.

A passagem da entrada τ acima para o referencial inercial, assim como com qualquer

elemento pertencente ao dual da álgebra de Lie g∗, segue pela aplicação coadjunta

τS = τInercial = Ad∗g−1τ

Escrevendo os componentes de translação acima (τu, τv) no referencial inercial, segue:[τx

τy

]

S

=

[τx

τy

]

Inercial

= R(θcm)

[τu

τv

]

=

[− sin(θcm) cos(φ/2) − cos(θcm) sin(φ/2)

cos(θcm) cos(φ/2) − sin(θcm) sin(φ/2)

][f1 + f2

f2 − f1

]


O resultado acima pode ser confirmado quando a entrada τθcm é obtida através do

levantamento cotangente da aplicação P das expressões da Seção 4.2.1, como mostram

os exemplos abaixo.

Exemplo 4.3.1. Retomando o exemplo do sistema de 2-corpos, da Seção 4.2.1, a en-

trada τ obtida sob a estrutura principal adquire a seguinte forma:[τθcm

τφ

]= ([P ](−1))T

[τ1

τ2

]=

l

4

[2(1 + cos(φ)(f2 − f1)

(1− cos(φ)(f1 + f2)

]

A partir das considerações acima tem-se que τθcm é obtido pela soma dos momentos das

forças fi em relação ao centro de massa do sistema, ou seja

τθcm =N∑

i=1

r0i ×Ri

[0

fi

](4.3.14)

No presente trabalho, tem-se o interesse no caso em que as forças de propulsão estão

localizadas nos corpos extremos do sistema, isto é, apenas as forças de propulsão f1,

aplicada no centro de massa do corpo 1, e fN , que atua no centro de massa do N -ésimo

corpo. Logo, de (4.2.8) e (4.3.14), segue que

τx

τy

τθcm

=

R1

[0

f1

]+ RN

[0

fN

]

r01 ×R1

[0

f1

]+ r0

N ×RN

[0

fN

]

(4.3.15)

Escrito com coordenadas no referencial inercial, a dinâmica livre f = (rx, ry, θcm, φ, px, py,

pθcm , pφ)T , é dada por

f =

px/m∗

py/m∗

(4.3.11)

(4.3.9)

0

0

0

(4.3.10)

(4.3.16)

Os valores nulos das três primeiras linhas da dinâmica livre, devem-se à aplicação direta

do Teorema de Noether. Pode-se, alternativamente, mostrar que pθcm ≡ 0: sabe-se

que o momento angular µ1 + µ2 do sistema se conserva. Logo, escrito sob a nova


parametrização, tem-se a seguinte condição de conservação do momento angular

µ1 + µ2 = 1TNP T

[pθcm

pφ

]= pθcm = cte (4.3.17)

No referencial inercial, os campos vetoriais relativos às entradas (u1, u2) = (f1 +f2, f2−f1) e T ′ são

g1 =

0

0

0

0

− sin(θcm) cos(φ/2)

cos(θcm) cos(φ/2)

0

0

, g2 =

0

0

0

0

− cos(θcm) sin(φ/2)

− sin(θcm) sin(φ/2)

L/2(cos(φ) + 1)

0

, g3 =

0

0

0

0

0

0

0

1

Dinâmica com θcm = θ1

Proposição 4.3.2. No espaço de configuração Q, onde q = (rcm, θ), o Lagrangiano

do sistema pode ser escrito em função da métrica de Riemann 〈〈., .〉〉G′, induzida pela

energia cinética do sistema KE, definida pela seguinte expressão

L =12

qTG′ q =12

[rTcm θ

T] [G′11 G′12

G′21 G′22

] [rcm

θ

](4.3.18)

Demonstração. Segundo (4.1.3), basta tomar G′11 = m∗I2, G′12 = G′T21 = 02,N e G′22 = J,onde m∗ é massa do sistema, I2 é a matriz identidade de dimensão 2 e J é a matriz de

inércia do sistema multi-corpos.

Proposição 4.3.3. No fibrado principal (Q, π,B ≡ Q/G,G), onde q = (g, r) = (g, φ)

e g = (rcm, θ1), o Lagrangiano do sistema pode ser escrito como

L =12

qTG q =12

[gT rT

][G11 G12

G21 G22

][g

r

](4.3.19)

Demonstração. A prova abaixo seguirá um desenvolvimento algébrico, através da de-

composição de (4.1.3). Expandindo o vetor θ, em função das coordenadas de base φ, e


utilizando um formato matricial segue que

θ =

θ1

θ1 − (θ1 − θ2)...

θ1 − (θ1 − θ2) · · · − (θN−1 − θN )

=

θ1

θ1

...

θ1

+

0

−(θ1 − θ2)...

−(θ1 − θ2) · · · − (θN−1 − θN )

=

1

1...

1

θ1 +

0 0 · · · 0

1 0 · · · 0... · · · · · ·1 1 · · · 1

(θ2 − θ1)

(θ3 − θ2)...

(θN − θN−1)

=

1

1...

1

θ1 +

0 0 · · · 0

1 0 · · · 0... · · · · · ·1 1 · · · 1

φ1

φ2

...

φN

= 1Nθ1 + Mφ (4.3.20)

onde 1N é o N -vetor de 1s, φi são os ângulos de junta e M é uma matriz N × (N − 1)

definida por

Mij =

0, se i = 1

1, se 1 ≤ j < i

0, caso contrário

⇒ M =

0 0 0 · · · 0

1 0 0 · · · 0

1 1 0 · · · 0...

... · · · · · · · · ·1 1 1 · · · 1

(4.3.21)

Aplicando-se a expressão acima para determinar a decomposição da orientação dos

corpos em relação ao referencial inercial em função dos ângulos de junta φi, segue

[rcm

θ

]=

[rcm

1Nθ1 + Mφ

]=

[I2 02,1 02,N−1

0N,2 1N M

]rcm

θ1

φ

onde I2 é a matriz identidade de dimensão 2. Derivando-se a expressão acima, resulta


em[rcm

θ

]=

[I2 02,1 02,N−1

0N,2 1N M

]rcm

θ1

φ

Transpondo-se esta última expressão, segue que

[rcm

θ

]T

=[rTcm θ1 φ

T]

I2 02,N

01,2 1TN

0N−1,2 MT

Fazendo uso das duas últimas expressões obtidas acima e de (4.1.3) e lembrando que

θi = ωi, pode-se determinar a métrica 〈〈., .〉〉G no fibrado principal:

G =

I2 02,N

01,2 1TN

0N−1,2 MT

[m∗I2 02,N

0N,2 J

][I2 02,1 02,N−1

0N,2 1N M

]

=

m∗I2 02,1 02,N−1

01,2 1TNJ1N 1T

NJM0N−1,2 MT J1N MT JM

=

[G11 G12

G21 G22

](4.3.22)

Observação 4.3.5. Observe que G12 = GT21 e a independência da G22(r) = G22(r, e) com

relação às coordenadas das direções da fibra G.

Observação 4.3.6. Note que o momento do sistema µ pode ser obtido por ambas as

métricas em função de G′ e G utilizadas acima, assim como por qualquer outra métrica

definida em Q e parametrizada por coordenadas diferentes das utilizadas acima, como

sugere a geometria Riemanniana. Neste caso, recordando que pcm é o momento linear

e µ o momento angular do sistema, tem-se quepcm

pθ1

pφ

= G

[g

r

](4.3.23)

O espaço T ∗Q definido pelas coordenadas de configuração com estrutura principal acima

é difeomórfico ao espaço parametrizado pelas coordenadas original,8 dadas por[pcm

µ

]=

[m∗I2 02,N

0N,2 J

][rcm

θ

]

8Note que isto é possível apenas quando ambas as parametrizações são realizadas com coordenadas

canônicas, (Lanczos, 1977).


Exemplo: o sistema de 2-corpos

Como alternativa, uma das equações do momento angular do sistema pode ser escrita

como a taxa de variação do elemento do espaço T ∗(Q/G), dado por pφ. Primeiramente,

procede-se com o cálculo do momento angular do corpo 1 (pθ1) através do Lagrangiano

L =12[gT rT ]

[G11 G12

G21 G22

][g

r

], G =

m∗I2 02,1 02,N−1

01,2 1TNJ1N 1T

NJM0N−1,2 MT J1N MT JM

=12

(gT (G11g +G12r) + rT (G21g +G22r)

)

Pela definição da transformada de Legendre, tem-se

pθ1 =∂L(φ, g, φ, g)

∂θ1

= G11

[01,2 θ1

]T+GT

12φ[01,2 1

]T, (G12 = GT

21)

= 1T2 J12θ1 + MT J12φ

= (J11 + 2J12 + J22)θ1 + (J12 + J22)φ

= (I1 + 2ελ(φ) + I2)θ1 + (ελ(φ) + I2)φ (4.3.24)

Tomando-se pφ ∈ T ∗φ(Q/G) em conjunto com a dinâmica referente a µ1, ou µ2, o movi-

mento do sistema fica completamente determinado em T ∗Q. Portanto, para as coorde-

nadas do espaço de base r ∈ B, segue que

pr =∂L(q, q)

∂r

onde q = (r, g) e g é o elemento do grupo G. Para o sistema de dois corpos, onde N = 2

e r = φ, segue que

pφ =∂L(φ, g, φ, g)

∂φ

=12gTG12 +

12G21g +G22φ, (G12 = GT

21)

= GT12g +G22φ

= 01,2rcm + MT J12θ1 + MT JMφ

= (J21 + J22)θ1 + J22φ

= (ελ(φ) + I2)θ1 + I2φ (4.3.25)


Por outro lado, obtém-se φ pelas equações de Hamilton

φ =∂H(φ, g, pφ, µS)

∂pφ

= −(I2 + K cos(φ))pθ1 − (I1 + 2K cos(φ) + I2)pφ

(I1I2 −K2 cos(φ)2)

= − (pθ1 − 2pφ)(I −K cos(φ))

, (I1 = I2 = I)

Isolando-se pφ e usando (4.3.23), lembrando que ω = θ, na expressão acima, tem-se que

pφ =(I2 + K cos(φ))µ1 + (I1I2 −K2 cos(φ)2)φ

(I1 + 2K cos(φ) + I2)

= (I2 + K cos(φ))ω1 + I2φ

O resultado obtido pelo caminho acima confere com o obtido em (4.3.25), como esperado.

Obtém-se agora a taxa de variação temporal do momento pφ. Pode-se, primeiramente,

diferenciar a última expressão acima, obtendo-se

pφ = (ελ(φ) + I2)θ −K sin(φ)φθ + I2φ

Alternativamente, a partir do Hamiltoniano, tem-se

pφ = −∂H(φ, g, pφ, µS)∂φ

= −K sin(φ)(I2µ1 − (I2 + K cos(φ))pφ)((I1 + K cos(φ))pφ −K cos(φ)µ1))

(I1I2 −K2 cos2(φ))2

(4.3.26)

Substituindo as definições para µ1 e pφ, em termos de θ e φ, no resultado acima, segue

que

pφ = −K sin(φ)θ(θ + φ)

As três expressões do momento pφ acima são equivalentes.

Observe que as expressões (4.3.24) e (4.3.25), parametrizadas por (θ1, φ), onde φ =

θ2 − θ1, são equivalentes às realizadas por µ = Jω, quando a parametrização (θ1, θ2) é

utilizada. Esta equivalência pode ser observada pela conservação do momento angular

µ1 +µ2 = pθ. O campo vetorial da dinâmica livre f = (rx, ry, θ1, φ, px, py, pθ1 , pφ)T com

4.4. MODELAGEM LAGRANGIANA 79

a presente parametrização fica

f =

px/m∗

py/m∗

(I2µ1 − (I2 + K cos(φ))pφ)/(I1I2 −K2 cos(φ)2)

−((I2 + K cos(φ))µ1 − (I1 + 2K cos(φ) + I2)pφ)/(I1I2 −K2 cos(φ)2)

0

0

0

(4.3.26)

e os campos vetoriais relativos às entradas (f1, f2, T ) são obtidos de maneira análoga

aos do modelo obtido anteriormente, respeitando a estrutura do espaço de configuração.

4.4 Modelagem Lagrangiana

A modelagem do sistema realizada a seguir, aplica as expressões da conexão mecânica,

do princípio variacional reduzido e da reconstrução da dinâmica discutidos no Capítulo

3.

4.4.1 Exemplo: o sistema de 2-corpos (θcm = θ1)

Para determinar a conexão mecânica do sistema, precisa-se, primeiramente, obter o

tensor de inércia travado. A partir das expressões de construção dos geradores infinite-

simais, detalhadas na Seção B.6.1, de (3.2.1)

〈I(q)η, ζ〉 = 〈〈ηQ(q), ζQ(q)〉〉 ⇒ ηT IT ζ = ηTQGζQ

e a partir da métrica induzida pela energia cinética G, obtida em (4.3.22),

G =

[G11 G12

G21 G22

]=

m∗ 0 0 0

0 m∗ 0 0

0 0 J11 + J12 + J21 + J22 J12 + J22

0 0 J21 + J22 J22


obtém-se a expressão para a matriz de inércia travado

I =

[m∗I2 −m∗Mrcm

−m∗(Mr)T m∗‖r‖2 + 1TNJ1N

]=

m∗ 0 −m∗ry

0 m∗ m∗rx

−m∗ry m∗rx m∗(r2x + r2

y) + 1TNJ1N

(4.4.1)

onde M é a matriz simplética de dimensão 2, veja Seção A.2.2. A matriz de inércia Jdo sistema de 2-corpos é dada por

J =

[J11 J12

J21 J22

]=

[I1 ελ

ελ I2

](4.4.2)

onde

Ii = Ii + εd2i , ε =

m1m2

m1 + m2, λ(φ) = d1d2 cos(φ)

A seguir, obtém-se a aplicação momento J do sistema. Seja vq = (rx, ry, ω1, φ) e a partir

de (3.2.3)

〈J(q, v), ξ〉 = 〈〈ξQ(q), vq〉〉 ⇒ Jiξi = [rx ry ω1 φ] G ξQ

e, portanto,

〈J(vq), ξ〉 = (mrx)ξ1 + (mry)ξ2 + (mrxry −mry rx + 1TNJ1Nω1 + 1T

NJMφ)ξ3 (4.4.3)

Os momentos lineares nas duas direções são conservados independentemente um do

outro. O momento angular, escrito em relação ao referencial inercial, apresenta uma

parcela devido ao movimento linear do centro de massa do sistema, em adição ao compo-

nente devido ao movimento angular do mesmo. No entanto, como os movimentos linear

e angular são independentes quando parametrizados em relação ao centro de massa, as

parcelas dos movimentos linear e angular do momento angular mantém-se constantes

de forma independente.

A matriz auxiliar M é definida em (4.3.21). Para computar a conexão, segundo (3.2.5),

faz-se

A(vq) = I−1J(vq)

=1

1TNJ1N

(rx + ryω1)1TNJ1N + ry1T

NJMφ

(ry − rxω1)1TNJ1N − rx1T

NJMφ

1TNJ1Nω1 + 1T

NJMφ

Da Seção A.2.2, a expressão da ação adjunta Adg em se(2), escrita na forma matricial,

é obtida pela expressão

Ad(R,r) =

[1 01,2

Mr R

]⇒ Ad(r,R) =

[R Mr

01,2 1

]


A conexão em coordenadas do referencial móvel segue diretamente de (3.2.5), e para

Ad(r,R)−1

AB(vq) = Adg−1A(vq)

=

[RT rcm

1TNJT ω(1T

NJ1N )−1

]

Devido a matriz J ser simétrica, observe, pelas expressões (4.3.20) que 1TNJT ω =

1TNJ1Nω1 + 1T

NJMφ, e, logo

AB(vq) =

[RT rcm

ω1

]+

11T

NJ1N

[02×1

1TNJM

]φ = TgLg−1 g +Aloc(φ)φ

Observe, da expressão acima, que TgLg−1 g = g−1g = ξB. A expressão local do tensor

de inércia travado é obtida através de (3.2.2)

Iloc(φ) = Ad∗gI(q)Adg (4.4.4)

=

[R Mrcm

01,2 1

]T [m∗I2 −m∗Mrcm

−m∗(Mrcm)T m‖rcm‖2 + 1TNJ1N

][R Mrcm

01,2 1

](4.4.5)

=

m∗ 0 0

0 m∗ 0

0 0 1TNJ1N

(4.4.6)

Para a obtenção da equação cinemática de reconstrução, faz-se necessária a determina-

ção da velocidade ξB na álgebra de Lie se(2). Fazendo µB = (µB1 , µB2 , µB3) e a partir

de (3.2.10), segue que

ξB = −Aloc(φ)r + I−1loc(r)µB

= − 11T

NJ1N

[02×1

1TNJM

]φ +

m∗ 0 0

0 m∗ 0

0 0 1TNJ1N

−1

µB1

µB2

µB3

=

µB1/m∗

µB2/m∗

µB3−(ελ(φ)+eI2)φ

eI1+2ελ(φ)+eI2

Escreve-se a equação de reconstrução g em função da expressão ξB = (ξB1 , ξB2 , ξB3)

acima, obtendo-se

g = gξB =

cos(θ) − sin(θ) rx

sin(θ) cos(θ) ry

0 0 1

0 −ξB3 ξB1

ξB3 0 ξB2

0 0 0

(4.4.7)


No cálculo da reconstrução da cinemática na fibra, e diferentemente quando da obtenção

da conexão AB realizada acima, utiliza-se elementos da álgebra no referencial móvel ξB

escritos em função do momento correspondente µB. Observe, também, que os compo-

nentes do momento linear no referencial móvel são transformados ao referencial inercial

via matriz de rotação R. O termo rotational do sistema, função do momento angular µB

e que simplifica a θ, por sua vez, possui mesma representação em ambos os sistemas de

coordenadas. A equação do momento, determinada a partir de (3.4.1), toma a seguinte

forma

(µB)c = cbac(µB)bξ

aB

onde a, b, c = 1, 2, 3 e cbac são as constantes estruturais da álgebra se(2), refira à Seção

B.5. Para um elemento do grupo SE(2) na forma g = (rcm,R), são as constantes não

nulas c123 = −c1

32 = 1 e c231 = −c2

13 = 1, o que resulta no momento:

µB =

µB2ξ3B

−µB1ξ3B

µB1ξ2B − µB2ξ

1B

=

µB2


eI1+2ελ(φ)+eI2−µB1


eI1+2ελ(φ)+eI20

(4.4.8)

Note que, no referencial móvel, os componentes do momento linear não se conservam.

Procede-se, agora, com a determinação da matriz de inércia para a dinâmica do sistema

no espaço de base B. Para r = φ, tem-se, de (3.4.2):

M(φ) = G22(φ)−ATloc(φ)Iloc(φ)Aloc(φ)

= MT JM− (1TNJM)2

(1TNJ1N )

=I2I1 − (ελ(φ))2

(I1 + 2ελ(φ) + I2)(4.4.9)

O termo relativo à dinâmica centrípeta e de Coriolis é obtida avaliando-se (3.4.3) com

a expressão da matriz de inércia M acima:

C(φ) = (εd1d2 sin(φ))(ελ(φ) + I1)(ελ(φ) + I2)

(I1 + 2ελ(φ) + I2)2(4.4.10)

Como, para o sistema de dois corpos

dAloc(φ) ≡ 0 (4.4.11a)

ad∗ξµBAloc(φ) = µBAloc(φ) ≡ 0 (4.4.11b)

em (3.4.4), o termo da dinâmica N , escrito em função do momento no referencial móvel

µB, simplifica a:

N =εd1d2 sin(φ)

(I1 + 2ελ(φ) + I2)2µ2

B3(4.4.12)


Finalmente, pela função de entrada τ , calcula-se a entrada na dinâmica de base segundo

a expressão

X (φ)τ = τφ − [τx, τy, τθ]Aloc(φ)

= T − [τx, τy, τθ]1

1TNJ1N

[02×1

1TNJM

]

= T − (ελ(φ) + I2)(I1 + 2ελ(φ) + I2)

τθ (4.4.13)

A equação de movimento do sistema no espaço de base B, dada por M(φ)φ+C(φ)φ2 +

N = X τ , fica

I2I1 − (ελ(φ))2

(I1 + 2ελ(φ) + I2)φ + (εd1d2 sin(φ))

(ελ(φ) + I1)(ελ(φ) + I2)(I1 + 2ελ(φ) + I2)2

φ2+

εd1d2 sin(φ)(I1 + 2ελ(φ) + I2)2

µ2B3

= T − (ελ(φ) + I2)(I1 + 2ελ(φ) + I2)

τθ

Observe que a solução da dinâmica no espaço de base é dependente das equações de

momento (4.4.8), mais especificamente, da dinâmica do momento angular µB3 .

Para corpos iguais e I1 = I2 = I, a equação de movimento acima fica

(I − ελ(φ))2

φ + K sin(φ)14φ2 +

K sin(φ)2(I + ελ(φ))2

µ2B3

= T +12τθ

Quando o momento é escrito no referencial inercial, o único termo da dinâmica de

junta φ que sofre modificação é N enquanto que os termos M(r) e C(r) permanecem

inalterados em relação às expressões obtidas no referencial móvel. Avaliando-se (3.4.5),

o termo NS fica

NS = (εd1d2 sin(φ))(xµS2 − yµS1 − µS3)

2

(I1 + 2ελ(φ) + I2)2(4.4.14)

A aplicação momento J obtida no espaço de configuração Q, parametrizado através

variáveis (θi, µi), fornece a expressão do momento total. Neste caso, fica evidente a

verificação da conservação dos momentos lineares e angulares em relação ao referencial

inercial, como previsto pelo Teorema de Noether.

Uma modelagem Lagrangiana do sistema de 2-corpos, em que θcm é definida de forma

similar a (θ1 + θ2)/2, é apresentada resumidamente em Souza e Maruyama (2007).

Resultados complementares da modelagem dos sistemas de 3 e 5 corpos são apresentados

no Apêndice C.

4.5. CONCLUSÃO 84

4.5 Conclusão

Em vista das definições da Seção 2.3 e do que foi discutido no Capítulo 3, apresentou-

se neste capítulo as equações de movimento do sistema multi-articulado, conforme a

estrutura de um sistema mecânico simples. Utilizando diferentes parametrizações do

espaço de configuração Q, quatro modelos da dinâmica do sistema foram obtidos sob

o formalismo Hamiltoniano, um deles escrito nas coordenadas do referencial móvel.

Alternativamente, um modelo do sistema foi obtido através da abordagem Lagrangiana.

A determinação dos modelos a partir do Hamiltoniano, através da estrutura simplética, é

relativamente mais simples; ao passo que o estabelecimento dos modelos pela abordagem

Lagrangiana é notadamente mais complexo, exigindo um conhecimento mais abrangente

dos elementos geométricos da mecânica envolvidos. Como o procedimento de modelagem

segundo os métodos Hamiltoniano e Lagrangiano são equivalentes, os modelos obtidos

através destes dois métodos são equivalentes. A equivalência dos modelos do sistema de

2-corpos obtidos pelas duas abordagens acima foi comprovada por simulação.

85

Capítulo 5

Análise do Sistema e

Controlabilidade

O presente capítulo apresenta uma introdução a análise da dinâmica do sistema multi-

articulado. Na primeira seção abaixo apresenta-se a análise para determinação dos

pontos de equilíbrio dinâmico do sistema através de alguns exemplos. Em seguida,

discute-se um fenômeno freqüentemente utilizado no planejamento da locomoção de

sistemas multi-articulados, denominado de fases geométricas, e que representa um fenô-

meno exclusivamente devido a uma restrição cinemática1 e, portanto, independente da

velocidade de movimento.

Finalmente, atenção será voltada à análise de controlabilidade do sistema utilizando os

resultados apresentados em (Sussmann, 1987) e (Nijmeijer e van der Shaft, 1990). Pode-

se adiantar que, em geral, verificar as características de controlabilidade de sistemas

não lineares constitui uma tarefa de relativa dificuldade, em comparação com análises

similares realizadas com as suas aproximações lineares correspondentes. Esta relativa

dificuldade deve-se à notável complexidade intrínseca da dinâmica não-linear, como a

presença de equilíbrios múltiplos ou por fenômenos de ciclo limite e oscilações, que

não estão presentes no âmbito linear. Portanto, observa-se que quanto mais geral o

modelo do sistema sendo analisado, mais difícil é estabelecer a estrutura do espaço de

evolução da dinâmica do mesmo. Além disso, a análise de controlabilidade para sistemas

lineares é local, em torno de um ponto determinado2 do espaço de estados, ao passo1Definida nos pontos em que a conexão mecânica se nula.2Em torno do qual a linearização é válida.

5.1. EQUILÍBRIO E ESTABILIDADE 86

que a verificação das características de controlabilidade dos sistemas não-lineares não

necessariamente se limita a um ponto, mas abrange um sub-conjunto do espaço de fase.

5.1 Equilíbrio e Estabilidade

O equilíbrio de um sistema dinâmico z = f(z, u) é definido pelo conjunto dos pontos

z em T ∗Q os quais z = 0 se verifica. Ou, equivalentemente, para o componente da

dinâmica livre, dado pelo campo vetorial f(.), de um sistema afim nas entradas, o

equilíbrio é verificado quando f(z) = 0.

5.1.1 Equilíbrio do Sistema Multi-corpos

O equilíbrio relativo é obtido pelo equilíbrio do sistema reduzido. Logo, das equações

do sistema reduzido em (4.2.15), segue que

φj = θj+1,j = 0, 1 ≤ j ≤ N − 1

µi = 0, 1 ≤ i ≤ N

A primeira condição acima estabelece que as velocidades angulares de todos os corpos

sejam iguais, ou seja, ωi = ω0, para i = 1, . . . , N , onde ω0 é uma função do tempo, por

exemplo. Isto equivale a restringir o estado relativo do sistema à origem do espaço de

base B. A segunda condição resulta em

∂H

∂θj+1,j= 0, 1 ≤ j ≤ N − 1

que estabelece condições para determinação do equilíbrio em relação aos φ. Note que,

todas as configurações q são equilíbrio do sistema quando o vetor vq ∈ TqQ é nulo,

ou, em particular quando ω0 ≡ 0 que representa pontos de equilíbrio triviais.

Os pontos de equilíbrio relativo para sistemas de dois e três corpos foram obtidos em

Sreenath (1987); por exemplo, para o sistema de 2-corpos, o equilíbrio relativo é dado

por θ1 = θ2 = θ e

• Para θ > 0 e φ = 0 equilíbrio estável;

• Para θ > 0 e φ = π equilíbrio instável;


• Para θ = 0 infinitos pontos de equilíbrio.

Note que a existência de mais de um ponto de equilíbrio elimina a possibilidade do

sistema possuir apenas um ponto de equilíbrio global. Logo, os equilíbrios desta classe

de sistemas são locais.

O equilíbrio relativo para um sistema de N corpos pode ser determinado pela solução

do seguinte sistema de N − 1 equações algébricas:

KX = 0

onde o vetor de estados X é função das N − 1 coordenadas do espaço de base B, dadas

pelo vetor φ. Note que a matriz K possui dimensão (N−1)×N(N−1)/2, onde o número

de colunas é igual a CN,2, isto é, ao número de combinações de N números tomados 2

a 2 ou, ainda, determinado pela somatória de uma progressão aritmética unitária até

o número N − 1. A título de exemplificação do procedimento acima, toma-se N = 5.

Denominando por m∗ a massa total do sistema, segue que:

∂H

∂φ1

∣∣∣∣equil

=ω2

0

m∗ [A1 sin(φ1) + E1 sin(φ1 + φ2)+

H1 sin(φ1 + φ2 + φ3) + J1 sin(φ1 + φ2 + φ3 + φ4)] = 0

∂H

∂φ2

∣∣∣∣equil

=ω2

0

m∗ [B2 sin(φ2) + E2 sin(φ1 + φ2) + F2 sin(φ2 + φ3)+

H2 sin(φ1 + φ2 + φ3) + I2 sin(φ2 + φ3 + φ4)+

J2 sin(φ1 + φ2 + φ3 + φ4)] = 0

∂H

∂φ3

∣∣∣∣equil

=ω2

0

m∗ [C3 sin(φ3) + F3 sin(φ2 + φ3) + G3 sin(φ3 + φ4)+ (5.1.1)

H3 sin(φ1 + φ2 + φ3) + I3 sin(φ2 + φ3 + φ4)+

J3 sin(φ1 + φ2 + φ3 + φ4)] = 0

∂H

∂φ4

∣∣∣∣equil

=ω2

0

m∗ [D4 sin(φ4) + G4 sin(φ3 + φ4)+

I4 sin(φ2 + φ3 + φ4) + J4 sin(φ1 + φ2 + φ3 + φ4)] = 0

A partir das expressões acima, obtém-se o seguinte equilíbrio relativo trivial do sistema:

(φ1, φ2, φ3, φ4)|equil = ±(n1π, n2π, n3π, n4π)

ni = 0, 1, 2...

i = 1, 2, 3, 4.


Em alguns casos práticos, no entanto, devido às restrições dimensionais, os corpos do

sistema não se sobrepõe, ou seja, não realizam uma rotação relativa completa entre si.

Conseqüentemente, nestes casos os inteiros ni restringem-se somente a 0.

Como exemplo, adota-se um sistema simétrico, em relação aos parâmetros de massa e

dimensões: os corpos extremos 1, 5 são idênticos com massa m1 e dimensão longitudinal

2a, os corpos 2, 4 são idênticos com massa m2 e dimensão longitudinal 2b e diferentes

do corpo central que possui massa m3 e comprimento 2c. Neste caso, tem-se que:

K1 = A1 = D4

K2 = B2 = C3

K3 = E1 = E2 = G3 = G3

K4 = F2 = F3

K5 = H1 = H2 = H3 = I2 = I3 = I4

K6 = J1 = J2 = J3 = J4

onde

K1 = abm1(2m1 + 3m2 + 2m3)

K2 = bc(2m1 + m2)m∗

K3 = acm1m∗

K4 = [b(2m1 + m2)]2

K5 = abm1(2m1 + m2)

K6 = a2m21

e m∗ = 2m1 + 2m2 + m3 é a massa total do sistema. Note que não é possível reduzir

o número de constantes Ki acima mesmo adotando um sistema cujos corpos são todos

iguais entre si. As quatro expressões (5.1.1) podem ser apresentadas de maneira mais

compacta em forma matricial, como se segue

K1 0 0 0 K3 0 0 K5 0 K6

0 K2 0 0 K3 K4 0 K5 K5 K6

0 0 K2 0 0 K4 K3 K5 K5 K6

0 0 0 K1 0 0 K3 0 K5 K6

X =

0

0

0

0

(5.1.2)

e o vetor X, função das coordenadas φ, é dado por

X(φ) = [ sin(φ1), sin(φ2), sin(φ3), sin(φ4), sin(φ1 + φ2), sin(φ2 + φ3),

sin(φ3 + φ4), sin(φ1 + φ2 + φ3), sin(φ2 + φ3 + φ4),

sin(φ1 + φ2 + φ3 + φ4)]T


Até o momento de conclusão deste trabalho, não se teve conhecimento, por parte do

autor, de um método de resolução geral da equação acima. Uma alternativa é obter

famílias de solução como procede-se abaixo.

Exemplo 5.1.1. Considerando ω0 6= 0, determina-se a seguir as soluções para três

casos:

φ1 = φ3 e φ2 = φ4 Torna o sistema de equações acima simétrico de maneira que apenas

o primeiro par de equações seja necessário resolver. Obtém-se a seguinte solução

em [0, 2π[: φ1 = (0, 0, π, π), φ2 = (0, π, 0, π).

φ1, φ3 = φ e φ2, φ4 = −φ Possui uma única solução φ = 0.

φ1, φ2, φ3, φ4 = φ As quatro equações de equilíbrio simplificam em uma única expressão,

dada por

(K2 −K1) sin(φ) + K4 sin(2φ) + K5 sin(3φ) = 0

através da qual obtém-se a seguinte solução

φ =

0

π

arctan(√

Z1+2K4√

Z2

K5,−K4−

√Z2

K5 )

arctan(−1/2√

Z1+2K4√

Z2

K5,−1/2K4−

√Z2

K5)

arctan(√

Z1−2K4√

Z2

K5,−K4+

√Z2

K5)

arctan(−1/2√

Z1−2K4√

Z2

K5,−1/2K4+

√Z2

K5)

onde

Z1 = −2K24 + 12K2

5 + 4K5K2 − 4K5K1

Z2 = K24 − 4K5K2 + 4K5K1 + 4K2

5

Note que, em geral, quanto mais estrutura é dada às coordenadas φ maior é o conjunto

solução. Especula-se que não exista solução diferente da trivial para o caso geral do

equilíbrio relativo do sistema acima.

5.2. FASES GEOMÉTRICAS: ANÁLISE 90

5.2 Fases Geométricas: Análise

Como comentado no Capítulo 3, as conexões podem ser vistas como descrições da in-

fluência do movimento horizontal, ou seja, movimento descrito no espaço Hq, no mo-

vimento do sistema no espaço vertical. Em geral, esta influência não é constante mas

regida por um comportamento não linear e, em alguns casos, esta conexão pode deter-

minar uma curvatura no espaço de configuração do sistema, sendo esta descrita pelos

símbolos de Christoffel.

Em geral, pode-se esperar que um movimento cíclico descrito no espaço de base B, que

corresponde a um movimento horizontal conforme ao comentários da Seção 2.5, não

corresponda a um movimento cíclico no espaço de configuração total Q. Apesar disso,

o movimento da configuração do sistema percorrerá uma curva aberta, que descreve a

curva cíclica ou fechada quando projetada no espaço de base B, mas que sofrerá um

deslocamento equivalente em Q e correspondente aos pontos de partida e chegada do

percurso fechado em B. Este deslocamento sofrido pela configuração do sistema é um

movimento vertical, geralmente definido por um elemento da fibra G, e é denominado

de mudança de fase ou fase geométrica, como comentado na Seção B.3. Quando µS = 0,

a magnitude da mudança de fase é dependente da área interna ao percurso fechado em

B e da geometria da conexão envolvida, (Bloch, 2003; Marsden, 2004).

A importância do mecanismo que define as fases geométricas deve-se, sobretudo, à

sua aplicação no projeto de movimentos de locomoção em sistemas robóticos multi-

articulados. Um exemplo trivial, embora interessante, é dado em (Littlejohn e Reinsch,

1997). Como será mostrado a seguir, o cálculo da mudança de fase reflete a alteração

do tensor travado de inércia com relação à mudança de forma do sistema.

O momento angular do sistema µ, dado no referencial inercial, pode ser obtido a partir

da matriz de inércia J e da velocidade angular ω através da seguinte expressão:

µ = Jω (5.2.1)

O momento angular total é obtido pela expressão

µ =N∑

k=1

µk = 1TNJω (5.2.2)

onde 1N é um vetor coluna com N uns. Assume-se, na análise realizada a seguir, que o


sistema possui momento angular total nulo. Então

1TNJω = µ = 0, ⇒ 1T

NJdθ = 0 (5.2.3)

onde dθ = [dθ1, . . . , dθN ]T . Expandindo o vetor dθ de maneira análoga ao realizado em

(4.3.20), segue que

dθ = 1Ndθ1 + Mdφ

onde M é uma matriz N×(N−1) definida em (4.3.21). Neste caso o espaço de grupo é o

grupo de Lie SO(2) e parametrizado pela coordenada θ1. Logo, considerando momento

angular nulo e a partir da Eq. (5.2.3) tem-se que

1TNJ1Ndθ1 = −1T

NJMdφ

dθ1 = − 1TNJM

1TNJ1N

dφ (5.2.4)

Como pode-se observar, o momento de inércia instantâneo 1TNJ1N é dependente da

forma do sistema e corresponde ao elemento (3, 3) do tensor travado de inércia em

(4.4.4). De (5.2.4), segue que

∆θ1 = −∫

ΓA(φ)dφ (5.2.5)

onde Γ é um caminho fechado no espaço de base B, que corresponde a um movimento

horizontal em função da conexão A(φ). O escalar 1TNJ1N corresponde à inércia travada

do sistema, cuja forma é determinada por φ. Em geral, a integral de linha acima avaliada

em um caminho fechado em B fornece um valor não nulo ∆θ1, que corresponde a um

deslocamento ou uma mudança de fase no espaço de grupo G. Esta mudança de fase

determina uma restrição linear nas velocidades angulares relativas φ. Esta restrição é

não-integrável, ou não-holonômica, no sentido de Frobenius, conforme a introdução da

Seção 2.1.2.

Observação 5.2.1. Uma dada conexão é dita plana ou chata3 se for desprovida de cur-

vatura. Neste caso, a conexão representa uma aplicação constante e a mudança de fase,

correspondente a um percurso fechado no espaço B, é dada simplesmente por um valor

proporcional à área definida pelo interior do percurso fechado em B, ou seja, proporci-

onal a uma métrica Euclidiana. Observe que, à princípio, nada pode ser concluído com

relação às fases geométricas de sistemas com conexões de curvaturas planas.

No caso G = SE(2), o componente da dinâmica rotacional da aplicação momento J em3Do inglês flat connections.


T ∗Q, em coordenadas inerciais, é:

J(3) = (rcm × pcm) + µ = rxpy − rypx +N∑

i=1

µi = 0 (5.2.6)

onde a operação × corresponde ao produto vetorial no plano, rcm = (rx, ry)T e pcm =

(px, py)T são a posição e o momento linear do centro de massa do sistema, dados em

relação ao referencial inercial. Observe que a primeira parcela da expressão do momento

angular acima, dado por rcm×pcm, deve-se à translação do sistema com relação à origem

do referencial inercial. Neste caso, observa-se, também, componentes da mudança de

fase nos componentes de translação do sistema, (Melli et al., 2006).

5.2.1 O Contexto Geométrico

Recorda-se que o grupo de Lie SE(2) não é abeliano e que, por sua vez, rende uma ál-

gebra se(2) não abeliana, refira a Seção A.2.2 para detalhes adicionais. Pode-se mostrar

que a dinâmica no subespaço abeliano SO(2) é desacoplada do movimento no espaço

vetorial R2, sendo este último o subespaço não compacto do grupo SE(2). Um breve

detalhamento disto é feito na Seção B.2.

Observação 5.2.2. O desacoplamento ocorre apenas em um sentido, ou seja, o compo-

nente de translação depende da parte abeliana do grupo.

Observação 5.2.3. A holonomia não nula para o componente de translação da conexão

será possível apenas quando os pontos da parametrização, do deslocamento linear do

sistema, forem escolhidos diferentes do centro de massa do mesmo. Ou seja, a mudança

de fase não será observada se o centro de massa do sistema for o ponto escolhido para

parametrizar o componente de movimento linear do mesmo. Isto está em acordo com a

conservação da quantidade de movimento linear enunciado pelo Teorema de Noether.

Parametrizando-se o componente de translação do espaço do grupo SE(2) pela distância

do centro de massa do sistema rcm, a holonomia da conexão mecânica deve-se apenas à

parte abeliana de SE(2). Logo, para s(0) = e, a holonomia da parte abeliana do grupo

pode ser obtida por, (Marsden et al., 1990):

s(1) = exp(−

∫ 1

0Ag(r)r(t)dt

)= exp

(−

∫

∂ΩAg(r)dr

)= exp

(−

∫∫

ΩDAg(r)dA

)

(5.2.7)

onde Ag : TQ → g é o componente abeliano da conexão e D representa a derivada

covariante exterior. A última igualdade em (5.2.7) deve-se a generalização do Teorema

5.3. ANÁLISE DE CONTROLABILIDADE 93

de Stokes e à aplicação exp : se(2) → SE(2), dada por:

exp(ω, vx, vy) = (θ, rx, ry)

onde (ω, vx, vy) ∈ R3 ' se(2) e exp é a aplicação exponencial, detalhada para o grupo

SE(2) na Seção A.2.2. Note que a expressão (5.2.7) não envolve uma parametrização

do caminho fechado no espaço de base B. Por outro lado, a holonomia do componente

de translação de fato depende dos pontos inicial e final da parametrização escolhida.

Nos casos em que G é um grupo de simetria abeliano, a mudança de fase também

pode ser calculada através da curvatura B da conexão principal que, a partir de (5.2.7)

fornece:

holonomia := θ(1) = −∫

ΓA(φ)dφ = −

∫∫

ΩBdΩ (5.2.8)

onde Γ = ∂Ω. A magnitude da mudança de fase é função da curvatura da conexão e da

área definida pelo caminho percorrido no espaço de base.

Exemplo 5.2.1. Para o sistema de 3-corpos, em que (φ1, φ2) parametrizam o espaço

de base B, as fases geométricas podem ser calculadas segundo a expressão dada a seguir:

∆θ1 = −∫

ΓA(φ)dφ =

= −[∫ (α,0)

(0,0)f1(φ1)dφ1 +

∫ (α,β)

(α,0)f2(φ2)dφ2 +

∫ (0,β)

(α,β)f1(φ1)dφ1 +

∫ (0,0)

(0,β)f2(φ2)dφ2

]

(5.2.9)

onde Γ é o caminho fechado no espaço (φ1, φ2) dado por Γ = [(0, 0), (α, 0), (α, β), (0, β),

(0, 0)]. Alternativamente, a curvatura da conexão neste caso é obtida através, refira à

Seção B.4 para detalhes:

B = dA =(

∂f2

∂φ1− ∂f1

∂φ2

)dφ1 ∧ dφ2 (5.2.10)

As Figuras 5.1 e 5.2 ilustram a mudança de fase e a curvatura da conexão, respecti-

vamente. A Seção B.4 do Apêndice B apresenta algumas expressões para o cálculo das

fases geométricas do sistema com 5-corpos.

5.3 Análise de Controlabilidade

Seja V uma vizinhança de um ponto z ∈ M , onde M representa o espaço de fase de

velocidade TQ ou de momento P = T ∗Q do sistema, e seja dado o conjunto de controle

U ⊂ Rm tal que u : [0, T ] 7→ U , para todo T > 0.


−4 −3 −2 −1 0 1 2 3 4

−4

−2

0

2

4

−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

θ23

System Phase Shift

θ12

Hol

onom

y

Figura 5.1: Mudança de fase do sistema de três corpos. A mudança de fase foi calculada

a partir de (5.2.9), para um caminho fechado no espaço de base B parametrizado por

α, β = 3. As coordenadas do espaço de base são dadas por (φ1, φ2) = (θ12, θ23).


−4−3−2−101234

−4

−2

0

2

4

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

θ12

Curvature of the Connection

θ23

Cur

vatu

re B

Figura 5.2: Curvatura B relativa à conexão principal do sistema de três corpos. A

curvatura da conexão A dada em (5.2.9) foi obtida a partir de (5.2.10).


Definição 5.3.1 (Conjunto Alcançável). O conjunto alcançável a partir de z0 em tempo

T , definido por RV (z0, T ) ⊂ M , é o conjunto de pontos z(t) ∈ V para os quais existem

entradas u(t) ∈ U que conduzem o estado do sistema do ponto z(0) = z0 ∈ V ao ponto

z(T ), onde 0 6 t 6 T , ou seja:

RV (z0, T ) = z ∈ M | ∃ u(t) ∈ U, z(0) = z0, z(t) ∈ V, ∀t ∈ [0, T ]

Observe, pela notação RV (.), que os critérios de acessibilidade e controlabilidade, apre-

sentados a seguir, são definidos para todas as possíveis vizinhanças do ponto z0, re-

presentadas genericamente por V . O conjunto alcançável em até o tempo T é definido

por:

RV (z0,≤ T ) =⋃

0≤t≤T

RV (z0, t). (5.3.1)

Como visto previamente no Capítulo 4, o sistema multi-articulado é um sistema me-

cânico simples. O modelo dinâmico de um sistema de controle na forma afim (Q, f,

g1, . . . , gm, U), onde dimQ = n, é tal que

z(t) = f(z) +m∑

i=1

gi(z)ui, m < n (5.3.2)

onde z ∈ P , f é o campo vetorial da dinâmica livre e os gi são os campos vetoriais de

entrada. As funções de controle são dadas por u ∈ U .

5.3.1 Álgebra e Distribuição de Acessibilidade de Sistemas Afim

Definição 5.3.2 (Acessibilidade4 Local). O sistema (5.3.2) é dito acessível a partir de

z0 ∈ T ∗Q se RV (z0,≤ T ) contém um aberto não vazio em T ∗Q, para todo V de z0 e

T > 0.

A álgebra de acessibilidade C é a menor álgebra fechada em relação ao colchete de Jacobi-

Lie que contém os campos vetoriais f, g1, . . . , gm. O próximo resultado simplifica a

obtenção desta álgebra.

Proposição 5.3.1. Qualquer iteração do colchete de Jacobi-Lie dos campos vetoriais

f, g1, . . . , gm é uma combinação linear das iterações à esquerda do colchete de Jacobi-

Lie de f, g1, . . . , gm.4Ou alcançabilidade, em algumas referências.


Demonstração. Este resultado segue das propriedades das álgebras de Lie, uma vez que

um conjunto de campos vetoriais em Q munido do colchete de Lie forma uma álgebra

de Lie.

Seja Lj uma álgebra de grau j e definida pelo colchete de Lie [., .]. Por definição,

qualquer colchete de grau j + 1 pode ser escrito pelo colchete de elementos de graus j

e 1, ou seja, [Lj , L1] = Lj+1. Generalizando, mostra-se que qualquer colchete de grau

j + l pode ser escrito pelo colchete de elementos de graus j e l, isto é

[Ll, Lj ] j Ll+j

Assume-se que [Ll, Lj ] j Ll+j para todo j. Então, por indução, segue que

[Ll, Lj+1] = [Ll, [Lj , L1]] j [[Ll, L1], Lj ] + [[Ll, Lj ], L1]

j [Ll+1, Lj ] + [Ll+j , L1]

j Ll+j+1

Para mostrar a implicação inversa, ou seja, qualquer colchete de grau j é dado pelos

colchetes de j elementos de grau 1, basta mostrar que o sub-espaço de um produto de

colchetes iterados à esquerda é uma sub-álgebra da álgebra de qualquer combinação dos

colchetes. Sejam dois colchetes com graus l e j dados por

X = [Xj , ..., [[X3, X2], X1], ..., ]

Y = [Yl, ..., [[Y3, Y2], Y1], ..., ]

Por indução, pode-se mostrar que [X,Y ] faz parte desta sub-álgebra para quaisquer l

e j. Para todo Y , fixado l, verificar a tese nos casos j = 1, 2 seque diretamente das

propriedades de anti-simetria e identidade de Jacobi da álgebra de Lie. Supondo que a

mesma vale para j = k, verifica-se a condição para j = k + 1 através na expressão:

[X,Y ] = [[Xj , X′], Y ] = −[Y, [Xj , X

′]]

onde X ′ = [Xj−1, ..., [X3, [X2, X1]]...]. Pela identidade de Jacobi, segue que

[Y, [Xj , X′]] + [X ′, [Y, Xj ]] + [Xj , [X ′, Y ]] = 0

Das duas últimas expressões tem-se

[X, Y ] = −[X ′, [Y, Xj ]]− [Xj , [X ′, Y ]]

= [X ′, [Xj , Y ]]− [Xj , [X ′, Y ]]


O primeiro termo [X ′, [Xj , Y ]] pertence a sub-álgebra uma vez que, pela hipótese, um

elemento de grau j = k pertence a mesma sub-álgebra e o grau de X ′ é k. Como

[X ′, Y ] pertence a sub-álgebra, o segundo termo também pertence a sub-álgebra. Logo,

um elemento genérico da álgebra pode ser reescrito na forma de produtos sucessivos à

esquerda com o colchete de Lie (sub-álgebra).

Aplicando o resultado acima à definição da álgebra de acessibilidade acima tem-se que,

para o campo vetorial Xik ∈ f, g1, . . . , gm, 0 ≤ ik ≤ m, a álgebra de acessibilidade do

sistema C, ou álgebra de Lie de controle, é obtida pela seguinte definição, empregando-se

a notação de índices múltiplos:

C(f, g1, . . . , gm) := [Xi1 , [Xi2 , . . . , [Xik−1, Xik ] . . .], k ≥ 1, 0 ≤ i1, . . . , ik ≤ m

(5.3.3)

Esta álgebra é também representada pela seguinte notação C(f, g1, . . . , gm) = Lie(f,

g1, . . . , gm). A distribuição associada a acessibilidade C é involutiva e determinada por

C(z) = spanX(z) | X ∈ C, z ∈ T ∗Q (5.3.4)

Teorema 5.3.2 (Acessibilidade Local: Suficiência, (Bloch, 2003)). Assume-se que o

sistema de controle afim (5.3.2) seja suave. Se o critério de posto pleno para acessibi-

lidade dimC(z0) = n, conhecido como a condição de posto da álgebra de Lie (LARC)5,

é verificado, então o conjunto RV (z0,≤ T ) possui interior não vazio para todo T > 0 e

o sistema é acessível a partir de z0 ∈ T ∗Q.

A condição acima pode ser observada quando:

dimC = dim(spanci) = dim(Im[ci]) = rank[C] = n (5.3.5)

Definição 5.3.3. O sistema (5.3.2) é dito acessível se a condição LARC for satisfeita

para todo z ∈ T ∗Q.

Definição 5.3.4. Um conjunto U é denominado próprio se 0 ∈ int(conv)(U), onde int

é interior do menor conjunto convexo, representado por conv, contendo U . O conjunto

convexo de U é definido por

k∑

i=1

λiui, k ∈ N : λi > 0,k∑

i=1

λi = 1

5Do inglês Lie Algebra Rank Condition.


Ademais, para sistemas definidos em uma variedade analítica e quando U é próprio, a

condição de acessibilidade implica na verificação do critério de posto para acessibilidade

(LARC), ou seja, o LARC é uma condição necessária e suficiente para a acessibilidade

do sistema.

5.3.2 Controlabilidade

O conceito de controlabilidade de um sistema pode ser definido como:

Definição 5.3.5 (Controlabilidade). O sistema (5.3.2) é dito controlável de z0 ∈ T ∗Q

se, para todo z ∈ T ∗Q, existir um T > 0 tal que z ∈ RV (z0, T ), para z ∈ V .

Definição 5.3.6 (Controlabilidade em Tempo Pequeno6: (Bullo e Lewis, 2005)). O

sistema (5.3.2) é dito controlável em tempo pequeno de z0 ∈ T ∗Q se existir um T > 0

tal que RV (z0,≤ T ) contém uma vizinhança V de z0.

Note que a condição acima V ⊂ RV (z0,≤ T ) é equivalente à condição de z0 estar no

interior de RV (z0,≤ T ), ou seja z0 não pode ser um ponto limite de RV (z0,≤ T ). Esta

condição permite que a trajetória do sistema possa convergir a z0 de todas as direções;

fato que não é verificado se z0 pertence a fronteira da região RV (z0,≤ T ). Isto permite

que o estado do sistema possa ser levado ao ponto z0 em tempo suficientemente pequeno.

Seguem abaixo algumas definições necessárias a um resultado para o STLC.

Define-se por δa(B) como o número de vezes que o campo vetorial Xa, para a = 0, . . . , m,

é utilizado em B. O grau de um colchete de Lie B, simbolizado por δ(B), é obtido

fazendo-se

δ(B) =m∑

0

δa(B)

Um elemento B ∈ Br(X) é dito ruim se δ0(B) for ímpar e δi(B), i = 1, . . . , m, par

(incluindo o zero). Se um elemento B ∈ Br(X) não é ruim, ele é dito bom.

Teorema 5.3.3 (Controlabilidade em Tempo Pequeno: (Sussmann, 1987)). Seja o

sistema (5.3.2) com ponto de equilíbrio em z0 ∈ T ∗q Q, ou seja, f(z0) = 0, e assume-se

que (5.3.2) satisfaça a condição LARC em z0. Se X ∈ Br(X) for ruim, então existem

Y1, . . . , Yk tais que

X = aiYi,

6Do original Small-time local controllability - (STLC).


para a1, . . . , ak ∈ R, e, para i = 1, . . . , m

δ(Yi) < δ(X)

Então o sistema (5.3.2) é STLC de z0.

Ou seja, se todo B ∈ Br(X) ruim puder ser escrito como uma combinação linear de

componentes bons de grau menor, e o sistema for acessível de z0, então o sistema é

STLC de z0. Um corolário do teorema acima estabelece que um sistema na forma afim

é STLC a partir de z0 se z0 for um ponto de equilíbrio e se o critério de acessibilidade

for verificado em z0.

Teorema 5.3.4 (Controlabilidade Especial: (Bloch, 2003)). Um sistema de controle na

forma afim cujos, campos vetoriais são analíticos, é controlável se dimC(q) = n, para

todo q ∈ Q, e se uma das seguintes condições se verificar:

• f = 0, ou

• f possui divergente nulo e Q é compacto e Riemanniano.

Observe que apenas os modelos cinemáticos do sistema multi-corpos se enquadrariam

no primeiro caso acima, Seção C.2.4. Uma particularização da segunda condição acima

diz respeito aos casos que o campo vetorial f é Hamiltoniano7. Note que, embora o

sistema mecânico em estudo seja Hamiltoniano, como observado através da dinâmica

livre dada pelo campo vetorial f em (4.2.1) e (4.2.5), o espaço de fase do mesmo não

é compacto, apesar de Riemanniano. A qualidade de não compaticidade do espaço de

fase T ∗Q deve-se ao fato do mesmo conter o espaço vetorial R2, um espaço não limitado.

Controlabilidade com o Modelo Cinemático do Sistema

Os modelos cinemáticos são, em determinadas situações,8 livres da presença do campo

vetorial relativo à dinâmica livre f e conseqüentemente são empregados na geração

de trajetórias para os modelos dinâmicos correspondentes em razão de preservarem a

estrutura dos canais de entrada τ do sistema. Um modelo cinemático, no espaço de7Consultar a Seção 2.2.8Quando tem-se momento nulo, ver Seção C.2.4.


configuração Q de dimensão n, pode ser escrito como:

q =m∑

i=1

uiXi(q), m < n (5.3.6)

onde q ∈ Q é a configuração, u ∈ U ⊂ Rm são as funções de entrada e F = X1, X2, . . . , Xmé um conjunto de campos vetoriais completos em Q. Por causa da reversibilidade de

sistemas sem dinâmica livre (Sontag, 1998), a acessibilidade implica em controlabilidade

para este caso, ou seja, a controlabilidade pode ser verificada através da critério de posto

para acessibilidade.

5.3.3 Controlabilidade do Sistema de Dois Corpos

Controlabilidade com Modelo Cinemático do Sistema

ReferencialInercial

L

T

φ

x

CM

−θcm

y

f2

f1

z1

z2

Figura 5.3: Cinemática do sistema de dois corpos.

A seguir procede-se com a análise de controlabilidade para o sistema de dois corpos

articulados. O modelo cinemático do sistema de dois corpos da Figura 5.3 é dado por

x = (f1 − f2) sin(

φ

2

)cos(θ)− (f1 + f2) cos

(φ

2

)sin(θ) (5.3.7)

y = (f1 − f2) sin(

φ

2

)sin(θ) + (f1 + f2) cos

(φ

2

)cos(θ) (5.3.8)

θ = −(f1 − f2)L cos(

φ

2

)(5.3.9)

φ = T (5.3.10)


que corresponde aos campos vetoriais de controle

g1 =

sin(

φ2

)cos(θ)− cos

(φ2

)sin(θ)

sin(

φ2

)sin(θ) + cos

(φ2

)cos(θ)

−L cos(

φ2

)

0

, g2 =

− sin(

φ2

)cos(θ)− cos

(φ2

)sin(θ)

− sin(

φ2

)sin(θ) + cos

(φ2

)cos(θ)

L cos(

φ2

)

0

,

g3 = [0, 0, 0, 1]T

Observe que o sistema é composto por um atuador rotativo interno T além de duas

forças propulsores f1 e f2, um em cada corpo, e responsáveis pela condução do sistema

ao longo da fibra G = SE(2).

A distribuição gerada pelos campos vetoriais é regular, ou seja, a dimensão da distri-

buição é mantida constante para todo q = (rx, ry, θ, φ) ∈ Q. Logo, a condição de LARC

é satisfeita com colchetes de grau dois ou maior, pois

rank [g1, g2, g3, [g1, g2], [g1, g3], [g2, g3]] = 4 = dimTqQ

A combinação linear de colchetes até o segundo grau é suficiente para gerar as direções do

espaço tangente à variedade de configuração Q, indicando a existência de um conjunto

de acessibilidade aberto e não vazio RV (q0, q0, T ) = Tq0Q.

Tomando-se, por exemplo, o conjunto de campos vetoriais g3, [g1, g2], [g1, g3], e [g1, [g1, g2]

pode-se facilmente verificar que estes geram um subespaço 4-dimensional de TqQ apenas

se φ não for múltiplos de π, como mostra a solução de:

det([g3, [g1, g2], [g1, g3], [g1, [g1, g2]]) = 2L4 sin(

φ

2

)cos5

(φ

2

)= 0

Uma rápida análise das equações do modelo cinemático do sistema reafirma este resul-

tado, uma vez que, em φ = π os corpos estão sobrepostos e o movimento do sistema

na fibra se restringe aos dois sentidos da linha reta, que é um espaço unidimensional.

Por outro lado, quando φ = 0, o sistema se degenera ao corpo rígido com dois propulso-

res, cuja acessibilidade é verificada no subespaço 3-dimensional TgSE(2) ⊂ TqQ, onde

g ∈ SE(2).

Controlabilidade com Modelo Dinâmico do Sistema

A análise com o modelo dinâmico do sistema de dois corpos mostrou resultado se-

melhante ao do modelo cinemático acima. Em geral, no entanto, é necessário obter

colchetes de Jacobi-Lie de grau maior que dois de modo a gerar o espaço de fase.


O modelo dinâmico do sistema de 2-corpos simétrico, ou seja, em que os corpos são

idênticos com relação aos parâmetros mi, Ii, di, para i = 1, 2, mostrou-se acessível para

qualquer z = (rx, ry, θcm, φ, pcm, pφ). Para um estado diferente do nulo, são necessários

apenas colchetes de segunda e terceira ordens. Ou seja, seja a matriz C3 composta pelos

oito primeiros campos vetoriais em ordem crescente de grau, dados por f, g1, g2, g3,

[f, g1], [f, g2], [f, g3] e [f, [f, g1]]. A matriz C3 permite verificar o critério de posto

pleno verificando a condição

det(C3(z)) 6= 0, z 6= 0

Calculada para um ponto do estado na origem z = 0, a acessibilidade é alcançada

somente com a avaliação dos colchetes de grau 4, em conjunto com alguns colchetes

de menor grau obtidos acima. Com isso, obtém-se a seguinte matriz construída pelos

campos vetoriais que primeiro fornecem, na ordem de grau crescente, uma distribuição

de dimensão igual ao espaço de momento T ∗q Q:

C4(0) =

0 0 0 0 0 0 0 l2m∗(K+I)

0 0 0 −1m∗ 0 0 0 0

0 0 0 0 −l2(K+I) 0 0 0

0 0 0 0 0 2(K−I) 0 0

0 0 0 0 0 0 − l2(K+I) 0

1 0 0 0 0 0 0 0

0 l 0 0 0 0 0 0

0 0 1 0 0 0 0 0

cujas colunas correspondem aos campos vetoriais de entrada g1, g2, g3 e aos [f, g1],

[f, g2], [f, g3], [g1, [f, g2]] e [f, [g1, [f, g2]]] calculados na origem. Na matriz acima, tem-

se que K = εd1d2, como definido na Seção 4.2, e I = I1 = I2. Logo, rank(C4(0)) = n =

8. Este resultado foi obtido com o modelo, cujo a dinâmica da fibra SE(2) é dada em

função do centro de massa do sistema, apresentado em (4.3.16), e com campos vetoriais

de entrada parametrizados por (u1, u2) = (f1 + f2, f2 − f1).

Observação 5.3.1. O critério para verificar a acessibilidade localmente na origem equivale

ao critério para acessibilidade forte, uma vez que o campo vetorial relativo a dinâmica

livre nunca contribui com informação sobre o sistema, ou seja, f(0) = 0.

Analogamente, a análise do modelo do sistema de 2-corpos, em que os corpos possuem

propriedades físicas distintas, mostrou mesmo resultado ao apresentado acima. Isto

vale tanto no caso em que este é modelado sob a abordagem Hamiltoniana quanto


Lagrangiana, independentemente da parametrização dos campos vetoriais relativos às

entradas.

Resultados com sistemas de três ou mais corpos cujo as juntas rotativas são todas

atuadas apresentam o mesmo resultado; como enunciado na seguinte proposição:

Proposição 5.3.5 (Controlabilidade: Sistema de N -corpos). Todo sistema multi-articu-

lado de N corpos, totalmente atuado no espaço de base B e com, ao menos, duas forças

de propulsão linearmente independentes e necessariamente aplicadas em corpos distin-

tos, é acessível e controlável dos pontos de equilíbrio.

Para um sistema multi-articulado de N corpos, cuja massa total é m∗, os campos

vetoriais da dinâmica livre e das entradas, são dados genericamente por

f =

px/m∗

py/m∗

Xθ(φ, pθ, pφ)

Xφ1(φ, pθ, pφ)...

XφN−1(φ, pθ, pφ)

0

0

0

Xpφ1(φ, pθ, pφ)

...

XpφN−1(φ, pθ, pφ)

, gi =

0

0

0

0...

0

Xvx(θcm, φ)

Xvy(θcm, φ)

Xpθ(φ)

0...

0

, i = 1, . . . , mp (5.3.11)

Faz-se importante notar que os Xθ, Xp(.)e Xφ(.)

são funções de primeira, de segunda

e de primeira ordem, respectivamente, das variáveis dos momentos pθ e pφ. Este fato

servirá, a seguir, para estabelecer limitações da iteração dos colchetes de Lie para a

construção de novas direções de movimento. Estas novas direções são representadas por

componentes não nulos dos campos vetoriais obtidos pelo colchete de Lie. Os demais

campos vetoriais, relativos aos torques nas juntas rotativas, são constantes e podem ser

parametrizados simplesmente pela base canônica de T ∗φB, quando Q possui estrutura


principal, ou seja

gmp+1 =

0N+5

1

0...

0

, . . . gj =

0N+5

...

1

0...

, . . . gm =

0N+5

0

0...

1

(N − 1) (5.3.12)

Por serem constantes, tem-se que Dgj ≡ 0, rendendo o vetor nulo como único elemento

da álgebra com o colchete de Jacobi-Lie de grau maior ou igual a dois dos gj : adkgj

gl ≡ 0,

como definido na Seção A.1, para j, l = mp + 1, . . . , m e ∀k > 0. Pode-se estender este

resultado aos campos vetoriais dos propulsores.

Lema 5.3.6. Todo colchete de Jacobi-Lie dos campos vetoriais de entrada do sistema

multi-articulado é sempre nulo, ou seja, [gi, gk] = 0, para i, k = 1, . . . , m.

Note que esta afirmação decorre independentemente dos campos vetoriais serem line-

armente independentes ou não, mas é conseqüência do fato de que um componente

não-nulo dos gi, e que atua em uma determinada direção, não é uma função da variável

correspondente a esta mesma direção. Por exemplo, os componentes não nulos dos gi

sempre atuam nas direções que correspondem aos momentos lineares e angulares. No

entanto, estes não são funções das variáveis px, py, pθ, pφ que modelam as direções pois

os campos vetoriais são funções apenas da configuração g = g(q), q ∈ Q.

Explorando a estrutura dos campos vetoriais que modelam o sistema, as propriedades de

anti-simetria e da identidade de Jacobi do colchete de Lie-Jacobi podem ser utilizadas

para obtenção de expressões que auxiliam na análise da álgebra de controlabilidade para

colchetes de grau maiores ou iguais a três.

Lema 5.3.7. Para colchetes de grau três [gi, [f, gk]] = [gk, [f, gi]], i, k = 1, . . . , m.

Demonstração. Para i, k, l = 1, . . . ,m e lembrando, do Lema 5.3.6, que [gi, gk] = 0

tem-se, da identidade de Jacobi, que

[gi, [f, gk]] + [gk, [gi, f ]] + [f, [gk, gi]] = 0

[gi, [f, gk]] + [gk, [gi, f ]] + 0 = 0

[gi, [f, gk]]− [gk, [f, gi]] = 0 (anti-simetria)

[gi, [f, gk]] = [gk, [f, gi]]


Lema 5.3.8. Para colchetes de grau quatro, valem os seguintes:

1. [f, [gi, [f, gi]]] = [gi, [f, [f, gi]]], i = 1, . . . , m

2. [gi, [gk, [f, gl]]] = [gk, [gi, [f, gl]]] = [gl, [gi, [f, gk]]], i, k, l = 1, . . . , m

3. [gi, [f, [f, gk]]] + [gk, [f, [f, gi]]] = 2[f, [gi, [f, gk]]], i, k = 1, . . . , m

Demonstração. Para i, k, l = 1, . . . , m, segue que:

1. Tomando [f, gi] = X, segue que

[f, [gi, X]] + [X, [f, gi]] + [gi, [X, f ]] = 0

[f, [gi, X]] + 0 + [gi, [X, f ]] = 0

[f, [gi, X]]− [gi, [f, X]] = 0 (anti-simetria)

[f, [gi, [f, gi]]] = [gi, [f, [f, gi]]]

2. Mostra-se primeiro a igualdade [gi, [gk, [f, gl]]] = [gk, [gi, [f, gl]]]. Fazendo X =

[f, gl], tem-se:

[gk, [gi, X]] + [X, [gk, gi]] + [gi, [X, gk]] = 0

[gk, [gi, X]] + 0 + [gi, [X, gk]] = 0

[gk, [gi, X]]− [gi, [gk, X]] = 0 (anti-simetria)

[gk, [gi, [f, gl]]] = [gi, [gk, [f, gl]]]

A segunda igualdade pode ser mostrada de maneira análoga a primeira, fazendo

X = [f, gk], obtendo-se [gi, [gk, [f, gl]]] = [gl, [gi, [f, gk]]].

3. Tomando X = [f, gi], tem-se:

[gk, [f, X]] + [X, [gk, f ]] + [f, [X, gk]] = 0

[gk, [f, X]]− [X, [f, gk]]− [f, [gk, X]] = 0 (anti-simetria) (5.3.13)

A partir do colchete do meio da última expressão, segue:

[[f, gi], [f, gk]] = [[f, gi], Y ] = −[Y, [f, gi]] (5.3.14)


onde Y = [f, gk]. Utilizando a identidade de Jacobi no colchete obtido, segue que

[Y, [f, gi]] + [gi, [Y, f ]] + [f, [gi, Y ]] = 0

[Y, [f, gi]]− [gi, [f, Y ]] + [f, [gi, Y ]] = 0 (anti-simetria)

[Y, [f, gi]] = [gi, [f, Y ]]− [f, [gi, Y ]] = A−B (5.3.15)

Substituindo-se (5.3.14) e (5.3.14) em (5.3.13) mostra-se o resultado que

[gi, [f, [f, gk]]] + [gk, [f, [f, gi]]] = 2[f, [gi, [f, gk]]].

Fazendo uso dos resultados dos Lemas acima, apresenta-se, a seguir, uma esboço da

demonstração da Proposição 5.3.5.

Demonstração. Para que o sistema seja acessível ou controlável, a álgebra obtida a

partir dos campos vetoriais do sistema de controle, segundo o colchete de Jacobi-Lie,

deve gerar um espaço dimQ = 2(3 + (N − 1)) = (2N + 4)-dimensional. Logo, basta

avaliar os primeiros 2N + 4 elementos da álgebra que são linearmente independentes

(L.I.) entre si. Como discutido na Seção 4.2.1, o número máximo de entradas m do

sistema de N -corpos é m 6 N +(N − 1) = 2N − 1. Por exemplo, o sistema de 2-corpos

pode ser concebido com duas entradas de propulsão e uma relativo ao torque de junta.

Neste caso sistema de controle é parametrizado por 3 elementos de entrada. Um sistema

com N corpos tem a entrada parametrizada por N + 1 elementos.


O jacobiano do campo vetorial f em (5.3.11) é dado por

Df =

01×3 · · · 0 · · · 1/m∗ 0

01×3 · · · 0 · · · 0 1/m∗

01×3 · · · Xθ · · · 0 0

01×3 · · · Xφ1 · · · 0 0

01×3 · · · ... · · · 0 0

01×3 · · · XφN−1· · · 0 0

03×3 03×(i−1) 03×1 03×(N−1−i) 03×1 03×1

01×3 · · · Xpφ1· · · 0 0

01×3 · · · ... · · · 0 0

01×3 · · · XpφN−1· · · 0 0

0 · · · 0 · · ·0 · · · 0 · · ·

Xθ(pφ) · · · Xθ(pθ, pφj ) · · ·Xφ1(pφ) · · · Xφ1(pθ, pφj ) · · ·

... · · · ... · · ·XφN−1

(pφ) · · · XφN−1(pθ, pφj ) · · ·

03×1 03×(i−1) 03×1 03×(N−1−i)

Xpφ1(pθ, p

2φ) · · · Xpφ1

(p2θ, p

2φj

, pφi) · · ·... · · · ... · · ·

XpφN−1(pθ, p

2φ) · · · XpφN−1

(p2θ, p

2φj

, pφi) · · ·

(5.3.16)

para 1 6 i, j 6 N − 1 e j 6= i. Na matriz acima os componentes representados por

X(.) correspondem a derivada parcial dos elementos do campo f , tomados na mesma

direção ou linha, em relação a variável (.). Com o fim de não carregar excessivamente a

notação das expressões, observe que embora todas sejam funções dos ângulos de junta φ,

apenas os momentos p(.) são representados como parâmetros dos elementos X na matriz

acima. Isto se justifica uma vez que os X são dependentes das variáveis φ através de

funções trigonométricas e, portanto, as derivadas parciais dos X sempre rendem funções

dos mesmos φ. Alternativamente, os X são funções lineares ou, no máximo, funções

de segunda ordem dos momentos p(.). Esta constatação é importante na análise para

determinação do limite de construção de elementos da álgebra com novas direções, ou

componentes não nulos, através do colchete de Jacobi-Lie. Em símbolos e generalizando

a situação acima para colchetes de qualquer grau, tem-se:

(adkigi

f)(z) = Dkipφj

Xpφj(φ, . . .) (5.3.17)


ki = 0, 1, 2, . . ., i = mp, . . . , m, j = i −mp = 1, . . . , N − 1. Se ki > 2, para ∀i, então(adki

gif)(z) = 0.9

A demonstração esboçada a seguir é construtiva: a estrutura dos colchetes dos campos

vetoriais de graus crescentes da álgebra de acessibilidade são analisados de maneira que

os elementos linearmente dependentes sejam identificados e eliminados da contagem até

que a dimensão do espaço de momento, dado pelo número 2N + 4, seja atingido.

Considere a álgebra dada através do colchete de Jacobi-Lie dos campos vetoriais do sis-

tema. Observe, a partir da expressão do campo vetorial f dado em (5.3.11), de (5.3.12),

e de (5.3.16), que é possível gerar campos vetoriais com componentes não nulos em todas

as linhas do vetor que representa o campo vetorial obtido pelo colchete de Jacobi-Lie.

Faz-se necessário identificar os colchetes que são linearmente dependentes e eliminá-los

da contagem dos elementos da álgebra que geram o espaço Q. Logo, para o modelo

de um sistema com N corpos valem os seguintes, independente da parametrização do

espaço Q escolhida:

Os colchetes de primeiro grau totalizam m+1 elementos da álgebra. Se todas as juntas

são atuadas, mt = N − 1, e q 6= 0, a álgebra de grau um fornece, ao máximo, N + 2

elementos L.I.: N + 1 devido às entradas se dois propulsores forem utilizados mais 1

relativo a dinâmica livre f ; e N + 3 elementos L.I.: N + 2 devido às entradas com três

ou mais propulsores mais 1 da dinâmica livre f . Quando z = 0, f se anula e o número

máximo de elementos L.I. é sempre N + 1, para dois ou mais propulsores.

O número total de colchetes de segundo grau totalizam um arranjo de m + 1 elementos

tomados dois a dois, ou seja, A(m+1),2 = m(m + 1). No entanto, da propriedade de

anti-simetria do colchete de Jacobi-Lie e utilizando o Lemma 5.3.6, apenas m elemen-

tos, seriam L.I.. Como alguns destes m elementos são colchetes de campos vetoriais que

foram eliminados na análise de colchetes de grau um, por serem linearmente dependen-

tes, a análise prossegue. Quando B é totalmente atuado e q 6= 0, a álgebra de grau dois

fornece, ao máximo, N + 1 elementos L.I., devido às entradas se dois propulsores forem

utilizados, e N + 2 elementos L.I., devido às entradas com três ou mais propulsores.

Quando q = 0, o número máximo de elementos L.I. é sempre N + 1, para dois ou mais9Utilizando indices múltiplos, para agrupar derivadas em relação a mesma variável, tem-se a seguinte

expressão geral

(adkilgil

f)(z) =Y

l=1

D

P=il

kilpφjl

Xpφjl(φ, . . .) (5.3.18)


propulsores.

Os colchetes de terceiro grau contam com um total de (m − 1)m(m + 1) elementos, o

que corresponde a um arranjo de m + 1 tomados três a três. Entretanto, utilizando a

identidade de Jacobi e o Lema 5.3.7, apenas m + Sm ou 2m + Cm,2 colchetes seriam

L.I., onde Cm,2 = m(m + 1)/2 é uma combinação de m elementos tomados dois a dois.

Observe que elementos da forma [gk, [f, gj ]], onde j, k = 1, . . . , mt, apenas contribuem

com elementos L.I. para a álgebra quando j 6= k. Com isto, mt elementos devem ser

desconsiderados acima pois são L.D.. Portanto, tem-se que m + Sm −mt elementos de

grau três são candidatos a completarem a distribuição da álgebra de forma que a sua

dimensão seja dimT ∗Q = 2N +4. Para qi, pi 6= 0, os colchetes obtidos até grau três são

suficientes para gerarem o fibrado cotangente T ∗Q.

Os colchetes de grau quatro são necessários à análise apenas para sistemas com dois

propulsores e quando z = 0. Este fato foi confirmado através de avaliações simbólicas

com modelos dos sistemas de 2 e 3 corpos. Os colchetes de grau quatro são A(m+1),4 =

(m+1)m(m−1)(m−2) no total. Utilizando o Lema 5.3.8 pode-se separar os elementos

em grupos:

• m: com estrutura [f, [f, [f, gj ]]]

• m: dados por [f, [gj , [f, gj ]]], que são iguais aos [gj , [f, [f, gj ]]]

• Am,2: com a forma [gj , [f, [f, gk]]] e [gk, [f, [f, gj ]]]

• Cm,3: com estrutura [gj , [gl, [f, gk]]]

• Am,2: com estrutura [gj , [gj , [f, gk]]] e [gj , [gk, [f, gk]]]

• mp: com estrutura [gj , [gj , [f, gj ]]]

No ponto z = 0, o campo vetorial da dinâmica livre f se anula (f(0) ≡ 0), assim como

todos os elementos com estrutura [f, . . . , [f, gi]], com grau maior ou igual que três, pois

todos os componentes não nulos do campo vetorial são lineares nos momentos. Para

z = 0 apenas um determinado grupo de elemento contribui para a álgebra. Este grupo

é caracterizado por campos vetoriais em que alguns componentes são funções afim nos

momentos. Como comentado no início da demonstração, as dinâmicas dos momentos

angulares, presente em f , são polinômios de segundo grau das coordenadas que repre-

sentam os momentos angulares. Após um número sucessivo de diferenciações parciais,


determinado pelos jacobianos da iteração com colchete de Jacobi-Lie dos elementos de

álgebra, o grau dos polinômios decresce até o zero e, finalmente, o polinômio se anula.

Quando o polinômio possui grau zero, este é dado apenas por um valor independente

da coordenada do momento angular que corresponde a aquela direção. Logo, este valor

nunca se anula em z = 0. Sob uma determinada combinação iterativa dos elementos da

álgebra de acessibilidade, pode-se obter campos vetoriais com elementos não nulos nas

direções, ou componentes, que faltam para completar o número de geradores do espaço

fibrado T ∗Q e, desta forma, atingir a dimensão dimT ∗Q desejada.

Resultados em que uma ou mais juntas não são atuadas, ou seja, são deixadas passivas,

devem ser consideradas com maior atenção. Neste caso, devido a ausência do torque de

junta, não existe o cancelamento do efeito das forças de propulsão nas juntas passivas,

como considerado no segundo caso de parametrização dos torques de juntas adotada na

Seção 4.2.1. Logo, a modelagem do efeito das forças de propulsão nas juntas passivas

deve ser considerada na análise de controlabilidade do sistema multi-articulado. É

possível verificar que o sistema de 2-corpos é acessível, a partir de todo z 6= 0, através

da análise da sub-álgebra obtida pelos colchetes, a partir dos dois campos vetoriais de

propulsão, com até grau três; semelhantemente ao caso acima em que todos as juntas

do sistema são atuadas.

Faz-se importante observar que controlabilidade linear implica na controlabilidade não

linear avaliado através do colchete de Jacobi-Lie. A implicação inversa, em geral, não

é satisfeita. Embora o critério de controlabilidade “não-linear”, verificado pelo cálculo

das distribuições sucessivas em função dos campos vetoriais, seja atendido, o sistema

não é controlável, como mostra a análise de posto pleno, segundo o critério de Kal-

man10, da aproximação linear da dinâmica do sistema, provida pelo truncamento da

expansão em série de Taylor das equações de movimento do sistema na primeira par-

cela (linear). Esta aparente contradição dos resultados de análise pode ser facilmente

desfeita se considerado que a análise de controlabilidade não linear estabelece “novas”

direções possíveis de movimento construídas através de deslocamentos sucessivos - e

infinitesimais se necessário - nas direções que são diretamente atuadas. Ou seja, avalia

o movimento nas direções que não são atuadas em função do movimento nas direções

que são diretamente controladas. Como comentado anteriormente, esta avaliação é re-

alizada em função da comutação de curvas integrais dos campos vetoriais do sistema.10Verificado nos pontos z do espaço de fase que não tornam a aproximação linear do sistema dege-

nerada, ou seja, quando a matriz Df(z) perde estrutura devido ao ponto z escolhido.

5.4. CONCLUSÃO 112

Em contraste, o critério de controlabilidade linear fornece um resultado instantâneo,

independente do movimento; podendo-se associar a idéia de controlabilidade estática.

Como será discutido no próximo capítulo, são necessárias três ou mais entradas de

propulsão de modo a tornar o sistema linearmente controlável na origem do espaço de

fase T ∗Q.

5.4 Conclusão

Nos parágrafos acima, foram revisados alguns critérios de controlabilidade para a aná-

lise de sistemas não-lineares. Alguns destes foram aplicados aos modelos cinemático e

dinâmico do sistema de 2 e 3 corpos. Apresentou-se uma generalização do critério de

acessibilidade para um sistema de N corpos da classe considerada.

113

Capítulo 6

Estabilização e Planejamento de

Trajetórias

Avalia-se, a seguir, as condições e os métodos em que o sistema multi-articulado permite

ser estabilizado. Assim como para a discussão de controlabilidade no capítulo anterior,

a análise das distribuições geradas pelos campos vetoriais do sistema, em especial das

características dos campos vetoriais relativos às entradas, é decisiva na determinação

destas condições e métodos.

Uma estratégia possível para a estabilização do sistema, em torno dos pontos de equi-

líbrio, consiste em aplicar técnicas de estabilização clássicas ao modelo linearizado do

sistema. Neste caso, o projeto do controlador consiste simplesmente em projetar uma

matriz de ganhos1, alocando os pólos do sistema linear em malha fechada, de modo a

tornar o sistema estável e com propriedades dinâmicas bem determinadas.

Com vista à estabilização de versões lineares do modelo do sistema, emprega-se um

método de linearização por realimentação, (Hunt, Su e Meyer, 1983; Isidori, 1995), a

alguns casos do modelo não linear do sistema, como apresentado no Capítulo 4. Nos

casos em que o sistema não é totalmente controlável no espaço de fase, no entanto, outras

técnicas são empregadas para compensar o baixo número de entradas do sistema. Neste

caso, considerou-se a seguir a teoria de análise da estabilidade de Lyapunov para o

projeto do controle de estabilização do sistema (Khalil, 2002).1Várias técnicas são disponíveis para a determinação do ganho de realimentação, como técnica de

controle linear robusto H∞, por exemplo.

6.1. ESTABILIZAÇÃO 114

6.1 Estabilização

A estabilização2 do sistema a um ponto do espaço de fase é desejado em muitas situações

práticas, como o posicionamento do sistema em relação a um referencial inercial, por

exemplo. A definição de estabilização para o corpo rígido, cujo modelo é apresentado

no Apêndice C, é feita abaixo.

Definição 6.1.1 (Estabilização Assintótica do Corpo Rígido). Sejam dados os campos

vetoriais da dinâmica livre f(q, p) e de entrada g1(q) e g2(q) que definem um corpo

rígido com dois propulsores. O ponto (q, p) = (q0, 0) é equilíbrio do sistema, para

qualquer q0 ∈ Q. Estabilizar o sistema f no equilíbrio consiste em regular o sistema em

(q0, 0) utilizando uma lei de realimentação τ = g1u1 + g2u2, para as funções de controle

ui = ui(q, p).

Quando o ponto final z0 corresponde a um ponto de equilíbrio estável, isto é f(q) = 0,

e na ausência de distúrbios externos, então pode-se tomar u(.) ≡ 0 após a estabilização

em z0. Isto pode não ser verdade para um ponto final z0 que não seja um ponto de

equilíbrio ou quando este é um ponto de equilíbrio instável, uma vez que qualquer

perturbação, não modelada na dinâmica nominal f , leva o sistema a deixar a condição

de estabilidade. A definição do problema de estabilização para um sistema de N corpos

é feita a seguir.

Definição 6.1.2 (Estabilização Sistema Multi-Articulado). Sejam dados os campos

vetoriais da dinâmica livre f(q, p) e de entrada g1(q), . . . , gm(q) que definem o modelo

dinâmico do sistema multi-articulado. Seja z0 um ponto no espaço de fase de equilíbrio

do sistema multi-articulado obtido a partir do modelo do sistema. A estabilização

assintótica da dinâmica do sistema consiste em determinar funções de controle u(q, p) ∈U , onde u = (u1, . . . , um) e

τ = g1(q)u1 + . . . + gm(q)um

de maneira que o estado do sistema no espaço de fase seja levado um ponto de equilí-

brio z0 em tempo finito e partindo de um ponto inicial pertencente a uma vizinhança

suficientemente pequena de z0.2Observe que a estabilização é um realizada mediante funções de controle em malha fechada, ao passo

que o procedimento denominado “Planejamento de trajetórias”, discutido posteriormente, é realizado

em malha aberta.

6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 115

Os resultados de estudo e implementação de estratégias de realimentação visando a

estabilização do sistema são apresentados.

6.2 Linearização por Realimentação

A linearização por realimentação representa um método de linearização exata, em con-

traste com a linearização por truncamento da série de Taylor, relativo às equações

dinâmicas do sistema. Quanto a linearização por Taylor, faz-se necessária a realização

de simulações com fim na validação do modelo linear em relação ao não-linear original.

Seja o sistema dinâmico afim nas entradas dado por

z = f(z) +m∑

i=1

gi(z)ui = f(z) + G(z)u

y = h(z) (6.2.1)

A linearização por realimentação consiste da determinação de uma lei de realimentação

do estado da forma

u(z) = α(z) + β(z)v,

onde α e β são operadores obtidos em relação aos campos vetoriais do sistema e v repre-

senta a nova entrada do sistema composto, aliado a uma transformação de coordenadas

Φ(z) de maneira a obter uma versão linear do sistema. Como ambas as operações não

são válidas globalmente, isto é, para todo z ∈ P , a linearização por realimentação é um

procedimento geralmente com validade local, ou seja, válida em uma vizinhança de um

ponto z0. Os operadores α e β são obtidos por, (Isidori, 1995):

α(z) = −A−1(z)b(z)

β(z) = A−1(z)

onde, para o grau de relatividade do sistema r1, . . . , rm, a matriz A é obtida, em

função da derivada direcional L dos campos f e g e da função h, pela expressão

A(z) =

Lg1Lr1−1f h1(z) · · · LgmLr1−1

f h1(z)

Lg1Lr2−1f h1(z) · · · LgmLr2−1

f h2(z)

· · · ... · · ·Lg1L

rm−1f hm(z) · · · LgmLrm−1

f hm(z)

, (6.2.2)


de maneira que esta seja não singular em uma vizinhança de z0; e o vetor coluna b é

dado por

b(z) =

Lr1f h1(z)

Lr2f h2(z)

...

Lrmf hm(z)

(6.2.3)

A transformação de coordenadas ξ = Φ(z) é dada pelo seguinte difeomorfismo

Φ(z) =

L0fh1(z)

Lk−1f h1(z)

...

Lk−1f hi(z)

...

Lrmf hm(z)

, 1 6 k 6 ri, 1 6 i 6 m

obtendo-se uma dinâmica linear do sistema

ξi1 = ξi

2

... =...

ξiri−1 = ξi

ri

ξiri

= bi(ξ) + A(ξ)iu

onde Ai é a i-ésima linha da matriz A.

Em geral o sistema na forma linear, escrito nas novas coordenadas, fornece uma de-

composição da dinâmica controlável e da dinâmica zero, usualmente representada por

η = fcn(ξ, η), (Isidori, 1995). A dinâmica zero está relacionada com os zeros de trans-

missão da aproximação linear do modelo não-linear do sistema. Entretanto, esta não

será importante para a análise de estabilização do sistema em consideração.

Observe que, aplicando (6.2.2) e (6.2.3) nas equações acima sob as novas coordenadas,


obtém-se o sistema linear e controlável ξ = Aξξ + Bξv, onde, para j = 1, . . . , m, tem-se

Aξ = diag(Aj), Aj =

0 1 0 · · · 0

0 0 1... 0

...... · · · · · · ...

0 0 0 · · · 1

0 0 0 · · · 0

e

Bξ = diag(bj), bj =

0

0...

0

1

Para estabilizar o sistema linearizado, pode-se impor uma realimentação do estado ξ,

segundo v = Kξ, onde K é uma matriz de ganhos, através de métodos de controle

lineares como H∞ ou Linear Quadrático (LQ), por exemplo, ou ainda por técnicas de

controle clássicas.

Definição 6.2.1. Sejam as distribuições Gi determinadas pelos campos vetoriais do

sistema através da expressão

Gi = spangj , . . . , adlfgj , j = 1, . . . , m, 0 6 l 6 i

onde o operador ad é definido na Seção A.1.

Teorema 6.2.1 (Linearização por Realimentação: (Isidori, 1995)). Seja o sistema dinâ-

mico (6.2.1), onde dim z = n e dimh(z) = dim g(z), ou seja, os espaços de entradas u e

saídas y do sistema possuem mesma dimensão3. (6.2.1) é linearizável por realimentação

em uma vizinhança do ponto z0 se e somente se

• as distribuições Gi, para 0 6 i 6 n − 1, possuírem dimensão constante em uma

vizinhança de z0;

• a distribuição Gn−1 tiver dimensão n;

• as distribuições Gi, para 0 6 i 6 n− 2, forem involutivas.3Sistemas quadrados.


Note que este corresponde a um resultado local, ou seja, válido apenas em uma vizi-

nhança de um ponto z0 do espaço de estados.

Outros resultados prevêem a linearização entrada-estado do sistema, ver as referências

(Charlet, Lévine e Marino, 1989), (Charlet, Lévine e Marino, 1991) e (Krener, 1999),

de certa forma abrangendo a limitação de considerar sistemas quadrados para sistemas

com número de entradas e saídas diferentes, se tomadas as saídas equivalentes ao estado.

Determinou-se, entretanto, que as distribuições G1 dos campos vetoriais dos sistemas de

2 e 3 corpos, com apenas duas entradas de propulsão, não são involutivos. Conseqüen-

temente, nestes casos, não é possível verificar as condições que tornam o sistema lineari-

zável por realimentação. Em geral, é possível mostrar que todo sistema multi-articulado

da classe considerada e com apenas duas entradas de propulsão possui distribuições não

involutivas.

Proposição 6.2.2. Seja o sistema multi-articulado dado, na forma afim, por (5.3.2)

com duas entradas de propulsão. Então existe pelo menos uma distribuição Gi não

involutiva.

Demonstração. Apresenta-se primeiramente um resultado que será útil na seqüência.

Uma distribuição D(q) ⊂ TqQ é involutiva, para todo q ∈ Q, se seguinte igualdade for

verdadeira

dim(spanX1(q), . . . , Xd(q)) = dim(spanX1(q), . . . , Xd(q), [Xi, Xj ](q)) (6.2.4)

para 1 6 i, j 6 d e onde X1, . . . , Xd ∈ D e dimD = d.

Para provar a proposição faz-se importante observar que ela é conseqüência direta da

Proposição 5.3.5, uma vez que a acessibilidade do sistema nunca é alcançada apenas

com os colchetes de primeiro ou segundo graus.

A distribuição G0 sempre será involutiva uma vez que contém apenas os campos vetoriais

da entrada gj e, do Lema 5.3.6, os colchetes de Jacobi-Lie dos gj sempre são nulos, ou

seja, não contribuem com novas direções.

Os elementos que compõe a álgebra G1 são da forma [f, gj ]. Para q 6= 0, por exemplo, a

distribuição G1 possui dimensão máxima igual a 2m < n, ou seja, os colchetes de grau

dois de G1 não possui a mesma dimensão do espaço de fase do sistema. No entanto, a

partir da análise da álgebra de acessibilidade da Proposição 5.3.5, apenas com a álgebra


2-corpos (n = 8) mp = 2 (m = 3): sub-atuado dimG0 = 3, dimG1 = 6

3-corpos (n = 12) mp = 2 (m = 4): sub-atuado dimG0 = 4, dimG1 = 8

mp = 3 (m = 5): atuado dimG0 = 5, dimG1 = 10

mp = 2 (m = 5): sub-atuado dimG0 = 5, dimG1 = 10

4-corpos (n = 12) mp = 3 (m = 6): atuado dimG0 = 6, dimG1 = 12

mp = 4 (m = 7): sobre-atuado dimG0 = 6, dimG1 = 12

mp = 2 (m = 6): sub-atuado dimG0 = 6, dimG1 = 12

5-corpos (n = 14) mp = 3 (m = 7): atuado dimG0 = 7, dimG1 = 14



Tabela 6.1: Dimensão das primeiras distribuições Gi dos sistemas com N 6 5, para

z 6= 0. As atribuições sub-atuado, atuado e sobre-atuado designam, respectivamente,

sistemas com número menor, igual e maior de entradas que a dimensão do espaço de

configuração Q correspondente.

dos colchetes de grau menor e igual a três é possível verificar esta condição. Logo, é

possível gerar as direções restantes do espaço de fase com os elementos de G1, gerando

produtos da forma [gk, [f, gj ]], k 6= j. Logo, de (6.2.4), a distribuição G1 não é involutiva.

Para z = 0, a argumentação para a não involutividade de G2 é análoga a acima.

Logo, o sistema multi-articulado proposto com apenas duas entradas de propulsão nunca

é linearizável por realimentação.

Exemplo 6.2.3. Resume-se na tabela abaixo as distribuições G0 e G1 para alguns sis-

temas e casos de entradas de propulsão. O espaço de base B é totalmente atuado por

torques nas juntas.

Os sistemas com N > 3 com três ou mais entradas de propulsão, entretanto, são sempre

linearizáveis por realimentação estática, pois G0, dimG0 < n, é sempre involutiva e Gi

i > 1 são sempre involutivas, dado que dimGi = n.

Exemplo 6.2.4. Apresenta-se a seguir um resultado de estabilização do sistema de 3-

corpos com três entradas de propulsão. O sistema possui m = 5 entradas e n = 10

estados.

A função de saída escolhida é dada apenas pela configuração q ∈ Q por h(z) = q, ou

seja, h(q) = (rx, ry, θcm, φ1, φ2). Com isto, o sistema possui grau de relatividade ri = 2,


para i = 1, . . . , 5. A transformação de coordenadas para obter ξ através de Φ é realizada

segundo

Φ(z) =

h1(q)

Lfh1(q)

h2(q)

Lfh2(q)

h3(q)

Lfh3(q)

h4(q)

Lfh4(q)

h5(q)

Lfh5(q)

=

rx

vx/m∗

ry

vx/m∗

θcm

Lfh3(q)

φ1

Lfh4(q)

φ2

Lfh5(q)

Empregando-se uma realimentação do estado ξ, projetou-se uma matriz de ganhos K de

maneira que os pólos do sistema (Aξ, Bξ) em malha fechada sejam estáveis e localizados

no plano complexo em

−1.0± 1.0i

−1.0± 1.0i

−1.4± 1.0i

−1.5± 1.0i

−1.5± 1.0i

As Figuras 6.1 e 6.2 mostram os resultados de estabilização do sistema de 3-corpos.

Uma possível solução para estabilizar sistemas com menos de três entradas de propul-

são consiste em adicionar integradores ao sistema, obtendo-se um sistema estendido de

maneira que as distribuições Gi geradas, a partir deste sistema estendido, sejam involu-

tivas. O procedimento que lineariza de forma exata o sistema, empregando este método

acima, é conhecido como linearização por realimentação dinâmica, em contraste com

o método anterior utilizado acima, em que a linearização por realimentação é estática.

A designação dos termos “estática” e “dinâmica”, para os métodos de linearização por

realimentação, referem-se ao fato dos compensadores obtidos pelo método dinâmico pos-

suírem uma dinâmica interna e regida por equações diferenciais de estados internos. Em

contraste, nos compensadores obtidos pelo método estático, a realimentação é realizada

por uma equação algébrica, sem dinâmica interna.


0 1 2 3 4 5 6−10.05

−10

−9.95

−9.9

−9.85

tempo (s)

coor

dena

da x

(m

) xyθ

(a) Deslocamento do centro do massa rx.

0 1 2 3 4 5 6−5.15

−5.1

−5.05

−5

−4.95

tempo (s)

coor

dena

da y

(m

) xyθ

(b) Deslocamento do centro do ry.

0 1 2 3 4 5 61.95

2

2.05

2.1

time (s)

com

pone

nte

φ 1 (ra

d)

φ1

φ2

pφ1

pφ2

(c) Trajetória do ângulo de junta φ1.

0 1 2 3 4 5 6−2.1

−2.05

−2

−1.95

tempo (s)

coor

dena

das

φ 2 (ra

d)φ

1φ

2pφ

1pφ

2

(d) Trajetória do ângulo de junta φ2.

0 1 2 3 4 5 6−1.58

−1.575

−1.57

−1.565

−1.56

−1.555

−1.55

−1.545

−1.54

−1.535

−1.53

tempo (s)

coor

dena

da θ

(ra

d)

xyθ

(e) Trajetória da orientação θcm.

Figura 6.1: Resultados da estabilização da configuração no ponto

(−9.90,−5.10,−1.55, 2.00, −2.00) do sistema de 3-corpos, através de linearização

por realimentação.


0 1 2 3 4 5 6−0.25

−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

0.25

tempo (s)

px

py

pθp

x

pθ

py

(a) Trajetórias dos momentos da fibra px, py, pθcm .

0 1 2 3 4 5 6−0.1

−0.08

−0.06

−0.04

−0.02

0

0.02

0.04

0.06

0.08

0.1

tempo (s)

coor

dena

das

p φ 1, pφ 2 (

mK

g2 /s)

φ1

φ2

pφ1

pφ2

(b) Trajetórias dos momentos do espaço de base pφ1 , pφ2 .

Figura 6.2: Resultados da estabilização do momento do sistema de 3-corpos, através de

linearização por realimentação.


6.2.1 Linearização por Realimentação Dinâmica

Sabe-se, como comentado em Charlet et al. (1991), que o corpo rígido não é linearizável

por realimentação estática. Isto se deve à qualidade das distribuições geradas pelos

campos vetoriais do sistema de controle do corpo rígido não serem involutivas. A versão

plana do mesmo sistema, assim como o modelo do uniciclo no plano (Respondek, 2002),

igualmente não pode ser linearizado por uma lei de realimentação estática. Uma maneira

de contornar esta limitação destes sistemas, de maneira a permitir a estabilização do

sistema via linearização por realimentação, constitui na adição de integradores à função

de realimentação (Charlet et al., 1989; Krener, 1999).

Em (Battilotti e Califano, 2004) encontra-se um algoritmo para determinar os índices µ

tais que o sistema seja linearizável por prolongamentos. A aplicação do mesmo mostrou-

se, no entanto, demasiadamente complexa com a classe de sistemas em estudo; inclusive

com o exemplo de sistema mais simples com apenas 2-corpos.

Considere um sistema controlável na forma afim

z = f(z) +m∑

i=1

gi(z)ui = f(z) + G(z)u (6.2.5)

Definem-se as distribuições em relação ao sistema afim acima

∆0 = spangk : µk = 0∆i + 1 = ∆i + adf∆i + spangk : µk = i + 1, i ≥ 0

Note, pela definição, que valem as relações ∆0 ⊂ ∆1 ⊂ · · · ⊂ ∆i · · · .

Usando a notação de diferenciação de ordem genérica, em que u(µ) corresponde a deri-

vada da função dµu/dtµ, o compensador com realimentação dinâmica aqui considerado

é da forma, (Charlet et al., 1991):

u(µ1)1...

u(µm)m

= α(z, ζ) + β(z, ζ)

v1

...

v′m

onde ζ representa um estado interno ao compensador e v(.), as novas entradas do sistema

em malha fechada. O sistema em malha fechada fica, então, definido pela dinâmica

z = f(z) + G(z, ζ)α(z, ζ) + G(z, ζ)β(z, ζ)v


onde a nova entrada é dada por v ∈ Rm′ . O compensador acima pode ser realizado pela

integração “pura” do sinal de entrada v, conforme (Battilotti e Califano, 2004):

uj = ζj(1), (6.2.6)

ζj = Ajζj + Bjvj , j = 1, . . . , m (6.2.7)

onde

Aj =

[0(µj−1)×1 I(µj−1)

0 01×(µj−1)

]

µj×µj

Bj =

[0(µj−1)×1

1

]

µj×1

onde ζj ∈ Rµj . Em (6.2.6), faz-se uj = vj quando µj = 0.4 O sistema em malha fechada

fica, então, definido pela seguinte dinâmica

z = f(z) + G(z, ζ)α(z, ζ) + G(z, ζ)β(z, ζ)v (6.2.8)

ζ = Aζ + Bv (6.2.9)

com entrada v ∈ Rm′ . Quando m′ = m, pode-se escolher a saída do sistema como u.

As condições suficientes para linearização local por realimentação dinâmica devem-se

do seguinte resultado.

Teorema 6.2.5 (Linearização por Realimentação Dinâmica - Suficiência (Charlet et al.,

1991)). Se existirem inteiros 0 ≤ µ1 ≤ · · · ≤ µm, tais que, em uma vizinhança de x0,

• ∆i sejam involutivos e dimensão constante para 0 ≤ i ≤ n + µm − 1

• dim(∆n+µm−1) = n

• [gs, ∆i] ⊂ ∆i+1, ∀s tal que µs ≥ 1 e ∀i, 0 ≤ i ≤ n + µm − 1,

então (6.2.5) é localmente linearizável por realimentação dinâmica com indices de pro-

longamento µ1, . . . , µm.

Observação 6.2.1. O Teorema acima diz que se o sistema é acessível, se as distribuições

∆s são involutivas - que também representam a condições necessárias - e se [gs, ∆i] ⊂∆i+1, então o sistema é dinamicamente linearizável por realimentação.

4Em um sistema linearizável por realimentação dinâmica pelo método de linearização por reali-

mentação com prolongamentos, pelo menos um dos índices de prolongamentos deve ser nulo, ou seja,

0 = µ1 ≤ µ2 ≤ · · · ≤ µm.


6.2.2 O Sistema Multi-Articulado

Considere um exemplo de aplicação do método acima ao sistema de 2-corpos.

Exemplo 6.2.6. Considere o sistema de 2-corpos onde o número de estados é dado por

n = 8 e o número de entradas m = 3. Aplica-se o Teorema 6.2.5 acima ao modelo do

sistema de 2-corpos.

Após algumas iterações de tentativa e erro, obteve-se os seguintes índices de prolonga-

mento µ = [µ1, µ2, µ3] = [0, 4, 4] para o sistema de 2-corpos. Observe que, para µ dado

acima, e de acordo com o Teorema (6.2.5), é necessário verificar as distribuições ∆i,

para 0 ≤ i ≤ n + µm − 1 = 11. Vale mencionar que os sistemas multi-corpos em geral,

do qual a classe de sistemas aqui proposta faz parte, são caracterizados por equações de

movimento racionais, isto é, por funções das variáveis de estado no denominador de

frações, originários do acoplamento do tensor de inércia. Isto representa um entrave

de considerável dificuldade no cálculo iterativo dos colchetes de Lie, uma vez que podem

resultar no aumento progressivo da complexidade das funções componentes dos campos

vetoriais. Logo, calcular distribuições de colchetes de Lie de ordem elevadas de certos

sistemas, pode representar uma tarefa quase impraticável.

No entanto, no decurso das primeiras iterações, pôde-se observar que nem todas as dis-

tribuições precisaram ser verificadas. No que diz respeito às duas primeiras condições

suficientes do Teorema (6.2.5), observou-se que foi necessária a verificação das distribui-

ções até, e incluindo, ∆5, uma vez que dim∆i = n = 8, para i ≥ 5, sendo involutivas5.

Isto permite evitar o cálculo de colchetes de Lie com campos vetoriais de ordem elevada,

isto é, maiores que os contidos em ∆5, pois não agregam direções alcançáveis adicionais

no espaço cotangente T ∗q Q, sendo, portanto, desnecessárias.

Para atender a terceira condição suficiente do Teorema (6.2.5), assim como nos dois

primeiros, não se faz necessário calcular todas as relações [gs, ∆i] ⊂ ∆i+1, para 0 ≤i ≤ n + µm − 1. Pode-se observar, como comentado em (Charlet et al., 1991), que as

primeira e terceira condições são parcialmente redundantes.

Logo, é suficiente verificar apenas as condições [gj , ∆i] ⊂ ∆i+1, tal que µj > i + 1 e5Uma distribuição regular D ⊂ TQ ∼ Rn tal que dim D = n é sempre involutiva, pois o colchete de

Lie dos campos vetoriais que a geram nunca contribuirão para alterar a dimensão de D.


i ≥ 0. Ou seja,

[gj ,∆0] ⊂ ∆1

[gj ,∆1] ⊂ ∆2

[gj ,∆2] ⊂ ∆3

para j = 2, 3 apenas, uma vez que µ1 = 0. Utilizando os índices de prolongamentos

dados por µ = [0, 4, 4], a lei de realimentação dinâmica é dada por

u1 = v1,

u2

ζ2(2)

ζ2(3)

ζ2(4)

=

ζ2(1)

ζ2(3)

ζ2(4)

v2

,

u3

ζ3(2)

ζ3(3)

ζ3(4)

=

ζ3(1)

ζ3(3)

ζ3(4)

v3

Neste caso a saída do sistema é dada por u = (v1, ζ2(1), ζ3(1))T .

Note que neste caso, o difeomorfismo ϕ, relativo a transformação de coordenadas de z

para z′, é constante e dado pela matriz identidade.

Não obstante a verificação de atendimento do sistemas multi-corpos para com todos os

ítens do Teorema 6.2.5, uma condição necessária para a linearização por realimentação

dinâmica consiste da controlabilidade linear, na origem, ou seja, a aproximação linear

(por Taylor) do sistema afim deve ser controlável na origem. As versões lineares dos

modelos do corpo rígido e do sistema multi-corpos com duas entradas de propulsão não

são controláveis em z 6= 0, como pode-se facilmente mostrar pelo critério de Kalman, e

na origem, pois rende um jacobiano degenerado, o que qualifica-os como sub-atuados.

Logo, apesar de ser possível obter modelos lineares dos sistema por realimentação dinâ-

mica, estes modelos lineares não são linearmente controláveis e, conseqüentemente, não

estabilizáveis a um ponto de equilíbrio por uma realimentação suave.

Embora seja possível mostrar que o sistema multi-corpos é controlável, criando-se “no-

vas” direções - através dos colchetes dos campos vetoriais do sistema segundo o critério

STLC - até gerar todo o espaço de fase em um ponto de equilíbrio do sistema, a con-

trolabilidade6 determinada pelas parcelas da dinâmica do sistema até a primeira ordem

(linear) ditam até que ponto as entradas podem influenciar a dinâmica do mesmo.

Portanto, sistemas não (linearmente) controláveis não podem ser assintoticamente (ou

suavemente) estabilizados.6Realizada nos pontos z do espaço de fase que não tornam a aproximação linear do sistema degene-

rada.


A estabilização por realimentação não-contínua ou adição de mais uma entrada ao sis-

tema, que não gere componentes no espaço de fase que são linearmente dependentes em

relação as outras entradas, são possíveis soluções.

Pode-se mostrar que o sistema multi-corpos é controlável em um sub-espaço do espaço

de fase que não contém a origem; pois a origem implica na origem do espaço de base B e

das coordenadas φ = 0. Estas representam, como definido acima, um sistema na forma

de uma linha reta. Em princípio seria possível linearizar o sistema por realimentação em

vizinhanças dos pontos deste sub-espaço. Observe, no entanto, que não seria possível

estabilizá-lo em torno da origem, ou seja, partindo ou chegando ao repouso uma vez

que as distribuições se anulam com momentos e configuração nulos. Propõe-se, uma

transformação de variáveis para contornar o problema.

Exemplo 6.2.7. Considere o sistema de 3-corpos com três entradas de propulsão e

com as duas juntas ativas e cujos corpos estão disposto na forma de um triângulo.

Quando todos os corpos são iguais o sistema é simétrico e nesta disposição forma um

triângulo eqüilátero. Neste caso, o sistema não é linearmente controlável pois, apesar

dos dois torques de junta, as três entradas de propulsão não produzem torque em relação

ao centro de massa, dado que as direções de ação das mesmas passam pelo centro de

massa. Note que isto ocorre porque, neste caso, as três forças linearmente dependentes

entre si. Entretanto, o sistema nesta disposição é linearmente controlável nas direções

lineares, o que permite linearizá-lo dinamicamente, pelo método discutido acima por

exemplo, e estabilizá-lo na origem se o mesmo for operado como corpo rígido. Como

os ângulos de junta não são nulos nesta configuração, recorre-se a uma transformação

de coordenadas. Definindo-se esta formação como a nova “origem” do espaço de base

B por uma transformação de coordenadas estática que consiste apenas em reposicionar

a origem no espaço de base B, é possível estabilizar o sistema na origem de Q. A

transformação proposta é dada por

φ′ = φ + 2π/3

Note que, por ser estática, e exceto pela modificação das coordenadas originais φ do

espaço de base B, esta transformação mantém inalteradas as expressões para φ e pφ.

Exemplo 6.2.8. Para um sistema de N -corpos, é sempre possível arranjá-lo na forma

de um polígono convexo de N lados; que se torna regular quando o mesmo for composto

por corpos idênticos. Neste caso particular, as direções das forças de propulsão passam

pelo centro de massa do sistema, ou polígono. Se o número de entradas de propulsão

for mp > 3, ou seja, se o sistema conta com ao menos três entradas de propulsão cujos

6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 128

campos vetoriais correspondentes são linearmente independentes, o sistema é controlável

na origem a menos de uma transformação das coordenadas do espaço de base. Excluem-

se do conjunto de campos vetoriais da entrada L.I. os campos vetoriais dados quando o

sistema forma um polígono convexo regular, por exemplo.

6.3 Controle de Sistemas Sub-atuados

Byrnes e Isidori (1991) mostraram que veículos sub-atuados e na ausência de campos

restaurativos, gravitacional e empuxo, por exemplo, não podem ser assintoticamente

estabilizados por uma lei de realimentação do estado de classe C1. Mostrou-se em

(Pettersen e Egeland, 1996) que para campos restaurativos, como os devidos à gravidade

e ao empuxo hidrostático, em geral não é possível estabilizar sistema sub-atuados com

realimentações contínuas ou descontínuas. Nestes casos, a estabilização assintótica é

possível através de uma realimentação do estado cujos termos, da lei de realimentação,

são funções explícitas do tempo.

Como mencionado anteriormente, o presente estudo considera um sistema livre da ação

de campos restaurativos. Por este motivo, uma realimentação contínua ou descontínua

é suficiente para a estabilização assintótica do sistema, como em (Fantoni et al., 1999).

Neste caso, a análise de convergência das leis de controle obtidas seguem da teoria de

estabilidade de Lyapunov (Khalil, 2002). Semelhantemente não é possível estabilizar su-

avemente sistemas não-holonômicos a um ponto de equilíbrio através uma realimentação

suave (Bloch, Reyhanoglu e McClamroch, 1992).

Faz-se necessário a apresentação de alguns resultados para a discussão que segue.

Teorema 6.3.1 (Método direto de Lyapunov (Khalil, 2002)). Seja z = 0 um ponto de

equilíbrio do sistema (6.2.5). Seja V : Rn → R uma função de classe C1 tal que

Definida positiva: V (z) > 0, ∀z 6= 0 e V (0) = 0

Radialmente não-limitada: ‖z‖ → ∞⇒ V (z) →∞

Definida negativa: V (z) < 0, ∀z 6= 0

então z = 0 é global e assintoticamente estável.


A função V , como definida acima, é denominada função de Lyapunov. Quando não é

possível determinar se V é definida e negativa, faz-se uso do Princípio de Invariância de

LaSalle:

Teorema 6.3.2 (Princípio de Invariância de LaSalle). Seja z = 0 um ponto de equilíbrio

do sistema (6.2.5) e D ⊂ Rn um domínio contendo z = 0. Seja V : [0,∞[×D → R uma

função C1, definida e positiva em D. Seja S = z ∈ D | V (z) = 0 e suponha que apenas

a solução trivial z(t) ≡ 0 esteja contida em S. Então, a origem é assintoticamente

estável.

Para sistemas não autônomos, ou seja, variantes no tempo, tem-se o seguinte resultado.

Teorema 6.3.3 (Método direto: sistemas não autônomos (Khalil, 2002)). Seja z = 0

um ponto de equilíbrio do sistema (6.2.5) e D ⊂ Rn um domínio contendo z = 0. Seja

V : [0,∞[×D → R uma função de classe C1 tal que

k1‖z‖a 6 V (t, z) 6 k2‖z‖a (6.3.1)∂V

∂t+

∂V

∂zf(t, z) 6 −k3‖z‖a (6.3.2)

para ∀t > 0 e ∀z ∈ D, onde k1, k2, k3 e a são constantes positivas. Então, z = 0 é

exponencialmente estável. Se as hipóteses são verificadas globalmente, então z = 0 é

global e exponencialmente estável.

A utilidade do Teorema 6.3.3, devido a estabilidade de Lyapunov para sistemas não-

autônomos, será justificada quando a função de Lyapunov for variante no tempo, por

ocasião dos sinais de referência das equações cinemáticas do sistema, como mostrado no

final desta seção.

Exemplo 6.3.4 ((Fantoni et al., 1999)). Seja um hovercraft definido por corpo rígido

no plano sob ação de uma entrada de propulsão e um torque no centro de massa. A

transformação de coordenadas de velocidade entre os referenciais móvel e inercial segue

da expressão

rcm = RθcmvB ⇒ rx = cos(θcm)u− sin(θcm)v

ry = sin(θcm)u + cos(θcm)v

onde vB = (u, v) é a velocidade no referencial móvel e r = θcm. Define-se um difeomor-

fismo global determinando por coordenadas fictícias da posição do sistema em relação


ao referencial móvel:

z = RTθcm

rcm ⇒ z1 = cos(θcm)rx + sin(θcm)ry

z2 = − sin(θcm)rx + cos(θcm)ry

Diferenciando-se no tempo as duas coordenadas z1, z2 acima, obtém-se

z1 = u + z2r

z2 = v − z1r

O modelo de velocidade do hovercraft, dado por um corpo rígido, é dado por

u = vr + τu (6.3.3)

v = −ur (6.3.4)

r = τr (6.3.5)

O componente da velocidade v do corpo rígido não é diretamente controlado. Deseja-se

estabilizar a posição do sistema rcm em relação ao referencial inercial. A orientação do

sistema θcm será deixada “livre” e sua evolução no tempo será determinada pela lei de

controle. Como proposto em (Fantoni et al., 1999), é possível mostrar a estabilização

do sistema acima mediante a função de Lyapunov

V =12(u2 + v2 + (r − v)2) (6.3.6)

e as funções de controle que estabilizam o sistema na origem são dadas por

τu = −kuu

τr = −ur − kr(r − v)

A variação temporal de (6.3.6) fornece

V = uu + vv + (r − v)(r − v) (6.3.7)

6.3.1 O Sistema de 2-Corpos

Sem perda de generalidade, considere o sistema de equações, com massa e inércia unitá-

rios, que modelam a dinâmica do sistema de 2-corpos em relação ao referencial móvel:

u = vr + τu (6.3.8)

v = −ur − τv (6.3.9)

r = τr (6.3.10)


onde as entradas τu, τv, τr para cada uma das três direções acima são dadas por

τu = cos(φ/2)(f1 + f2)

τv = 2 sin(φ/2)/(L(cos(φ) + 1))τr

τr = L(cos(φ) + 1)/2(f2 − f1)

onde o ângulo de junta é representado por φ. Note que r é acionado diretamente e

que τr possui influência direta na dinâmica v apenas quando φ 6= 0, ou seja, quando o

sistema degenera-se no corpo rígido em (Fantoni et al., 1999). Observe que é possível

estabilizar a origem de ambas as direções u e v através de τu e todas as direções (u, v, r)

com τr, como indicam análises segundo o critério de controlabilidade de Kalman.

Note também que é possível estabilizar (6.3.8)-(6.3.10) na origem através de uma lei de

realimentação linear simples, sem, no entanto, a convergência de r a zero.

Objetiva-se extender o resultado de estabilização do corpo rígido acima para o sistema

de 2-corpos de maneira que o primeiro represente um caso particular do segundo. Para

este propósito, entretanto, as tentativas de manter a estrutura da função em (6.3.6) para

análise de Lyapunov, da Proposição 6.3.1, não foram válidas.7 O projeto de estabilização

do modelo pode partir da adição de um integrador com a função de desacoplamento entre

τr e a dinâmica v. Neste caso, adotando-se uma variável auxiliar s cuja taxa temporal

será usada para designar a entrada τr, assim como r.8 O sistema dinâmico passa a ter

a seguinte forma:

u = vr + τu

v = −ur − C(φ)s

s = τr

r = τr

7Observe que, embora seja possível mostrar que a velocidade sistema é estabilizável através da função

dada em (6.3.6) e das leis de controle

τu = −kuu− C(φ)r[(2v − r)− kr/u]

τr = −ur − kr(r − v)

estas não correspondem a uma solução cabível uma vez que τu é racional em u e representa uma divisão

por 0 quando u << 0 e este converge mais rapidamente para 0 do que v ou r. Ademais, a lei de controle

τr = −ur− kr(r− v)u2 fornece V com uma estrutura da forma −fcnu2. Esta estrutura não é desejável

uma vez que u = 0 pode render uma estabilização de v e r em pontos diferentes da origem.8Embora s e r representam a mesma grandeza, adota-se variáveis distintas apenas com a finalidade

de facilitar os cálculos intermediários. Ao final destes, toma-se s ≡ r.


onde C(φ) = 2 sin(φ/2)/(L(cos(φ) + 1)). Adotando-se uma função de Lyapunov, modi-

ficada em relação ao caso anterior, e igual a

V =12(u2 + v2 + (r − v)2 + (s− v)2),

tem-se, para as funções de entrada

τu = −kuu

τr = −ur − kr(r − v)− 32C(φ)s

que a taxa temporal de V é definida negativa e, fazendo a substituição s ≡ r, dada por

V = −kuu2 − kr(r − v)− C(φ)r2

Logo, pela Proposição 6.3.1 e pelo Princípio de LaSalle, o único ponto possível para

V (z) = 0 é z = 0 e as leis de controle obtidas estabilizam global e assintoticamente o

subsistema de velocidade do sistema de 2-corpos. A validade global do controle deve-se

a característica de V ser radialmente não-limitada (Khalil, 2002). As leis de controle

acima são válidas apenas nos intervalos em que f não muda de sinal, como pode-se

observar a partir da última expressão. Note que o resultado, para o sistema de dois

corpos, obtido acima generaliza o obtido para o corpo rígido em (Fantoni et al., 1999).

A Figura 6.3 mostra a convergência do sistema para a origem sob ação das leis de

controle obtidas. O projeto acima é válido quando a forma do sistema é mantida fixa;

ou seja, para o ângulo φ estático. Pode-se, no entanto, obter uma realimentação em que

φ é dinamicamente alterado para melhorar o desempenho de estabilização do sistema.

Considerando a dinâmica da junta, tem-se

u = vr + τu

v = −ur − C(φ)r

r = τr

pφ = Xpφ+ T

onde Xpφé a dinâmica do momento de junta e a entrada T corresponde ao torque da

junta que atua diretamente na variação do ângulo φ. Note que, de acordo com a hipótese

de parametrização adotada na Seção 4.2.1, T atua exclusivamente na dinâmica de φ.

Deseja-se avaliar a possibilidade de se variar φ de forma a melhorar o desempenho do

sistema. Adotando-se, portanto, uma curva de referência φref ao qual φ deve rastrear,

define-se a seguinte função de Lyapunov

Vφ(φ, pφ) =12(φ− φref )2 +

12(pφ − pφref

)2


0 5 10 15 20 25 30 35 40 45 500

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

tempo (s)

Vel

ocid

ades

(u,

v,r)

uvr

u

v

r

Figura 6.3: Estabilização da velocidade do sistema de 2-corpos.


Escolhe-se a entrada T de maneira a cancelar a dinâmica de junta Xpφ:

T = −Xpφ−Kφ(φ− φref )−Kpφ

(pφ − pφref) + pφref

Tomando eφ = φ − φref e epφ= pφ − pφref

, a dinâmica de junta em malha fechada é

equivalente a

eφ = fcn(epφ)

epφ= −Kφeφ −Kpφ

epφ

Sem maiores detalhamentos aqui, mostra-se que a dinâmica do erro acima converge

para zero pelos argumentos de passivação por realimentação, (Khalil, 2002). Apresenta-

se abaixo um exemplo de como φref pode ser escolhido para melhorar o desempenho do

sistema.

Exemplo 6.3.5. Deseja-se levar o sistema de 2-corpos em repouso de uma configuração

inicial, no instante t0, à origem do referencial inercial em tempo t1 − t0.

Relembrando as equações de movimento do centro de massa do sistema, tem-se

px = − sin(θcm − φ/2)f1 − sin(θcm + φ/2)f2 (6.3.11)

py = cos(θcm − φ/2)f1 + cos(θcm + φ/2)f2 (6.3.12)

Para descrever um movimento horizontal, implica-se ter py = 0 e px > 0, se o mesmo

ocorre para a direita, ou px < 0, para um movimento à esquerda.

Especificando-se t0 e t1, construiu-se curvas para as coordenadas θcm, φ através de

equações algébricas de segundo grau. Das equações acima, observa-se que, para uma

orientação inicial θcm(t0) qualquer, o sistema é igualmente controlável em ambas as

direções de translação com φ = π/2. Tomando-se a derivada da equação do momento

pθcm = 2θcm(I + K cos(φ)), com relação ao tempo, tem-se que

pθcm =2L

(1 + cos(φ))(f2 − f1) (6.3.13)

Resolvendo a expressão acima para f2, substitui-se o resultado em (6.3.12) para py = 0

obtendo-se

f1 =−2 cos(θcm + φ/2)

L(1 + cos(φ))(cos(θcm − φ/2) + cos(θcm + φ/2))pθcm

A entrada f2 pode ser determinada substituindo-se a curva encontrada para f1 acima

na equação do momento (6.3.13). Como as curvas θcm(t) e φ(t) foram construídas


de maneira que o sistema se desloque para a direita, pode-se verificar que a expressão

(6.3.11) é sempre positiva. As Figuras 6.4 e 6.5 ilustra o movimento do sistema obtido.

Note, portanto, que é possível planejar uma trajetória em função de φ de forma a me-

lhorar o desempenho de estabilização: neste caso um funcional é otimizado para menor

trajetória.

O projeto da estabilização cinemática segue igualmente de (Fantoni et al., 1999). A

síntese do controle de estabilização da posição do centro de massa do sistema é feita

com base nas expressões da cinemática

z1 = u + z2r

z2 = v − z1r

φ = pφ/Iφ

para entradas u, r e pφ, onde Iφ é uma constante para cada φ. Pelo fato da controlabi-

lidade na direção v ser deficitária, impõe-se a convergência do movimento vertical para

a origem, equilíbrio do sistema cinemático, segundo a expressão

v + z2 := −(v + z2)

A expressão acima estabelece que a composição da velocidade v e a coordenada de

deslocamento correspondente z2, definidas no referencial móvel, possuem variação com

taxa negativa. A partir da expressão acima e das equações cinemáticas, obtém-se as

seguintes leis de controle para as velocidades de translação u e rotação r

u = −z1 +12

√v2 + z2

2 (6.3.14)

r =4v + 2z2√

v2 + z22 + 2C

(6.3.15)

As expressões acima são variantes no tempo e representam sinais de referência para a

malha de controle da dinâmica da velocidade do sistema. Ou seja, a malha de controle

do sub-sistema cinemático fornece os sinais de referência do sub-sistema dinâmico.

Emprega-se a função de Lyapunov para o sub-sistema cinemático Vc

Vc(z) =12(z2

1 + z21) +

14(v + z2)2 ⇒ Vc(z) = z1u− 1

2(v2 + z2

2)

Substituindo as leis de controle (6.3.14) e (6.3.15) em V e V , segue que

Vc(z) = −z21 −

12(v2 + z2

2) +12z1

√v2 + z2

2


0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−2

−1.5

−1

−0.5

0

0.5

1

Angulos θ1(t), θ

2(t) & θ

cm(t) projetados

tempo (s)

θ1

θ2

θcm

θ2 θ

cm

θ1

(a) Projeto das curvas de orientação θcm(t) e (θ1(t), θ2(t)).

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 18

9

10

11

12

13

14

Propulsao f1(t) projetada

tempo (s)0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

−13

−12

−11

−10

−9

−8

−7

−6

−5

−4

−3

Propulsao f2(t) projetada

tempo (s)

(b) Forças de propulsão (f1, f2)(t) projetadas.

Figura 6.4: Planejamento de trajetória do sistema de 2-corpos.


0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−10

−5

0

5

tempo (s)

rx

ry

θ

θcm

ry

rx

(a) Deslocamento do centro de massa no plano rx − ry.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−15

−10

−5

0

5

10

15

tempo (s)

px

py

pθ

px

py

θcm

(b) Trajetórias das coordenadas de momento (px, py, pθcm).

Figura 6.5: Resultados de simulação em malha aberta do planejamento de trajetória do


6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 138

Completando as expressões de Vc e Vc de maneira a obter-se o quadrado perfeito, tem-se

que

18(z2

1 + z21 + v2) 6 Vc(z) 6 (z2

1 + z21 + v2)

Vc(z) 6 −14(z2

1 + z21 + v2)

Logo, pela Proposição 6.3.3, o sistema é global e exponencialmente estável. Além disso,

pode-se mostrar que a velocidade de rotação r tende a zero para alguns casos.

Proposição 6.3.6. Seja o sistema de 2-corpos com o controle de realimentação cine-

mático dados por (6.3.14) e (6.3.15). Se φ 6= 0 então r tende a zero quando z2, v → 0.

Demonstração. Este resultado é uma extensão em relação ao caso do corpo rígido, uma

vez que, para a função de Lyapunov e as leis de controle para este sistema, r é apenas

limitado.

Tomando o limite em (6.3.15) quando z2, v → 0, observe que (6.3.15) pode ser reescrita

por uma função que tende a zero multiplicada por outra que é limitada se 0 < φmin < φ.

Logo, pelo resultado do Cálculo Diferencial, o limite de r quando z2, v → 0 é zero.

A Figura 6.6 ilustra o resultado de estabilização pela composição das leis de controle

cinemática e de velocidade obtidas acima.

6.4 Planejamento de Trajetórias e Controle Ótimo

Definição 6.4.1 (Planejamento de Trajetória do Sistema de 2-corpos). Dados dois

pontos de configuração qi, qf ∈ Q, determinar uma função u = [u1, u2, u3] tal que o

sistema

z(t) = f(z(t)) + g1(q(t))u1(t) + g2(q(t))u2(t) + g3(q(t))u3(t)

parametrizado pela curva z(t) = [q(t), p(t)] : [0, tf ] → T ∗q(t)Q e partindo do ponto

(q(0), p(0)) = (qi, 0), seja conduzido ao ponto (q(tf ), p(tf )) = (qf , 0) em tempo tf .

Pode-se, adicionalmente, estabelecer penalidades sobre um ou todos a função u, os

estados q ou o tempo tf a serem minimizados quando da determinação do planejamento

da trajetória. Este procedimento é conhecido como controle ótimo e será comentado

mais detalhadamente a seguir.


0 10 20 30 40 50 60 70 80 90 100−1.5

−1

−0.5

0

0.5

1

1.5

2

tempo (s)

Coo

rden

adas

[z1,z

2]=m

Estabilizacao posicao

z1

z2

z1

z2

(a) Estabilização da posição (z1, z2).

0 10 20 30 40 50 60 70 80 90 100−1

−0.5

0

0.5

1

1.5

2

2.5

3

3.5

tempo (s)

Vel

ocid

ade

[u,v

]=m

, [r]

=ra

d/s

Estabilizacao velocidade

uvr

r

u

v

(b) Estabilização da velocidade (u, v, r).

Figura 6.6: Resultados de estabilização de posição e velocidade pela composição das leis

de controle.


6.4.1 Controle Ótimo do Modelo Cinemático

O planejamento de trajetórias para o sistema multi-articulado pretendido neste trabalho

é tratado como um projeto de determinação da solução de um problema de controle

ótimo. Para este fim, utiliza-se o modelo cinemático associado do sistema. Logo, para

as considerações a seguir considera-se o modelo cinemático do sistema controlável, como

mostrado anteriormente na Seção 5.3.3.

Diferentemente da formulação da mecânica não-holonômica, o problema de controle

ótimo é um problema variacional. Considere, primeiramente, uma subvariedadeD ⊂ TQ

do espaço tangente de uma variedade suave Q. Seja uma função escalar F = F (q(t)).

Percorrida a curva q(t) : [0, tf ] → Q, entre os dois pontos distintos qi, qf ∈ Q, avalia-se

o valor da integral de linha

IP =∫ tf

0F (q(t))dt

que corresponde ao custo do percurso q(t) em Q. A trajetória em D que liga qi a qf e

cujo resultado minimiza IP dentre todas as possíveis trajetórias em D é denominada de

ótima. Uma condição necessária para a obtenção do mínimo, ou extremo, do custo IP

é que a integral de F , avaliada nas variações de q(t), possua deslocamento infinitesimal

nulo9, ou seja

δIP = 0

Definição 6.4.2 (Controle Ótimo). Admite-se queD possua pontos, ou seções de q ∈ Q,

com a seguinte parametrização ξ = G(π(ξ), u1, . . . , um) ∈ D, onde G ∈ C∞ e onde

u = (u1, . . . , um) ∈ U ⊂ Rm e π é a projeção de TQ em Q. Logo, as trajetórias, em D,

que ligam os pontos qi e qf são dadas por

q(t) = G(q(t), u(t))

Então o custo do percurso partindo de qi até qf é obtido pela expressão

IP =∫ tf

0F G(q(t))dt

Neste caso, a tarefa de determinar as trajetórias ótimas é reinterpretada naquela em

que se deseja determinar o controle ótimo u1, . . . , um, ou seja, a parametrização das

trajetórias em D.9Demonstra-se, que este resultado generaliza às equações de Euler-Lagrange para a função F em

x(t).


O controle ótimo tem sido aplicado para resolver problemas de minimização da energia

quando o controle age apenas no espaço de base, refira a (Yang, 1992). Estes problemas

de controle ótimo são definidos conforme o seguinte: Dados os pontos de configuração

inicial qi e final qf em (B × G,B, π, G), ambos na mesma fibra, determinar o controle

u(t) que conduz o sistema (Q,D, 〈〈., .〉〉, G, H) de qi a qf minimizando

IP =∫ tf

ti

C(r) + 〈u, u〉Bdt

para a métrica Riemanniana 〈., .〉B em B e sujeito às equações da cinemática do sistema.

Entretanto, tem-se o interesse em minimizar funcionais, não apenas das trajetórias no

espaço de base B, mas também, das trajetórias na fibra.

Nos parágrafos a seguir, realiza-se um exemplo numérico com o modelo cinemático do

sistema de 2-corpos apresentado na Seção 5.3.3. Para o sistema de dois corpos em

questão (5.3.7), o vetor de configuração é q(t) = (x, y, θ, φ)(t), as condições terminais

(dqi = dqf = 0) de posição e atitude

x(ti) = xi x(tf ) = xf

y(ti) = yi y(tf ) = yf

θ(ti) = θi θ(tf ) = θf

φ(ti) = φi φ(tf ) = φf

e de velocidade q(t) ∈ TQ

x(ti) = xi = 0 x(tf ) = xf = 0

y(ti) = yi = 0 y(tf ) = yf = 0

θ(ti) = θi = 0 θ(tf ) = θf = 0

φ(ti) = φi = 0 φ(tf ) = φf = 0

Vínculos de controle nas variáveis f1, f2, T

0 = fmin ≤f1, f2

f1, f2 ≤ fmax

Tmin ≤T ≤ Tmax


Alguns índices de desempenho de interesse estão sendo utilizados. Entre estes:

IP1 =∫ tf

ti

1dt = tf (∃ u ≤ umax)

IP2 =∫ tf

ti

x2(t) + y2(t) + θ2(t) + φ2(t)dt

IP3 = IP2 +∫ tf

ti

f21 (t) + f2

2 (t) + T 2(t)dt

Devido à existência do número relativamente elevado de restrições ou vínculos nas variá-

veis de controle e de estado, optou-se por uma investigação numérica, como alternativa

de se evitar a complexidade inerente à obtenção da solução por métodos analíticos nestes

casos.

Para tanto, fez-se uso do toolbox de controle ótimo para MatLab denominado RIOTS -

Recursive Integration Optimal Trajectory Solver, (Schwartz, Polak e Yangquan, 1997) e

as suas referências. Maiores detalhes a respeito da implementação do RIOTS não serão

aqui considerados. Uma recente e detalhada descrição da teoria do funcionamento do

RIOTS pode ser encontrada em (Menegaldo, 2000).

As Figuras 6.7 e 6.8 mostram os resultados da sintonização do controle ótimo aplicado ao

modelo cinemático do sistema de dois corpos (5.3.7) utilizando o RIOTS. O referencial

móvel é localizado na junta rotativa do sistema, com eixo horizontal direcionado ao

corpo direito e eixo vertical, restrito ao plano, é perpendicular ao horizontal, conforme

a Fig. 5.3. O procedimento numérico considerou tempo fixo de 2.4s e otimização o índice

de desempenho IP3 dado acima. O controle u é restrito aos valores −1 6 f1, f2 6 1

e −0.2 6 T 6 0.2. O sistema parte da origem no plano x − y inercial, totalmente

estendido φi = 0 e com orientação inicial θi = −π/2, isto é, eixo vertical alinhado com o

eixo x inercial. O sistema é levado ao ponto (−1, 1) do plano, φf = 0 e com orientação

final θf = π/4.


−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Trajetória Ótima no plano x−y

xop

y op

(a) Deslocamento ótimo do centro do referencial móvel no plano

x− y.

0 0.5 1 1.5 2 2.5−2

−1.5

−1

−0.5

0

0.5

1

1.5

2Trajetória Ótimas

tempo (s)

x(t)

op, y

(t) op

, θ(t

) op

(b) Trajetórias ótimas das coordenadas de fibra (rx, ry, θcm).

Figura 6.7: Resultados do controle ótimo aplicado ao modelo cinemático do sistema de

dois corpos.


0 0.5 1 1.5 2 2.5−0.1

−0.05

0

0.05

0.1

0.15

0.2

0.25

0.3Evolução Ótima da variável da Base

tempo (s)

φ(t)

op

(a) Trajetória ótima das coordenadas da base φ(t).

0 0.5 1 1.5 2 2.5−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2Controle Ótimo

tempo (s)

Con

trol

uop

(b) Controle ótimo u(t) = (f1, f2, T )(t).

Figura 6.8: Resultados do controle ótimo aplicado ao modelo cinemático do sistema de

dois corpos.

6.5. CONCLUSÃO 145

6.5 Conclusão

A partir das considerações acima, determinou-se algumas condições, e os respectivos

métodos, em que o sistema é estabilizável.

Os sistemas com apenas duas entradas de propulsão não são linearizáveis por realimen-

tação estática uma vez que os seus campos vetoriais geram distribuições não involutivas.

Além disso, estes sistemas não são linearizáveis por realimentação dinâmica, pois as suas

aproximações lineares não são controláveis, ou seja, são sistemas sub-atuados. Neste

caso, recorre-se a técnicas de estabilização não suaves ou variantes no tempo. Para este

propósito, considerou-se aqui uma extensão de um resultado obtido para a estabilização

no plano do corpo rígido sub-atuado através do procedimento de análise e síntese do

controlador segundo a teoria de estabilidade de Lyapunov.

Os sistemas com três ou mais entradas de propulsão, que geram direções de propulsão

linearmente independentes, são linearizáveis por realimentação e, portanto, estabilizá-

veis por uma realimentação do estado obtida através de técnicas de controle lineares,

por exemplo.

Apresentou-se, ainda, exemplos analítico e numérico do planejamento de trajetória do


146

Capítulo 7

Conclusões

Modelagem

Apresentou-se, neste trabalho, as equações de movimento dinâmico de uma classe de

sistemas multi-corpos em que os corpos componentes são fisicamente acoplados por

articulações rotativas. Além das articulações, ou juntas, ativas, o sistema é dotado de

propulsores que atuam na variação da posição do centro de massa do sistema.

Como mencionado no Capítulo 3, a dinâmica de sistema em geral associada às restri-

ções de movimento implicam em uma dinâmica não-holonômica. A dinâmica do sistema

multi-articulado, apesar de caracterizada por medidas não integráveis no sentido de Fro-

benius, dado pelo momento angular, foi aqui considerado livre de restrições cinemáticas

no espaço bidimensional. Logo, as equações de Euler-Lagrange foram utilizadas para a

modelagem Lagrangiana do sistema.

Na presença de restrições não-holonômicas de velocidade, no entanto, a modelagem

do sistema deve seguir pela formulação do Princípio de Lagrange d’Alembert, como

discutido no Capítulo 3. Neste caso, a dinâmica não é obtida por um procedimento

variacional, que caracteriza os problemas de controle ótimo, uma vez que a variação das

curvas é tomada sem as restrições.

Além desta, a modelagem Hamiltoniana do sistema foi apresentada segundo duas para-

metrizações da orientação do centro de massa do sistema.

7.1. SUGESTÕES PARA TRABALHOS FUTUROS 147

Controlabilidade

A importância da análise de acessibilidade não-linear de sistemas dinâmicos reside na

análise com vista a obtenção de controle e da síntese de algoritmos de planejamento de

trajetória, atividade não realizada neste trabalho mas reservada como um dos tema de

trabalhos futuros.

O sistema proposto, com pelo menos duas entradas de propulsão e com o espaço de base

totalmente atuado, sempre é acessível em todo espaço de configuração Q, independente

do número de corpos. Isto decorre do fato de que, para um conjunto de sistemas com N

crescente, o número de direções de movimento possíveis, e construídas pelos colchetes

de Jacobi-Lie, cresce mais rapidamente que o número de estados ou dimensão do espaço

de fase para o qual a dimensão da álgebra de acessibilidade deve alcançar.

Estabilização

O método utilizado para a estabilização do sistema no plano é dependente do número de

entradas; em particular, do número de entradas de propulsão. Pode-se enfatizar que, em

geral, este número de entradas é também função da quantidade de direções linearmente

independentes que os campos vetoriais correspondentes podem gerar.

Para sistemas da classe, em que o espaço de base é totalmente controlado, com três

ou mais entradas de propulsão é possível estabilizar o sistema a um ponto de equilíbrio

empregando-se técnicas lineares de controle ao modelo linear do mesmo. O procedimento

considerado para a linearização do modelo do sistema é exato e realizado por um método

de linearização por realimentação. Note que, pela definição da classe de sistemas no

primeiro capítulo, não é possível utilizar esta solução de estabilização para o sistema

com apenas dois corpos, uma vez que possui apenas duas entradas de propulsão. Neste

caso, assim como para sistemas de N corpos mas com apenas dois propulsores, utilizou-

se uma técnica derivada da teoria de estabilidade de Lyapunov para estabilização da

dinâmica do sistema.

7.1 Sugestões para Trabalhos Futuros

Algumas possíveis contribuições futuras são resumidas a seguir:

7.1. SUGESTÕES PARA TRABALHOS FUTUROS 148

• Modelagem tridimensional do sistema. A extensão dos modelos obtidos no plano

ao espaço de três dimensões não é trivial e requer atenção com relação ao apare-

cimento de singularidades;

• Análise da dinâmica: estabilidade, bifurcações e caos;

• Modelagem do sistema sob ação de forças dissipativas ou potenciais: como no caso

de robôs submarinos e terrestres;

• Planejamento de trajetórias construtiva, com embasamento nos resultados de aces-

sibilidade do sistema;

• Planejamento de trajetórias através de uma abordagem analítico-numérica do con-

trole ótimo. Otimização da configuração de entradas, isto é, determinar uma

combinação ótima de entradas, propulsores e atuadores rotativos, para uma de-

terminada trajetória dada;

• Investigação de outras técnicas não-lineares de estabilização. Considerar técnicas

de rastreamento.

149

Referências Bibliográficas

Arnold, V. I. (1989). Mathematical Methods of Classical Mechanics, Vol. 60 of Graduate

Texts in Mathematics, 2 edn, Springer-Verlag.

Battilotti, S. e Califano, C. (2004). A constructive condition for dynamic feedback

linearization, System Control & Letters 52: 329–338.

Bloch, A. M. (2003). Nonholonomic Mechanics and Control, Vol. 24 of Interdisciplinary

Applied Mathematics, 1 edn, Springer.

Bloch, A. M., Krishnaprasad, P. S., Marsden, J. E. e Murray, R. M. (1996). Nonho-

lonomic mechanical systems with symmetry, Archive for Rational Mechanics and

Analysis 136: 21–99.

Bloch, A. M., Reyhanoglu, M. e McClamroch, N. H. (1992). Control and stabiliza-

tion of nonholonomic dynamic systems, IEEE Transactions on Automatic Control

37(11): 1746Ű1757.

Bullo, F. e Lewis, A. D. (2005). Geometric Control of Mechanical Systems: Modeling,

Analysis, and Design for Simple Mechanical Systems, Vol. 49 of Texts in Applied

Mathematics, Springer.

Byrnes, C. I. e Isidori, A. (1991). On the attitude stabilization of rigid spacecraft,

Automatica 27: 87–95.

Charlet, B., Lévine, J. e Marino, R. (1989). On dynamic feedback linearization, System

Control & Letters 13: 143–151.

Charlet, B., Lévine, J. e Marino, R. (1991). Sufficient conditions for dynamic state

feedback linearization, SIAM Journal of Control and Optimization 29(1): 38–57.

REFERÊNCIAS BIBLIOGRÁFICAS 150

Dubowsky, S. e Papadopoulos, E. (1993). The kinematics, dynamics, and control of

free-flying and free-floating space robotic systems, IEEE Transactions on Robotics

and Automation 9(5): 531–543.

Fantoni, I., Lozano, R., Mazenc, F. e Pettersen, K. Y. (1999). Stabilization of a Non-

linear Underactuated Hovercraft, Proc. 38th IEEE Conference on Decision

and Control, Phoenix, USA pp. 2533–2538.

Fernandes, C., Gurvits, L. e Li, Z. (1994). Near-optimal nonholonomic motion planning

for a system of coupled rigid bodies, IEEE Transactions of Automatic Control

39(3): 450–463.

Hunt, L. R., Su, R. e Meyer, G. (1983). Design for multi-input nonlinear systems,

in R. Brockett e R. S. M. H. J. Sussmann (eds), Differential Geometric Control

Theory, Vol. 27 of Progress in Mathematics, Birkhäuser, chapter 9, pp. 268–298.

Isidori, A. (1995). Nonlinear Control Systems, Communication and Control Engi-

neering Series, 3 edn, Springer-Verlag.

Kallem, V. e Cowan, N. J. (2007). Image-guided control of flexible beveltip nee-

dles, IEEE International Conference on Robotics and Automation, Rome, Italy

p. 3015Ű3020.

Khalil, H. K. (2002). Nonlinear Systems, 3 edn, Prentice Hall.

Koningstein, R. e Cannon Jr., R. H. (1995). Experiments with model-simplified

computed-torque manipulator controllers for free-flying robots, AIAA Journal of

Guidance, Control and Dynamics 18(6): 1386–1390.

Krener, A. J. (1999). Mathematical control theory, Springer, chapter Feedback Lineari-

zation, p. 360.

Lanczos, C. (1977). The Variational Principles of Mechanics, 4 edn, Dover Publi-

cations, Inc.

Littlejohn, R. e Reinsch, M. (1997). Gauge fields in the separation of rotation and

internal motions in the n-body problem, Reviews of Modern Physics 69(1): 213–

275.

Manikonda, V. (1998). Control and stabilization of a class of nonlinear system with

symmetry, Ph.D. Report TR 98-2, University of Maryland, College Park.


Marsden, J. E. (2004). Lectures on Mechanics, Vol. 174 of Lecture notes series, sept04

draft version edn, Cambridge University Press.

Marsden, J. E., Montgomery, R. e Ratiu, T. S. (1990). Reduction, symmetry, and phases

in mechanics, Memoirs American Mathematical Society 436.

Marsden, J. E. e Ostrowski, J. (1998). Symmetries in motion: Geometric foundations

of motion control, Nonlinear Science Today pp. 1–21.

Marsden, J. E. e Ratiu, T. S. (1999). Introduction to Mechanics and Symmetry, Vol. 17

of Texts in Applied Mathematics, 2 edn, Springer. 3rd printing.

Marsden, J. E. e Scheurle, J. (1993). The reduced euler-lagrange equations, Fields

Institute Communications (1): 139–164.

Marsden, J., Ratiu, T. e Weinstein, A. (1984). Semidirect products and reduction in

mechanics, Transactions on the AMS 281(1): 147–177.

Mather, J. (2005). Mat-327: Differential geometry, Undergraduate class notes, Dept. of

Mathematics, Princeton University.

McLain, T. W., Rock, S. M. e Lee, M. J. (1995). Experiments in the Coordination

of Underwater Manipulator and Vehicle Control, Proceedings of the MTS/IEEE

OCEANS ’95 2: 1208–1215.

Meirovitch, L. (1970). Methods of Analytical Dynamics, McGraw-Hill, NY.

Melli, J. B., Rowley, C. W. e Rufat, D. S. (2006). Motion planning for an articulated

body in a perfect fluid, Submitted to SIADS .

Menegaldo, L. L. (2000). Modelagem Biomecânica e Controle Ótimo da Postura Humana

Através de Algoritmos Baseados na Teoria das Aproximações Consistentes, Tese de

doutoramento, EPUSP.

Murray, R. M. (1997). Nonlinear control of mechanical systems: A lagrangian perspec-

tive, Annual Reviews in Control 21: 31–45.

Nijmeijer, H. e van der Shaft, A. (1990). Nonlinear Dynamical Control Systems,

Springer-Verlag.

Ostrowski, J. P. (1995). The Mechanics and Control of Undulatory Robotic Locomotion,

Ph.d. thesis, California Institute of Technology.


Ostrowski, J. P. (1999). Computing reduced equations for robotic systems with

constraints and symmetries, IEEE Transactions on Robotics and Automation

15(1): 111–123.

Pettersen, K. Y. e Egeland, O. (1996). Exponential Stabilization of an Underactuated

Surface Vessel, Proc. 35th IEEE Conference on Decision and Control, Kobe,

Japan pp. 967–971.

Respondek, W. (2002). Geometry of static and dynamic feedback, Warsaw-Poland

Summer School on Mathematical Control Theory Lecture Notes.

Reyhanoglu, M. e McClamroch, N. H. (1991). Controllability and stabilizability of pla-

nar multibody systems with angular momentum preserving control torques, Proc.

1991 American Control Conference, Boston pp. 1102–1107.

Rui, C., Kolmanovsky, I. V. e McClamroch, N. H. (2000). Nonlinear attitude and

shape control of spacecraft with articulated appendages and reaction wheels, IEEE

Transactions on Automatic Control 45(8): 1455–1469.

Schutz, B. (1980). Geometrical Methods of Mathematical Physics, Cambridge University

Press.

Schwartz, A., Polak, E. e Yangquan, C. (1997). RIOTS 95TM : A MatLab Toolbox for

Solving Optimal Control Problems, windows version 1.0 edn, Dept. of Electrical

Engineering, Stanford University.

Shapere, A. e Wilczeck, F. (1987). Self-propulsion at low reynoilds number, Physics

Review and Letters 58: 2051–2054.

Shen, J. (2002). Nonlinear Control of Multibody Systems with Symmetries via Shape

Change, Ph.d. report, University of Michigan.

Sontag, E. D. (1998). Mathematical Control Theory: Deterministic Finite-Dimensional

Systems, Vol. 6 of Texts in Applied Mathematics, 2 edn, Springer-Verlag.

Souza, E. C. e Maruyama, N. (2007). Lagrangian modeling for a class of mobile mul-

tibody systems, 3rd IFAC Symposium on Systems, Structures and Control, Foz do

Iguaçu, Brasil .

Spivak, M. (1999). A Comprehensive Introduction to Differential Geometry, Vol. I, 3

edn, Publish or Perish, Inc.


Sreenath, N. (1987). Modeling and Control of Multibody Systems, Ph.d. thesis report,

University of Maryland.

Sussmann, H. J. (1987). A general theorem on local controllability, SIAM Journal of

Control and Optimization 25(1): 158–194.

UUVMP Committee (2004). The navy unmanned undersea vehicle (uuv) master plan,

Master plan, Department of the Navy, United States of America.

Walsh, G. C. e Sastry, S. S. (1995). On reorienting linked rigid bodies using internal

motions, IEEE Transactions on Robotics and Automation 11(1): 139–146.

Wittenburg, J. (1977). Dynamics of Systems of Rigid Bodies, Teubner, Stuttgart.

Yang, R. (1992). Nonholonomic Geometry, Mechanics and Control, Ph.d. thesis, Sys-

tems Research Institute, Univ. of Maryland.

Yuh, J. e West, M. (2001). Underwater robotics, Advanced Robotics 15(5): 609–639.

Review paper.

154

Apêndice A

Fundamentos Gerais

A.1 Aplicações e Conjuntos Usuais na Mecânica Geomé-

trica

Seja um grupo de Lie G agindo em uma variedade M e g a álgebra de Lie correspondente

ao grupo G. Para x ∈ M , g ∈ G, e ξ, η ∈ g, definem-se os seguintes.

Para uma curva, t-parametrizada, tξ em g e t ∈ R, a aplicação exponencial é dada pelo

subgrupo de um parâmetro γξ(t) tal que

exp : g → G : tξ 7→ exp(tξ) = γξLt (e)

A órbita da ação Φ de G em M corresponde a uma variedade imersa de M

Orb(x) = Φg(x) | g ∈ G ⊂ M (A.1.1)

A aplicação de projeção π e o espaço quociente estão relacionados pelas seguintes ex-

pressões

π : M → M/G

x 7→ Orb(x)

Seja ξ ∈ g. A R-ação em M segue da relação

Φξ(t, x) = Φξt (x) = Φ(exp(tξ), x) = Φexp(tξ)(x) (A.1.2)

A.1. APLICAÇÕES E CONJUNTOS USUAIS NA MECÂNICA GEOMÉTRICA 155

Seja Φ : G × M → M uma ação de grupo suave à esquerda. O gerador infinitesimal

de Φ é definido como o campo vetorial relativo a ação de grupo Φ dada pela aplicação

exponencial de uma trajetória na álgebra g parametrizada por t, ou seja

ξM (x) :=d

dt

∣∣∣∣t=0

Φexp(tξ)(x)

Automorfismo interno, ou aplicação conjugação, é definida por

Ig : G → G (A.1.3)

h 7→ Ig(h) = Rg−1 Lg(h) = ghg−1 (A.1.4)

A ação adjunta de g ∈ G em ξ ∈ g corresponde a aplicação Ad : G× g → g. Esta repre-

senta uma transformação de similaridade para Lie álgebras de matrizes. Sob o contexto

da cinemática do corpo rígido, a aplicação adjunta representa uma transformação do

sistema de coordenadas de referência

Adg = TeIg : g → g (A.1.5)

ξ 7→ Te(Rg−1 Lg)(ξ) =d

dε

∣∣∣∣ε=0

gh(ε)g−1 = gξg−1 (A.1.6)

onde ξ é a tangente da curva h(ε) em ε = 0. A ação coadjunta de g ∈ G em µ ∈ g∗ é a

aplicação Ad∗ : G× g∗ → g∗ ou

Ad∗g−1 : g∗ → g∗ (A.1.7)

onde

〈Ad∗g−1(µ), ξ〉 = 〈µ,Adg−1(ξ)〉 (A.1.8)

observe que Ad∗g não é definida como a aplicação coadjunta, mas representa simples-

mente a aplicação dual de Adg e que Ad∗g = AdTg para grupos de matrizes. O operador

adjunto ou, simplesmente, ad, é definido por

adξ : g → g (A.1.9)

η 7→ ξg(η) = [ξ, η] (A.1.10)

onde o gerador infinitesimal ξg para a ação adjunta é dado por

ξg(η) =d

dt

∣∣∣∣t=0

Adexp(tξ)(η)

Sejam X e Y dois campos vetoriais e a álgebra definida pelo operador adjunto adXY =

[X,Y ]. A iteração do colchete de Jacobi-Lie por l vezes é dada por adlXY = [X, . . . , [X, Y ] . . .].

Define-se ad0XY = Y .

A.2. REPRESENTAÇÕES ESPACIAIS COM A ÁLGEBRA DO GRUPO 156

O operador coadjunto

ad∗ξ : g∗ → g∗ (A.1.11)

onde

〈ad∗ξ(α), η〉 = 〈α, adξ(η)〉 (A.1.12)

Assim como no caso da aplicação adjunta, vale a relação ad∗ = adT para grupos de

matrizes.

A.2 Representações Espaciais com a Álgebra do Grupo

A.2.1 Representações entre Referenciais

Para g = ξ ∈ TgG a representação inercial, respectivamente de corpo, é dada pela

translação à direita, respectivamente esquerda, em TG ou, para grupos de matrizes,

ξS = TgRg−1(ξ) = gg−1 e ξB = TgLg−1(ξ) = g−1g. (A.2.1)

onde ξ(.) pertence a Lie álgebra de G, isto é, ξ(.) ∈ TeG ≡ g.

Para g∗ = µ ∈ T ∗g G a representação inercial de µ é dada por sua translação à direita

em T ∗G ou

µS = T ∗e Rg(µ). (A.2.2)

Analogamente, a representação de corpo de µ é dada pela translação à esquerda em T ∗G

ou

µB = T ∗e Lg(µ). (A.2.3)

onde µ(.) pertence a Lie álgebra de G∗, ou seja, µ(.) ∈ T ∗e G ≡ g∗.

Para grupos de matrizes, tem-se

ξS = AdgξB = gξBg−1 (A.2.4)

Logo, a relação entre as representações nos referenciais inercial e móvel em TG, respec-

tivamente T ∗G, são dadas pela aplicação adjunta

ξS = Adg ξB ⇔ ξB = Adg−1 ξS e (A.2.5)

µS = Ad∗g−1 µB ⇔ µB = Ad∗g µS (A.2.6)


A ponte entre a algebra de Lie e a sua representação dual é feita pelo levantamento

cotangente da ação de grupo Φg, (g ∈ G) e dada pelo pareamento da álgebra

〈T ∗e Φgπ, ξ〉 = 〈π, TeΦgξ〉 (A.2.7)

onde ξ ∈ g e π ∈ T ∗g G. Logo, para manipulações com matrizes, onde o elemento

identidade e é dado pela matriz identidade (e = I), e para uma ação de grupo à

esquerda Φg = Lg, (A.2.7) é definida por

〈T ∗I Lgπ, ξB〉 = 〈π, TILgξB〉 = tr(πT gξB) = tr(ξTB gT π)

= 〈ξB, gT π〉 = 〈ξB, T ∗I Lgπ〉 ∈ R

onde tr é a operação traço, definida no espaço matrizes quadradas. Portanto

µB = T ∗I Lgπ = gT π ∈ g∗ (A.2.8)

A.2.2 O Grupo SE(2)

Para R = R(θ) ∈ SO(2), onde θ é a parametrização de um elemento do círculo S1 e

r = (x, y)T ∈ R2, tem-se que

g =

[R r

01×2 1

]∈ SE(2) (A.2.9)

O elemento inverso correspondente

g−1 =

[R−1(θ) −R−1(θ)r

01×2 1

]=

[RT (θ) −RT (θ)r

01×2 1

]∈ SE(2) (A.2.10)

pois R−1(θ) = RT (θ) = R(−θ). Como mencionado anteriormente, qualquer elemento

g de SE(2) pode ser parametrizado pela tripla (x, y, θ) e

g =

[R r

01×2 0

]∈ TgSE(2) = T(R,r)SE(2) = T(θ,x,y)SE(2) (A.2.11)

Os elementos da Lie álgebra para SE(2) podem ser obtidos pela translação dos pontos

do espaço tangente TgSE(2) aos pontos do espaço tangente na origem TeSE(2). As

translações à esquerda fornecem representações do espaço de fase do sistema no referen-

cial móvel; alternativamente, as translações à direita fornecem representações do espaço

de fase do sistema no referencial inercial. Uma translação à direita de g por g−1 fornece

ξS = gg−1 =

[RRT −RRT r + r

01×2 0

]=

[−ωM v

01×2 0

]∈ TI3SE(2) ≡ se(2) (A.2.12)


onde v = r + ωMr, ω = θ ∈ R, o elemento identidade e do grupo SE(2) é a matriz

identidade I3 e M é a matriz (quadrada) simplética de dimensão 2 dada por

M =

[0 1

−1 0

]

Note que é possível tomar se(2) ' R3 e os elementos ξS podem ser definidos pela

parametrização ξS = (ω,v).

Ademais, para µS = T ∗e Rgπ e utilizando o pareamento entre os elementos dos espaços

duais, tem-se

〈T ∗e Rgπ, ξS〉 = 〈π, TeRgξS〉 = tr(µSξS) = ϕω + α · v = 〈(ϕ,α), (ω,v)〉

Portanto, os elementos da Lie álgebra dual se∗(2) possuem a seguinte estrutura

µS =

[ϕ2M 02×1

α 0

]∈ T ∗I3SE(2) ≡ se∗(2) ' R3

onde ϕ ∈ R e α ∈ R2. Identificando se(2) ' R3 ' se∗(2) o pareamento entre se(2) e

se∗(2) corresponde ao produto interno usual em R3, como mostrado acima.

Para elementos de grupo parametrizados por g = (R, r), a ação adjunta Adg na álgebra

se(2), relativa ao referencial móvel, fica

Ad(R,r)ξB = g ξB g−1 =

[−ωM r + ωMr

01×2 0

]= ξS (A.2.13)

que recupera (A.2.12), ao passo que a ação adjunta inversa Ad−1g em ξS fornece

Ad(R,r)−1 ξS = g−1ξS g =

[−ωM RT r

01×2 0

]= ξB (A.2.14)

o que recupera o elemento correspondente no referencial móvel ξB. Sob o contexto em

que operações são realizadas com vetores, ao contrário de quando com matrizes, pode-

se obter a representação matricial da ação adjunta aplicada a ξS = (ω,v) através da

expressão

Ad(R,r) =

[1 01,2

Mr R

]⇒ Ad(R,r)(ω,v) =

[1 01,2

Mr R

](ω

v

)=

(ω

ωMr + Rv

)

(A.2.15)

que parametriza o resultado em (A.2.13). Analogamente, a representação matricial da

ação adjunta inversa Adg−1 fica

Ad(R,r)−1 =

[1 01×2

−RTMr RT

]


que fornece Adg−1 ξS = g−1ξSg = ξB quando aplicado em ξS , ou seja:

Ad(R,r)−1(ω,v) =

[1 01×2

−RTMr RT

](ω

v

)=

(ω

RT r

)(A.2.16)

No resultado acima utilizou-se (A.2.12). Observe, também, que este condiz com a

expressão obtida em (A.2.14). Alternativamente, é possível obter expressões da ação

adjunta para elementos de grupo dados por g = (r,R), como apresenta a seguinte

expressão

Ad(R,r) =

[1 01,2

Mr R

]⇒ Ad(r,R) =

[R Mr

01,2 1

]

Neste caso, a representação matricial da ação adjunta de ξS = (v, ω) é obtida pela

expressão

Ad(r,R)(v, ω) =

[R Mr

01,2 1

](v

ω

)=

(ωMr + Rv

ω

)(A.2.17)

que corresponde ao resultado de (A.2.15), como esperado. A aplicação adjunta inversa

correspondente, equivalente ao resultado em (A.2.16), é dada por

Ad(r,R)−1(v, ω) =

[RT −RTMr

01,2 1

](v

ω

)=

(RT r

ω

)(A.2.18)

Note que [Adg−1 ] = [Adg]−1. Observe, também, que a ação adjunta inversa Adg−1 ,

anula a ação da ação adjunta direta, como esperado; ou seja, AdgAdg−1 = I3 para um

sistema plano. O mesmo vale para a ação coadjunta Ad∗g. A velocidade do corpo rígido

no referencial móvel ξB ∈ se(2) é obtida segundo a expressão

ξB = g−1g =

[RT R RT r

01×2 0

]=

[−ωM RT r

01×2 0

]

Mostrar que a álgebra se(2) não é abeliana é trivial. Sejam dois os elementos da álgebra

se(2) dados por ξ1 = (ω1, u1, v1) e ξ2 = (ω2, u2, v2). Calcula-se, então

ξ1ξ2 =

−ω1ω2 0 −ω1v2

0 −ω1ω2 ω1u2

0 0 0

e

ξ2ξ1 =

−ω1ω2 0 −ω2v1

0 −ω1ω2 ω2u1

0 0 0


Logo, ξ1 e ξ2 não comutam. Observe, no entanto, que, assim como ocorre com o grupo

SO(2), os elementos da álgebra so(2) comutam.

A aplicação exponencial exp : se(2) → SE(2) : (ω, vx, vy) 7→ (θ, rx, ry), também conhe-

cida por hélice, provem da fórmula de Rodrigues, veja (Bullo e Lewis, 2005):

θ = ω (A.2.19)

[rx

ry

]=

[vx

vy

], para ω = 0 (A.2.20a)

[sin ω

ω(1−cos ω)

ω−(1−cos ω)

ωsin ω

ω

][vx

vy

], para ω 6= 0 (A.2.20b)

161

Apêndice B

Resultados Auxiliares

Resultados auxiliares para mecânica geométrica são detalhados a seguir.

B.1 Superfície de Energia Constante para o Sistema de 2-

corpos

No que segue, apresenta-se o cálculo das superfícies iso-energia (energia constante) para

a dinâmica rotacional do sistema de dois corpos interconectados. Para isto, deseja-se

reduzir o Hamiltoniano do sistema (4.2.18) a T ∗S1. Definem-se os parâmetros µ e ν

como

µ = µ1 + µ2 = µ ν =µ2 − µ1

2Parametriza-se o momento angular como

µ1 = −ν + 1

2µ

µ2 = ν + 12µ

Substituindo estas definições em (4.2.18), tem-se:

2∆H =

[I2

(−ν +

12µ

)2

− 2ελ

(−ν +

12µ

)(ν +

12µ

)+ I1

(ν +

12µ

)2]

=[(I1 + I2 + 2ελ)ν2 + (I1 − I2)µν +

14µ2(I1 + I2 − 2ελ)

](B.1.1)

B.2. DESACOPLAMENTO DOS COMPONENTES DA SE(2) 162

A parametrização para a plotagem no espaço 3D é feita através de coordenadas cilín-

dricas: x = µ cos(φ)

y = µ sin(φ)⇒

µ =

√x2 + y2

φ = arctan( y

x

) (B.1.2)

Substituindo µ e φ em (B.1.1) e resolvendo a equação algébrica de segunda ordem para

a componente vertical ν, para um dado valor de H, determina a superfície iso-bárica.

B.2 Desacoplamento dos Componentes da se(2)

Tem-se o interesse de mostrar aqui a estrutura desacoplada dos componentes da álgebra

de Lie de grupos com produto semi-direto. Uma abordagem similar a encontrada em

Marsden, Ratiu e Weinstein (1984) será tomada a seguir. Como caso especial, pode-se

mostrar o desacoplamento dos componentes de se(2), que resulta do fato da estrutura

do grupo SO(2) de SE(2) estar desacoplada da estrutura do espaço vetorial R2.1

Seja a ação de um grupo de Lie G no espaço vetorial V . Para g1, g2 ∈ G e v1, v2 ∈ V , a

estrutura de grupo GsV é definida por

(g1, v1) · (g2, v2) = (g1g2, g1v2 + v1) (B.2.1)

onde s determina o produto semi-direto. Denomina-se por S o grupo dado pelo produto

semi-direto do grupo de Lie G com o espaço vetorial V ,

S = GsV = G×ρ V

O símbolo ×ρ é empregado em Marsden et al. (1984) para representar a mesma estrutura

de produto dada por s. Logo, para g ∈ G e u ∈ V , tem-se (g,u) ∈ S. A álgebra de

Lie associada é

s = gsV = g×ρ′ V

onde V ' TeV V e eV é o elemento identidade do espaço vetorial V . Isto pode ser

explicitado pela seguinte identidade: (0,v) = (eV ,v) ∈ TeV V ' V . Logo, os elementos

da álgebra Lie e da sua dual são

ξ ∈ g, v ∈ V ⇒ (ξ,v) ∈ s (B.2.2)

µ ∈ g∗, a ∈ V ∗ ⇒ (µ,a) ∈ s∗ (B.2.3)

1Observe que, apesar de ambos SO(2) e R2 serem abelianos, a estrutura do produto semi-direto de

SE(2) não é abeliana.

B.3. EQUAÇÃO DA CONEXÃO HORIZONTAL E HOLONOMIA 163

Ademais, o fibrado tangente possui a seguinte estrutura

vh ∈ ThG, w ∈ TvV ' V ⇒ (vh,v,w) ∈ T(h,v)(G× V ) (B.2.4)

αh ∈ T ∗hG, a ∈ T ∗vV ' V ⇒ (αh,v,a) ∈ T ∗(h,v)(G× V ) (B.2.5)

A ação à esquerda L de (g,u) em (h,v) é

L(g,u)(h,v) = (gh,u + ρ(g)v) (B.2.6)

Por causa da estrutura de um produto semi-direto de S, o elemento inverso de S é

(g,v)−1 =(g−1,−ρ(g−1)v

),2 onde ρ é um automorfismo de G em V . Segue que

L(g,u)−1(h,v) =(g−1h, g−1v − ρ(g−1)u

)

Uma translação genérica, no fibrado tangente, de (h,v) no ponto (g,u) é dada por

T(h,v)L(g,u)(vh,v,w) = (ThLgvh,u + ρ(g)v, ρ(g)w)

A translação à esquerda para a álgebra de Lie s fica

T(h,v)L(h,v)−1(vh,v,w) =(ThLh−1vh,−ρ(h−1)v + ρ(h−1)v, ρ(h−1)w

)

=(h−1vh,0, ρ(h−1)w

)

=(h−1h,0, ρ(h−1)w

)

= (ξG, eV , ξV ) ∈ s

Observe, da última igualdade, que a álgebra do espaço vetorial é dependente do elemento

de grupo h. Alternativamente, a álgebra de grupo é independente do espaço vetorial V .

Pode-se também verificar o desacoplamento da álgebra abeliana de grupo g da álgebra

do espaço vetorial V através da obtenção das constantes estruturais cbac da álgebra s.

Refira a Seção B.5.

B.3 Equação da Conexão Horizontal e Holonomia

Seja Q dado por uma estrutura principal (s, r) ∈ G×B. A solução da equação diferencial

relativa ao componente horizontal de uma conexão de Ehresman A é dada por:

s(t) = −s(t)A(r(t))r(t) = −TeLg(t)ξ(t), s(0) = e. (B.3.1)2Isto pode ser mostrado fazendo

(g,v) · (g,v)−1 = (g,v) · `g−1,−ρ(g−1)v´

=`gg−1,v − ρ(g)ρ(g−1)v

´= (e,0)

Pela natureza comutativa da ação de grupo, o elemento identidade pode ser obtido quando o elemento

inverso age à esquerda de (g,v).

B.4. CURVATURA DA CONEXÃO 164

Denominando-se s(t)−1s(t) = η(t) ∈ g, onde η(0) = 0, pode-se proceder segundo∫ t

0η dt = η(t)− η(0) = η(t) =

(−

∫ t

0A(r)r dt

)=

(−

∫ t

0ξ(t) dt

)(B.3.2)

A solução da equação diferencial (B.3.1), como discutido em Marsden et al. (1990), é

da forma

s(t) = exp(η(t)) (B.3.3)

e

s(t) = η(t) exp (η(t)) (B.3.4)

Substituindo (B.3.3) e (B.3.4) em (B.3.1), segue que

η exp(η(t)) = − exp(η(t))A(r)r ⇒ (B.3.5)

−A(r)r exp(−

∫ t

0A(r)r dt

)= − exp

(−

∫ t

0A(r)r dt

)A(r)r (B.3.6)

Ambos os lados da última expressão são iguais somente se seus fatores comutarem, ou

seja, se (condição suficiente) o grupo de Lie G for abeliano.

B.4 Curvatura da Conexão

A finalidade desta seção é mostrar como obter as expressões para o cálculo das fases ge-

ométricas de um sistema de corpos articulados. Algumas definições que serão utilizadas

abaixo podem ser encontradas no Capítulo 4 de (Marsden e Ratiu, 1999). As expressões

serão escritas para um sistema de (N = 5)-corpos. O vetor orientação θ e de formato

do sistema φ são dados por:

θ =

θ1

θ2

θ3

θ4

θ5

, φ =

φ1

φ2

φ3

φ4

=

θ21

θ32

θ43

θ54

=

θ2 − θ1

θ3 − θ2

θ4 − θ3

θ5 − θ4

, M =

0 0 0 0

1 0 0 0

1 1 0 0

1 1 1 0

1 1 1 1

Seja dxi, i = 1, . . . , n, a base dual para um dado sistema de coordenadas de uma

variedade genérica. Para uma função real f arbitrária, tem-se

d(f) = gradf · dx = (gradf)[ =∂f

∂x1dx1 +

∂f

∂x2dx2 +

∂f

∂x3dx3 + · · ·+ ∂f

∂xndxn (B.4.1)

Seja dφi, i = 1, . . . , N − 1, a base dual de um sistema de coordenadas para um espaço

de base.


Partindo de (5.2.4), define-se a função vetorial F como

F (φ) = − 1TNJ(φ)M

1TNJ(φ)1N

= (f1, f2, f3, f4)(φ) : R(N−1) → R(N−1)

onde as funções reais fi, ou também 0-formas, são dadas por

fi = fi(φ) : R(N−1) → R(N−1), i = 1, ..., N − 1

Transformando o vetor F em uma 1-forma por meio de um operador bemol [, segue que

F [ = f1dφ1 + f2dφ2 + f3dφ3 + f4dφ4 = A1i (φ)dφi

Observe que F [ corresponde à 1-forma da conexão A(φ)dφ no espaço de base. A

derivada exterior de F [, simbolizada por d(F [), é obtida segundo a expressão

d(F [) = df1 ∧ dφ1 − f1 ∧ d(dφ1) + df2 ∧ dφ2 − f2 ∧ d(dφ2)

+ df3 ∧ dφ3 − f3 ∧ d(dφ3) + df4 ∧ dφ4 − f4 ∧ d(dφ4)

Note o uso do operador produto exterior ∧, agora que dfi é composta por 1-formas.

Sabe-se também, das propriedades gerais de diferenciação externa das formas, que

ddφi = 0. Utilizando (B.4.1), tem-se

d(F [) = df1 ∧ dφ1 + df2 ∧ dφ2 + df3 ∧ dφ3 + df4 ∧ dφ4

=(

∂f1

∂φ1dφ1 +

∂f1

∂φ2dφ2 +

∂f1

∂φ3dφ3 +

∂f1

∂φ4dφ4

)∧ dφ1

+(

∂f2

∂φ1dφ1 +

∂f2

∂φ2dφ2 +

∂f2

∂φ3dφ3 +

∂f2

∂φ4dφ4

)∧ dφ2

+(

∂f3

∂φ1dφ1 +

∂f3

∂φ2dφ2 +

∂f3

∂φ3dφ3 +

∂f3

∂φ4dφ4

)∧ dφ3

+(

∂f4

∂φ1dφ1 +

∂f4

∂φ2dφ2 +

∂f4

∂φ3dφ3 +

∂f4

∂φ4dφ4

)∧ dφ4

Utilizando a propriedade de anti-comutatividade do produto exterior para 1-formas,

obtém-se dx∧ dy = −dy ∧ dx e dx∧ dx = 0. Agrupando os termos com fatores comuns,

chega-se a expressão

d(F [) =(

∂f2

∂φ1− ∂f1

∂φ2

)dφ1 ∧ dφ2 +

(∂f3

∂φ2− ∂f2

∂φ3

)dφ2 ∧ dφ3

+(

∂f4

∂φ3− ∂f3

∂φ4

)dφ3 ∧ dφ4 +

(∂f4

∂φ1− ∂f1

∂φ4

)dφ1 ∧ dφ4

+(

∂f3

∂φ1− ∂f1

∂φ3

)dφ1 ∧ dφ3 +

(∂f4

∂φ2− ∂f2

∂φ4

)dφ2 ∧ dφ4 (B.4.2)


Para o espaço R3, a expressão geral do equacionamento acima segue da seguinte equação

d(F [) = n · curlF dΩ

onde a função curl de F é (∗d(F [))\ e dΩ é o elemento infinitesimal da área sobre o

qual a integração da forma da curvatura é realizada, (Spivak, 1999).

Para uma k-forma genérica no espaço vetorial dual n-dimensional T ∗q Q (k < n) e com

a base dx1, . . . , dxk, tem-se que

ω =∑

I

ωIdxI =∑

i1<···<ik

ωi1,...,ikdxi1 ∧ · · · ∧ dxik (B.4.3)

onde a notação multi-índice I = (i1, . . . , ik) é definida acima. Observe que uma seqüên-

cia de produtos exteriores dos elementos da base acima define a função determinante

usual no espaço de matrizes GL(k,R).3 O diferencial da forma ω é

dω =∑

I

dωIdxI =∑

I

n∑

α=1

∂ω

∂xαdxα ∧ dxI (B.4.4)

Especializa-se, agora, as expressões acima para a conexão principal (k = 1) e para a

curvatura de formas (k = 2). A holonomia para o sistema pode ser computada através

de

holonomia :=∫∫

Ωd(F [) =

∫∫

ΩBdΩ

onde d(F [), para o sistema de 5-corpos, é dada por (B.4.2). Para um sistema de

3-corpos, uma holonomia não nula pode ser obtida variando-se as duas variáveis do

espaço de base. Dada a conexão A : TSO3(2) → so(2) em SO3(2)/SO(2) segue que,

para um movimento horizontal, o movimento na direção da fibra é obtida através da

integração de

Aloc(φ) =∑

ik

aikdφik = a1dφ1 + a2dφ2 (B.4.5)

O sinal negativo é omitido na expressão acima. Por outro lado, para a curvatura B

B = b12dφ1 ∧ dφ2 (B.4.6)

onde b12 pode ser escrita como uma função de aI , usando (B.4.4), como

b12 =∂a2

∂φ1− ∂a1

∂φ2(B.4.7)

3O operador determinante de matrizes é um exemplo de um tensor alternante.

B.5. CONSTANTES ESTRUTURAIS DA ÁLGEBRA SE(2) 167

Note que, por so(2) ser abeliana, o termo restante do colchete de Lie não entra nas

fórmulas de curvatura. Isto pode ser facilmente verificado observando que a única

constante estrutural nula é c111 = 0, uma vez que a álgebra é uni-dimensional.

No fibrado principal, a expressão para os componentes da curvatura da conexão é Bloc(r)·(r1, r2) = Bb

αβ r1r2eb, onde

Bbαβ =

(∂Ab

β

∂rα− ∂Ab

α

∂rβ− cb

acAaαAc

β

)

e onde as cbac são as constantes estruturais detalhadas na Seção B.5.

B.5 Constantes estruturais da álgebra se(2)

Seja g a álgebra de Lie algebra do grupo de Lie G. As constantes estruturais da álgebra

g são os escalares cbac, para a, b, c = 1, ..., n, onde n é a dimensão da álgebra g. Dada

uma base da álgebra e1, e2, ..., en, as constantes estruturais são determinadas através

de

[ea, ec] = cbaceb

onde [., .] representa a operação dada pelos colchetes de Lie. Para o grupo SE(2),

parametrizado pelos elementos com a estrutura g = (rx, ry, θ), tem-se os seguintes com-

ponentes da base para a álgebra correspondente se(2)

e1 =

0 0 1

0 0 0

0 0 0

, e2 =

0 0 0

0 0 1

0 0 0

, e3 =

0 −1 0

1 0 0

0 0 0

pois dim se(2) = 3. Utilizando esta base no cálculo das constantes estruturais através

dos colchetes de Lie, obtém-se

c1ac =

0 0 0

0 0 1

0 −1 0

, c2

ac =

0 0 −1

0 0 0

1 0 0

, c3

ac = 03×3 (B.5.1)

B.6 Espaço Tangente à Órbita do Grupo

O espaço tangente à órbita do grupo pelo ponto q ∈ Q é definido pela expressão

TqOrb(q) = ξQ(q) | ξ ∈ g ⊂ TqQ

B.6. ESPAÇO TANGENTE À ÓRBITA DO GRUPO 168

Para G = SO(2) e um elemento ω ∈ so(2), o espaço TqOrb(q) fica

TqOrbSO(2)(q) = ω

(∂

∂θ1+

∂

∂θ2+ · · ·+ ∂

∂θN

)

= span

∂

∂θ1+

∂

∂θ2+ · · ·+ ∂

∂θN

pois SO(2) age igualmente em todos os corpos e ω = θ = θ1 = · · · = θN . Quando

G = SE(2) e para um elemento da álgebra ξ ∈ se(2), em função das coordenadas

(ω, vx, vy), tem-se que o espaço TqOrbG(q) toma a seguinte forma

TqOrbSE(2)(q) = vx∂

∂rx+ vy

∂

∂ry+ ω

(−ry

∂

∂rx+ rx

∂

∂ry+

∂

∂θ1+

∂

∂θ2+ · · ·+ ∂

∂θN

)

= span

∂

∂rx,

∂

∂ry,−ry

∂

∂rx+ rx

∂

∂ry+

∂

∂θ1+

∂

∂θ2+ · · ·+ ∂

∂θN

Observe que TqOrbG(q) é um espaço tridimensional, ou seja, dimTqOrbG(q) = 3, mer-

gulhado no espaço tangente TqQ, cuja dimensão, em função do número de corpos com-

ponentes do sistema, é 2(N + 2).

B.6.1 Gerador Infinitesimal de SE(2)

O objetivo desta seção consiste em obter o gerador infinitesimal da álgebra do grupo

SE(2) no espaço de configuração Q. A título de exemplificação, utilizar-se-á o espaço

de configuração do sistema de dois corpos (N = 2). Revisa-se, primeiramente, a ação

do grupo G na variedade Q. Seja G = SE(2) o grupo de Lie, dado por g = (R, r) ∈ G,

agindo nele mesmo, ou seja em Q = SE(2), onde q = (R1, rcm) = (θ1, rx, ry) ∈ Q. Este

é o típico caso de transformações da configuração do corpo rígido no plano. Portanto,

a ação à esquerda Φg do grupo SE(2) em Q fica

Φg(q) =

[R r

0 1

][R1 rcm

0 1

]=

[RR1 Rrcm + r

0 1

](B.6.1)

Seja agora a ação de SE(2), com a mesma parametrização acima, em Q = S1×S1×R2,

onde q = (R1,R2, rcm) = (θ1, θ2, rx, ry) ∈ Q. Logo, a ação à esquerda Φg é

Φg(q) =

[R r

0 1

][R1 R2 rcm

0 0 1

]=

[RR1 RR2 Rrcm + r

0 0 1

](B.6.2)

Observe que a orientação relativa entre os corpos 1 e 2, dada pela coordenada φ do

espaço de base B, não é alterada com a ação de grupo. Isto equivale a dizer que a


ação de grupo se aplica somente à componente da fibra G do espaço de configuração Q,

permanecendo inalteradas as coordenadas do espaço de base B.

Seja o elemento da álgebra de Lie se(2) dado por ξ = (ω,v) = (ω, vx, vy), onde ω define

a matriz anti-simétrica Ω como

Ω =

[0 −ω

ω 0

]= ωM ∈ so(2)

onde M é a matriz simplética definida na Seção A.2.2. Seja uma curva na álgebra se(2)

parametrizada por t e dada por tξ = t(ω, vx, vy) ∈ se(2). Para computar a exp de tξ

observe que, para tω 6= 0, tem-se

exp(tξ) =

[R(tω) p(t)

0 1

]∈ SE(2) (B.6.3)

onde

p(t) =1tω

[sin(tω) −(1− cos(tω))

1− cos(tω) sin(tω)

][tvx

tvy

](B.6.4)

Quando tω = 0, segue, da regra de diferenciação de l’Hospital, que exp(tξ) é simples-

mente tξ. Portanto

Φexp(tξ)(q) =

(R(tω)R1,R(tω)R2,R(tω)r + p(t)), para ω 6= 0 (B.6.5a)

(R(tω)R1,R(tω)R2,R(tω)r + tv), para ω = 0 (B.6.5b)

Logo, o gerador infinitesimal é dado por

ξQ(q) =d

dt

∣∣∣∣t=0

Φexp(tξ)(q) (B.6.6)

=(ΩR1, ΩR2, Ωr + v

)(B.6.7)

pois

d

dt

∣∣∣∣t=0

R(tω) =

R(tω)Ω∣∣∣t=0

= Ω, ou (B.6.8a)

ΩR(tω)∣∣∣t=0

= Ω (B.6.8b)

ed

dt

∣∣∣∣t=0

p(t) =1ω

ωR(tω)∣∣∣∣t=0

v = I2v = v (B.6.9)

Procura-se, agora, obter uma base para o espaço gerado pela Álgebra de Lie, parametri-

zado por ξ, na variedade de quatro dimensões Q. Qualquer elemento do espaço tangente


sobre Q tem coordenadas dadas por (x, y, θ1, θ2). De (B.6.7), segue que

q = x∂

∂x+ y

∂

∂y+ θ1

∂

∂θ1+ θ2

∂

∂θ2

= (−yω + vx)∂

∂x+ (xω + vy)

∂

∂y+ ω

∂

∂θ1+ ω

∂

∂θ2(θ1 = θ2 = θ = ω)

= vx∂

∂x+ vy

∂

∂y+ ω

(−y

∂

∂x+ x

∂

∂y+

∂

∂θ1+

∂

∂θ2

)= ξQ(q)

Ou, equivalentemente

ξQ(q) = (vx − ryω)∂

∂x+ (vy + rxω)

∂

∂y+ ω

∂

∂θ1+ ω

∂

∂θ2

O espaço gerado pela Álgebra de Lie, através de ξ, em Q é denominada espaço tangente

á órbita do grupo em q e representado por TqOrb(q). Segundo a descrição do caso

acima, este espaço é construído da seguinte maneira

TqOrb(q) = span

∂

∂x,

∂

∂y,−y

∂

∂x+ x

∂

∂y+

∂

∂θ1+

∂

∂θ2

⊂ TqQ

e, portanto, dimTqOrb(q) = 3. Logo, uma base natural para o gerador de se(2) em Q é

(1, 0, 0)Q =∂

∂x

(0, 1, 0)Q =∂

∂y

(0, 0, 1)Q = −y∂

∂x+ x

∂

∂y+

∂

∂θ1+

∂

∂θ2

Observe que o quando espaço de configuração Q é dado por uma estrutura principal

G × B, o gerador infinitesimal em Q não apresenta influência da ação de grupo nas

direções do espaço de base B. No caso estudado acima, o gerador infinitesimal adquire

a seguinte forma:

(1, 0, 0)Q =∂

∂x

(0, 1, 0)Q =∂

∂y

(0, 0, 1)Q = −y∂

∂x+ x

∂

∂y+

∂

∂θ1+ 0

∂

∂φ

171

Apêndice C

Modelagem Complementar

C.1 O Corpo Rígido

Centro deMassa

f1

f2

Referencial

ReferencialMovel

Inercial

y

x

z1

z2

Figura C.1: O corpo rígido com dois propulsores no SE(2).

Considere um corpo rígido no plano com dois propulsores f1, f2 alinhados na direção

longitudinal do corpo e localizados simetricamente em ambos os lados do centro de

massa. Note, pela Fig. C.1, que os propulsores atuam na direção v do referencial do

móvel do corpo.

As coordenadas inerciais são determinadas por (rx, ry, θ) e por µS = (px, py, pθ), onde

rx, ry, θ são as coordenadas de grupo SE(2) do centro de massa do corpo. O movi-

mento no referencial do corpo é parametrizado por µB = (Px, Py, Pθ). As equações de

C.1. O CORPO RÍGIDO 172

movimento, no referencial inercial, são dadas por:

rx = px/m (C.1.1)

ry = py/m (C.1.2)

θ = pθ/I (C.1.3)

px = −(f1 + f2) sin(θ) (C.1.4)

py = (f1 + f2) cos(θ) (C.1.5)

pθ = (f2 − f1)L (C.1.6)

Note que a aplicação momento fornece o momento total do sistema com relação à origem

do referencial inercial:

J(vq) = µS =

px

py

rxpy − rypx + pθ

=

mrx

mry

m(rxry − ry rx) + Iθ

Na ausência de esforços externos, a taxa de variação temporal do momento total µS ≡ 0,

como previsto pelo Teorema de Noether.

Observe que a estrutura das equações acima em muito se assemelha à estrutura das

equações cinemáticas do uniciclo, dadas por

rx = u1 cos(θ)

ry = u1 sin(θ)

θ = u2

e parametrizadas pela entrada (u1, u2). Sabe-se que estas equações não são lineari-

záveis por realimentação estática (Respondek, 2002), pela falta de involutividade de

determinadas distribuições geradas pelos campos vetoriais do modelo. As equações de

movimento (dinâmica) do uniciclo são dadas por

rx = px/m (C.1.7)

ry = py/m (C.1.8)

θ = pθ/I (C.1.9)

px = u1 cos(θ) (C.1.10)

py = u1 sin(θ) (C.1.11)

pθ = u2 (C.1.12)

C.1. O CORPO RÍGIDO 173

Observe a semelhança das equações acima com as equações de movimento do corpo

rígido (C.1.1). Isto pode ser verificado por uma reparametrização das variáveis de

entrada, em relação aos parâmetros de entrada originais (f1, f2), definida por[u1

u2

]=

[1 1

−1 1

][f1

f2

]=

[f1 + f2

f2 − f1

]

O corpo rígido com dois propulsores possui todos os seus autovalores nulos, quando

o modelo dinâmico correspondente é expresso nas coordenadas do referencial inercial

(rx, ry, θ, px, py,Π). Neste referencial o sistema é controlável na fibra, ou na álgebra

se(2)∗, uma vez que o critério de posto pleno (LARC) é satisfeito para um sistema com

campo vetorial f(z) identicamente nulo. O equilíbrio do corpo rígido dado no referencial

inercial é dado por (q, p) = (q0, 0), fixada uma configuração q0 qualquer.

Obtendo-se o momento correspondente no referencial móvel, através de µB = Ad∗g−1µS ,

tem-se

µB =

cos(θ)px + sin(θ)py

− sin(θ)px + cos(θ)py

Iθ

=

Px

Py

Pθ

Como, no caso plano, um dos eixos está sempre alinhado, tem-se que Pθ = pθ = Iθ e,

portanto, quando da conservação do momento angular pθ = Pθ = 0. As equações de

movimento escritas no referencial móvel, utilizando o momento linear acima, são dadas

por:

rx =1m

(Px cos(θ)− Py sin(θ)) (C.1.13)

ry =1m

(Px sin(θ) + Py cos(θ)) (C.1.14)

θ = Pθ/I (C.1.15)

Px = Pθ/IPy (C.1.16)

Py = −Pθ/IPx + (f1 + f2) (C.1.17)

Pθ = (f2 − f1)L (C.1.18)

Quando expresso nas coordenadas do referencial móvel (rx, ry, θ, Px, Py,Π), entretanto,

pode-se verificar a existência de dois autovalores no eixo imaginário (±iΠ/I) e os quatro

autovalores restantes são nulos. Neste caso, o campo vetorial das variáveis em se(2)∗ é

não-nulo.

C.2. SISTEMA MULTI-CORPOS 174

C.2 Sistema Multi-Corpos

C.2.1 Matriz de Inércia do Sistema

Detalha-se nesta seção o algoritmo iterativo para determinação da matriz de inércia Joriginalmente apresentado em Sreenath (1987), mas mostrado corretamente a seguir. A

matriz de inércia é utilizada no modelo analítico apresentado na Seção 4.1.

Considera-se o referencial móvel localizado no centro de massa do sistema. A posição

do centro de massa do sistema, em relação ao referencial inercial Figura C.2, é dado por

r =1m

N∑

i=1

mkrk (C.2.1)

ReferencialMovel

Centro deMassa

ReferencialInercial

r

corpo k + 1

corpo k

αkβk

corpo k − 1

rk

r0k

Figura C.2: Esquema para a modelagem da matriz de inércia do sistema multi-articulado

J.

Para um sistema de N corpos interconectados note que α1, β1@. Adicionalmente, β2 é

o vetor do centro de massa do corpo 1 a junta com o corpo 2.

A posição do k-ésimo corpo em relação ao baricentro do sistema, é dado, em coordenadas


inerciais, por

r0k = −

N∑

l=2

εl

∑

i ∈ S0,l

i 6= 1

βi

+

[−

N∑

l=2

εlαl

]+

∑

j ∈ S0,k

j 6= 1

βj + αk

= −N∑

l=2

εl

[N∑

i=1

Il,iβi

]+

N∑

i=1

Ik,iβi −N∑

l=2

εlαl + αk

= −N∑

i=1

[N∑

l=2

εl

]Il,iβi +

N∑

i=1

Ik,iβi −N∑

i=2

εiαi + αk

=N∑

i=1

[Ik,i −

N∑

l=2

Il,iεl

]βi +

N∑

i=1

bk,iαi

=N∑

i=1

[ak,iβi + bk,iαi]

Os vetores rk e r0k são dados no referencial inercial. A inércia expandida é obtida

fazendo-se

Ik = Ik +N∑

j=1

mj‖δkj‖2 (C.2.2)

onde

δkj = bkjαj +∑

∀ i tal queJ(i) = j

akiβi (C.2.3)

onde os coeficientes acima são definidos por

aki = Iki −N∑

l=2

Iliεl, (C.2.4)

bki =

1− εi, para k = i e i 6= 1 (C.2.5a)

0, para k = i = 1 (C.2.5b)

−εi, para k 6= i e i 6= 1, (C.2.5c)e

Ili =

1, se i ∈ S0,l e i 6= 1 (C.2.6a)

0, caso contrário (C.2.6b)

O processo iterativo inicia-se no corpo denominado corpo 1. Note que, ao começar a

iteração do corpo 1, α1 and β1 não são definidos.


Observação C.2.1. A matriz de inércia J é invariante a ação da fibra SE(2), como

pode ser observado pela ausência de coordenadas do grupo, mas função apenas das

coordenadas φ do espaço de base B. Além disso, a matriz de inércia determinada pelo

algoritmo acima é definida positiva e simétrica e, portanto, invertível e diagonalizável,

respectivamente, como esperado.

C.2.2 Modelo do sistema de 3-corpos

A matriz de inércia do sistema é dada por

J =

J11 J12 J13

J21 J22 J23

J31 J32 J33

(C.2.7)

onde, lembrando que J = JT , e

J11 = I1 + [m1(−e2 − e3)2 + (m2 + m3)(1− e2 − e3)2]d21

J22 = I2 + [m1(−e2 − 2e3)2 + m2(1− e2 − 2e3)2 + m3(2− e2 − 2e3)2]d22

J33 = I3 + [(m1 + m2)e23 + m3(1− e3)2]d2

3

J12 = J21 = [m1(e2 + e3)(e2 + 2e3) + (m2(1− e2 − 2e3) + m3(2− e2 − 2e3))

(1− e2 − e3)]d1d2 cos(φ1)

J13 = J31 = [m1e3(e2 + e3)− (m2e3 −m3(1− e3))(1− e2 − e3)]d1d3 cos(φ1 + φ2)

J23 = J32 = [(m1(e2 + 2e3)−m2(1− e2 − 2e3))e3 + m3(2− e2 − 2e3)(1− e3)]

d2d3 cos(φ2)

Adotando m1 = m2 = m3 = m, I1 = I2 = I3 = I, e d1 = d2 = d3 = d, J simplifica na

J =

I + 23md2 md2 cos(φ1) 1

3md2 cos(φ1 + φ2)

md2 cos(φ1) I + 2md2 md2 cos(φ2)13md2 cos(φ1 + φ2) md2 cos(φ2) I + 2

3md2

(C.2.8)

As equações do movimento de translação, quando apenas as forças de propulsão f1 e f3

estão presentes, são dadas por

rx =px

m1 + m2 + m3=

px

3m

ry =py

m1 + m2 + m3=

py

3m

px = − sin(θ1)f1 − sin(θ1 + φ1 + φ2)f3

py = cos(θ1)f1 + cos(θ1 + φ1 + φ2)f3


A dinâmica da orientação do sistema θ1 segue da expressão

θ =∂H

∂µ1

= 3µ1(5m2d4 + 16Imd2 + 6I2) + md2(2I + md2)(3µ2 cos(φ1) + µ3 cos(φ1 + φ2))

18∆+

+ 3m2d4(3µ3 cos(φ1 − φ2) + µ2 cos(φ1 + 2φ2)− 3µ1 cos(2φ2))

18∆

onde ∆ = det(J) e

∆ = I3 + md2(103

I2 +3718

Imd2 +518

m2d4) +118

m2d4(md2 − I) cos(2φ2 + 2φ1)−

− 16m2d4(md2 + 3I)(cos(2φ1) + cos(2φ2))

Utilizando a parametrização θcm = (θ1+θ3)/2, os campos vetoriais relativos às entradas

(f1, f2), T1 e T2 são os seguintes

g1 =

0

0

0

0

0

sin(−θcm + (φ1 + φ2)/2)

cos(−θcm + (φ1 + φ2)/2)

d(−2/3− cos(φ1)− cos(φ1 + φ2)/3)

0

0

, g2 =

0

0

0

0

0

− sin(θcm + (φ1 + φ2)/2)

cos(θcm + (φ1 + φ2)/2)

d(cos(φ1 + φ2)/3 + cos(φ2) + 2/3)

0

0

Os campos vetoriais dos torques são dados por g3 = [0, 0, 0, 0, 0, 0, 0, 0, 1, 0] e g4 =

[0, 0, 0, 0, 0, 0, 0, 0, 0, 1].

C.2.3 Modelo do sistema de 5-corpos

Para N = 5 onde tomam-se mi = m, Ii = I, e di = d, i = 1, . . . , 5, a matriz de inércia

J simplifica a

J =

I + 4/5md2 7/5md2 cos(θ21) md2 cos(θ31) 3/5md2 cos(θ41) 1/5md2 cos(θ51)

7/5md2 cos(θ21) I + 16/5md2 3md2 cos(θ32) 9/5md2 cos(θ42) 3/5md2 cos(θ52)

md2 cos(θ31) 3md2 cos(θ32) I + 4md2 3md2 cos(θ43) md2 cos(θ53)

3/5md2 cos(θ41) 9/5md2 cos(θ42) 3md2 cos(θ43) I + 16/5md2 7/5md2 cos(θ54)

1/5md2 cos(θ51) 3/5md2 cos(θ52) md2 cos(θ53) 7/5md2 cos(θ54) I + 4/5md2


As equações do movimento de translação são dadas por

rx =px

m1 + m2 + m3 + m4 + m5=

px

5m

ry =py

m1 + m2 + m3 + m4 + m5=

py

5m

px = − sin(θ1)f1 − sin(θ1 + φ1 + φ2 + φ3 + φ4)f5

py = cos(θ1)f1 + cos(θ1 + φ1 + φ2 + φ3 + φ4)f5

A dinâmica rotacional do sistema é determinada por

θi,i−1 =∂H0

∂µi− ∂H0

∂µi−1, i = 2, .., N

µ1 =∂H0

∂θ2,1− T1 + T ext

1

µ2 =∂H0

∂θ3,2− ∂H0

∂θ2,1− T2 + T1

µ3 =∂H0

∂θ4,3− ∂H0

∂θ3,2− T3 + T2

µ4 =∂H0

∂θ5,4− ∂H0

∂θ4,3− T4 + T3

µ5 = − ∂H0

∂θ5,4+ T4 + T ext

5

onde T ext1 e T ext

5 são determinadas em (4.2.9), para k = 1, 5. As demais equações da

dinâmica serão omitidas por serem demasiadamente extensas.

C.2.4 Modelo Cinemático do Sistema

O modelo cinemático para o sistema multi-corpos é composto pelo componente cine-

mático em (3.4.1), descrevendo o movimento do sistema na fibra G, cujas entradas são

dadas pelas coordenadas de velocidades que parametrizam o momento do sistema. Além

da expressão acima, a cinemática do sistema é definida pelas equações em B

φi = θi+1 − θi, i = 1, . . . , N − 1

Observe que, quando o momento do sistema não representa uma entrada mas apenas

um parâmetro não-nulo do movimento, o sistema cinemático é caracterizado por um

componente de dinâmica livre.


C.2.5 Modelagem Lagrangiana

Reproduz-se nas próximas páginas o artigo Souza e Maruyama (2007), publicado no

3rd IFAC Symposium on Systems, Structures and Control - SSSC, realizado em Fóz do

Iguaçú em Outubro de 2007.

Modelagem e Controle de uma Classe de Sistemas Multi-Corpos ...

Documents

Transcript of Modelagem e Controle de uma Classe de Sistemas Multi-Corpos ...