Modelagem e Controle de uma Classe de Sistemas Multi-Corpos ...
Transcript of Modelagem e Controle de uma Classe de Sistemas Multi-Corpos ...
Eric Conrado de Souza
Modelagem e Controle de uma Classe deSistemas Multi-Corpos Móveis
Tese apresentada a Escola Politécnica da
Universidade de São Paulo para obtenção
do Título de Doutor em Engenharia Mecâ-
nica
São Paulo
Março 2008
Eric Conrado de Souza
Modelagem e Controle de uma Classe deSistemas Multi-Corpos Móveis
Tese apresentada a Escola Politécnica da
Universidade de São Paulo para obtenção
do Título de Doutor em Engenharia Mecâ-
nica
Área de Concentração:
Engenharia de Controle e Automação
Mecânica
Orientador:
Prof. Dr. Newton Maruyama
São Paulo
Março 2008
Agradecimentos
Ao Prof. Dr. Newton Maruyama por toda a jornada de acompanhamento, orientação e
amizade.
A Profa. Dra. Naomi Ehrich Leonard pela co-orientação, introdução à geometria e
incentivo durante o ano de 2005.
Ao Prof. Dr. Pedro Tonelli pela disponibilidade de conversar sobre assuntos relacionados
aos meus estudos e pela oportunidade do seminário no IME-USP.
Aos Prof. Dr. Jair Koiller e Prof. Dr. Agenor de Toledo Fleury pela forma atenciosa
com que se dispuseram a me receber algumas vezes para conversar sobre o trabalho que
realizava.
Aos colegas de sala e laboratório pela convivência, amizade e ajuda.
A CAPES pela concessão das bolsas de Doutorado e PDEE.
A minha família pelo apoio. Dedico este trabalho a minha família.
A Deus, pela força, pela motivação, por mais um degrau galgado; sem Ele “nada que se
fez, se fez”.
Resumo
No que segue, propõe-se uma classe de sistemas robóticos multi-corpos, cujos corpos
componentes estão fisicamente acoplados através de juntas rotativas ativas. Os sis-
temas da classe considerada possuem mobilidade irrestrita no espaço plano uma vez
que propulsores distribuídos ao longo dos corpos do sistema. A modelagem dinâmica
destes sistemas é apresentada sob as abordagens Hamiltoniana e Lagrangiana da mecâ-
nica analítica. A descrição destes métodos de modelagem, assim como os modelos por
eles obtidos, é realizada com ênfase na interpretação geométrica da matemática envol-
vida. Alguns exemplos de parametrizações do espaço de fase do sistema são discutidos e
exemplos de modelagem em função destas parametrizações são obtidos. Ademais, alguns
critérios de análise de controlabilidade não-linear são revisados e aplicados aos modelos
do sistema com a estrutura de entradas considerada. Alguns casos de estabilização da
classe de sistemas são também discutidos. Resultados de simulação de estabilização são
obtidos para sistemas através de estudos de casos. Sistemas completamente controlados
no espaço de estados podem ser linearizados através de uma técnica de linearização
por realimentação e estabilizados com uma realimentação de estados. Para os sistemas
cuja controlabilidade é deficiente, propõe-se a modificação de um método de controle
de sistemas sub-atuados e uma lei de controle por realimentação é obtida pela teoria de
estabilidade de Lyapunov. A classe de sistemas aqui discutida possui grande potencial
de aplicação nos ambientes espacial e submarino.
Abstract
In the following, a class of multi-body robotic systems is proposed in which its system
component bodies are physically coupled by active rotating joints. The systems be-
longing to the proposed class have unrestricted mobility on the plane since thrusters
are distributed along the system. System dynamical modeling is obtained through the
analytic mechanical Hamiltonian and Lagrangian methods. The presentation of these
methods, as well as the dynamical models obtained by them, is realized with an empha-
sis in the geometrical interpretation of the corresponding mathematics. A few different
system phase space parameterizations approaches are discussed and modeling examples
are presented under these parameterizations. Additionally, some nonlinear controllabi-
lity analysis criteria are reviewed and applied to system dynamical models composed
by the input structure mentioned above. A few stabilization case studies for the class
of systems are also discussed and simulation results are presented. Totally controlled
systems in the phase space can be linearized by feedback linearization techniques and
stabilized through a state feedback. For partially controllable systems a modification of
a stabilization method for under-actuated systems is proposed which renders feedback
control via Lypunov stability theory. The class of systems discussed has great potential
for space and underwater applications.
iii
Sumário
Resumo ii
Abstract iii
Sumário iii
Lista de Figuras vii
1 Introdução 11.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Sistemas Multi-Articulados . . . . . . . . . . . . . . . . . . . . . 21.1.2 Revisão da Literatura Técnica . . . . . . . . . . . . . . . . . . . . 3
1.2 Proposta de uma Classe de Sistemas Robóticos Móveis . . . . . . . . . . 41.3 Objetivos de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1 Contribuições do Trabalho . . . . . . . . . . . . . . . . . . . . . . 71.3.2 Justificativa do uso da Teoria Geométrica . . . . . . . . . . . . . 81.3.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3.4 Organização da Tese . . . . . . . . . . . . . . . . . . . . . . . . . 10
Lista de Símbolos 1
2 Elementos da Mecânica Geométrica 122.1 Geometria Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.1 Campos vetoriais e Espaços Tangentes . . . . . . . . . . . . . . . 132.1.2 Distribuições de Campos Vetoriais . . . . . . . . . . . . . . . . . 16
2.2 Mecânica Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2.1 Grupos e Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . 172.2.2 Mecânica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . 202.2.3 Mecânica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . 21
2.3 Sistemas Mecânicos Simples . . . . . . . . . . . . . . . . . . . . . . . . . 252.4 Sistemas com Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4.1 Redução de Sistemas com Simetria . . . . . . . . . . . . . . . . . 302.5 Espaços Fibrados e Conexões . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5.1 A Conexão de Ehresmann . . . . . . . . . . . . . . . . . . . . . . 312.5.2 A Conexão Principal . . . . . . . . . . . . . . . . . . . . . . . . . 332.5.3 Curvatura do Fibrado Tangente . . . . . . . . . . . . . . . . . . . 34
SUMÁRIO iv
3 Mecânica não-Holonômica 353.1 Mecânica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.1 Princípio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . 363.1.2 Sistemas com Restrições . . . . . . . . . . . . . . . . . . . . . . . 363.1.3 Princípio de Lagrange-d’Alembert . . . . . . . . . . . . . . . . . 383.1.4 Equações de Lagrange-d’Alembert . . . . . . . . . . . . . . . . . 383.1.5 Não-holonomicidade do Sistema . . . . . . . . . . . . . . . . . . . 40
3.2 A Conexão Mecânica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.3 Princípio Variacional Reduzido . . . . . . . . . . . . . . . . . . . . . . . 433.4 Reconstrução da Dinâmica . . . . . . . . . . . . . . . . . . . . . . . . . . 443.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4 Modelagem do Sistema Multi-Corpo 484.1 Cinemática do Sistema no Espaço Completo . . . . . . . . . . . . . . . . 49
4.1.1 Simetria do Sistema e Redução . . . . . . . . . . . . . . . . . . . 534.2 Modelo do Sistema no Espaço Cotangente . . . . . . . . . . . . . . . . . 56
4.2.1 Modelagem da Entrada do Sistema . . . . . . . . . . . . . . . . . 594.2.2 Sistema de Controle Multi-Corpos . . . . . . . . . . . . . . . . . 624.2.3 Exemplo: o sistema de 2-corpos . . . . . . . . . . . . . . . . . . . 64
4.3 Modelagem da Dinâmica no Fibrado Principal . . . . . . . . . . . . . . . 664.3.1 O Fibrado Principal . . . . . . . . . . . . . . . . . . . . . . . . . 664.3.2 Exemplos de Parametrizações da Configuração . . . . . . . . . . 67
4.4 Modelagem Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 794.4.1 Exemplo: o sistema de 2-corpos (θcm = θ1) . . . . . . . . . . . . 79
4.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5 Análise do Sistema e Controlabilidade 855.1 Equilíbrio e Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.1.1 Equilíbrio do Sistema Multi-corpos . . . . . . . . . . . . . . . . . 865.2 Fases Geométricas: Análise . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.2.1 O Contexto Geométrico . . . . . . . . . . . . . . . . . . . . . . . 925.3 Análise de Controlabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.3.1 Álgebra e Distribuição de Acessibilidade de Sistemas Afim . . . . 965.3.2 Controlabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 995.3.3 Controlabilidade do Sistema de Dois Corpos . . . . . . . . . . . . 101
5.4 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6 Estabilização e Planejamento de Trajetórias 1136.1 Estabilização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1146.2 Linearização por Realimentação . . . . . . . . . . . . . . . . . . . . . . . 115
6.2.1 Linearização por Realimentação Dinâmica . . . . . . . . . . . . . 1236.2.2 O Sistema Multi-Articulado . . . . . . . . . . . . . . . . . . . . . 125
6.3 Controle de Sistemas Sub-atuados . . . . . . . . . . . . . . . . . . . . . . 1286.3.1 O Sistema de 2-Corpos . . . . . . . . . . . . . . . . . . . . . . . . 130
6.4 Planejamento de Trajetórias e Controle Ótimo . . . . . . . . . . . . . . . 1386.4.1 Controle Ótimo do Modelo Cinemático . . . . . . . . . . . . . . . 140
6.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
SUMÁRIO v
7 Conclusões 1467.1 Sugestões para Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . 147
Referências Bibliográficas 149
Apêndices 153
A Fundamentos Gerais 154A.1 Aplicações e Conjuntos Usuais na Mecânica Geométrica . . . . . . . . . 154A.2 Representações Espaciais com a Álgebra do Grupo . . . . . . . . . . . . 156
A.2.1 Representações entre Referenciais . . . . . . . . . . . . . . . . . . 156A.2.2 O Grupo SE(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
B Resultados Auxiliares 161B.1 Superfície de Energia Constante para o Sistema de 2-corpos . . . . . . . 161B.2 Desacoplamento dos Componentes da se(2) . . . . . . . . . . . . . . . . 162B.3 Equação da Conexão Horizontal e Holonomia . . . . . . . . . . . . . . . 163B.4 Curvatura da Conexão . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164B.5 Constantes estruturais da álgebra se(2) . . . . . . . . . . . . . . . . . . . 167B.6 Espaço Tangente à Órbita do Grupo . . . . . . . . . . . . . . . . . . . . 167
B.6.1 Gerador Infinitesimal de SE(2) . . . . . . . . . . . . . . . . . . . 168
C Modelagem Complementar 171C.1 O Corpo Rígido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171C.2 Sistema Multi-Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
C.2.1 Matriz de Inércia do Sistema . . . . . . . . . . . . . . . . . . . . 174C.2.2 Modelo do sistema de 3-corpos . . . . . . . . . . . . . . . . . . . 176C.2.3 Modelo do sistema de 5-corpos . . . . . . . . . . . . . . . . . . . 177C.2.4 Modelo Cinemático do Sistema . . . . . . . . . . . . . . . . . . . 178C.2.5 Modelagem Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . 179
vi
Lista de Figuras
1.1 Sistema robótico multi-articulado móvel, como N corpos, sob ação deforças fi e de torques das juntas Tj . . . . . . . . . . . . . . . . . . . . . . 6
2.1 Difeomorfismos f entre variedades, levantamentos tangentes Tf em es-paços tangentes TmM e levantamentos cotangentes T ∗f em espaços co-tangentes T ∗nN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 O espaço de configuração Q, o espaço tangente e o seu dual em q, e aforça f(vq) em T ∗q Q. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Levantamento cotangente T ∗f das ações de grupo f . Os campos vetoriaisX|Q e X|S são definidos, respectivamente, em Q e S. . . . . . . . . . . . 19
2.4 Equivariância da aplicação momento J equivale a comutação das ações. . 252.5 Trajetórias da dinâmica de rotação do corpo rígido no espaço tridimen-
sional. A intersecção da superfície de conservação do momento angular,dada por esferas concêntricas ao centro de massa do corpo, com a superfí-cie representativa da conservação de energia, descrita por elipsóides (nãoilustrados) fornece as possíveis trajetórias do corpo no espaço de variáveis. 29
2.6 Espaço tangente total TqQ, espaço tangente sobre B e o levantamento daprojeção π. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 O fibrado principal. Φg(q) corresponde a órbita da ação de g ∈ G em q,Seção A.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1 Em geral, o pareamento dos elementos duais de TQ e T ∗Q é não nulo.Na mecânica, no entanto, as forças de restrições fc são perpendiculares avelocidade, pois não realizam trabalho. . . . . . . . . . . . . . . . . . . . 39
3.2 Diagrama definindo a conexão mecânica. . . . . . . . . . . . . . . . . . . 41
4.1 O i-ésimo sistema de coordenadas é especificado, através da posição dasua origem ri e orientação θi, em relação ao i− 1-ésimo referencial. . . . 50
4.2 Trajetórias da dinâmica de rotação do sistema de dois corpos no plano.As trajetórias são determinadas pela intersecção da superfície cilíndrica,devida à conservação do momento angular do sistema µ1 + µ2, com oelipsóide, representativo da conservação de energia H. Ver Seção B.1. . . 55
4.3 Efeito das forças de propulsão nas juntas de rotação. . . . . . . . . . . . 604.4 Entradas relativas aos propulsores no referencial móvel do sistema de
2-corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
LISTA DE FIGURAS vii
5.1 Mudança de fase do sistema de três corpos. A mudança de fase foi cal-culada a partir de (5.2.9), para um caminho fechado no espaço de baseB parametrizado por α, β = 3. As coordenadas do espaço de base sãodadas por (φ1, φ2) = (θ12, θ23). . . . . . . . . . . . . . . . . . . . . . . . 94
5.2 Curvatura B relativa à conexão principal do sistema de três corpos. Acurvatura da conexão A dada em (5.2.9) foi obtida a partir de (5.2.10). . 95
5.3 Cinemática do sistema de dois corpos. . . . . . . . . . . . . . . . . . . . 101
6.1 Resultados da estabilização da configuração no ponto (−9.90,−5.10,−1.55, 2.00,−2.00) do sistema de 3-corpos, através de linearização por realimentação. 121
6.2 Resultados da estabilização do momento do sistema de 3-corpos, atravésde linearização por realimentação. . . . . . . . . . . . . . . . . . . . . . . 122
6.3 Estabilização da velocidade do sistema de 2-corpos. . . . . . . . . . . . . 1336.4 Planejamento de trajetória do sistema de 2-corpos. . . . . . . . . . . . . 1366.5 Resultados de simulação em malha aberta do planejamento de trajetória
do sistema de 2-corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1376.6 Resultados de estabilização de posição e velocidade pela composição das
leis de controle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1396.7 Resultados do controle ótimo aplicado ao modelo cinemático do sistema
de dois corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1436.8 Resultados do controle ótimo aplicado ao modelo cinemático do sistema
de dois corpos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
C.1 O corpo rígido com dois propulsores no SE(2). . . . . . . . . . . . . . . 171C.2 Esquema para a modelagem da matriz de inércia do sistema multi-articulado
J. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
Lista de Símbolos
0(.) vetor de zeros ou matriz1N vetor coluna de N unsA conexão de EhresmanA conexão principalB curvatura da conexão de Ehresman AB curvatura da conexão principal AR Matriz de rotação, elemento do grupo de Lie SO(n)f campo vetorial da dinâmica livre de um sistemaf(.) força de propulsãog elemento do Grupo de Lie G ou campo vetorial de entrada de um sistemaB Espaço de baseG Grupo de LieG inércia generalizada, isomorfismo da métrica de Riemanng álgebra de Lie do grupo de Lie GJ Matriz de inércia do sistemaJ Aplicação momentoH Hamiltoniano de um sistemaKE Energia cinética de um sistemaL Lagrangiano de um sistemaLX(F ) derivada direcional da função F na direção do campo vetorial XM variedade diferenciável genéricam número de entradas ou restriçõesn dimensão do espaço de estados ou de faseN número de corpos componentes do sistemaq configuração do sistema, q ∈ QQ variedade ou espaço de configuraçãop elemento de uma variedade diferenciável genérica M ou elemento do espaço de fasede momento de um sistema, p ∈ T ∗q QX campo vetorial genéricox difeomorfismo ou parametrização de uma variedade diferenciável ao Rn
z elemento do espaço de fase T ∗Q, z = (q, p)〈〈., .〉〉 métrica de Riemann[., .] colchete de Lie dos elementos da álgebra ou de Jabobi-Lie para campos vetoriaisV função de Lyapunovv vetor velocidade, elemento do espaço tangente de uma variedader coordenada genérica do espaço de base Bs coordenada genérica do espaço de grupo G
LISTA DE FIGURAS ix
Caracteres Gregos
θ orientação com relação a um referencial inercialφ ângulo de juntaω velocidade rotational do sistema mecânicoµ momento rotacional do sistema mecânicoτ entrada do sistema mecânicoξ elemento da álgebra de Lie genérica ou novas coordenadas do processo de linearizaçãopor realimentação
Superscrito
∗ - referente a massa total do sistemaext - referente às forças externas
Subscrito
p - referente aos propulsorest - referente aos torques das juntas rotativasB - referente ao referencial móvelS - referente ao referencial inercialcm - referente ao centro de massa do sistemax - referente ao eixo das abscissas do referencial inercialy - referente ao eixo das ordenadas do referencial inercialc - referente a cinemática do sistema
1
Capítulo 1
Introdução
1.1 Contextualização
O projeto de sistemas robóticos, em particular os sistemas móveis, segue uma constante e
irreversível crescente em termos da complexidade de inteligência e de reação ao ambiente,
do projeto do desempenho dinâmico e de interação com o ambiente.
A modelagem da dinâmica do corpo rígido compreende uma descrição dos movimentos
de translação e rotação sob a ação de esforços externos. Para o sistema analisado a
seguir, assim como para todos os sistemas que são compostos por mais de um corpo
rígido, por exemplo, faz-se importante descrever a posição relativa entre os seus elemen-
tos componentes, em conjunto com a descrição da translação e rotação de um ponto
representativo do sistema. Sistemas deste tipo, cujo a dinâmica de muitos corpos es-
tão envolvidos na descrição do mesmo, são denominados sistemas multi-corpos. A
complexidade relativamente maior da dinâmica destes sistemas reside nesta premissa,
uma vez que é necessário um número maior de variáveis para descrever a evolução no
tempo dos graus de liberdade adicionais. Por outro lado, um maior número de graus
de liberdade envolvidos permite incrementar a variabilidade de desempenho do sistema
pois é possível realizar uma maior quantidade de manobras no espaço de movimento.
Um típico exemplo do aumento da inteligência diz respeito aos atributos que conferem
ao sistema maior autonomia, ou seja, capacidade de tomada de decisões, cuja implemen-
tação segue da estruturação de vários níveis hierárquicos ou cooperativos na arquitetura
1.1. CONTEXTUALIZAÇÃO 2
do sistema de controle. Quanto a dinâmica de movimento, uma variedade de técnicas
de controle estão disponíveis que possibilitam projetar trajetórias de movimentos com
margens de estabilidade e de rejeição aos distúrbios bem determinadas e que, em mui-
tas circunstâncias, são estabelecidas através de relações de compromisso. Além disso,
muitos sistemas móveis são dotados de partes móveis internas ou de manipuladores, o
que permite expandir as possibilidades de desempenho, ao passo que, e concomitante-
mente, tornam mais complexos os projetos dinâmico e dos subsistemas que garantem
a autonomia do sistema, (Yuh e West, 2001) e (UUVMP Committee, 2004). Sistemas
desta categoria não apenas realizam tarefas de monitoramento, inspeção ou segurança,
mas operam alterando ativamente o seu meio de atuação ou simplesmente reagindo ao
ambiente.
1.1.1 Sistemas Multi-Articulados
Os sistemas multi-articulados são particularizações dos sistema multi-corpos defini-
dos acima, cujos corpos estão acoplados fisicamente entre si por articulações planas ou
esféricas. Sistemas deste tipo possuem aplicação variada, como a espacial, onde o ônibus
espacial e a estação espacial internacional (ISS) constituem exemplos típicos de veículos
tripulados, e aquática, como nos veículos submarinos tripulados ou não, que possuem
manipuladores, entre outros. Neste último exemplo, com o projeto de veículos operando
com velocidades cada vez mais maiores, ocorre um aumentando do acoplamento dinâ-
mico entre veículo e manipulador através das forças hidrodinâmicas (McLain, Rock e
Lee, 1995). Isto demanda maior capacidade de desempenho do sistema de controle e
dos atuadores do sistema.
No presente trabalho, investiga-se técnicas de modelagem dinâmica, análise da controla-
bilidade dinâmica e cinemática, geração de trajetória e controle para um sistema mecâ-
nico articulado restrito ao plano. O sistema mecânico mencionado consiste em múltiplos
corpos rígidos articulados entre si através de juntas rotativas de um grau de liberdade.
Tal idealização é representativa de sistemas físicos como sistemas mecânicos complexos
ou uma rede de robôs ou veículos móveis acoplados através de manipuladores. Exem-
plos recentes de estudos com sistemas multi-corpos no espaço (3D) e acoplados através
de juntas de rotação podem ser encontrados em (Dubowsky e Papadopoulos, 1993),
(Walsh e Sastry, 1995), (Koningstein e Cannon Jr., 1995), (Rui, Kolmanovsky e Mc-
Clamroch, 2000), entre outros.
1.1. CONTEXTUALIZAÇÃO 3
Um exemplo de aplicação do sistema pode ser representado pela construção e instalação
de estruturas submarinas com auxílio de veículos autônomos, como os AUVs1 dotados
de manipuladores, por exemplo. Neste caso, o movimento simultâneo e coordenado do
veículo e manipulador(es) é considerado acoplado e determinado para atender a diversos
cenários de operação.
O grupo de veículos, componentes do sistema multi-corpo, é passível da variação da
geometria de formação, ou seja, a orientação relativa entre os corpos é variável, visando
o interesse no desempenho de movimento dos corpos de forma coordenada. A atuação
sobre o sistema é realizada através de entradas (ou atuadores) internos e externos,
segundo a nomenclatura de sistemas robóticos. Atuadores internos são responsáveis
pela orientação relativa entre os corpos. Esforços externos, como distúrbios por exemplo,
alteram a dinâmica do sistema em relação a um referencial inercial.
1.1.2 Revisão da Literatura Técnica
Os sistemas robóticos multi-corpos, como os manipuladores robóticos e robôs bípedes,
são uma presente realidade e durante várias décadas vem sendo empregados como auxílio
de produção nos processos industriais e como tema de estudo nas atividades de ensino
e pesquisa. Publicações variadas sobre a teoria de modelagem envolvida, o projeto e
construção, controle ou tendências experimentais tem sido produzidas; dentre estas,
pode-se mencionar a referência pioneira (Wittenburg, 1977), além das citadas na seção
anterior, entre outras.
Mais recentemente, sistemas multi-articulados são estudados com vista a aplicação es-
pacial, em particular no controle de atitude de satélites artificiais. Apresentou-se em
Sreenath (1987) a modelagem de um sistema multi-articulado no plano sob um tra-
tamento geométrico. Em Reyhanoglu e McClamroch (1991) pode-se encontrar uma
discussão sobre a controlabilidade e estabilização de sistemas multi-corpos com a restri-
ção de invariância do momento angular. Dubowsky e Papadopoulos (1993) apresentou
a dinâmica e controle de sistemas robóticos espaciais totalmente controláveis no espaço
tridimensional. O controle não-linear da atitude e da forma de um sistema composto por
apêndices articulados e rodas de inércia foi discutido em Rui et al. (2000). Shen (2002)
dissertou sobre o controle de sistema multi-corpos através da variação de forma. Como
aplicação submarina, Melli, Rowley e Rufat (2006) apresentam um algoritmo para a1Do inglês: Autonomous Underwater Vehicles.
1.2. PROPOSTA DE UMA CLASSE DE SISTEMAS ROBÓTICOS MÓVEIS 4
geração de trajetórias de translação pelo controle de forma do sistema multi-articulado
em um meio fluido.
A mecânica geométrica, como no contexto apresentado em Marsden (2004) e nas refe-
rências ali citadas, entre outras, é aqui utilizada para modelagem do sistema, elaborada
por uma descrição segundo a mecânica clássica através da linguagem devido a geome-
tria diferencial (Spivak, 1999). Como será discutido ao longo do texto, as ferramentas
disponíveis a partir do ramo da geometria, mais especificamente da geometria diferen-
cial, permitem fragmentar a dinâmica de sistemas, possibilitando sua análise de forma
elegante e consistente com o intuito de identificar características de movimento. Estas,
por sua vez, permitem organizar e minimizar os cálculos de modelagem e de solução das
equações diferenciais do modelo. Referências adicionais são feitas a seguir.
O estudo da controlabilidade de sistemas mecânicos não-lineares ganhou nova motivação,
nas três últimas décadas, com o surgimento de ferramentas baseadas em resultados
conhecidos da geometria diferencial. Em particular, este avanço se aplica na análise da
estrutura dos campos vetoriais que descrevem as equações de dinâmica, pela álgebra
determinada pelo colchete de Jacobi-Lie dos campos vetoriais, (Sussmann, 1987).
Em função das mesmas ferramentas de análise empregadas na determinação da con-
trolabilidade, as técnicas de linearização por realimentação da dinâmica de estado
(Isidori, 1995), utilizadas para a estabilização de sistema completamente controláveis,
foram desenvolvidas por Brockett, Respondek, Krener e Isidori, entre outros. Nos sis-
temas que apresentam medidas de controlabilidade deficientes, outros métodos de es-
tabilização devem ser utilizados como, por exemplo, técnicas cujas leis de controle não
são infinitamente diferenciáveis nas variáveis do estado ou, mesmo, técnicas de controle
variantes no tempo. A teoria de estabilidade proposta por Lyapunov, (Khalil, 2002),
pode ser empregada com esta finalidade.
1.2 Proposta de uma Classe de Sistemas Robóticos Móveis
Uma das contribuições deste trabalho consiste em propor uma classe de sistemas ro-
bóticos móveis e multi-articulados, no qual o sistema propulsor está distribuído pelos
elementos, ou corpos, do sistema ao invés de se concentrarem apenas no corpo base ou
veículo.
1.2. PROPOSTA DE UMA CLASSE DE SISTEMAS ROBÓTICOS MÓVEIS 5
Uma apresentação inicial da modelagem de um sistema multi-articulado no plano foi
realizada em Sreenath (1987), através de uma abordagem Hamiltoniana.2 No entanto, a
modelagem e análise do sistema considerados naquele estudo compreendiam um sistema
desprovido de uma configuração de entradas que permitisse a sua movimentação no
plano. O sistema aqui considerado, em contraste, e como será proposto a seguir, possui
entradas dispostas de maneira a possibilitar que este seja manobrado por todo o espaço
de variáveis do plano.
Diferentemente, uma abordagem segundo uma visão Lagrangiana não é, até o presente
momento, empregada de maneira freqüente na modelagem de sistemas multi-articulados.
Exceções a esta afirmação são encontradas na modelagem do Elroy’s Benie - sistema
composto por dois corpos articulados no centro comum de massa e, portanto, mais
simples do que o considerado aqui - discutido em Ostrowski (1995),Ostrowski (1999)
e do sistema com restrições não-holonômicas denominado snakeboard, (Bloch, Krishna-
prasad, Marsden e Murray, 1996; Bloch, 2003). Uma das possíveis razões para o uso
não freqüente desta, deve-se a relativa complexidade da teoria em comparação com a
alternativa Hamiltoniana. No entanto, a modelagem sob uma abordagem Lagrangiana
permite, em geral, um melhor detalhamento da geometria da dinâmica envolvida.
Define-se, a seguir, a classe de sistemas multi-corpos considerada neste trabalho:
Definição 1.2.1 (Sistema multi-articulado móvel). Define-se a classe de sistemas multi-
corpos móveis, como aquele composto por mais de um corpo rígido, acoplados fisica-
mente entre si através de juntas rotativas e em que os seus atuadores, responsáveis pela
sua mobilidade em relação a um referencial inercial, estão distribuídos nos corpos que
o compõe, Fig. 1.1.
A qualidade de ser móvel na definição acima, em princípio, abrange o espaço físico tri-
dimensional. No entanto, as discussões do presente trabalho restringem-se ao caso em
que a mobilidade do sistema limita-se ao plano bidimensional. Como será visto nos
capítulos de modelagem e análise, as juntas rotativas podem ser tomadas como ativas
ou passivas. No presente capítulo, apresenta-se uma evolução em relação a acionamento
dos sistemas multi-articulados apresentados em Sreenath (1987), por exemplo, no que
diz respeito à capacidade de auto-manobra no espaço pela ação de propulsores. Estes2Algumas correções de um resultado, no que diz respeito ao algoritmo para determinação da inércia
do sistema multi-corpos, desta referência são apresentadas na Seção C.2.1 do Apêndice C do presente
trabalho.
1.2. PROPOSTA DE UMA CLASSE DE SISTEMAS ROBÓTICOS MÓVEIS 6
Centro deMassa
T1 T2
f1
f2
fN
TN−1corpo 1
corpo N
corpo 2
Figura 1.1: Sistema robótico multi-articulado móvel, como N corpos, sob ação de forças
fi e de torques das juntas Tj .
propulsores podem ser realizados por jatos de gases sob pressão ou provenientes de com-
bustão, como encontrados em sistemas espaciais, ou pelo empuxo relativo de um fluído
por uma hélice, como encontrado nos sistemas aquáticos, submarinos e aéreos. Observe,
também, que a classe de sistemas definida acima difere dos considerados em Dubowsky
e Papadopoulos (1993), em que os acionamentos de translação do sistema estão todos
localizados em um único corpo rígido, denominado veículo base, por exemplo.
O sistema de interesse neste trabalho é, de maneira geral, caracterizado pelos seguintes
atributos, e formalmente definidos nos próximos capítulos:
• Dinâmica livre não-linear e autônoma;
• Dinâmica representada na forma afim3;
• Sistema Lagrangiano, determinado apenas pela energia cinética;
• Sistema Hamiltoniano (Marsden e Ratiu, 1999), (Nijmeijer e van der Shaft, 1990);
• Configuração descrita por um grupo de Lie definido por N cópias do SE(2), onde
N é o número de corpos do sistema;4
• Sistema invariante à esquerda nas variáveis do referencial móvel;
• Sistema com restrição não-holonômica na velocidade e determinada pela conser-
vação do momento angular total na ausência de esforços externos;3Muitos sistemas mecânicos possuem esta propriedade.4Note que o conceito de configuração, como definido no próximo capítulo é, por definição, distinto
da relativa ao estado, podendo esta última incluir a configuração do sistema - composto pela posição,
orientação e variáveis de forma - além das variáveis de velocidade.
1.3. OBJETIVOS DE PESQUISA 7
• Sistema de controle sobre-atuado, atuado ou sub-atuado, dependendo do número
de entradas estipulado.
1.3 Objetivos de Pesquisa
Ambas as abordagens analíticas da mecânica, segundo Hamilton e Lagrange, são utiliza-
das na modelagem do sistema proposto. Como será visto, estas abordagens se alternam
em permitir uma melhor elucidação da física do problema. Por exemplo, quando da ca-
racterização de restrições não-holonômicas para um sistema, é usual deparar-se com um
desenvolvimento Lagrangiano. Alternativamente, a abordagem Hamiltoniana permite
obter de maneira direta as equações de movimento, adequando-se melhor à análise de
controlabilidade.
O foco principal de aplicação da teoria relativa aos métodos geométricos são empregados,
na presente pesquisa, à modelagem, analise da dinâmica, planejamento de trajetórias
e síntese de controle em malha fechada de sistemas mecânicos, em particular dos sis-
tema multi-corpos como apresentado acima. Neste contexto, apresentam-se a dinâmica
e técnicas de controle para um robô móvel e composto por corpos rígidos articulados
com interesse no desempenho de tarefas de forma coordenada e autônoma. Uma das
principais motivações para o presente trabalho consiste na investigação do aumento de
desempenho do sistema robótico móvel proposto, ou sistema multi-corpos, em relação
aos robôs móveis na forma como geralmente são utilizados, ou seja, composto por um
único corpo rígido. Estas medidas de desempenho podem ser determinados para otimi-
zação do comprimento da trajetória, variáveis temporais, esforço de controle ou consumo
energético.
1.3.1 Contribuições do Trabalho
Dentre as principais contribuições deste trabalho, podem-se destacar as seguintes:
• Proposta de uma classe de robôs móveis multi-articulados;
• Modelagem dinâmica fundamentada na teoria geométrica sob as abordagens La-
grangiana e Hamiltoniana. Modelagem das entradas do sistema, como descrito na
definição da classe de sistemas acima, Fig. 1.1;
1.3. OBJETIVOS DE PESQUISA 8
• Análises de controlabilidade de exemplos de sistemas da classe proposta;
• Estabilização por regulação do sistema mediante um método de linearização por
realimentação, aliado a realimentação do estado, e através da teoria de estabilidade
de Lyapunov.
Dentre os principais resultados obtidos neste trabalho, os seguintes são notáveis:
• Apresenta-se a modelagem da dinâmica do sistema através de diferentes parame-
trizações do espaço de configuração Q;
• Apresenta-se a modelagem das entradas de propulsão do sistema;
• A análise de controlabilidade mostra que um sistema multi-articulado de N -corpos,
com pelo menos dois propulsores, é sempre acessível e controlável dos pontos de
equilíbrio:
– Mostra-se que o sistema é sempre linearizável por realimentação quando o nú-
mero de entradas iguala-se à dimensão do espaço de configuração Q. Neste
caso, pode-se estabilizar o sistema através de uma realimentação suave do
estado, dada uma matriz de ganhos do compensador projetada adequada-
mente;
• Nos casos em que a controlabilidade é deficiente, obtém-se uma extensão de um
resultado de estabilização para sistemas sub-atuados (Fantoni, Lozano, Mazenc e
Pettersen, 1999).
1.3.2 Justificativa do uso da Teoria Geométrica
Como mencionado acima, o caminho seguido para abordar o tema proposto baseia-se
nos métodos geométricos para a mecânica clássica, ramo da matemática que agrega
elementos do cálculo diferencial, álgebra linear e topologia, denominada geometria di-
ferencial. Neste contexto, a modelagem do sistema é realizada através da obtenção
dos campos vetoriais, que nada mais representam que um sistema de EDOs autôno-
mas descritas adequadamente. De maneira bastante simplista pode-se dizer que estes
métodos geométricos correspondem a uma especialização do ramo da mecânica denomi-
nado mecânica analítica5, que por sua vez permitem uma análise do sistema como um5Formalmente, esta analogia não é aceita, não sendo endossada por muitos autores.
1.3. OBJETIVOS DE PESQUISA 9
todo, em contraste da abordagem Newtoniana, que trata do estudo individual de cada
componente do sistema.
De maneira mais abrangente, a geometria diferencial permite estabelecer uma associ-
ação entre a análise e a geometria, permite ainda “sintetizar figuras” da geometria do
problema em estudo, o que garante potencial heurístico na inferência de certas pro-
priedades inerentes ao sistema dinâmico e que podem ser rapidamente verificadas. Isto
pode traduzir-se em uma “simplificação” do ferramental matemático necessário à análise
do objeto de estudo além de uma compreensão mais fundamental da física do mesmo
(Schutz, 1980).
Além disso, a geometria diferencial consiste em um dos canais possíveis através dos quais
essas vantagens acima apresentadas podem ser extrapoladas do espaço físico para o es-
paço de variáveis. A modelagem do sistema baseia-se, neste contexto, na possibilidade
de tradução do comportamento dinâmico dos sistemas físico em modelos matemáticos
correspondentes e na análise destes de maneira independente de um sistema de coorde-
nadas (Lanczos, 1977). A formulação conceitual da mecânica analítica é, por exemplo,
realizada desta maneira. Neste sentido, a mecânica analítica caracteriza-se por ser mais
versátil, permitindo uma generalização das coordenadas em contraste com o espaço de
coordenadas físicas da formulação Newtoniana, (Meirovitch, 1970). Ademais, a inclusão
da dinâmica de subsistemas adicionais na abordagem analítica é realizada de maneira
direta e sistemática. Esta representa uma nítida vantagem de aplicação ao sistema
proposto. A teoria geométrica possui difundida aplicação especificamente na teoria de
controle. Logo, o emprego da teoria da mecânica geométrica ganha motivação extra
com as ferramentas de análise e síntese de sistemas de controle. Como visto a seguir,
estas estão fortemente baseadas na teoria geométrica, especialmente no caso de sistemas
não-lineares.
A motivação de escolha da mecânica geométrica abrange estas explicações acima junta-
mente com um interesse pessoal do autor em expandir o conhecimento, mesmo que de
maneira introdutória, nas disciplinas da matemática relacionadas aos sistemas dinâmi-
cos.
1.3. OBJETIVOS DE PESQUISA 10
1.3.3 Aplicações
Outras áreas de aplicação do sistema aqui considerado, em adição às aplicações já citadas
nas seções anteriores, resumem-se nas seguintes:
Robótica: sistemas distribuídos swarm; por exemplo, operação de vários robôs mó-
veis atuando em conjunto para a realização de tarefas - http://www.work.caltech.
edu/ling/, http://payman.caltech.edu/sis/program.html;
Medicina: modelagem e controle de agulhas utilizadas na instrumentação médica
(Kallem e Cowan, 2007) - http://glacier.me.jhu.edu/ vinutha/research.html;
Química: modelagem e análise de reações químicas em sistemas poliatômicos (4 a 7
átomos) - http://www.cds.caltech.edu/ koon/project/;
Biologia: modelagem do movimento de microorganismos (Shapere e Wilczeck, 1987).
1.3.4 Organização da Tese
O presente trabalho está organizado nos seguintes capítulos:
Capítulo 2 Uma breve fundamentação teórica dos conceitos relativos à modelagem,
análise e controle que são realizados nos capítulos subseqüentes são apresentados.
Em síntese são revistos os conceitos de grupos, simetria, aplicação momento J,
conexão principal, decomposição do espaço de fase do sistema no fibrado princi-
pal. Em particular, a configuração de um corpo rígido no plano é completamente
especificada pelas coordenadas do grupo SE(2), que é um grupo definido por um
produto semi-direto.
Capítulo 3 Apresentação do princípio de Lagrange d’Alembert para sistemas não-
holonômicos. Descrição e teoria à modelagem Lagrangiana através do relaciona-
mento entre a inércia, a simetria e o momento generalizado do sistema denominado
por conexão mecânica. Discussão sobre a redução do sistema para obtenção da
dinâmica relativa, reconstrução da dinâmica completa do sistema no espaço de
fase TQ.
Capítulo 4 Modelagens Hamiltoniana e Lagrangiana:
1.3. OBJETIVOS DE PESQUISA 11
• Descrição e obtenção da matriz de inércia do sistema, determinação da função
Hamiltoniano em função da inércia do sistema, modelagem da dinâmica do
sistema;
• Equações da dinâmica reduzida e de reconstrução da dinâmica completa do
sistema no espaço de fase TQ, sob o ponto de vista de Lagrange;
• Modelagem da entrada e do sistema de controle com N corpos sob ambas as
abordagens Hamiltoniana e Lagrangiana.
Capítulo 5 Exposição do equilíbrio dinâmico do sistema. Análise das fases geométricas
do sistema multi-articulado. Apresentação da teoria e análise da controlabilidade
do sistema.
Capítulo 6 Apresentação da teoria, análise e discussão do problema de estabilização do
sistema multi-corpos através de linearização por realimentação e síntese de controle
por realimentação através da teoria de Lyapunov. Apresenta-se um resultado do
planejamento de trajetória através do controle ótimo.
Capítulo 7 Conclusão dos principais resultados e discussões do trabalho. Apresentam-
se, também, alguns temas sugestivos para o prosseguimento deste trabalho.
Além destes, três capítulos estão organizados como Apêndice.
O primeiro capítulo do Apêndice apresenta uma breve recapitulação da teoria envolvida.
Em particular, as definições de alguns conceitos básicos da geometria diferencial e da
mecânica geométrica são revisadas. Estas definições serão utilizadas corriqueiramente
no trabalho.
O segundo capítulo do Apêndice contém resultados da mecânica geométrica utilizados
no curso do texto principal. Estes resultados podem não ser encontrados na literatura
que trata do assunto ou são detalhamentos, de resultados de algumas referências, para
o tratamento aqui pretendido.
O terceiro capítulo do Apêndice apresenta um modelo do corpo rígido no plano e modelos
do sistema multi-articulado. Em particular, apresentam-se resultados complementares
de modelagem dos sistemas de 3 e 5 corpos.
12
Capítulo 2
Elementos da Mecânica Geométrica
Conceitualmente, a mecânica Lagrangiana resume-se na descrição da dinâmica de um
sistema em uma variedade diferencial denominada espaço de configuração em conjunto
com uma função escalar, o Lagrangiano, definida no espaço tangente ao espaço de
configuração. A mecânica Hamiltoniana estende a teoria de Lagrange com a introdução
de mais estrutura à geometria do sistema. Esta é definida em uma variedade de dimensão
par e caracterizada por uma estrutura simplética não degenerada chamada espaço de
fase, que usualmente corresponde ao dual do espaço tangente ao espaço de configuração.
Um sistema Hamiltoniano é completamente determinado com a especificação do espaço
de fase com uma estrutura simplética e com o Hamiltoniano definido neste espaço de
fase. Nos parágrafos a seguir, os elementos essenciais destas duas abordagens serão
revistos com ênfase dada à descrição da geometria envolvida.
Vale destacar que os resultados discutidos a seguir valem - mas em geral não são ne-
cessariamente exclusivos - ao caso de dimensão finita. E, finalmente, a convenção do
somatório de Einstein é subentendida ao longo do texto quando o símbolo do somatório
não é explicitamente empregado, como de costume em textos de física ou mecânica.
2.1 Geometria Diferencial
Uma variedade M é um conjunto em que, para cada elemento de M , existe uma aplicação
bijetora e contínua que transforma pontos de um aberto que contém este elemento a um
2.1. GEOMETRIA DIFERENCIAL 13
aberto do Rn, para algum natural n.1 Mais precisamente, uma variedade é um espaço
métrico onde para cada p ∈ M com um aberto U de p e um inteiro n ≥ 0 tal que
existe um homeomorfismo ϕ que parametriza U a Rn (Spivak, 1999). Uma variedade
n-dimensional (finita) M é denominada uma variedade diferencial quando possui um
atlas de cartas (ϕi, Ui), i > 1, ao Rn, cujos ϕi são aplicações suaves (C∞) ou de classe
Ck, k > 1. A variedade M é dita suave se os ϕi forem aplicações suaves.
2.1.1 Campos vetoriais e Espaços Tangentes
Um campo vetorial X em M é uma regra atribuindo um vetor vp a cada ponto p ∈M . O conjunto de todos os vp define um espaço vetorial de dimensão n denominado
espaço tangente a M em p e representado por TpM . Um vetor vp ∈ TpM também
é representado como Xp = X(p). O fibrado tangente TM é uma variedade 2n-
dimensional composta pela união dos espaços tangentes TpM , para cada ponto p ∈ M :
TM =⋃
p∈M
TpM (2.1.1)
com coordenadas (p, vp) = (p, p). Logo, um campo vetorial X induz uma aplicação
X : M → TM : p 7→ (p, vp). Dada uma parametrização (x,U) em M , onde x : U ⊂M → Rn, uma base de TpM , em torno de p ∈ U , é dada por
∂
∂x1
∣∣∣∣p
, . . . ,∂
∂xn
∣∣∣∣p
(2.1.2)
e o campo vetorial em M pode ser escrito nas coordenadas da base dada acima
X(p) =n∑
i=1
ai(p)∂
∂xi
∣∣∣∣p
(2.1.3)
Um campo vetorial completo é aquele cuja curva integral pode ser estendida infinita-
mente aos tempos futuro e passado.
Similarmente, pode-se definir um espaço dual ao espaço tangente TpM , chamado de
espaço cotangente T ∗M . Os elementos do espaço T ∗p M são denominados de covetores,
conhecidos também como 1-formas. Definido um ponto p ∈ M , o espaço T ∗p M possui
base dx1|p, . . . , dxn|p. O fibrado cotangente T ∗M é definido analogamente a TM .1A definição de variedade feita aqui possui uma conotação local. Quando de uma definição
concernente às propriedades globais, deve-se considerar os axiomas da contabilidade e Hausdorff
(Mather, 2005).
2.1. GEOMETRIA DIFERENCIAL 14
Sejam M e N duas variedades e um difeomorfismo f : M → N : m 7→ f(m) = n,
para m ∈ M e n ∈ N . A aplicação tangente correspondente Tmf : TmM → Tf(m)N
transforma os vetores v ∈ TmM em u ∈ TnN , Figura 2.1. O levantamento cotangente
T ∗mf : TnN → Tf−1(n)M , onde f−1(n) = m, é definido pelo seguinte pareamento
〈T ∗f(un), vm〉 = 〈un, T f · vm〉
O conceito relativo ao levantamento cotangente será importante quando da reparame-
trização das coordenadas da dinâmica do sistema multi-articulado e da descrição das
suas forças de entrada no contexto geométrico.
ψ(V )
RdNRdM
φ(U)
N
U
ψ
V
f
ψ f φ−1
TpM
T ∗p M
φ M
p
Xp
f(p)
f∗ = Tpf
f ∗p (ωf(p))
vp
πp
f ∗ = T ∗p f
ωf(p)
T ∗f(p)N
Tf(p)N
f∗(vp)
FL(vp)
Figura 2.1: Difeomorfismos f entre variedades, levantamentos tangentes Tf em espaços
tangentes TmM e levantamentos cotangentes T ∗f em espaços cotangentes T ∗nN .
2.1. GEOMETRIA DIFERENCIAL 15
Derivada direcional e Colchete de Lie
Seja uma função F : M → R. Lembrando que o diferencial de F , escrito na base dx|p,é dado por
dF (p) =∂F (p)
∂xdx
a derivada direcional de F ao longo do campo vetorial X é definida por
LXF = X[F ] = dF ·X (2.1.4)
Em coordenadas locais, isto é, para a carta (x,U ⊂ M) em torno de p, tem-se que
X[F ](p) = dF (p) ·X(p) = Xi(x(p))∂F (x(p))
∂xi∈ R (2.1.5)
O colchete de Jacobi-Lie de dois campos vetoriais X, Y é definido pela operação LXY ,
ou seja, a diferenciação segundo Lie de um campo vetorial Y ao longo de X. Quando
aplicado à função F , o colchete de Jacobi-Lie de X, Y confere a seguinte expressão
[X,Y ][F ] = X[LY F ]− Y [LXF ] = X[Y [F ]]− Y [X[F ]]
A representação local, ou seja, em coordenadas, do colchete de Jacobi-Lie
[X, Y ] = DY ·X −DX · Y = (X · ∇)Y − (Y · ∇)X (2.1.6)
onde o operador D simboliza a matriz Jacobiana relativo à diferenciação de um vetor
com relação ao estado e ∇ é o operador divergente de uma função. Denominando por
X(M) o espaço de todos os campos vetoriais suaves em M , o colchete de Jacobi-Lie
pode ser visto como uma aplicação [·, ·] : X(M)×X(M) → X(M). Como será visto nos
próximos capítulos, o colchete de Jacobi-Lie representa uma importante ferramenta na
avaliação de controlabilidade de sistemas de controle.
Álgebras de Lie
Uma álgebra de Lie V é um espaço vetorial em R dotado de uma operação bilinear
[·, ·] : V × V → V e satisfazendo, para todo ξ, η, ζ ∈ V , as seguintes propriedades
anti-comutatividade : [ξ, η] = −[η, ξ]
Identidade de Jacobi : [ξ, [η, ζ]] + [η, [ζ, ξ]] + [ζ, [ξ, η]] = 0
2.1. GEOMETRIA DIFERENCIAL 16
onde [·, ·] é também chamado de colchete ou comutador de Lie. Como será visto a seguir,
o espaço tangente na identidade de um grupo de Lie, TeG, é um espaço vetorial típico
do cenário definido acima. Campos vetoriais em uma variedade munida do colchete
de Jacobi-Lie formam uma álgebra de Lie, (Marsden e Ratiu, 1999). Uma álgebra de
Lie é dita abeliana se a operação com o colchete de Lie resultar no elemento nulo para
quaisquer dois elementos de V .
2.1.2 Distribuições de Campos Vetoriais
Uma distribuição d-dimensional Dp em M é uma atribuição suave de um subespaço
m-dimensional Dp = D(p) contido em TpM a todo p ∈ M .
Uma distribuição D, definida em um conjunto ou variedade aberta M , é não singular
ou regular se constituir um subespaço de dimensão constante, ou, alternativamente,
se o posto da matriz construída, em coordenadas locais, pelos campos vetoriais da
distribuição for constante, para todo p ∈ M . Uma distribuição é dita singular, caso
contrário. Um ponto p′ ∈ M é denominado um ponto regular da distribuição D, se
existir uma vizinhança U de p′ com a propriedade que Dp′ é não singular em U .
Um campo vetorial X pertence à distribuição D se X(p) ∈ D(p) para todo p ∈ M . A
distribuição D é dita involutiva se [X, Y ] ∈ D para todos X,Y ∈ D.
Uma subvariedade N ⊂ M é dita uma variedade integrável de D se D(p) = TpN para
todo p ∈ N . Alternativamente, se D(p) induzir uma variedade integrável para todo p ∈M , então D é dita integrável. Involutividade e integrabilidade estão relacionadas através
do Teorema de Frobenius, (Isidori, 1995), no qual se estabelece que uma distribuição
regular é integrável se e somente se esta for involutiva. A determinação da involutividade
de uma distribuição d-dimensional D(p) = span X1(p), . . . , Xd(p) é equivalente ao
problema de verificação da integrabilidade da mesma, segundo o Teorema de Frobenius.
Determinar se uma distribuição é integrável significa encontrar n− d funções f∗(p) que
são diferenciais perfeitas, ou seja, que possuem a seguinte estrutura
f∗j (p) =∂λj
∂x
onde λ : M → R são funções suaves e j = 1, . . . , n− d, tal que seja possível determinar
n− d soluções independentes para as seguintes equações diferenciais
∂λj
∂x[X1(p) · · ·Xd(p)] = 0
2.2. MECÂNICA GEOMÉTRICA 17
onde j = 1, . . . , n− d.
2.2 Mecânica Geométrica
Define-se por configuração a generalização da posição e atitude de um sistema. Repre-
senta-se o espaço ou variedade de configuração por Q, com elementos q. Os vetores
velocidade do mesmo são representados como elementos do espaço tangente TqQ.
A força externa total f é geralmente definida por uma aplicação C∞ no fibrado tangente
e função do tempo f : R × TQ → T ∗Q : (t, vq) 7→ f(t, vq), ver Figura 2.2. Uma força
f é denominada básica quando existir um campo vetorial dual C∞ representado por
f ′ em Q tal que f(t, vq) = f ′(q). Uma variedade Riemanniana (Q, 〈〈., .〉〉) consiste de
Q
TqQ
T ∗q Q
f
vq
Figura 2.2: O espaço de configuração Q, o espaço tangente e o seu dual em q, e a força
f(vq) em T ∗q Q.
uma variedade diferenciável Q e de um campo tensorial (0, 2) em Q, ou, simplesmente,
uma métrica quadrática, simétrica e definida e positiva, 〈〈., .〉〉 : TQ × TQ → R. Uma
métrica é sempre definível para sistemas mecânicos e será utilizada para definir a energia
cinética destes sistemas a seguir. Sejam (Q, 〈〈., .〉〉1) e (Q, 〈〈., .〉〉2) duas variedades de
Riemann. Uma isometria é um isomorfismo suave ϕ : Q → Q onde ϕ∗〈〈., .〉〉2 = 〈〈., .〉〉1.
2.2.1 Grupos e Grupos de Lie
Um grupo G é definido como um conjunto munido de uma operação binária (·) : G×G 3(a, b) 7→ a · b ∈ G, para todo a, b, c ∈ G, com as seguintes propriedades:
2.2. MECÂNICA GEOMÉTRICA 18
associatividade: a · (b · c) = (a · b) · c;
existência do elemento identidade: ∃ e ∈ G tal que a · e = e · a = a;
existência do elemento inverso: ∃ a−1 ∈ G tal que a · a−1 = a−1 · a = e.
Um grupo é denominado abeliano quando a operação do grupo for comutativa. Em
símbolos: o grupo G é abeliano se a · b = b · a, para a, b ∈ G.
Um grupo de Lie G é um grupo caracterizado por ser também uma variedade dife-
rencial tal que, para todo a, b ∈ G, as operações de grupo (a, b) 7→ a · b e a operação
de inversa a 7→ a−1 são aplicações suaves. Dado um natural n ∈ N, os seguintes são
exemplos de grupos de Lie em que a operação de grupo é a multiplicação usual de
matrizes:
• SO(n): Grupo Ortogonal especial representado por matrizes do tipo:
SO(n) = R ∈ Rn×n | RTR = In, det(R) = +1 (2.2.1)
onde R são matrizes de rotação. Para n = 3, as aplicações lineares R que preser-
vam a norma Euclideana são utilizadas para descrever rotações de corpos rígidos
no espaço. Quando n = 2, as rotações restringem-se aos movimentos no plano, o
grupo Ortogonal Especial no plano. O grupo SO(2) é abeliano, no qual a operação
de grupo comuta para quaisquer R1,R2 ∈ SO(2).
• SE(n): O grupo Euclideano especial consiste em elementos do tipo
SE(n) =
[R r
01×n 1
]∈ R(n+1)×(n+1)
∣∣∣∣∣R ∈ SO(n), r ∈ Rn
(2.2.2)
A operação de grupo entre os elementos de SE(n) é dado por:[
R1 r1
01×n 1
]·[
R2 r2
01×n 1
]=
[R1R2 R1r2 + r1
01×n 1
]
Logo, SE(n) é dado por um produto semi-direto2 entre os elementos do grupo
SO(n) e o espaço vetorial Rn. Em símbolos, SE(n) = SO(n)sRn, Seção B.2.
O SE(2) é denominado grupo Euclideano especial no plano e o grupo SE(3)
corresponde ao conjunto de deslocamentos rígidos no espaço.2Em contraste com o produto cartesiano ou direto.
2.2. MECÂNICA GEOMÉTRICA 19
A ação de um grupo de Lie G em uma variedade Q é definida pela aplicação Φ : G×Q →Q
Φg(q) = Φ(g, q) = Φq(g) (2.2.3)
Exemplos de ações à esquerda de grupos são a aplicação de translação à esquerda e a
conjugação. Uma translação à direita é uma ação à direita de grupo. Um grupo de Lie
é denominado abeliano se a operação (·) envolvendo os seus elementos for comutativa.
Dada uma G-ação à esquerda Φ em Q, o levantamento à esquerda da ação Φ é definida
por
〈T ∗g−1qΦg(u), v〉 = 〈u, TqΦg · v〉
para v ∈ TqQ e u ∈ T ∗Φg(q)Q. Alternativamente, o levantamento à direita é dado por
〈T ∗gqΦg−1(u), v〉 = 〈u, TqΦg−1 · v〉
Diz-se que G age em T ∗Q pelo levantamento cotangente, Figura 2.3, quando G age em
Q por isometrias.
TQπQ -¾X|Q
Q ¾π∗Q
T ∗Q
TS
Tf
?¾ X|S
πS
- S
f
?
f−1
6
¾π∗S
T ∗S
T ∗f
6
Figura 2.3: Levantamento cotangente T ∗f das ações de grupo f . Os campos vetoriais
X|Q e X|S são definidos, respectivamente, em Q e S.
Álgebras de Grupos de Lie
Sejam ξ, η os elementos de TeG para um dado grupo de Lie G. Os campos vetoriais em
G correspondentes, de maneira que sejam invariantes à esquerda, são Xξ e Xη, onde
Xξ(g) = TeLgξ e g ∈ G, para o qual o colchete de Jacobi-Lie é definido. A álgebra
2.2. MECÂNICA GEOMÉTRICA 20
de Lie g do grupo G, como na Seção 2.1.1, é definida pelo colchete de Jacobi-Lie dos
campos vetoriais associados e avaliado na identidade e ∈ G, ou seja:
[ξ, η] := [Xξ, Xη](e) = X[ξ,η](e) (2.2.4)
onde a operação [·, ·] representa o colchete da álgebra de Lie g. Note que, como TeG
possui a estrutura de uma álgebra de Lie, os espaços TeG e g são isomórficos. Uma
álgebra de Lie g de G é dita abeliana se [ξ, η] = 0, ou seja, quando o colchete da álgebra
de Lie se anula para quaisquer ξ, η ∈ g.
Proposição 2.2.1 ((Marsden e Ratiu, 1999)). Se G é um grupo de Lie abeliano então
sua álgebra de Lie g é abeliana. A implicação inversa é verdadeira apenas quando G é
conexo.
2.2.2 Mecânica Lagrangiana
Seja um corpo rígido3 no espaço R3. Qualquer ponto do corpo, em coordenadas do
corpo, pode ser especificado por X. Dado a distância r do sistema de coordenadas
do corpo em relação ao sistema inercial, então a posição inercial de qualquer ponto do
corpo é dada por x = r + RX. A energia cinética KE de um corpo no instante t, tem
a forma
KE(t) =12
∫
B‖r(t) + R(t)X‖2dµ
Avaliada para um corpo no plano, a energia cinética toma a seguinte forma (Sreenath,
1987):
KE =12
∫
Bρ(X)‖x‖2d2X
O Lagrangiano L é uma função escalar no fibrado tangente L : TQ → R, definida pela
diferença entre a energia cinética KE e a energia potencial.4 A dinâmica de movimento
de um sistema livre de restrições pode ser obtida em função do Lagrangiano através
da equação de Euler-Lagrange, por exemplo, como discutido no próximo capítulo. Em
termos da métrica de Riemann 〈〈., .〉〉, o Lagrangiano de um sistema mecânico pode ser
escrito como
L(q, q) =12〈〈q, q〉〉G =
12〈Gq, q〉 (2.2.5)
3Formalmente definido por (B, µ), onde B ⊂ R3 é compacto e µ é uma medida de Borel finita e
equivalente a ρdV , sendo ρ a densidade e dV uma medida infinitesimal do volume do corpo, (Bullo e
Lewis, 2005).4A função Lagrangiano é usualmente definida por L = KE − Vpot, onde Vpot representa a energia
potencial. Similarmente a função Hamiltoniano, quando invariante no tempo, é definida como H =
KE + Vpot. Neste trabalho, no entanto, considerada-se Vpot = 0.
2.2. MECÂNICA GEOMÉTRICA 21
onde q ∈ Q, 〈〈., .〉〉G corresponde à métrica induzida pela energia cinética e G representa
a matriz de inércia generalizada do sistema, definida por
Gij =∂2KE
∂qi∂qj, i, j = 1, . . . , n
onde q ∈ TqQ. A métrica de Riemann permite que a manipulação dos elementos geo-
métricos, para modelagem, por exemplo, seja realizada de forma independente da pa-
rametrização escolhida. A modelagem do sistema multi-articulado, a ser apresentada
nos capítulos a seguir, é feita sob este contexto, juntamente com alguns exemplos de
parametrizações de Q.
2.2.3 Mecânica Hamiltoniana
O Lagrangiano é dito hiper-regular quando é possível utilizar-se de um difeomorfismo
para definir a função escalar Hamiltoniano H : T ∗Q → R. Este difeomorfismo é conhe-
cido como a transformada de Legendre FL : TQ → T ∗Q, onde FL indica a operação
de diferenciação no espaço tangente sobre Q. O campo vetorial de um Hamiltoniano
H define a aplicação XH : T ∗Q → T (T ∗Q) : z 7→ (z), ou seja, XH(z) ∈ Tz(T ∗q Q) via
Equações de Hamilton.
O espaço cotangente ou dual T ∗Q, também chamado de espaço de fase do momento
para sistemas mecânicos, é uma variedade de Poisson, uma vez que possui uma estrutura
simplética. Este é, muitas vezes, chamado de espaço de estados de sistemas mecânicos.
Variedades de Poisson
O par (P, ., .), onde P é uma variedade e o colchete ., . definido pela aplicação
., . : F(P )×F(P ) → F(P ), (2.2.6)
é denominado de variedade de Poisson se, para as funções F, G, H ∈ F(P ), as seguintes
condições são satisfeitas:
bilinearidade F,G é bilinear em F e G
anti-comutatividade F,G = −G,F
Identidade de Jacobi F, G,H+ H, F, G+ G, H, F = 0
2.2. MECÂNICA GEOMÉTRICA 22
Derivação de Leibniz FG,H = FG,H+ F, HG
Observe que as variedades de Poisson (P, ., .) possuem a estrutura de uma álgebra de
Lie. Localmente, isto é, nas coordenadas de z ∈ P , o colchete toma a seguinte forma
F, G(z) =2n∑
i,j=1
wi,j(z)∂F
∂zi(z)
∂G
∂zj(z) (2.2.7)
onde [wi,j ](z) é uma matriz anti-simétrica. O colchete de Poisson é não degenerativo
quando rank[wi,j ](z) = 2n para todo z ∈ P .
Aplicações de Poisson
Seja ϕ uma aplicação entre duas variedades de Poisson (P1, ., .1) e (P2, ., .2) e duas
funções reais F,H ∈ F(P2). Uma aplicação ϕ é dita uma aplicação de Poisson se
ϕ∗F, H2 = ϕ∗F,ϕ∗H1 (2.2.8)
Para sistemas autônomos, o fluxo ϕt de XH é uma aplicação de Poisson e deixa o
Hamiltoniano H invariante: H ϕt = H; indicando conservação de energia quando as
trajetórias do sistema são dadas pelo fluxo de um campo vetorial Hamiltoniano XH .
Variedades Simpléticas
Uma variedade simplética (P, Ω) é (sempre) uma variedade de Poisson5 de dimensão
par cuja estrutura Ω é uma 2-forma diferencial fechada6 e não degenerada, ou seja,
Ω(XH(q), vq) = 0, ∀H ∈ F(P ) ⇒ vq = 0 (2.2.9)
onde vq ∈ TqQ, veja (Marsden e Ratiu, 1999) e (Arnold, 1989). O espaço de fase de um
sistema mecânico possui naturalmente uma estrutura simplética. Portanto, P ≡ T ∗Q
e o levantamento cotangente, visto acima, é sempre uma aplicação simplética. Para
as coordenadas (qi, pi) da variedade simplética T ∗Q, onde i = 1, . . . , n, a 2-forma fica
determinada por
Ω = dqi ∧ dpi (2.2.10)5A implicação inversa não é verdadeira, em geral.6Uma forma diferencial Ω é dita fechada quando sua derivada exterior, operação simbolizada por d,
for nula, ou dΩ = 0.
2.2. MECÂNICA GEOMÉTRICA 23
onde ∧ representa o produto exterior. O colchete de Poisson, dado por (2.2.7), das
funções F e G, para z = (q, p) ∈ T ∗q Q, fica
F, G(z) = Ω(XF (z), XG(z))
=n∑
i=1
∂F
∂qi
∂G
∂pi(z)− ∂G
∂qi
∂F
∂pi(z)
= dF ·M∇G
onde M corresponde a matriz simplética dada na Seção A.2.2. Uma aplicação suave
ϕ : P1 → P2 é simplética se, dadas duas variedades simpléticas (P1, Ω1) e (P2, Ω2),
satisfizer
ϕ∗Ω2 = Ω1
Toma-se H ∈ F(P ). Restrito a uma variedade simplética, a dinâmica de movimento é
dada pelas equações de Hamilton que, nas variáveis canônicas zi = (qi, pi), adquire a
forma
qi =∂H
∂pi
pi = −∂H
∂qi⇔ z =M∇H(z)
Um campo vetorial Hamiltoniano XH em T ∗Q é aquele dado por z = XH(z). Logo, a
função suave definida em P , representada por F(P ), que corresponde ao campo vetorial
Hamiltoniano é a função H. Segundo (2.2.11), esta aplicação é um anti-homomorfismo.7
A definição de um campo vetorial é dependente do contexto; se este é definido em um
espaço vetorial simplético, uma variedade simplética ou em uma variedade de Poisson.
Dado um Hamiltoniano H a equação da dinâmica escrita em função do colchete de
Poisson é dada por F = F,H, para F ∈ F(P ).
Proposição 2.2.2 ((Marsden e Ratiu, 1999)). O colchete de Poisson de funções suaves
definidas em uma variedade, ou espaço vetorial, simplética define uma álgebra de Lie.
A operação nesta álgebra é denominada de álgebra de Poisson.
Corolário 2.2.3 ((Marsden e Ratiu, 1999)). O colchete Jacobi-Lie de campos vetoriais
de Hamiltonianos definidos em uma variedade, ou espaço vetorial, simplética define uma
sub-álgebra de Lie.7Dadas duas funções F, H ∈ F(P ), a aplicação F(P ) → X(P ) : H 7→ XH é um anti-homomorfismo
da álgebra de Lie, ou
[XH , XF ] = −XH,F (2.2.11)
para XH ∈ X(P ).
2.2. MECÂNICA GEOMÉTRICA 24
Aplicação Momento
Seja a ação de uma álgebra de Lie g em uma variedade de Poisson P , definida pelo
gerador infinitesimal ξP , isto é, um campo vetorial de uma curva definida em P por
indução de um caminho na álgebra g através da aplicação exponencial, refira a Seção
A.1 do Apêndice A. A aplicação momento J : P → g∗ é uma grandeza que, em geral8,
permanece constante com a dinâmica de sistemas Hamiltonianos, ou seja, permanece
inalterada quando avaliada ao longo do fluxo dos campos vetoriais XH , quando H é
invariante a ação de G.9 A aplicação J caracteriza-se pela propriedade em que a função
〈J, ξ〉, definida pelo pareamento entre as álgebras de Lie duais, é calculada através da
expressão
X〈J,ξ〉 = ξP , ξ ∈ g
onde ξP é o gerador infinitesimal em P . No lado Hamiltoniano, a aplicação J é uma
aplicação de Poisson no espaço cotangente T ∗Q
J : P = T ∗Q → g∗
definida a partir da expressões de levantamento cotangente10 das ações de grupo, como
〈J, ξ〉(pq) = 〈pq, ξQ(q)〉
Uma aplicação momento é denominada equivariante11 quando satisfaz a relação:
Ad∗g−1 J = J Φg
para g ∈ G e onde Φg é uma ação à esquerda de G em P . Aplicações momento
equivariantes, Figura 2.4, são aplicações de Poisson e, portanto, homomorfismos de
álgebras de Lie, preservando a operação com colchetes de Poisson. Esta propriedade será
explorada nas expressões de modelagem geométrica no próximo capítulo. Similarmente,
no lado Lagrangiano, a aplicação J : TQ → g∗, definida no fibrado tangente TQ, é
avaliada através de
〈J(vq), ξ〉 = 〈FL(vq), ξQ(q)〉
onde FL : TQ → T ∗Q representa a diferenciação no espaço tangente sobre Q.8Exceção feita quando da presença de restrições não-holonômicas; assunto a ser revisado no próximo
capítulo.9Veja a Seção 2.4.10Ver expressão (A.2.7) da Seção A.1 no Apêndice.11Ou, também, Ad-equivariante.
2.3. SISTEMAS MECÂNICOS SIMPLES 25
Q T ∗QJ - g∗
Q
Φg
6................................
T ∗Q
T ∗Φg
?
J- g∗
Ad∗g−1
?
Figura 2.4: Equivariância da aplicação momento J equivale a comutação das ações.
Estratificação Simplética de Variedades de Poisson
Diz-se que uma variedade de Poisson forma uma foliação simplética. Toda folha em P
constitui uma subvariedade injetivamente imersível e regular, ou seja, uma variedade de
Poisson corresponde a uma foliação de folhas simpléticas, conexas e integráveis12. Este
resultado é formalizado no seguinte Teorema.
Teorema 2.2.4 (Estratificação Simplética (Marsden e Ratiu, 1999)). Seja P uma va-
riedade de Poisson de dimensão finita. Então P é a união disjunta de suas folhas
simpléticas, onde cada folha é uma subvariedade de Poisson com a propriedade que esta
é uma subvariedade definida por uma imersão13 injetiva e onde a estrutura de Pois-
son em cada folha é induzida pela estrutura simplética da folha. A dimensão da folha
passante pelo ponto z ∈ P é determinada pelo posto da estrutura de Poisson neste ponto.
2.3 Sistemas Mecânicos Simples
O termo Sistema Mecânico Simples é empregado para designar uma variedade e,
no entanto, bem definida classe de sistemas mecânicos. Muitos autores têm-se utilizado
desta terminologia (Nijmeijer e van der Shaft, 1990), (Marsden, 2004), (Bullo e Lewis,
2005), entre outros. Na descrição a seguir, tentou-se manter a notação utilizada nesta úl-
tima referência. Um sistema mecânico simples é uma 7-upla (Q, 〈〈., .〉〉G, Vpot, fext,D,F , U)
onde:12No sentido de Frobenius.13Aplicação cujo posto se iguala, de maneira global, a dimensão do domínio.
2.4. SISTEMAS COM SIMETRIA 26
• Q é a variedade ou espaço de configuração,
• 〈〈., .〉〉G é a métrica de Riemann em Q relativa à energia cinética,
• Vpot é a função potencial em Q utilizada na definição do Lagrangiano - não em-
pregada neste trabalho,
• fext é uma resultante de força em Q devido ao distúrbio externo não-controlável,
• D é uma distribuição correspondente a restrição de velocidades,
• F = F 1, F 2, . . . , Fm é uma coleção de campos vetoriais completos em Q e
referentes a entrada do sistema,
• U ⊂ Rm é conjunto de controle, muitas vezes próprio14.
Um sistema de controle na forma afim (Q, f, g1, . . . , gm, U), para o campo vetorial da
dinâmica f e onde g1, . . . , gm são os campos vetoriais de controle em Q, é dado por
z(t) = f(z(t)) +m∑
j=1
gj(z(t))uj(t) (2.3.1)
com m canais de entrada ou controle.
Um sistema Hamiltoniano simples, (Nijmeijer e van der Shaft, 1990), em uma variedade
de Poisson P , é aquele em que os campos vetoriais são determinados a partir dos Ha-
miltonianos H0(q, p) and Hj(q, p) do sistema, onde Hj(q, p) = Hj(q). Sejam as funções
H0,H1, . . . ,Hm ∈ C∞(P ) e z ∈ P . Para um colchete de Poisson não-degenerado, o
Sistema de controle Hamiltoniano Afim é definido em T (T ∗Q) como:
z = XH0(z)−m∑
j=1
XHj (z)uj (2.3.2)
yj = Hj(z) (2.3.3)
No sistema acima, toma-se F j = XHj e yj são os canais de saída do sistema. No caso
de colchetes degenerados, o sistema (2.3.2) é chamado de Poisson.
2.4 Sistemas com Simetria
Dá-se o nome simetria às grandezas de sistemas dinâmicos que são conservadas, isto é,
às constantes de movimento que podem ser observadas. A invariância da dinâmica do14O conjunto U é dito próprio se 0 ∈ int(conv)(U), Seção 5.3.1
2.4. SISTEMAS COM SIMETRIA 27
movimento associada se traduz em uma invariância do Hamiltoniano, ou Lagrangiano,
que modela o sistema.
Revisa-se, primeiramente, o conceito de invariância sob a ação de um grupo. Dada uma
ação à esquerda Φ de um grupo de Lie G em Q e os campos vetoriais X,Y ∈ C∞ em Q,
valem as seguintes relações, para todo g ∈ G e q ∈ Q:
• A função f : M → R é invariante se Φ∗gf = f , ou seja, f Φg = f
• O campo vetorial avaliado em q: X(q) é invariante se TqΦgX(q) = X(Φgq);
equivalentemente, uma distribuição D em M é invariante se TqΦg(Dq) = DΦg(q)
• Um aplicação no fibrado F : TM → T ∗M sobre eQ é equivariante se Φ∗g(F (X)) =
F (Φ∗gX)
Feitas as observações acima, pode-se dizer que simetrias são ações de grupo que deixam
invariantes a estrutura do espaço e, portanto, as dinâmicas nela definidas. Dado um
sistema dinâmico, os grupos de simetria ou invariância do sistema, correspondem ao
conjunto de grupos pelos quais as simetrias observadas podem-se descritas. Formal-
mente, a ação suave Φ de um grupo de Lie G à esquerda representa uma simetria do
sistema (Q, 〈〈., .〉〉G, fext,D,F , U) se Φ for uma isometria de (Q, 〈〈., .〉〉G), se D e F são
invariantes, e se F é equivariante.
Teorema de Noether
A aplicação momento J é uma grandeza conservada em sistemas com simetria. Sob
o ponto de vista Lagrangiano, a aplicação momento J é constante no tempo, para
soluções da equações de Euler-Lagrange do sistema. Alternativamente, o teorema pode
ser enunciado no lado Hamiltoniano:
Teorema 2.4.1. Seja ação de um grupo de Lie G em uma variedade de Poisson P
através do gerador infinitesimal, Seção A.1. Considere um Hamiltoniano H que é G-
invariante em P , onde ϕt é o fluxo do campo vetorial XH . Então J é uma constante
de movimento ao longo das trajetórias de XH , isto é, J ϕt = J.
Demonstração. Seja z ∈ P um ponto da variedade de Poisson P dado por z = (q, p) ∈P ≡ T ∗Q. A invariância da função H, segundo a translação de z por g, traduz-se em
2.4. SISTEMAS COM SIMETRIA 28
H(g·z) = H(z). Restringindo o sistema Hamiltoniano ao caso autônomo e diferenciando
esta expressão em relação a g na direção ξ no ponto g = e, tem-se que
∂
∂g
∣∣∣∣g=e
H(g · z) · ξ =∂
∂g
∣∣∣∣g=e
H(z) · ξ
∂H(z)∂z
· ∂Φg(z)∂g
∣∣∣∣g=e
· ξ = 0, (H(g · z) = H(z)) (2.4.1)
Mostra-se que o segundo termo da última linha é dado pelo gerador infinitesimal ξP .
A função exponencial em g dada por exp(tξ) = γξ(t) ∈ G gera um subgrupo uni-
parametrizado por t ∈ R, para todo ξ ∈ g. Da definição do gerador infinitesimal da
Seção A.1, tem-se, utilizando a regra da cadeia para a diferenciação, que
ξP (z) :=d
dt
∣∣∣∣t=0
Φexp(tξ)(z) =∂Φg(z)
∂g
∣∣∣∣g=e
· dΦexp(tξ)(z)dt
∣∣∣∣t=0
= TzΦg(γ′ξ(0) · z)
Observe que γξ(0) = e e que γ′ξ(0) = ξ. Logo, da última igualdade de (2.4.1), segue que
dH(z) · ξP (z) = 0
Sabe-se, no entanto, que outra maneira de definir o gerador infinitesimal ξP (z) é através
do campo vetorial X〈J,ξ〉(z), onde o pareamento, dado por 〈J, ξ〉, entre a aplicação
momento J : TQ → g∗ e elementos da álgebra ξ ∈ g, representa uma função real em z.
Logo, segue que
dH(z) ·X〈J,ξ〉(z) = 0
d〈J, ξ〉(z) ·XH(z) = 0
H, 〈J, ξ〉 = 0
d〈J, ξ〉(z) ·XH(z) = 0
onde ., . representa o colchete de Poisson, XH(z) =M∇H(z) e o vetor ∇H(z) ∈ TzP
representa o gradiente da função H, dado por
∇H(z) =[
∂H(z)∂q
∂H(z)∂p
]T
Como, em geral, XH representa uma dinâmica não nula, tem-se que d〈J, ξ〉(z) = 0, ou
seja, 〈J, ξ〉(z) se mantém constante ao longo das trajetórias do campo XH(z).
O Teorema de Noether, enunciado aqui no contexto geométrico, traduz-se nos Teoremas
da conservação de momento linear e da conservação de momento angular da mecânica
clássica Newtoniana.
2.4. SISTEMAS COM SIMETRIA 29
Exemplo 2.4.2. Considere um corpo rígido no espaço tridimensional. Suponha que
este possa girar livremente em torno dos três eixos do referencial fixo cujo a origem
está localizada no seu centro de massa. O espaço de configuração do corpo rígido é
dado pelo grupo SO(3) e seu momento angular µ ∈ T ∗q SO(3) ≈ R3. Pelo Teorema
de Noether, e na ausência de torques, o corpo mantém seu movimento indefinidamente
nas trajetórias determinadas pelas curvas integrais do campo vetorial que modela a sua
dinâmica. Algumas destas trajetórias são ilustradas na Figura 2.5, (Marsden e Ratiu,
1999).
Figura 2.5: Trajetórias da dinâmica de rotação do corpo rígido no espaço tridimensio-
nal. A intersecção da superfície de conservação do momento angular, dada por esferas
concêntricas ao centro de massa do corpo, com a superfície representativa da conserva-
ção de energia, descrita por elipsóides (não ilustrados) fornece as possíveis trajetórias
do corpo no espaço de variáveis.
2.5. ESPAÇOS FIBRADOS E CONEXÕES 30
2.4.1 Redução de Sistemas com Simetria
Em geral, a simetria do sistema permite uma redução de ordem do seu modelo dinâmico
associado. A motivação por traz de uma redução de ordem do sistema muitas vezes recai
na necessidade de simplificação das equações diferenciais que modelam a dinâmica, nos
procedimentos de análise da dinâmica, ou na aplicação de ferramentas de planejamento
de trajetória. Alguns métodos de redução, no contexto geométrico de simetria, são
apresentados e discutidos em Marsden e Ratiu (1999) e (Bloch, 2003).
A Estrutura Principal e Simetria do Sistema
Como será detalhado na Seção a seguir, o espaço de configuração Q é localmente iso-
mórfico ao produto do espaço de base com espaço de grupo, ou fibra, G:
Q ' Q/G×G (2.4.2)
Assume-se, neste trabalho, que o grupo de simetria e a estrutura de grupo do fibrado
principal coincidem. O espaço completo Q, e o fibrado principal são relacionados pela
aplicação projeção do fibrado: π : Q → Q/G.
2.5 Espaços Fibrados e Conexões
Apresenta-se, nesta seção, uma descrição mais detalhada da estrutura geométrica do
relacionamento entre variedades e seus espaços tangentes, veja (Bloch, 2003; Bullo e
Lewis, 2005).
Um espaço fibrado é uma 4-upla (Q, π, B, F ) em que Q, B, e F são variedades C∞denominadas de espaço total, espaço de base e espaço de fibra, respectivamente, e a
aplicação π : Q → B projeta pontos q ∈ Q a r ∈ B. A fibra sobre b ∈ B é π−1(r).
Ademais, existe um atlas (Ua, φa)a∈A para B tal que o fibrado é localmente trivial, ou
π−1(Ua) é homeomórfico ao espaço produto Ua × F . As coordenadas do elemento q no
fibrado Q são dadas por qi = (rα, sa), onde rα ∈ B e sa descrevem a fibra localmente.
O espaço vertical Vq ⊂ TqQ é definido como sendo o núcleo da aplicação Tqπ para
todo ponto q. Denomina-se Tqπ como a aplicação tangente, corresponde a π em todo
2.5. ESPAÇOS FIBRADOS E CONEXÕES 31
ponto q ∈ Q. Faz-se importante especificar uma conexão ou um relacionamento entre
o fibrado tangente ao espaço de base TB e um subespaço do TQ detalhado a seguir.
As conexões são utilizadas para isolar o que se denominam direções horizontais que,
para todo q ∈ Q, definem um espaço horizontal suave Hq ⊂ TqQ tal que TqQ = Hq⊕Vq
e Hq são G-invariantes, ou seja, TqΦgHq = Hgq para todo g ∈ G. Logo, para qualquer
vetor vq ∈ TqQ, pode-se escrever:
vq = hor vq + ver vq
onde a aplicação hor : TQ → H devolve a componente horizontal do vetor vq e corres-
ponde a um elemento do espaço horizontal Hq em q; analogamente, ver vq ∈ Vq.
2.5.1 A Conexão de Ehresmann
Uma conexão de Ehresmann A corresponde a uma 1-forma no fibrado Q que retorna
um vetor em TQ tal que, para cada q ∈ Q, os seguintes se verificam:
• A(q) = Aq : TqQ → Vq é uma aplicação linear e vertical;
• A(vq) = vq é uma projeção, para todo vq ∈ Vq.
Define-se, a partir da conexão A acima, o espaço horizontal por Hq = kerAq. Seja
vq ∈ TqQ. Na base de TqQ, vq é escrito como
vq = rβ ∂
∂rβ+ sb ∂
∂sb
e ωa(q) a estrutura local da 1-forma da conexão A em q dado por
ωa(q) = dsa + Aaα(r, s)drα (2.5.1)
então a conexão A em vq fornece, em coordenadas, a expressão
A(vq) = (ωa(q) · vq)∂
∂sa= (sa + Aa
αrα)∂
∂sa(2.5.2)
O subespaço horizontal definido pela conexão é isomórfico ao espaço tangente do espaço
de base: Hq ' TrB. Para mostrar esta afirmação basta aplicar o levantamento tangente
da projeção π a elementos do espaço vertical para determinar o elemento nulo em TB
e vice-versa, aplicar Tπ a elementos de Hq para obter TB. O levantamento tangente
2.5. ESPAÇOS FIBRADOS E CONEXÕES 32
de π é dado por Tqπ : TqQ → TrB : q = (s, r) 7→ (0, r), vide Figura 2.6. A implicação
direta fica evidente observando, a partir de (2.5.2), que
Tqπ(Vq) = Tqπ(Aq) = Tqπ((s + Aq r)∂
∂s) ≡ 0
A implicação contrária deve-se ao fato que Tqπ é a aplicação identidade para elementos
de Hq.
TqπVq
TrB
Aq
TqQvq
vr ≡ 0vVq
Figura 2.6: Espaço tangente total TqQ, espaço tangente sobre B e o levantamento da
projeção π.
Seja um campo vetorial X(q(t)), onde X(q(t0)) = v0, para uma curva parametrizada
pelo tempo q(t) ∈ Q. Diz-se que o campo vetorial X(q(t)) é transportado paralelamente
se este permanecer paralelo a v0 para todo tempo t quando a curva q(t) é percorrida,
refira a (Schutz, 1980; Marsden e Ostrowski, 1998; Bloch, 2003) para detalhes.15 Este
deslocamento paralelo de X(q) recebe o nome de movimento geodésico ao longo da
curva q(t) e é descrito pela seguinte dinâmica
qa + Γabcq
bqc = 0 (2.5.3)
onde Γabc representam os símbolos de Christoffel. Seja uma métrica de Riemann
〈〈., .〉〉 em uma variedade Q, e seja x ∈ Rn a representação (local) em coordenadas do
ponto q ∈ Q, então Γabc são determinados por
Γabc =
12〈〈., .〉〉ad
∂〈〈., .〉〉bd
∂xc+
∂〈〈., .〉〉ac
∂xb− ∂〈〈., .〉〉bc
∂xd
(2.5.4)
O movimento de um sistema mecânico simples como definido na Seção 2.3, com ou sem
restrições, é descrito por equações de geodésicas.15Um vetor vq é horizontal se satisfazer A(vq) = 0. Para o fibrado tangente (q, vq) ∈ TQ, vq é
transportado paralelamente ao longo da curva q(t) se o vetor vq é deslocado ao longo das direções
horizontais com relação à conexão.
2.5. ESPAÇOS FIBRADOS E CONEXÕES 33
π Q/G
q
Φg(q)Q
r
Figura 2.7: O fibrado principal. Φg(q) corresponde a órbita da ação de g ∈ G em q,
Seção A.1.
2.5.2 A Conexão Principal
Seja um grupo de Lie G que age propriamente no espaço de configuração Q. O espaço
Q é isomórfico ao produto do espaço de quociente Q/G com o espaço do grupo ou fibra
G: Q ' G × Q/G. Se o espaço do produto possui esta estrutura globalmente, este é
chamado de trivial. Observe que o espaço de base B é dado pelo espaço quociente Q/G
através de uma relação de equivalência, onde dados q1, q2 ∈ Q e g ∈ G, tem-se que
q1 ∼ q2 ⇔ q2 = g · q1. O espaço de base Q/G é também conhecido como o espaço
de formatos pois define a forma de sistemas multi-corpos, estabelecendo as posições
relativa entre os seus componentes. Um elemento do espaço Q, dado pelo produto com
a estrutura acima, tem coordenadas (g, r), onde r ∈ Q/G ≡ B.
A aplicação π : Q → Q/G é uma projeção no segundo componente. Toma-se a ação de G
como uma translação à esquerda do primeiro componente. A estrutura (Q, π, Q/G, G)
descrita acima, cuja fibra G é um grupo de Lie, é chamada de fibrado principal,
Figura 2.7. Se G age livre e propriamente, o espaço de forma Q/G é uma variedade
suave e Tπ é uma aplicação sobrejetora.
Define-se a conexão principal A em um fibrado principal π como uma 1-forma com
valores na álgebra de Lie, de maneira que, para todo, q ∈ Q e ξ ∈ g, A(ξQ(q)) = ξ e
A(TqΦg(vq)) = AdgA(vq), ou seja, A é Ad-equivariante, para uma ação Φq do grupo de
Lie G em Q.16
16Note que A é equivariante com relação a g ao passo que J, em relação a g∗.
2.5. ESPAÇOS FIBRADOS E CONEXÕES 34
2.5.3 Curvatura do Fibrado Tangente
A curvatura da conexão principal A, representada por B, é uma aplicação à álgebra de
Lie, determinada por
B(X, Y ) = −A([horX, horY ])
onde [., .] são os colchetes de Jacobi-Lie. Para os campos vetoriais invariantes à esquerda
X,Y , pode-se escrever
B(X, Y ) = X[A(Y )]− Y [A(X)]− [A(X),A(Y )] (2.5.5)
onde [., .] são os colchetes da álgebra de Lie. Nas coordenadas locais (s, r), calcula-se a
curvatura da conexão através da expressão
Bb(X,Y ) = BbαβXαY β (2.5.6)
onde
Bbαβ =
(∂Ab
α
∂rβ− ∂Ab
β
∂rα+Aa
α
∂Abβ
∂sa−Aa
β
∂Abα
∂sa
)
35
Capítulo 3
Mecânica não-Holonômica
3.1 Mecânica Lagrangiana
A discussão da estrutura do fibrado principal apresentada neste capítulo segue dos
resultados provenientes de Ostrowski (1995) além das referências adicionais Bloch et al.
(1996) e da referência conjunta Bloch (2003).
Na mecânica não-holonômica aqui considerada atenção é voltada aos sistemas mecânicos
sujeitos à restrições na velocidade que não são deriváveis das restrições de posição ou,
mais genericamente, da configuração. Nestas condições, a simetria do sistema não mais
necessariamente corresponde às grandezas sendo conservadas1 mas, ao invés, à equação
de momento generalizada, (Bloch et al., 1996). Em geral, a não-holonomicidade é
encontrada sempre que a forma de Pfaff das restrições de um sistema não puder ser
transformada na forma de um diferencial perfeito que, porventura, permite ser integrada.
Para uma explanação mais detalhada do assunto, ver (Meirovitch, 1970).
Como mostrado em Bloch et al. (1996), utiliza-se o princípio de Lagrange-d’Alembert
como ferramenta para equacionar esta classe de sistemas. Em geral, o princípio de
Lagrange-d’Alembert é também aplicável a outros casos, como sistemas sem restrições
com forças externas, sistemas holonômicos com ou sem forças externas e, como menci-
onado acima, a sistemas não-holonômicos com ou sem forças externas.1Ou leis de conservação, como o Teorema da Conservação do Momento Angular da mecânica clássica,
ou a aplicação momento J.
3.1. MECÂNICA LAGRANGIANA 36
3.1.1 Princípio de Hamilton
Recorda-se que a variação infinitesimal δ de uma curva q(t) ∈ Q é dada por
δq(t) =∂
∂εq(t, ε)
∣∣∣∣ε=0
A variação infinitesimal da curva δq, também conhecida como deslocamento virtual,
pode ser imaginada como uma mudança infinitesimal da coordenadas da curva que são
consistentes com as restrições do sistema mas que, em caso contrário, são arbitrárias
(Meirovitch, 1970). Seja o Lagrangiano L : TQ → R com coordenadas (qi, qi), para
i = 1, . . . n, onde dimQ = n. Para sistemas sem restrições, ou seja, livre de vínculos as
equações da dinâmica podem ser obtidas a partir do Princípio de Hamilton:
δ
∫ b
aL
(qi(t), qi(t)
)dt = 0, i = 1, . . . n (3.1.1)
para variações arbitrárias δ. Sabe-se que, na ausência de restrições e de forças externas,
as equações de Euler-Lagrange são condições necessária e suficiente para que a dinâmica
do sistema atenda ao Princípio de Hamilton.
3.1.2 Sistemas com Restrições
Para um sistema n-dimensional, consideram-se dados m restrições (m < n), ou víncu-
los, nas velocidades. Estas restrições podem ser classificadas em duas categorias. As
restrições holonômicas correspondem a sub-espaços integráveis do fibrado tangente à
variedade de configuração do sistema, TQ. Esta noção de integrabilidade é a mesma
presente no contexto do Teorema de Frobenius e é avaliada com relação à distribuição
associada à restrição do sistema, no fibrado tangente TQ.
As restrições de juntas rotativas de sistemas interconectados, como as presentes em
manipuladores, representam um típico exemplo de vínculos holonômicos. Por exemplo,
o movimento de um sistema com N corpos fica completamente definido com as equações
da dinâmica livre juntamente com a descrição de m = 2N − 2 equações de vínculos2.
Para o caso holonômico, as coordenadas generalizadas qi são independentes, porque as
restrições são integráveis e, portanto, redutíveis a m diferenciais perfeitas em TQ.
A conexão de Ehresmann é, em geral, utilizada para definir as restrições cinemáticas.
Nas considerações que se seguem, é conveniente empregar uma distribuição de restrições2Duas equações para cada junta de corpos adjacentes: uma equação de velocidade e outra de posição.
3.1. MECÂNICA LAGRANGIANA 37
correspondente D ⊂ TqQ para descrever estes vínculos. Logo, uma distribuição das
restrições em Q é um subconjunto de TQ das direções admissíveis da dinâmica do
sistema, definido para cada q ∈ Q.
Restrições Não-Holonômicas
Quando da existência de restrições não-holonômicas, a distribuição de restrição não
é mais integrável. Neste caso, as quantidades conservadas de um sistema dinâmico,
relacionadas às simetrias correspondentes, e que podem ser entendidas como a aplicação
de uma conexão principal, constituem em um exemplo de restrição não-holonômica. Na
teoria não-holonômica, as coordenadas generalizadas qi não são mais independentes,
mas sujeita a restrições.
Alguns casos usuais em que restrições tomam forma são as lineares e afins. A restrição
linear, ou homogênea, nas velocidades do sistema é equivalente a uma restrição hori-
zontal, ou seja, A(q)q = 0. Seja a configuração com estrutura principal q = (g, r) ∈ Q,
como apresentada na Seção 2.5. Logo, para uma restrição horizontal:
q ∈ Hq ⇒ qi = (rα, sa) = (rα,−Aaαrα) (3.1.2)
As restrições cinemáticas são geralmente realizadas por restrições lineares. Portanto, a
distribuição da restrição Dq
Dq = q ∈ TqQ | A(q) · q = 0 = kerAq
onde Aq ≡ A(q) é a conexão de Ehresmann no espaço Q, em q ∈ Q. Logo, a restrição é
especificada por um subespaço horizontal associado à conexão A, (Bloch, 2003). Maiores
detalhes a respeito de como as restrições influenciam o movimento do sistema multi-
articulado através das fases geométricas serão vistos na Seção 5.2.
As equações de Lagrange-d’Alembert representam uma extensão geral das equações de
Euler-Lagrange para inclusão de restrições não-holonômicas via o Princípio de Lagrange-
d’Alembert 3.3As equações de Lagrange-d’Alembert simplificam, ou equivalem, às equações de Euler-Lagrange
quando da presença de vínculos holonômicos apenas.
3.1. MECÂNICA LAGRANGIANA 38
3.1.3 Princípio de Lagrange-d’Alembert
O Principio de Lagrange-d’Alembert é empregado para quantificar os efeitos de forças de
entradas ou de restrições na dinâmica de um sistema através da modificação das equações
de Euler-Lagrange. Faz-se importante mencionar que a mecânica não-holonômica não
é variacional como observado na teoria de controle ótimo, uma vez que as restrições de
movimento não são impostas a velocidade q mas apenas a variação δq, ver (Bloch, 2003)
e suas referências. Para um sistema com configuração q ∈ Q, as restrições cinemáticas
são descritas pela distribuição m-dimensional D, onde Dq ⊂ TqQ para todo q ∈ Q. A
dinâmica do sistema é completamente definida através de n equações diferenciais de
segunda ordem - que podem ser reescritas nas Equações de Hamilton como 2n equações
de primeira ordem - e com a subvariedade D, que define m equações de vínculos ou
restrições na velocidade q.
Definição 3.1.1. Para toda curva t ∈ [a, b] 7→ q(t) em Q, o princípio de Lagrange-
d’Alembert estabelece que
δ
∫ b
aL(q(t), q(t)) dt = 0 (3.1.3)
onde a variação δq(t) da curva q(t) satisfaz δq(t) ∈ Dq(t). Esta variação desaparece nos
pontos extremos, ou seja, δq(a) = δq(b) = 0 e a curva q(t) preserva as restrições.
Na definição acima, toma-se a variação da curva previamente a imposição das restri-
ções; ou seja, as restrições na família de curvas são impostas apenas após a variação δq.
Estas duas operações não comutam em geral mas representam justificativa conceitual
à mecânica não-holonômica não constituir em um problema variacional. Conseqüente-
mente, as variações, ou deslocamentos virtuais, associadas a δqi não são independen-
tes mas devem satisfazer a distribuição das restrições Dq(t),4 ou seja, são horizontais
δqi = (δrα,−Aaαδrα).
3.1.4 Equações de Lagrange-d’Alembert
As equações da dinâmica de um sistema sujeito a restrições lineares nas velocidades,
derivadas a partir do Princípio de Lagrange-d’Alembert, são dadas por:
d
dt
∂L
∂q− ∂L
∂q= λA(q), A(q)q = 0
4Observe que a curva q(t) ∈ Q satisfaz as restrições se q(t) ∈ Dq(t).
3.1. MECÂNICA LAGRANGIANA 39
onde λ são os multiplicadores de Lagrange e A, a conexão que define as restrições de
velocidade do sistema. Note que no caso holonômico a curvatura da conexão Bbαβ = 0,
o que é equivalente a afirmar que a diferenciação externa da 1-forma da conexão A(q)
que define a restrição se anula, ou seja, dωb = 0. Isto corresponde a situação em que
a distribuição é totalmente integrável no sentido de Frobenius, como esperado quando
apenas restrições holonômicas são presentes. No caso geral, o caso não-holonômico, tem-
se Bbαβ 6= 0,5 o que traduz em esforços adicionais a serem considerados nas equações de
movimento obtidas a partir do Princípio de Lagrange-d’Alembert.
Q
TqQ vq
T ∗q Qfc
Figura 3.1: Em geral, o pareamento dos elementos duais de TQ e T ∗Q é não nulo. Na
mecânica, no entanto, as forças de restrições fc são perpendiculares a velocidade, pois
não realizam trabalho.
Quando forças externas fext são presentes, como às entradas de um sistema por exemplo,
o Princípio de Lagrange-d’Alembert é formulado com a restrição adicional de que as
forças não realizam trabalho na direção da variação δq, Figura 3.1. Dada a curva
t ∈ [a, b] 7→ q(t) em Q, tem-se que
δ
∫ b
aL(q(t), q(t)) dt +
∫ b
afext(q(t), q(t)) · δq dt = 0 (3.1.4)
para uma dada variação δq que se anula nos pontos extremos. A expressão acima
permite obter as equações modificadas de Euler-Lagrange:
d
dt
∂L
∂q− ∂L
∂q= λA(q) + fext
onde λ são os multiplicadores de Lagrange e A, a conexão das restrições.5A curvatura da conexão de uma restrição B serve como uma medida de falta de integrabilidade.
3.2. A CONEXÃO MECÂNICA 40
3.1.5 Não-holonomicidade do Sistema
Sabe-se, da mecânica clássica ou pelo Teorema de Noether, que na ausência de torques
externos um sistema mantém o seu momento angular conservado. Neste caso, a con-
servação do momento angular representa uma restrição, ou vínculo, não-holonômica do
sistema (Fernandes, Gurvits e Li, 1994). Observe que a conservação do momento é uma
restrição dinâmica. Pode-se adiantar que o sistema em estudo é conhecidamente não-
holonômico, porque possui uma restrição nas velocidades, dado pelo momento angular,
não-integrável no sentido de Frobenius. Um sistema sujeito a restrições cinemáticas, no
entanto, representa um caso diferente. Neste caso as equações de Lagrange d’Alembert
regem a dinâmica do sistema sob as restrições lineares na velocidade, como apresen-
tado acima. Neste trabalho, o sistema em consideração não sofre ação de restrições
cinemáticas.
A seguir, apresentam-se as expressões de um dos casos de reconstrução da dinâmica no
espaço de configurações total Q, a saber, a conexão mecânica6.
3.2 A Conexão Mecânica
A utilidade da conexão mecânica resume-se na sua aplicação à teoria de redução de
sistemas com simetria e sem restrições. No que se segue, descreve-se os principais
elementos envolvidos neste contexto.
Seja q = (r, g) ∈ Q. O tensor de inércia travado7 I, que induz a aplicação equivariante
I(q) : g → g∗, pode ser definido pela expressão que iguala o pareamento entre elementos
da álgebra g e sua correspondente dual com a métrica de Riemann, em Q, dos geradores
infinitesimais correspondentes:
〈I(q)η, ζ〉 = 〈〈ηQ(q), ζQ(q)〉〉G, q ∈ Q (3.2.1)
onde η, ζ ∈ g e 〈〈., .〉〉G é a métrica devido a energia cinética do sistema em Q. A aplica-
ção induzida pelo tensor de inércia travado I(q) possui a propriedade de ser equivariante,
ou seja:
I(q) = Ad∗gI(Φgq)Adg
6Alguns outros casos importantes neste contexto, mas não utilizados no presente estudo, são os
relativos às conexões cinemática e não-holonômica.7Traduzido diretamente do inglês: “locked”, (Marsden, Montgomery e Ratiu, 1990).
3.2. A CONEXÃO MECÂNICA 41
Utiliza-se esta propriedade para determinar a versão local da inércia Iloc que é indepen-
dente da fibra G:
Iloc(r) = I(r, e) = Ad∗gI(q)Adg (3.2.2)
Note que Iloc(r) é uma trivialização local da expressão para o tensor de inércia travado
em Q/G.
Recorda-se que a aplicação momento J : TQ → g∗, quando definida no fibrado tangente
TQ, é dada por
〈J(q, vq), ξ〉 = 〈〈ξQ(q), vq〉〉 =⟨
∂L(q, q)∂q
, ξQ(q)⟩
, ξ ∈ g (3.2.3)
Note que a aplicação momento J fornece valores na álgebra g∗ cujos elementos corres-
pondem ao momento do sistema no referencial inercial e simbolizados por µS , ou seja:
J(q, vq) 7→ µS ∈ g∗, onde g representa a álgebra de Lie dos elementos invariantes à di-
reita. Logo, a versão no referencial móvel da aplicação J pode ser obtida pela aplicação
coadjunta Ad∗, consulte as seções do Apêndice A, através da expressão
JB = Ad∗gJ (3.2.4)
Neste caso JB(q, vq) 7→ µB ∈ g∗, para a álgebra de Lie g dos elementos invariantes à
esquerda.
T ∗QJ - g∗
TQ
FL(q)
6
A(q)- g
I(q)
6
Figura 3.2: Diagrama definindo a conexão mecânica.
Definição 3.2.1 (Conexão Mecânica). A conexão mecânica no fibrado principal Q →Q/G é definida pela aplicação principal A : TQ → g que atribui, Figura 3.2, para
todo (q, vq) ∈ TQ, a velocidade angular correspondente ao sistema “travado” a partir
da aplicação momento J segundo a expressão:
A(q) · vq = A(q, vq) = I−1(q)J(q, vq) (3.2.5)
3.2. A CONEXÃO MECÂNICA 42
Observe que o espaço horizontal, como definido na Seção 2.5, determinado pela conexão
mecânica A(q) é obtido pela subespaço (q, vq) ∈ TQ | J(vq) = 0, ou seja, subespaço
de TQ que rende momento nulo. Note também que, por ser uma conexão principal, a
conexão mecânica resulta em uma 1-forma, como apresentado em (2.5.1):
A(r, g) = dgg−1 +Aloc(r, g)dr
Para obter a versão da expressão da conexão A(q) no referencial móvel,
A(r, g) = dgg−1 +Aloc(r, g)dr
= Adg(g−1dg +Aloc(r)dr)
= AdgAB(r, g) (3.2.6)
Observe, no entanto, que a 1-forma AB(r, g) não é uma conexão. Define-se por Ω a
velocidade no espaço vertical Vq obtida pela conexão no referencial móvel através da
relação
Ω = g−1g +Aloc(r)r
= ξB +Aloc(r)r (3.2.7)
onde ξB representa a velocidade devido ao movimento somente na fibra. A partir de
(3.2.2), a conexão em TQ pode ser construída conforme o seguinte
A(q) · q = I−1(q)J(vq) = I−1(q)µS
= (AdgI−1loc(r)Ad
∗g)µS
= Adg(I−1loc(r)Ad
∗g µS)
A partir da última linha acima e utilizando a definição da conexão no referencial móvel
em (3.2.6), verifica-se que Ω = I−1loc(r)Ad
∗g µS . A expressão de Ω, construída apenas com
elementos definidos no referencial móvel, fica determinada por
Ω = I−1loc(r)Ad
∗gµS = I−1
loc(r)µB (3.2.8)
De (3.2.7) e (3.2.8) segue a expressão do momento do sistema no referencial móvel, dado
por
µB = Iloc(r)(ξB +Aloc(r)r) (3.2.9)
ou, invertendo a expressão acima, pode-se obter ξB a partir de µB
ξB = −Aloc(r)r + I−1loc(r)µB (3.2.10)
3.3. PRINCÍPIO VARIACIONAL REDUZIDO 43
3.3 Princípio Variacional Reduzido
Seja L um Lagrangiano G-invariante, como definido na Seção 2.4. Pode-se mostrar que
o fibrado tangente reduzido TQ/G é isomórfico ao espaço g × TB que, por sua vez,
induz um Lagrangiano reduzido l em TQ/G com coordenadas ξ ∈ g e r ∈ TB. Logo,
a partir de um Lagrangiano L invariante à esquerda, o Lagrangiano reduzido l é obtido
segundo
l(r, r, ξB) := L(r, e, r, g−1g) = L(r, g−1g, r, g−1g) = L(Lg(r, g), TLg(r, g))
onde ξB é um elemento da álgebra de Lie correspondente sistema de referência móvel e
l é função da álgebra de Lie g do referencial móvel parametrizada pela velocidade ξB.
As forças e torques correspondem às entradas de um sistema mecânico e, como apre-
sentado na Seção 2.2, são elementos do espaço T ∗q Q e, portanto, são covetores e sujeitas
a estrutura geométrica de Q. As entradas são representadas por τ . O particionamento
da entrada τ na estrutura do fibrado trivial, segundo os componentes nas direções dos
espaços de fibra e base, é realizado de maneira análoga à decomposição da configuração
q. Desta maneira, tem-se
τ = τedge + τidri ∈ T ∗q Q
onde τe ∈ T ∗g G corresponde aos componentes da entrada τ relativos às direções da fibra
G e τi ∈ T ∗r B, os componentes relativos às direções no espaço de base B. Pode-se levar
os covetor τ à álgebra dual correspondente a g através da expressão do levantamento
cotangente da ação de grupo Φg aplicado a τe ∈ T ∗g G, onde τe é a restrição de τ nas
direções da fibra G, obtendo-se τeg ∈ T ∗e G ≡ g∗.
Em termos da métrica 〈〈., .〉〉G, o Lagrangiano reduzido do sistema l : TQ/G → R fica
l =12
[ξT rT
][G11 G12
G21 G22
] [ξ
r
](3.3.1)
Similarmente, um L invariante à direita confere um Lagrangiano l função da álgebra de
Lie representado por coordenadas inerciais ξS .
Define-se o momento generalizado do sistema no referencial móvel em função do La-
grangiano reduzido l, a partir de (3.2.9), como
µB :=∂l
∂ξB= Iloc(r)(ξB +Aloc(r)r) (3.3.2)
3.4. RECONSTRUÇÃO DA DINÂMICA 44
Ao usar (3.3.2) para definir uma restrição da velocidade de um ponto do sistema ξB,
induz-se uma função em TB × g∗ denominada Lagrangiano reduzido da restrição lc:
lc(r, r, µB) = l(r, r, ξB)|ξB
No que se segue, reproduz-se as expressões da dinâmica do sistema reduzida do espaço
de fase de velocidade TQ para o espaço quociente TQ/G segundo a ação de G em Q.
Para um Lagrangiano L invariante a ação de G, a projeção do princípio variacional
em TQ/G induz um Lagrangiano reduzido l e o princípio variacional reduzido
correspondente. Este processo de redução, propicia um particionamento da dinâmica
no espaço fibrado definido pela álgebra de Lie concatenado ao fibrado tangente da base
(g×TB) e regida pelas equações de Lagrange-Poincaré, ver (Marsden e Scheurle, 1993)
e (Ostrowski, 1995) para detalhes adicionais.
Proposição 3.3.1 ((Ostrowski, 1995)). As equações reduzidas definidas em g×TB, com
restrições não-holonômicas, relativas ao princípio variacional são dadas pelas expressões
d
dt
(∂l
∂ξa
)− ad∗ξ
∂l
∂ξa= λcω
cbg
ba + τbg
ba (3.3.3)
d
dt
(∂l
∂ri
)− ∂l
∂ri= λcω
ci + τi (3.3.4)
onde a, b = 1, . . . ,dimG e i = 1, . . . , dimB.
Note que τbgb, para a, b = 1, . . . ,dimG, é dado pela expressão do levantamento cotan-
gente da ação de grupo calculado nos componentes da fibra G de τ .
Note que a primeira equação, definida em g, corresponde à equação de Euler-Poincaré
forçada. A partir destas expressões gerais é possível obter as equações diferenciais que
regem as dinâmicas do momento generalizado, do espaço de base do sistema e uma
expressão da reconstrução da cinemática na fibra. Estas três últimas equações acima
serão apresentadas na próxima seção por ocasião da modelagem do sistema.
3.4 Reconstrução da Dinâmica
A trajetória no espaço total Q pode ser recuperada a partir de um caminho percorrido no
espaço de base Q/G, em conjunto com as restrições em D, o momento total generalizado
3.4. RECONSTRUÇÃO DA DINÂMICA 45
e com a equação de momento do sistema. Este processo, inverso da redução, recebe o
nome de reconstrução.8
O modelo da dinâmica total de um sistema com simetria pode ser apresentado da
seguinte maneira (Bloch, 2003):
g−1g = −A(r)r + B(r)p
p = rT H(r)r + rT K(r)p + pT D(r)p
M(r)r = δ(r, r, p) + τ
onde a primeira expressão corresponde à equação de reconstrução que modela a cinemá-
tica do sistema em função do elemento de grupo g ∈ G, a segunda expressão representa a
equação de momento em T ∗G, para o momento p ∈ T ∗g G em coordenadas do referencial
móvel, e a terceira equação apresenta a dinâmica do sistema no espaço de base Q/G
em função da configuração r. Em geral, os esforços externos τ da representação acima
afetam apenas as variáveis de forma em B; sendo, portanto, G-invariantes. No entanto,
as entradas do sistema que será definido no capítulo seguinte, possui componentes que
afetam, além das variáveis de forma, as variáveis da fibra G.
Com os elementos acima, tem-se condições de estabelecer as equações de reconstrução
no referencial móvel, ver (Ostrowski, 1995; Murray, 1997). Estas são deduzidas a partir
do princípio não-holonômico variacional reduzido, resultando nas expressões:
g = g(−Aloc(r)r + I−1
loc(r)µB
)
µB = ad∗ξ µB + τ (3.4.1)
M(r)r + rT C(r)r + N = X (r)τ
onde define-se a matriz de inércia reduzida M(r) como
M(r) = G22(r)−ATloc(r)Iloc(r)Aloc(r), (3.4.2)
e as forças centrípeta e de Coriolis são determinadas a partir do seguinte tensor da
métrica Riemanniana
Cijk(r)rj rk =12
(∂Mij
∂rk+
∂Mik
∂rj− ∂Mkj
∂ri
)rj rk (3.4.3)
Note que os coeficientes Cijk dos termos acima são dados pelos símbolos de Christoffel,
definidos em (2.5.4), avaliados apenas no espaço de base B. O termo da dinâmica N ,8No caso não-holonômico mais geral, o processo de reconstrução deve considerar a interação entre
as restrições e a simetria do sistema. Neste caso, a dinâmica reduzida do sistema em D/G é elevada ao
subconjunto do espaço total D ∈ TQ.
3.4. RECONSTRUÇÃO DA DINÂMICA 46
responsável pela incorporação da dinâmica do momento do sistema µB à dinâmica no
espaço de base B, é dado pela expressão
N(.) = ad∗ξB
∂l
∂ξBAloc(.) +
∂l
∂ξB
(dAloc(r, .) +
12
∂I−1locµB
∂r(.)
)(3.4.4)
onde ∂l/∂ξB representa o momento no referencial móvel definido em (3.2.9) e (.) assume
valores em TB.
Observação 3.4.1. Observe que um dos termos da expressão da dinâmica N(.) deve-se
à derivada exterior do componente local da 1-forma relativo a conexão principal A,
e dado por dAloc(r, .), como definida na Seção 2.5.3. Note também que, pelo fato do
componente local da conexãoAloc não ser função das coordenadas da fibra G mas apenas
das coordenadas do espaço de base B, a derivada exterior implica a seguinte 2-forma
em B:
dAloc(r, δr) =(
∂Alocα
∂rβ− ∂Alocβ
∂rα
)rαδrβ
uma vez que o termo dependente do colchete de Jacobi-Lie se anula. Vale mencionar
que o resultado, avaliado nos vetores r e δr, corresponde a um elemento na álgebra g e,
portanto, de dimensão igual à dimensão da fibra G.
A contribuição das entradas τ = (τe, τi) na equação do momento é dada por τa = τbgba,
onde gba representa a ação do grupo G, no componente da entrada relativa a fibras τe ∈
T ∗g G, elevada ao espaço cotangente através da ação de translação dual do levantamento
cotangente T ∗e Lg, veja Seção A.1 para detalhes. Na equação do movimento na base, a
parcela da força τ é determinada pela aplicação da 1-forma X , função da conexão A, a
τ :
(X (r)τ)i = τi − τe(Aloc(r))ei
As equações acima expressas em função das coordenadas do referencial inercial são
apresentadas abaixo. Observe que AdgAloc(r) = Aloc(r, g), e que nas coordenadas
inerciais, tem-se (Murray, 1997):
g = g(−Aloc(r, g)r + I−1(r, g)µS
)
µS = Ad∗gτ
M(r)r + rT C(r)r + NS = X (r)τ
onde M(r) e C(r) são dadas pelas mesmas expressões quando no referencial móvel. A
função NS , por outro lado, toma a seguinte forma
NS =⟨
µS ;AdgadξBAloc(.) + AdgdAloc(r, .) +
12
∂I−1µS
∂r(.)
⟩(3.4.5)
3.5. CONCLUSÃO 47
Uma evidente vantagem de se escrever a dinâmica do sistema no referencial móvel se
revela no desacoplamento na equação de momento das variáveis do grupo g ∈ G, facili-
tando a obtenção do movimento na fibra pela integração da equação de momento, dada
uma curva r(t) no espaço de base. Esta característica não é observada quando função
das coordenadas inerciais. Entretanto, a conservação do momento é verificada apenas
no referencial inercial.
3.5 Conclusão
A modelagem Lagrangiana de um sistema segue das equações de Lagrange, quando
livre de restrições ou vínculos de velocidade. Estas equações foram aqui apresentadas
sob a mesma decomposição da estrutura principal da Seção 2.5 e serão utilizadas na
modelagem do sistema multi-articulado sem restrições no próximo capítulo.
48
Capítulo 4
Modelagem do Sistema
Multi-Corpo
No presente capítulo apresenta-se a modelagem do sistema multi-articulado no plano.
O cenário utilizado para a formulação da modelagem da dinâmica do sistema, segue
de Sreenath (1987) e Marsden e Ratiu (1999), para a dinâmica Hamiltoniana, e de
Ostrowski (1995), para uma abordagem Lagrangiana.
Como mencionado no capítulo introdutório, a classe de sistemas multi-articulados aqui
definida apresenta uma evolução em relação aos sistemas multi-articulados encontra-
dos na literatura. Esta evolução diz respeito à incorporação dos esforços externos, ou
entradas às equações de movimento do sistema. Em particular, os sistemas consistem
de representações de sistemas veículo-manipulador considerados “ativos” no sentido de
usufruírem da capacidade de auto-manobra no espaço de configuração pela ação de
propulsores distribuídos pelo sistema. No caso plano, aqui considerado, os veículos são
dotados de manipuladores com inércia não desprezível de um grau de liberdade, a saber,
a rotação em torno do eixo perpendicular ao plano. Estes sistemas podem ser vistos
como uma rede interconectada de corpos rígidos. À medida que o número de corpos e
conexões entre estes corpos aumentam, o número de variáveis aumenta, e o modelo da
dinâmica do sistema se torna altamente complexo.
Ao longo deste capítulo, e nos que se seguem, assume-se a modelagem do sistema
negligenciando-se a existência de forças potenciais, como a gravidade ou magnéticas,
e dissipativas, como o atrito ou arrasto de fluidos, por exemplo. Adota-se também,
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 49
juntas rotativas ideais quando da conexão dos corpos. Quando presentes, as forças de
propulsão são tomadas como agentes nos centros de massa do corpo correspondente.
Além disso, não são consideradas forças vetorizadas, o que simplifica as expressões so-
bremaneira.
4.1 Cinemática do Sistema no Espaço Completo
Para um sistema restrito ao plano composto por N corpos livres, o espaço de configu-
ração é dado por
Qlivre = SE(2)× . . .× SE(2) (N -vezes)
onde SE(2) é o grupo Euclideano especial no plano1. Porque o grupos SE(n) e SO(n)×Rn são isomórficos entre si, para qualquer n ∈ N, a seguinte aplicação é naturalmente
definida como
SE(n) 3[
R r
01×n 1
]7→ (R, r) ∈ SO(n)× Rn
onde R representa uma matriz de rotação e r, o vetor posição em relação a um refe-
rencial, conforme a Fig. 4.1. Portanto, identificam-se os elementos de SE(n) com os
elementos de SO(n)× Rn. Logo:
q = (qi) = ((R1, r1), (R2, r2), . . . , (RN , rN )) ∈ Qlivre
onde qi = (Ri, ri), para i = 1, . . . , N , ou, em forma vetorial,
q =
(r1,R1)T
...
(rN ,RN )T
∈ Qlivre
No caso de sistema multi-corpos interconectados, os corpos são fisicamente acoplados
dois-a-dois entre si por juntas de rotação. Neste caso define-se uma restrição de junta2
através da relação:
rj+1 = rj + R(θj)dj+1j −R(θj+1)d
jj+1 1 ≤ j < N
1O grupo SE(n) é o produto semi-direto SO(n)sRn, como visto na Seção 2.2.1.2Derivada da premissa que dois corpos articulados por meio de uma junta rotativa sempre mantém
contato em um mesmo ponto. Portanto, o ponto onde se localiza a junta rotativa é o mesmo se visto a
partir dos referenciais móveis em ambos os corpos.
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 50
ReferencialInercial
x1
θ1
θi
xi
ri
r1
θ∗
θcmrcm
θk
rk xk
yI
xI
y1
yi
yk
Figura 4.1: O i-ésimo sistema de coordenadas é especificado, através da posição da sua
origem ri e orientação θi, em relação ao i− 1-ésimo referencial.
onde dj+1j é a posição da junta entre os j-ésimo e (j + 1)-ésimo corpos em relação à
origem do sistema referencial do j-ésimo corpo. Portanto, o espaço de configuração do
sistema interconectado Q, onde Q ⊂ Qlivre, simplifica a:
Q = R2 × SO(2)× . . .× SO(2) (N -vezes) (4.1.1)
Ademais, pode-se identificar os grupos SO(2) e S1 devido ao seguinte isomorfismo:
SO(2) 3 R 7→ (x1, x2) ∈ S1 ⊂ R2,√
x21 + x2
2 = 1
Adicionalmente, o círculo S1 pode ser parametrizado através do difeomorfismo f :
[0, 2π] ∪ [−π, π] → S1 : θ 7→ (cos θ, sin θ).3 Logo, determina-se um ponto em S1 por
θ podendo-se escrever (4.1.1) como:
Q = R2 × S1 × . . .× S1 (N -vezes)
e, conseqüentemente
q = (r, (θi)) = (r, θ1, θ2, . . . , θN ) ∈ Q.
3O domínio do difeomorfismo em questão é estabelecido pela projeção estereográfica do círculo S1
no eixo dos reais, (Spivak, 1999; Mather, 2005).
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 51
onde r é a posição de um ponto (qualquer) do sistema em relação ao referencial inercial.
Do exposto acima, pode-se parametrizar Ri = R(θi) ∈ SO(2) por θi ∈ S1. Seja q ∈ Q.
A ação de translação do sistema por r pode ser explicitada como
r · q = r · ((R1, r1), (R2, r2), . . . , (RN , rN ))
= ((R1, r + r1), (R2, r + r2), . . . , (RN , r + rN ))
Por outro lado, rotacionando-se o sistema em torno de qualquer ponto pertencente ao
sistema por R = R(θ) ∈ SO(2), o seguinte mostra que todos os corpos são rotacionados
igualmente:
R · q =R · ((R1, r + r1), (R2, r + r2), . . . , (RN , r + rN ))
=((RR1, r + r1), (RR2, r + r2), . . . , (RRN , r + rN ))
=((R(θ + θ1), r + r1), (R(θ + θ2), r + r2), . . . , (R(θ + θN ), r + rN ))
Observe, pela última igualdade, que os elementos pertencentes a SO(2) comutam, tor-
nando explícito o homeomorfismo abeliano do grupo.
As equações de movimento da dinâmica do sistema são definidas no espaço de estados.
Toma-se o espaço de estados como sendo o fibrado tangente TQ sobre o espaço de
configuração, o espaço de fase de velocidade, ou como o espaço de fase de momento,
dado pelo espaço cotangente T ∗Q sobre Q, dependendo de uma abordagem Lagrangiana
ou Hamiltoniana. Para a configuração q = (Ri, ri), para i = 1, . . . , N , o espaço de fase
TQ é dado por
(Ri, ri) ∈ TqQ = Tq1SE(2)× . . .× TqN SE(2) (N -vezes)
O vetor velocidade angular ω fica determinado por
ω =
ω1
ω2
...
ωN
=
θ1
θ2
...
θN
(4.1.2)
Pode-se escrever o vetor q ∈ TqQ, em q, em função das coordenadas (r, θ).
Lagrangiano do Sistema
O Lagrangiano do sistema L é determinado apenas pela energia cinética do sistema,
devido à ausência, aqui considerada, de forças potenciais ou dissipativas. Logo, as
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 52
equações da movimento são governadas somente por dinâmicas inerciais. A energia
cinética total KE do sistema plano, composto por N corpos, é obtida pela soma das
energias cinéticas individuais, (Bullo e Lewis, 2005). Conforme notação apresentada na
Seção 2.2, segue de (2.2.2) que
L = KEk=
12
∫
Bk
ρ(Xk)‖rcmk‖2d2Xk, k = 1, . . . , N
No contexto de Riemann, com estrutura definida por (Q, 〈〈., .〉〉), a métrica da energia
cinética pode ser definida através da métrica 〈〈., .〉〉G, onde G é a matriz de inércia
generalizada, definida a seguir. Denominando-se por rcm ∈ R2 o centro de massa do
sistema, tem-se, no referencial inercial, que:
L(q, q) = 〈〈q, q〉〉G =12〈Gq, q〉 =
12
qTG q =12
ωT Jω +12
m∗‖rcm‖2 (4.1.3)
onde q ∈ TqQ, m∗ é a massa total do sistema e ω foi definido em (4.1.2) e
G =
[m∗I2 02×2
02×2 J
]
A matriz de inércia J é simétrica e definida e positiva e dada por, Seção C.2.1:
J = J(θ) =
I1 λ12 · · · λ1N
λ12 I2 · · · λ2N
......
. . ....
λ1N λ2N · · · IN
(4.1.4)
onde o momento de inércia expandido do k-ésimo corpo Ik pode ser calculado como
Ik = Ik +N∑
j=1
mj‖bjk‖2, (4.1.5)
o momento de inércia relativo entre os k-ésimo e o j-ésimo corpos λlj é dado por
λlj(θlj) =
[N∑
k=1
mk〈bkj ,bkl〉]
cos(θlj) +
[N∑
k=1
mk|bkj × bkl|]
sin(θlj) (4.1.6)
e onde o ângulo relativo entre os k-ésimo e o j-ésimo corpos é
θlj = θl − θj
Quando l = j−1, diz-se que θlj representam os ângulos de junta. Nas expressões (4.1.5)
e (4.1.6), b(.,.) ∈ R2 representa o equivalente da distância “linear” entre quaisquer dois
corpos do sistema e as operações do produto interno 〈.〉, produto vetorial × e norma de
um vetor |.| são tomadas como usuais em R2.
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 53
Hamiltoniano do Sistema
Aplicando-se a transformada de Legendre FL : TQ → T ∗Q, ao vetor q, obtém-se p ∈T ∗q Q. Fixadas as coordenadas de configuração q, o espaço cotangente tem coordenadas
canônicas (qi, pi), para i = 1, . . . , N , onde o momento conjugado p fica determinado
por:
FL(q) = FL
rcm
θ1
...
θN
7→
pcm
µ1
...
µN
= p (4.1.7)
onde p é definido por
p :=∂L(q, q)
∂q
A partir da transformação no espaço tangente acima, especificam-se os elementos do
espaço cotangente: o momento angular µ é definido por µ = Jω e o momento linear
do centro de massa pcm ∈ R2 é obtido por pcm = m∗rcm, onde m∗ é a massa total do
sistema.
Como visto na Seção (4.1), o elemento do espaço tangente TqQ fica determinado por
(Ri, ri) ∈ TqQ. Por outro lado, um ponto no espaço de fase de momento T ∗Q é dado
por
(µi,pcm) ∈ T ∗q Q = T ∗q1SE(2)× . . .× T ∗qN
SE(2) (N -vezes)
Como a matriz de inércia do sistema J é definida e positiva, J é invertível e o Hamilto-
niano do sistema H : T ∗Q → R fica definido por
H(q, p) = H(θ, rcm, µ,pcm) =12µT J−1µ +
‖pcm‖2
2m∗ (4.1.8)
Como H independe de rcm, o Hamiltoniano pode ser escrito como H(q, p) = H(θ,µ,pcm).
4.1.1 Simetria do Sistema e Redução
Pode-se mostrar que a classe de sistemas aqui considerada possui grupo de simetria
G = SE(2), o que traduz em invariância da dinâmica, como discutido na Seção 2.4.
Para a ação de levantamento à esquerda TΦg, a invariância da função Lagrangiano
pode ser verificada através da relação
Φ∗gL(q, vq) = L(Φg(q), TqΦg(vq)) = L(q, vq) (4.1.9)
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 54
No que se segue, descreve-se brevemente a redução da dinâmica do sistema que resulta
na dinâmica relativa do sistema. Primeiramente, devido a estrutura do produto semi-
direto do grupo S = SE(2), a redução de Q por S pode ser realizada em etapas, como
elucidado a seguir. A redução ao centro de massa do sistema é realizada primeiro,
através da redução do movimento de translação pelo espaço vetorial V = R2, obtendo-
se Q/V . O espaço de fase de momento parcialmente reduzido em Q/R2 rende PV =
P/R2 ' T ∗(S1 × . . . × S1). Em seguida, prossegue-se com a redução da orientação
inercial devido ao grupo G = SO(2), que corresponde a redução ao referencial do corpo.
O espaço de fase resultante em (Q/V )/G = Q/SE(2), obtido pela redução de PV por
SO(2), fica PS = PV /S1 = T ∗(S1 × . . . × S1)/S1. Maiores detalhes são discutidos em
Marsden e Ratiu (1999) e suas nas referências.
Logo, a invariância translacional e rotacional é observada e a dinâmica relativa entre os
corpos fica inalterada quando o sistema como um todo é deslocado no plano, na ausência
de esforços externos. Como comentado anteriormente, esta invariância corresponde a
conservação do momento. Mesmo sob a ação de torques devido aos atuadores localizados
nas juntas rotativas entre os corpos que compõe o sistema, o momento angular não sofre
alteração4. A atuação destes torques são internos ao sistema e contribuem apenas para
a variação de energia do sistema. Sob o enfoque geométrico, esta variação corresponde
à mudança de trajetória pertencente ao elipsóide de energia inicial para o elipsóide
de energia correspondente a variação. Um comportamento dinâmico distinto aparece
nos casos em que as juntas são rotacionadas devido aos esforços de propulsão. Neste
caso, pelo fato dos esforços de propulsão atuarem externamente ao sistema, não há
necessariamente conservação do momento angular. A modelagem das entradas de torque
e propulsão é realizada na Seção 4.2.1.
A função Hamiltoniano reduzida H do sistema é
H(q, p) =12µT J−1µ +
‖pcm|B‖2
2m∗ (4.1.10)
onde pcm|B representa o momento linear do centro de massa do sistema em coordenadas
do referencial móvel (Manikonda, 1998) e m∗ é a massa total do sistema. O campo
vetorial Hamiltoniano associado é XH .
Analogamente, o espaço da dinâmica reduzida do sistema pode ser decomposta em4Os torques nas juntas rotativas alteram os momentos angulares dos corpos individualmente; o
momento angular total do sistema se mantém constante uma vez que os incrementos de momentos dos
corpos devido aos torques internos se cancelam.
4.1. CINEMÁTICA DO SISTEMA NO ESPAÇO COMPLETO 55
folhas simpléticas. Conforme a expressão dada acima, a dinâmica reduzida é invariante
a ação do grupo SE(2). O espaço reduzido é um espaço de Poisson de três dimensões,
parametrizado por (φ, µ1, µ2). A especificação de cada folha simplética é feita fixando
um valor do momento angular total µ = µ1 + µ2. A dinâmica em cada folha pode
ser parametrizada pelas variáveis (φ, ν), onde ν = µ2 − µ1. A Figura 4.2 ilustra as
trajetórias da dinâmica do sistema de 2-corpos no plano restrita às folhas simpléticas
cilíndricas. Refira à Seção 4.2 e (Sreenath, 1987) para detalhes da construção das folhas
simpléticas e à Seção B.1 para detalhes da construção da superfície de energia constante
do sistema de dois corpos no plano.
Figura 4.2: Trajetórias da dinâmica de rotação do sistema de dois corpos no plano.
As trajetórias são determinadas pela intersecção da superfície cilíndrica, devida à con-
servação do momento angular do sistema µ1 + µ2, com o elipsóide, representativo da
conservação de energia H. Ver Seção B.1.
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 56
Decomposição da Configuração na Estrutura Principal
Os ângulos de junta φi, ou a orientação relativa entre dois corpos consecutivos, são
dados por
φi = θi+1,i, i = 1, . . . , N − 1
e definem as coordenadas r do espaço de base B tomado como o espaço quociente Q/G.
Por determinarem a “forma” do sistema, fixando a orientação relativa entre os corpos, os
φi são também denominados variáveis de forma do sistema, e o espaço B, similarmente,
é chamado de espaço de forma do sistema. Devido à invariância da matriz de inércia
J em relação à orientação absoluta dos corpos, J é função apenas das coordenadas do
espaço de base. Conseqüentemente, os termos de J podem ser escritos como função
apenas das φi. Logo, agrupando todos os φi em um único vetor φ, segue de (4.1.4) que
J = J(φ)
4.2 Modelo do Sistema no Espaço Cotangente
A determinação das equações de movimento do sistema livre (sem entradas) com N -
corpos, no espaço cotangente sobre o espaço de configuração Q, é realizada em função
do Hamiltoniano H dado em (4.1.8).
Em se tratando de um sistema de Poisson, pode-se utilizar de uma particularização do
colchete de Poisson para o sistema e chegar a estrutura simplética. O colchete de Poisson
levanta a trajetória ao espaço dual sobre a configuração do sistema Q e que corresponde
ao espaço cotangente T ∗Q. Logo, para as coordenadas z = (q, p) = (rcm, θ,pcm, µ) ∈T ∗Q e H(z) = H(θ,pcm, µ), as equações de movimento do sistema ficam determinadas
por:
z = z, H = XH(z) ⇒
rcm = rcm,Hpcm = pcm,H
θi = θi, Hµi = µi,H
Avaliando-se, primeiramente, o colchete de Poisson das duas primeiras equações, a di-
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 57
nâmica de translação do centro de massa do sistema é obtida por:
rcmx =∂H
∂pcmx
(4.2.1)
rcmy =∂H
∂pcmy
(4.2.2)
pcmx = − ∂H
∂rcmx
= 0 (4.2.3)
pcmy = − ∂H
∂rcmy
= 0 (4.2.4)
onde rcm = (rx, ry) e pcm = (px, py). As duas últimas expressões se anulam devido
a invariância de H em relação às coordenadas de posição rcm, confirmando, segundo
Noether, a conservação do momento linear. A dinâmica rotacional do sistema segue das
seguintes equações
θi =∂H
∂µi
µi = −∂H
∂θi, i = 1, 2, . . . , N (4.2.5)
A dinâmica acima é definida em uma variedade de Poisson, como pode-se atestar pelo
colchete de Poisson não-degenerado5. Apesar disto, como pode ser observado, a estru-
tura das equações de movimento do sistema multi-articulado de N corpos é simplética e o
espaço de fase T ∗Q da sua dinâmica tem dimensão par, dada por n = 2(N +2) = 2N +4.
A estrutura simplética também pode ser observada na subvariedade de Q relativo à di-
nâmica no espaço de base B.
Observação 4.2.1. Como introduzido na Seção 2.2.3, uma variedade de Poisson é dada
pela união disjunta de folhas simpléticas. Logo, a dinâmica do sistema pode ser para-
metrizada em cada elemento da foliação da estrutura principal. Cada folha do fibrado
principal é especificada pelos momentos linear e angular do sistema, que são corres-
pondentes às direções da fibra SE(2). Como a dinâmica do sistema multi-articulado é
simplética, as equações de movimento acima descrevem a dinâmica de cada folha como
exemplificado a seguir. A dinâmica de movimento fica totalmente especificada na folha
fixados valores dos momentos linear pcm e angular total µ do sistema. Fixado valores
do momento de translação e rotação do sistema µS , sua dinâmica permanece invariante
a uma folha da variedade de Poisson, dado que, na ausência de esforços externos, o
momento não tem o seu valor alterado como enunciado pelo Teorema de Noether. Note
que a estrutura simplética do movimento de translação é degenerada pois pcm = 0 e,
portanto, trivial, como apresentado em (4.2.1). Para o sistema de 2-corpos, a dinâmica5Ou, não identicamente nulo.
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 58
rotacional em cada folha simplética é uma subvariedade de Poisson de três dimensões
(4.2.1).
Observação 4.2.2. Note que a dinâmica da classe de sistemas em consideração, salvo
os sistemas de um único corpo rígido, não representa uma dinâmica de Lie-Poisson,
veja (Marsden e Ratiu, 1999), uma vez que o espaço de configuração Q não se resume
simplesmente ao grupo de simetria G e, portanto, o espaço reduzido não pode ser
reduzido simplesmente a álgebra de Lie g correspondente.
Reparametrizando as equações (4.2.5) em função de ângulos relativos θi,i−1, onde i =
1, . . . , N , pode-se mostrar utilizando o colchete de Poisson, (Sreenath, 1987), que a
dinâmica de rotação do sistema segue conforme
θi,i−1 =∂H
∂µi− ∂H
∂µi−1, i = 2, . . . , N
µ1 =∂H
∂θ2,1
......
µi =∂H
∂θi+1,i− ∂H
∂θi,i−1, i = 2, . . . , N − 1
......
µN = − ∂H
∂θN,N−1(4.2.6)
As equações acima correspondem a dinâmica reduzida do sistema multi-articulado,
como pode-se perceber pela ausência de uma variável que caracterize a orientação do
sistema em relação ao referencial inercial, além da dinâmica de translação. Esta ausên-
cia de variáveis de deslocamento e orientação é conseqüência da invariância do sistema
em relação ao grupo de simetria SE(2). As equações de movimento do sistema redu-
zido, provém da expressão do Hamiltoniano (4.1.10). Observe, também, que embora a
dinâmica ainda permaneça em um espaço de Poisson, as equações do sistema reduzido
possuem a estrutura simplética no espaço de variáveis presente em (4.2.5). É possível,
no entanto, recuperar a informação adicional da orientação do sistema em relação ao re-
ferencial inercial e determinar a atitude do sistema, bastando apenas adicionar à (4.2.6)
uma expressão da forma
θi =∂H
∂µi
Incorporando-se a configuração do estado θ1, por exemplo, à dinâmica no espaço de
base acima, em função das coordenadas φ, é possível descrever a dinâmica completa
no fibrado principal. Logo, o espaço de estados do sistema compreende uma espaço
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 59
2N -dimensional, composto por N cópias de (S1 × R) com a seguinte dinâmica:
θ1
φ1
...
φi−1
...
φN−1
=
∂H∂µ1
∂H∂µ2
− ∂H∂µ1
...∂H∂µi
− ∂H∂µi−1
...∂H∂µN
− ∂H∂µN−1
(4.2.7)
acrescida da dinâmica dos momentos µi.
4.2.1 Modelagem da Entrada do Sistema
As entradas físicas, consideradas atuantes no modelo do sistema plano de N -corpos,
compreendem as forças de propulsão fi, para i = 1, . . . , mp, onde mp 6 N . O ponto
de aplicação de cada fi dá-se no centro de massa do i-ésimo corpo. Adicionalmente as
juntas rotativas planas são consideradas ativas. Os torques que atuam nas juntas são
simbolizados por Tj , para j = 1, . . . ,mt, onde mt 6 N −1. Portanto, o número máximo
de entradas do sistema corresponde a N + (N − 1) = 2N − 1.
Como discutido na Seção 2.2 e no Capítulo 3, a entrada do modelo do sistema τ pode
ser identificada geometricamente como um elemento do espaço tangente dual T ∗q Q. Na
forma afim, como apresentado na Seção 2.3, a expressão da entrada τ é escrita como
τ = g1(z)u1 + g2(z)u2 + · · ·+ gm(z)um, i = 1, . . . , m
onde gi(z) são os campos vetoriais da entrada do sistema e u = (u1, . . . , um) ∈ U ⊂ Rm
são funções parametrizadas pelas forças fi e torques Tj . A função u é detalhada nas
próximas seções através de exemplos.
A modelagem da entrada do sistema é feita em duas etapas. Primeiramente, determina-
se a influência das forças externas fi por todo sistema multi-articulado através dos
diagramas de corpo livre de cada um dos corpo componentes. A modelagem dos
torques Tj é considerada posteriormente. A justificativa desta modelagem por etapas
deve-se ao princípio da superposição, isto é, escolhido um ponto do sistema, somam-se
as forças e torques com origens distintas.
Os componentes da entrada τ responsáveis pela translação do centro de massa do sis-
tema, em relação ao referencial inercial, são representados por τx e τy, nas direções dos
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 60
eixos das abscissas e ordenadas, respectivamente, como indicam os subscritos. Neste
caso, dadas N forças fi, os componentes τx e τy são obtidos projetando as fi nos eixos
do sistema inercial através das matrizes de rotação Ri = Rθi de cada um dos corpos,
conforme a expressão: [τx
τy
]=
N∑
i=1
Ri
[0
fi
](4.2.8)
Nesta etapa de modelagem, os componentes de rotação da entrada τ correspondem aos
torques que derivam de forças fi e que atuam rotacionando os corpos do sistema. Como
os corpos estão conectados através de articulações, ou juntas rotativas, ideais, estas não
transmitem torque, mas apenas força. Logo, o torque no i-ésimo corpo, i = 1, . . . , N−1,
correspondente a uma força fk atuante no k-ésimo corpo, i 6 k, de um sistema de N
corpos, é dado por6
T exti = −
k∑
i
((k − i)
Ndi
i+1 ×Rθk,i
[0
fk
]+
(k − i + 1)N
di+1i ×Rθk,i
[0
fk
])
= −k∑
i
((k − i)
Ndi
i+1 cos(θk,i)fk +(k − i + 1)
Ndi+1
i cos(θk,i)fk
)(4.2.9)
onde di+1i é o vetor do baricentro do i-ésimo corpo à junta entre os copos i e i+1, dado
no referencial do i-ésimo corpo, conforme indica a Figura 4.3, e ‖d‖2 = d.
fkcorpo i
k−iN
cos(θk,i)fk
k−i+1N
cos(θk,i)fk
corpo kdk+1
kcorpo i− 1
k−iN
cos(θk,i−1)fk
Figura 4.3: Efeito das forças de propulsão nas juntas de rotação.
Exemplo 4.2.1. Para um sistema em que os dois corpos são idênticos, com compri-
mento 2l, os torques nos corpos 1 e 2 são obtidos por[τµ1
τµ2
]=
[−l/2 l cos(θ21)/2
−l cos(θ21)/2 l/2
][f1
f2
]
6Os passos intermediários do desenvolvimento da expressão do torque devido a força de propulsão
serão aqui omitindos. Apresenta-se aqui apenas o resultado final.
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 61
Observação 4.2.3. Note que quando o sistema está totalmente estendido θ21 = 0 e
f1 = f2, o sistema apenas translada, não havendo rotação inercial do sistema ou rotação
relativa entre os corpos.
Exemplo 4.2.2. Analogamente, para um sistema com 5 com corpos idênticos, os torques
obtidos são
τµ1
τµ2
τµ3
τµ4
τµ5
= l
−45
25 cos(θ21) 1
5 cos(θ21 + θ32)
−75 cos(θ21) −1
5 cos(θ32)
− cos(θ21 + θ32) − cos(θ32) 0
−35 cos(θ21 + θ32 + θ43) −3
5 cos(θ32 + θ43) − cos(θ43)
−15 cos(θ21 + θ32 + θ43 + θ54) −1
5 cos(θ32 + θ43 + θ54) −15 cos(θ43 + θ54)
15 cos(θ21 + θ32 + θ43) 1
5 cos(θ21 + θ32 + θ43 + θ54)35 cos(θ32 + θ43) 3
5 cos(θ32 + θ43 + θ54)
cos(θ43) cos(θ43 + θ54)15
75 cos(θ54)
−25 cos(θ54) 4
5
f1
f2
f3
f4
f5
Observação 4.2.4. Note que quando o sistema acima é acionado apenas por f3, ou de
forma simétrica f1 = f5 e f2 = f4, o corpo do meio não sofre rotação.
A modelagem do acionamento dos ângulos de junta pelos torques Ti pode ser realizada
de duas maneiras. A primeira considera o efeito das forças de propulsão fi no ângulo
de junta no modelo do sistema em conjunto com os Tj . A entrada de rotação τµi do
i-ésimo corpo, para i = 1, . . . , N , é:
τµi = Ti−1 − Ti + T exti , (T0, TN = 0)
Na segunda, os torques Ti representam valores líquidos de acionamento das juntas. Neste
segundo caso, os Ti neutralizam os efeitos das forças de propulsão e são responsáveis pelo
acionamento direto das juntas. Isto pode ser justificado fisicamente, quando deseja-se
manter um ângulo de junta φ constante mesmo quando a junta está submetida a ação
de forças que tendem a variar o ângulo de junta. Considere o acionamento da junta
rotativa por meio de um motor elétrico de corrente contínua (CC). Acionando-se, por
exemplo, o motor com uma tensão de armadura a 50% do duty-cycle, a junta mantém
o seu ângulo inalterado. O cancelamento do efeito das forças fi é obtido escolhendo-se
um motor projetado para conduzir uma corrente elétrica no campo de modo a gerar um
torque maior que o torque produzido pelas fi. Esta idealização permite a modelagem
sem a consideração explícita dos efeitos das forças fi. Conseqüentemente, trabalha-se
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 62
com uma nova parametrização dos torques Ti segundo:
T ′j = Tj + T extj (fk)
onde a função T extj contabiliza os efeitos de propulsão de todas as forças fk na j-ésima
junta, para 1 6 k 6 N .
Observe que, por causa da entrada τ , a simetria do sistema é quebrada em geral, ou seja,
a aplicação momento J não mais permanece invariante à ação do grupo. Logo, para
entradas não nulas, os momentos lineares e angulares não permanecem necessariamente
constantes com o movimento do sistema. Faz-se importante observar, entretanto, que
os toques Tj , por serem internos ao sistema, deixam a aplicação momento J invariante,
não contribuindo para a alteração dos momentos linear ou angular, como estabelecido
pelo Teorema de Noether. Estes contribuem apenas na variação da energia do sistema.
Fixados valores de magnitude arbitrários em malha aberta para as forças de propulsão,
as direções de fi são tomadas como básicas, como definido na Seção 2.2. Ou seja, a
direção das entradas de propulsão só dependem da configuração q ∈ Q do sistema e não
são funções da velocidade vq ∈ TqQ do mesmo. Em malha fechada, e diferentemente da
descrição acima, as forças de propulsão obtidas através da lei de controle de realimen-
tação podem ser funções da velocidade vq do sistema. Similarmente, para entradas de
torque arbitrários, que atuam diretamente no espaço de base B, os Tj não dependem da
configuração Q, uma vez que sempre atuam nas juntas de rotação entre os corpos com-
ponentes do sistema. Em malha fechada, os torques Tj podem ser funções da velocidade
vq, assim como ocorre com as forças fi.
4.2.2 Sistema de Controle Multi-Corpos
Renomeando o Hamiltoniano H relativo à dinâmica livre para H0(q, p), o Hamiltoniano
do sistema de controle fica determinado por:
H(q, p, u) = H0(q, p)−m∑
j=1
Hj(q, p)uj (4.2.10)
onde uj são as entradas generalizadas e Hj são funções usualmente chamadas de Ha-
miltonianos de acoplamento ou de interação (Nijmeijer e van der Shaft, 1990). Como
o sistema multi-articulado proposto é um sistema mecânico simples, Seção 2.3, sabe-se
que Hj(q, p) = Hj(θ). Para i = x, y, a expressão geral do movimento do centro de
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 63
massa do sistema fica
rcmi =∂H0
∂pcmi
−m∑
j=1
∂Hj
∂pcmi
uj =∂H0
∂pcmi
(4.2.11)
pcmi = − ∂H0
∂rcmi
+m∑
j=1
∂Hj
∂rcmi
uj =m∑
j=1
∂Hj
∂rcmi
uj (4.2.12)
uma vez que
∂H1∂rcmx
∂H2∂rcmx
∂H1∂rcmy
∂H2∂rcmy
=
[cos(θ1) cos(θN )
sin(θ1) sin(θN )
],
[∂Hj
∂pcmi
]= 02×m
e onde os componentes de entrada uj correspondem a forças f e torques T externos, con-
forme discutido na Seção 4.2.1. Entretanto apenas as forças contribuem na translação,
como dado em (4.2.8), portanto:
τtrans =
[τx
τy
]=
∂H1∂rcmx
· · · ∂HN∂rcmx
∂H1∂rcmy
· · · ∂HN∂rcmy
f1
...
fN
Observe que o ângulo absoluto θN pode ser determinado fazendo-se
θN = θ1 +N−1∑
j=1
φj (4.2.13)
A dinâmica rotacional (4.2.5) não reduzida é escrita como
θi =∂H0
∂µi
µi = −∂H0
∂θi+ Ti + T ext
i , i = 1, 2, . . . , N (4.2.14)
Considerando entradas externas e internas atuando nas dinâmicas de rotação, tem-se
θi,i−1 =∂H0
∂µi− ∂H0
∂µi−1, i = 2, . . . , N
µ1 =∂H0
∂θ2,1− T1 + T ext
1
......
µi =∂H0
∂θi+1,i− ∂H0
∂θi,i−1− Ti + Ti−1 + T ext
i , i = 2, . . . , N − 1
......
µN = − ∂H0
∂θN,N−1+ TN−1 + T ext
N (4.2.15)
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 64
Observe que (4.2.15) representa a dinâmica rotacional reduzida forçada. O vetor de
entradas que acionam a dinâmica de rotação τrot é dado por
τrot =
τµ1
τµ2
τµ3
...
τµi
...
τµN−1
τµN
=
−1 0 0 . . . 0 . . . 0 0
1 −1 0 . . . 0 . . . 0 0
0 1 −1 0 0 . . . 0 0... · · · ...
. . .... · · · ...
...
0 0 0 . . . −1 0 0 0...
...... · · · · · · . . .
......
0 0 0 . . . 0 . . . 1 −1
0 0 0 . . . 0 . . . 0 1
T1
T2
T3
...
Ti
...
TN−2
TN−1
+
T ext1
T ext2
T ext3...
T exti...
T extN−1
T extN
(4.2.16)
para i = 1, . . . , N e que τ = [0N+2, τtrans, τrot]T , onde τ é dado pelos campos vetoriais
de entrada gj e pelas funções u ∈ U ⊂ Rm, de acordo com a Seção 4.2.1.
4.2.3 Exemplo: o sistema de 2-corpos
A função Hamiltoniano para o sistema de 2-corpos é dada por
H0 =12µT J−1(φ)µ (4.2.17)
onde a matriz de inércia J é dada em (4.4.2) e o ângulo relativo entre os corpos é
φ = θ2 − θ1. Tomando a definição para o determinante de J
∆ = det J = I1I2 − (ελ)2
a função H acima toma a seguinte expressão
H0 =1
2∆
[µ1 µ2
] [I2 −ελ
−ελ I1
][µ1
µ2
]
=1
2∆[I2µ
21 − 2ελµ1µ2 + I1µ
22] (4.2.18)
As equações de movimento são dadas abaixo em função das entradas obtidas no pará-
grafo acima; as expressões da dinâmica linear são
rx =px
m1 + m2=
px
2m(m1 = m2 = m)
ry =py
m1 + m2=
py
2m(m1 = m2 = m)
px = − sin(θ1)f1 + sin(θ1 + φ)f2
py = cos(θ1)f1 + cos(θ1 + φ)f2
4.2. MODELO DO SISTEMA NO ESPAÇO COTANGENTE 65
ao passo que, a dinâmica rotacional do sistema na fibra fica definida por
θ =∂H0
∂µ1=
µ1I2 − µ2ελ
∆(4.2.19)
e pela dinâmica rotacional reduzida, nas coordenadas θ2,1 = φ do espaço de base B,
através de
φ =∂H0
∂µ2− ∂H0
∂µ1=
µ1(ελ + I2)− µ2(ελ + I1)∆
µ1 =∂H0
∂φ− T + T ext
1
= εd1d2 sin(φ)(µ2ελ− µ1I2)(µ1ελ− µ2I1)
∆2− T + T ext
1
µ2 = −∂H0
∂φ+ T + T ext
2
= −εd1d2 sin(φ)(µ2ελ− µ1I2)(µ1ελ− µ2I1)
∆2+ T + T ext
2
Os torques externos T ext1 e T ext
2 são funções da força de propulsão fi de cada corpo e da
distância do centro de massa do sistema ao centro de massa do respectivo corpo, onde
localiza-se o ponto de atuação do efeito de propulsão. Logo, usando a notação e análise
do diagrama de corpo livre da Seção 4.2.1 e d21 = d1
2 = l, tem-se:
T ext1 = − l
2f1 + l2 cos(θ2,1)f2
T ext2 = − l
2 cos(θ2,1)f1 + l2f2
Observação 4.2.5. A dinâmica do sistema de N -corpos degenera-se ao do corpo rígido,
cujo modelo é apresentado no Apêndice C, quando os ângulos de junta φ são mantidos
constantes. Isto será detalhado a seguir.
As equações da dinâmica do sistema de dois corpos idênticos, para f = (rx, ry, θ, φ, px, py, µ1, µ2)T ,
ou seja, no referencial inercial, são dadas a seguir:
f =
px/m
py/m
(µ1I − µ2K cos(φ))/(I2 −K2 cos2(φ))
(µ2 − µ1)/(I −K cos(φ))
0
0
K sin(φ)(µ1I − µ2K cos(φ))(µ2I − µ1K cos(φ))/(I2 −K2 cos2(φ))2
−K sin(φ)(µ1I − µ2K cos(φ))(µ2I − µ1K cos(φ))/(I2 −K2 cos2(φ))2
(4.2.20)
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 66
onde K = εd21d
12 e os campos vetoriais relativos às entradas (f1, f2, T )
g1 =
0
0
0
0
− sin(θ)
cos(θ)
−l/2
−(l/2) cos(θ2,1)
, g2 =
0
0
0
0
− sin(θ + φ)
cos(θ + φ)
l/2 cos(θ2,1)
l/2
, g3 =
0
0
0
0
0
0
−1
1
(4.2.21)
As últimas duas linhas do campo vetorial referente à dinâmica livre f correspondem às
taxas dos momentos angulares µ1, µ2. Observe que a taxa de variação temporal do mo-
mento angular total, dado por µ1 + µ2, é nulo, como previsto pelo Teorema de Noether.
Note, também, que, apesar das dinâmicas livres de µ1 e µ2 serem linearmente depen-
dentes, é possível controlá-las de modo independente devido à estrutura dos campos
vetoriais de entrada g1, g2.
Considerando fixa a posição relativa dos dois corpos (φ = 0), na posição totalmente
extendida (φ = 0), tem-se que µ1 = µ2. Nesta condição, é possível mostrar que as
equações da dinâmica do sistema multi-corpos (4.2.20) degeneram-se às equações do
corpo rígido (C.1.1). Tomando-se a equação de movimento da orientação em relação ao
referencial inercial tem-se:
θ = (µ1I − µ2K cos(φ))/(I2 −K2 cos2(φ))
= (µ1I − µ2K)/(I2 −K2)
= µ1/(I + 2K) = µ1/(I + 2εL2)
Note que a última expressão acima corresponde à divisão do momento angular total do
sistema µ1 + µ2 = 2µ1 pelo momento de inércia total do sistema 2(I + 2εL2).
4.3 Modelagem da Dinâmica no Fibrado Principal
4.3.1 O Fibrado Principal
Por causa da restrição da dinâmica do sistema ao plano, o grupo de simetria G é, para
a classe de sistemas aqui considerada, o grupo Euclidiano especial no plano SE(2).
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 67
Como comentado previamente, este é o produto semi-direto G∗sV = SO(2)sR2. O
espaço de coordenadas gerado pelo SE(2) é tridimensional e, portanto, dimQ = n e
dim(Q/G) = n− 3.
Na estrutura do fibrado principal (2.4.2), o espaço (N + 2)-dimensional Q possui coor-
denadas
q = (s, r) = (g, φ), φ ∈ Q/G, g ∈ G, (4.3.1)
onde φ é o vetor, com (N − 1) elementos, relativo a orientação entre os corpos consecu-
tivos do sistema. O vetor q ∈ TqQ, dado na estrutura acima, fica (r, g) = (φ, g). Logo,
(φ, g, φ, g) ∈ TQ.
O fibrado tangente sobre o espaço reduzido T (Q/G), que corresponde a N − 1 cópias
do S1 × R, possui coordenadas (r, r) = (φ, φ) ∈ T (Q/G). O fibrado tangente reduzido
(TQ)/G é uma espaço vetorial sobre o fibrado tangente do espaço de base T (Q/G) cuja
fibra é isomórfica a álgebra de Lie g e, portanto, T (Q/G)× g.
O espaço (TQ)/G possui coordenadas (r, r, g−1g) = (φ, φ, ξB) ∈ (TQ)/G, onde ξB ∈ g.
Este compreende, no caso sistemas invariantes a esquerda, por exemplo, as velocidades
lineares e angulares em coordenadas do referencial móvel.
O espaço de fase de velocidade, com esta estrutura principal, no ponto q = (g, r) =
((rcm, θ),φ) é dado por
(rcm, θ∗, φ) ∈ TqQ ' T (R2 × S1 × . . .× S1),
onde θ∗ é a orientação de um ponto arbitrário do sistema, e o espaço de fase de momento,
por
(pcm, pθ∗ , pφ) ∈ T ∗q Q ' T ∗(R2 × S1 × . . .× S1)
4.3.2 Exemplos de Parametrizações da Configuração
Dinâmica com nova definição para θcm
Definição 4.3.1. A orientação do referencial fixo ao centro de massa do sistema em
relação ao sistema de coordenadas inercial é definida pela expressão
θcm = (θ1 + θN )/2 (4.3.2)
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 68
A expressão para θcm acima juntamente com o vetor dos ângulos relativos entre os
corpos φ estabelece o seguinte difeomorfismo entre as diferentes parametrizações de Q
[θcm
φ
]= P (θ), ⇒ [P ] =
1/2 0 · · · 1/2
−1 1 0 · · ·0 −1 1 · · ·... · · · · · · ...
0 · · · −1 1
(4.3.3)
Observação 4.3.1. A definição da orientação θcm acima é satisfatória pois é canônica,
ver (Lanczos, 1977) para detalhes, e independente das variáveis de forma φ e, por esta
razão, não incorpora o movimento exclusivamente realizado no espaço B. A matriz
que define a mudança de coordenadas P é definida e positiva e, portanto, invertível.
Adicionalmente, note que por ser uma transformação linear, P é, conseqüentemente,
um difeomorfismo global. Observe, também, que o determinante de [P ] é unitário,
permitindo preservar o volume entre os elementos das duas parametrizações. Pode-se
mencionar ainda que P diagonaliza a matriz de inércia do sistema J.
Observação 4.3.2. Uma definição igualmente possível para a orientação do referencial
móvel pode ser dada por
θcm =1N
N∑
i=1
θi (4.3.4)
A transformação P deve ser utilizada para gerar a transformação equivalente entre as
coordenadas de momento do sistema e, desta maneira, definir o levantamento cotangente
sob as novas coordenadas do espaço cotangente sobre o espaço principal. Desta maneira,
e utilizando a transformada de Legendre e a igualdade dos Hamiltonianos sob ambas as
parametrizações, tem-se que o momento angular, obtido para Q com (θcm,φ), fica
µ(θcm,φ) = (P T )−1µθ (4.3.5)
e a matriz de inércia J escrita sob a nova parametrização de Q fica
J(θcm,φ) = (P T )−1JθP−1 (4.3.6)
Observe que, como esperado a partir de (A.2.7) no Apêndice A, a matriz que traduz o
levantamento cotangente da transformação P , em função da matriz correspondente [P ],
é a matriz transposta ou [P ]T .
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 69
Exemplo: o sistema de 2-corpos
Para um sistema composto por dois corpos interconectados, o espaço completo 4-
dimensional Q iguala-se a R2 × SO(2) × SO(2). Um elemento genérico do fibrado
tangente é (q, q) = ((rcm, θ1, θ2), (rcm, θ1, θ2)) ∈ TQ. Utilizando a decomposição pro-
vida pela estrutura do fibrado principal, as coordenadas são q = (g, r) = (g, φ), onde a
coordenada no espaço de base φ ∈ Q/G é a orientação relativa entre os corpos. As coor-
denadas no espaço tangente reduzido são (r, r, g−1g) = (φ, φ, ξB) ∈ (TQ)/G, e ξB ∈ g.
O fibrado tangente sobre Q/G possui coordenadas (r, r) = (φ, φ) ∈ T (Q/G) = S1 × R.
O difeomorfismo entre os sistemas de coordenadas de variáveis canônicas apresentado
acima, neste caso, é dado por
[P ] =
[1/2 1/2
−1 1
](4.3.7)
Observação 4.3.3. Pode-se verificar que, como mencionado anteriormente, P diagonaliza
a matriz de inércia J, a despeito das propriedades físicas dos dois corpos. Para corpos
com características inerciais distintas, J pode ser diagonalizada tomando-se
[P ] =
[h1 h2
−1 1
], (4.3.8)
onde h1 = (I2 + K cos(φ))−1 e h2 = (I1 + K cos(φ))−1. Neste caso, entretanto, os
elementos na diagonal principal de J são dados por funções racionais.
A matriz de inércia generalizada G é definida por
G =
m∗I2 02×1 02×1
01×2 1TNJ1N J†
01×2 J† J‡
onde J† = (I2 − I1)/2 e J‡ = (I1 + I2 − 2ελ)/4.
Pode-se obter φ pelas equações de Hamilton
φ =∂H(φ, g, pφ, µS)
∂pφ
=12
(pθcm(I1 − I2) + 2pφ(I1 + 2K cos(φ) + I2))(I1I2 −K2 cos(φ)2)
=2pφ
(I −K cos(φ)), (I1 = I2 = I) (4.3.9)
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 70
Alternativamente, a equação do momento pφ segue de
pφ = −∂H(φ, g, pφ, µS)∂φ
= −K sin(φ)
(14
p2θcm
(I + K cos(φ))2− p2
φ
(I −K cos(φ))2
)(4.3.10)
A orientação do referencial móvel, localizado no centro de massa, é dada por
θcm =∂H(φ, g, pφ, µS)
∂pφ
=14
(pθcm(I1 − 2K cos(φ) + I2) + 2pφ(I1 − I2))(I1I2 −K2 cos(φ)2)
(4.3.11)
=12
pθcm
(I + K cos(φ)), (I1 = I2 = I)
Partindo da parcela relativo a dinâmica rotacional do sistema na expressão do Lagran-
giano e tomando iguais as velocidades de rotação dos corpos ω1 = · · · = ωN = ω,
tem-se:
L(q, q) =12ωT Jω =
12ω1T
NJω1N =12Itω
2
onde It = It(φ) é definido por 1TNJω1N , ou seja, a soma de todos os elementos da
matriz de inércia J e corresponde à inércia total em relação ao centro de massa do
sistema. Observe que It corresponde ao elemento (3, 3) do tensor de inércia travado Iloc
em (4.4.4). Para o sistema de dois corpos idênticos, It é dado por:
It(φ) = 1TNJ1N
= J11 + 2J12 + J22, (J simétrica)
= I1 + I2 + 2ελ(φ)
= 2(I + ελ(φ)), (I1 = I2 = I)
Modelo do referencial no centro de massa
Neste caso, o campo vetorial da dinâmica livre, pode ser escrito tanto em função
da velocidade do ângulo de junta φ como em função do momento angular relativo
ao mesmo ângulo. As variáveis de momento no referencial móvel são definidas por
(pu, pv, pθcm) = (µB1 , µB2 , µB3). No primeiro caso, o campo vetorial f escrito em co-
ordenadas do referencial móvel localizado no centro de massa do sistema, é dado por
(rx, ry, θcm, φ, µB1 , µB2 , µB3 , vφ)T , onde vφ = φ e vφ é dado por
vφ =K sin(φ)
((ελ(φ))2 − I2I1)1
(I1 + 2ελ(φ) + I2)
((ελ(φ) + I1)(ελ(φ) + I2)v2
φ + µ2B3
)
(4.3.12)
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 71
No segundo caso, escrito no mesmo referencial, o campo vetorial z = (rx, ry, θcm, φ, pu, pv,
pθcm , pφ)T , onde z ∈ T ∗q Q, fica
f =
1m∗ (µB1 cos(θ)− µB2 sin(θ))1
m∗ (µB1 sin(θ) + µB2 cos(θ))
(4.3.11)
(4.3.9)µB2
(2µB3−J†φ)
2m∗1TNJ1N
−µB1(2µB3
−J†φ)
2m∗1TNJ1N
0
(4.3.10)
(4.3.13)
Consultar Souza e Maruyama (2007), no Apêndice C, para detalhes da obtenção das
expressões escritas com coordenadas do referencial móvel.
Modelagem das Entradas
Utiliza-se aqui a decomposição da entrada τ na estrutura principal7 τ = [τ |G, τ |B], onde
τG e τB representam as entradas que atuam exclusivamente no espaço de grupo G e no
espaço de base B, respectivamente.
Observação 4.3.4. Observe que a parametrização das entradas físicas (fi, Tj) é realizada
de maneira a verificar dimG = dim τG.
Obtém-se, primeiramente, a entrada no referencial móvel, fixo ao centro de massa do
sistema, Fig. 4.4; em seguida, escreve-se a entrada em relação ao referencial inercial. As
entradas no referencial móvel são G-invariantes à esquerda com relação ao referencial
móvel localizado no centro de massa do sistema. A entrada τ ∈ g∗ dada nas coordenadas
do espaço cotangente fica τ = (τu, τv, τθcm , τφ) ∈ T ∗Q. Os componentes que afetam o
momento linear são[τu
τv
]= R(−φ/2)
[0
f1
]+ R(φ/2)
[0
f2
]=
[− sin(φ/2)(f2 − f1)
cos(φ/2)(f2 + f1)
]
Observe que, quando φ = 0, o sistema possui a mesma estrutura de entradas do corpo
rígido com dois propulsores localizados simetricamente em relação ao centro de massa
e, portanto: [τu
τv
]=
[0
(f1 + f2)
]
7Discutida no Capítulo 3.
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 72
ReferencialInercial
L
T
φ
x
CM
−θcm
y
f2
f1
z1
z2
Figura 4.4: Entradas relativas aos propulsores no referencial móvel do sistema de 2-
corpos.
A entrada na direção rotacional da fibra G, para corpos idênticos, fica
τθcm = L cos2(φ/2)(f2 − f1)
Observe que, evitando termos que combinam funções trigonométricas e quadráticos
pode-se aliviar a carga computacional quando do cálculo de distribuições, realizado no
próximo capítulo. Utilizando a relação trigonométrica fundamental sin2(.)+cos2(.) = 1
em conjunto com a expressão cos(φ) = cos2(φ/2)− sin2(φ/2), mostra-se que
cos2(φ/2) =12(cos(φ) + 1)
Utilizando o lado direito da igualdade acima, na expressão do campo vetorial para a
entrada τθcm , permite simplificar o cálculo das distribuições do sistema de controle,
reduzindo a carga computacional e, conseqüentemente, o tempo de cálculo.
A passagem da entrada τ acima para o referencial inercial, assim como com qualquer
elemento pertencente ao dual da álgebra de Lie g∗, segue pela aplicação coadjunta
τS = τInercial = Ad∗g−1τ
Escrevendo os componentes de translação acima (τu, τv) no referencial inercial, segue:[τx
τy
]
S
=
[τx
τy
]
Inercial
= R(θcm)
[τu
τv
]
=
[− sin(θcm) cos(φ/2) − cos(θcm) sin(φ/2)
cos(θcm) cos(φ/2) − sin(θcm) sin(φ/2)
][f1 + f2
f2 − f1
]
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 73
O resultado acima pode ser confirmado quando a entrada τθcm é obtida através do
levantamento cotangente da aplicação P das expressões da Seção 4.2.1, como mostram
os exemplos abaixo.
Exemplo 4.3.1. Retomando o exemplo do sistema de 2-corpos, da Seção 4.2.1, a en-
trada τ obtida sob a estrutura principal adquire a seguinte forma:[τθcm
τφ
]= ([P ](−1))T
[τ1
τ2
]=
l
4
[2(1 + cos(φ)(f2 − f1)
(1− cos(φ)(f1 + f2)
]
A partir das considerações acima tem-se que τθcm é obtido pela soma dos momentos das
forças fi em relação ao centro de massa do sistema, ou seja
τθcm =N∑
i=1
r0i ×Ri
[0
fi
](4.3.14)
No presente trabalho, tem-se o interesse no caso em que as forças de propulsão estão
localizadas nos corpos extremos do sistema, isto é, apenas as forças de propulsão f1,
aplicada no centro de massa do corpo 1, e fN , que atua no centro de massa do N -ésimo
corpo. Logo, de (4.2.8) e (4.3.14), segue que
τx
τy
τθcm
=
R1
[0
f1
]+ RN
[0
fN
]
r01 ×R1
[0
f1
]+ r0
N ×RN
[0
fN
]
(4.3.15)
Escrito com coordenadas no referencial inercial, a dinâmica livre f = (rx, ry, θcm, φ, px, py,
pθcm , pφ)T , é dada por
f =
px/m∗
py/m∗
(4.3.11)
(4.3.9)
0
0
0
(4.3.10)
(4.3.16)
Os valores nulos das três primeiras linhas da dinâmica livre, devem-se à aplicação direta
do Teorema de Noether. Pode-se, alternativamente, mostrar que pθcm ≡ 0: sabe-se
que o momento angular µ1 + µ2 do sistema se conserva. Logo, escrito sob a nova
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 74
parametrização, tem-se a seguinte condição de conservação do momento angular
µ1 + µ2 = 1TNP T
[pθcm
pφ
]= pθcm = cte (4.3.17)
No referencial inercial, os campos vetoriais relativos às entradas (u1, u2) = (f1 +f2, f2−f1) e T ′ são
g1 =
0
0
0
0
− sin(θcm) cos(φ/2)
cos(θcm) cos(φ/2)
0
0
, g2 =
0
0
0
0
− cos(θcm) sin(φ/2)
− sin(θcm) sin(φ/2)
L/2(cos(φ) + 1)
0
, g3 =
0
0
0
0
0
0
0
1
Dinâmica com θcm = θ1
Proposição 4.3.2. No espaço de configuração Q, onde q = (rcm, θ), o Lagrangiano
do sistema pode ser escrito em função da métrica de Riemann 〈〈., .〉〉G′, induzida pela
energia cinética do sistema KE, definida pela seguinte expressão
L =12
qTG′ q =12
[rTcm θ
T] [G′11 G′12
G′21 G′22
] [rcm
θ
](4.3.18)
Demonstração. Segundo (4.1.3), basta tomar G′11 = m∗I2, G′12 = G′T21 = 02,N e G′22 = J,onde m∗ é massa do sistema, I2 é a matriz identidade de dimensão 2 e J é a matriz de
inércia do sistema multi-corpos.
Proposição 4.3.3. No fibrado principal (Q, π,B ≡ Q/G,G), onde q = (g, r) = (g, φ)
e g = (rcm, θ1), o Lagrangiano do sistema pode ser escrito como
L =12
qTG q =12
[gT rT
][G11 G12
G21 G22
][g
r
](4.3.19)
Demonstração. A prova abaixo seguirá um desenvolvimento algébrico, através da de-
composição de (4.1.3). Expandindo o vetor θ, em função das coordenadas de base φ, e
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 75
utilizando um formato matricial segue que
θ =
θ1
θ1 − (θ1 − θ2)...
θ1 − (θ1 − θ2) · · · − (θN−1 − θN )
=
θ1
θ1
...
θ1
+
0
−(θ1 − θ2)...
−(θ1 − θ2) · · · − (θN−1 − θN )
=
1
1...
1
θ1 +
0 0 · · · 0
1 0 · · · 0... · · · · · ·1 1 · · · 1
(θ2 − θ1)
(θ3 − θ2)...
(θN − θN−1)
=
1
1...
1
θ1 +
0 0 · · · 0
1 0 · · · 0... · · · · · ·1 1 · · · 1
φ1
φ2
...
φN
= 1Nθ1 + Mφ (4.3.20)
onde 1N é o N -vetor de 1s, φi são os ângulos de junta e M é uma matriz N × (N − 1)
definida por
Mij =
0, se i = 1
1, se 1 ≤ j < i
0, caso contrário
⇒ M =
0 0 0 · · · 0
1 0 0 · · · 0
1 1 0 · · · 0...
... · · · · · · · · ·1 1 1 · · · 1
(4.3.21)
Aplicando-se a expressão acima para determinar a decomposição da orientação dos
corpos em relação ao referencial inercial em função dos ângulos de junta φi, segue
[rcm
θ
]=
[rcm
1Nθ1 + Mφ
]=
[I2 02,1 02,N−1
0N,2 1N M
]rcm
θ1
φ
onde I2 é a matriz identidade de dimensão 2. Derivando-se a expressão acima, resulta
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 76
em[rcm
θ
]=
[I2 02,1 02,N−1
0N,2 1N M
]rcm
θ1
φ
Transpondo-se esta última expressão, segue que
[rcm
θ
]T
=[rTcm θ1 φ
T]
I2 02,N
01,2 1TN
0N−1,2 MT
Fazendo uso das duas últimas expressões obtidas acima e de (4.1.3) e lembrando que
θi = ωi, pode-se determinar a métrica 〈〈., .〉〉G no fibrado principal:
G =
I2 02,N
01,2 1TN
0N−1,2 MT
[m∗I2 02,N
0N,2 J
][I2 02,1 02,N−1
0N,2 1N M
]
=
m∗I2 02,1 02,N−1
01,2 1TNJ1N 1T
NJM0N−1,2 MT J1N MT JM
=
[G11 G12
G21 G22
](4.3.22)
Observação 4.3.5. Observe que G12 = GT21 e a independência da G22(r) = G22(r, e) com
relação às coordenadas das direções da fibra G.
Observação 4.3.6. Note que o momento do sistema µ pode ser obtido por ambas as
métricas em função de G′ e G utilizadas acima, assim como por qualquer outra métrica
definida em Q e parametrizada por coordenadas diferentes das utilizadas acima, como
sugere a geometria Riemanniana. Neste caso, recordando que pcm é o momento linear
e µ o momento angular do sistema, tem-se quepcm
pθ1
pφ
= G
[g
r
](4.3.23)
O espaço T ∗Q definido pelas coordenadas de configuração com estrutura principal acima
é difeomórfico ao espaço parametrizado pelas coordenadas original,8 dadas por[pcm
µ
]=
[m∗I2 02,N
0N,2 J
][rcm
θ
]
8Note que isto é possível apenas quando ambas as parametrizações são realizadas com coordenadas
canônicas, (Lanczos, 1977).
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 77
Exemplo: o sistema de 2-corpos
Como alternativa, uma das equações do momento angular do sistema pode ser escrita
como a taxa de variação do elemento do espaço T ∗(Q/G), dado por pφ. Primeiramente,
procede-se com o cálculo do momento angular do corpo 1 (pθ1) através do Lagrangiano
L =12[gT rT ]
[G11 G12
G21 G22
][g
r
], G =
m∗I2 02,1 02,N−1
01,2 1TNJ1N 1T
NJM0N−1,2 MT J1N MT JM
=12
(gT (G11g +G12r) + rT (G21g +G22r)
)
Pela definição da transformada de Legendre, tem-se
pθ1 =∂L(φ, g, φ, g)
∂θ1
= G11
[01,2 θ1
]T+GT
12φ[01,2 1
]T, (G12 = GT
21)
= 1T2 J12θ1 + MT J12φ
= (J11 + 2J12 + J22)θ1 + (J12 + J22)φ
= (I1 + 2ελ(φ) + I2)θ1 + (ελ(φ) + I2)φ (4.3.24)
Tomando-se pφ ∈ T ∗φ(Q/G) em conjunto com a dinâmica referente a µ1, ou µ2, o movi-
mento do sistema fica completamente determinado em T ∗Q. Portanto, para as coorde-
nadas do espaço de base r ∈ B, segue que
pr =∂L(q, q)
∂r
onde q = (r, g) e g é o elemento do grupo G. Para o sistema de dois corpos, onde N = 2
e r = φ, segue que
pφ =∂L(φ, g, φ, g)
∂φ
=12gTG12 +
12G21g +G22φ, (G12 = GT
21)
= GT12g +G22φ
= 01,2rcm + MT J12θ1 + MT JMφ
= (J21 + J22)θ1 + J22φ
= (ελ(φ) + I2)θ1 + I2φ (4.3.25)
4.3. MODELAGEM DA DINÂMICA NO FIBRADO PRINCIPAL 78
Por outro lado, obtém-se φ pelas equações de Hamilton
φ =∂H(φ, g, pφ, µS)
∂pφ
= −(I2 + K cos(φ))pθ1 − (I1 + 2K cos(φ) + I2)pφ
(I1I2 −K2 cos(φ)2)
= − (pθ1 − 2pφ)(I −K cos(φ))
, (I1 = I2 = I)
Isolando-se pφ e usando (4.3.23), lembrando que ω = θ, na expressão acima, tem-se que
pφ =(I2 + K cos(φ))µ1 + (I1I2 −K2 cos(φ)2)φ
(I1 + 2K cos(φ) + I2)
= (I2 + K cos(φ))ω1 + I2φ
O resultado obtido pelo caminho acima confere com o obtido em (4.3.25), como esperado.
Obtém-se agora a taxa de variação temporal do momento pφ. Pode-se, primeiramente,
diferenciar a última expressão acima, obtendo-se
pφ = (ελ(φ) + I2)θ −K sin(φ)φθ + I2φ
Alternativamente, a partir do Hamiltoniano, tem-se
pφ = −∂H(φ, g, pφ, µS)∂φ
= −K sin(φ)(I2µ1 − (I2 + K cos(φ))pφ)((I1 + K cos(φ))pφ −K cos(φ)µ1))
(I1I2 −K2 cos2(φ))2
(4.3.26)
Substituindo as definições para µ1 e pφ, em termos de θ e φ, no resultado acima, segue
que
pφ = −K sin(φ)θ(θ + φ)
As três expressões do momento pφ acima são equivalentes.
Observe que as expressões (4.3.24) e (4.3.25), parametrizadas por (θ1, φ), onde φ =
θ2 − θ1, são equivalentes às realizadas por µ = Jω, quando a parametrização (θ1, θ2) é
utilizada. Esta equivalência pode ser observada pela conservação do momento angular
µ1 +µ2 = pθ. O campo vetorial da dinâmica livre f = (rx, ry, θ1, φ, px, py, pθ1 , pφ)T com
4.4. MODELAGEM LAGRANGIANA 79
a presente parametrização fica
f =
px/m∗
py/m∗
(I2µ1 − (I2 + K cos(φ))pφ)/(I1I2 −K2 cos(φ)2)
−((I2 + K cos(φ))µ1 − (I1 + 2K cos(φ) + I2)pφ)/(I1I2 −K2 cos(φ)2)
0
0
0
(4.3.26)
e os campos vetoriais relativos às entradas (f1, f2, T ) são obtidos de maneira análoga
aos do modelo obtido anteriormente, respeitando a estrutura do espaço de configuração.
4.4 Modelagem Lagrangiana
A modelagem do sistema realizada a seguir, aplica as expressões da conexão mecânica,
do princípio variacional reduzido e da reconstrução da dinâmica discutidos no Capítulo
3.
4.4.1 Exemplo: o sistema de 2-corpos (θcm = θ1)
Para determinar a conexão mecânica do sistema, precisa-se, primeiramente, obter o
tensor de inércia travado. A partir das expressões de construção dos geradores infinite-
simais, detalhadas na Seção B.6.1, de (3.2.1)
〈I(q)η, ζ〉 = 〈〈ηQ(q), ζQ(q)〉〉 ⇒ ηT IT ζ = ηTQGζQ
e a partir da métrica induzida pela energia cinética G, obtida em (4.3.22),
G =
[G11 G12
G21 G22
]=
m∗ 0 0 0
0 m∗ 0 0
0 0 J11 + J12 + J21 + J22 J12 + J22
0 0 J21 + J22 J22
4.4. MODELAGEM LAGRANGIANA 80
obtém-se a expressão para a matriz de inércia travado
I =
[m∗I2 −m∗Mrcm
−m∗(Mr)T m∗‖r‖2 + 1TNJ1N
]=
m∗ 0 −m∗ry
0 m∗ m∗rx
−m∗ry m∗rx m∗(r2x + r2
y) + 1TNJ1N
(4.4.1)
onde M é a matriz simplética de dimensão 2, veja Seção A.2.2. A matriz de inércia Jdo sistema de 2-corpos é dada por
J =
[J11 J12
J21 J22
]=
[I1 ελ
ελ I2
](4.4.2)
onde
Ii = Ii + εd2i , ε =
m1m2
m1 + m2, λ(φ) = d1d2 cos(φ)
A seguir, obtém-se a aplicação momento J do sistema. Seja vq = (rx, ry, ω1, φ) e a partir
de (3.2.3)
〈J(q, v), ξ〉 = 〈〈ξQ(q), vq〉〉 ⇒ Jiξi = [rx ry ω1 φ] G ξQ
e, portanto,
〈J(vq), ξ〉 = (mrx)ξ1 + (mry)ξ2 + (mrxry −mry rx + 1TNJ1Nω1 + 1T
NJMφ)ξ3 (4.4.3)
Os momentos lineares nas duas direções são conservados independentemente um do
outro. O momento angular, escrito em relação ao referencial inercial, apresenta uma
parcela devido ao movimento linear do centro de massa do sistema, em adição ao compo-
nente devido ao movimento angular do mesmo. No entanto, como os movimentos linear
e angular são independentes quando parametrizados em relação ao centro de massa, as
parcelas dos movimentos linear e angular do momento angular mantém-se constantes
de forma independente.
A matriz auxiliar M é definida em (4.3.21). Para computar a conexão, segundo (3.2.5),
faz-se
A(vq) = I−1J(vq)
=1
1TNJ1N
(rx + ryω1)1TNJ1N + ry1T
NJMφ
(ry − rxω1)1TNJ1N − rx1T
NJMφ
1TNJ1Nω1 + 1T
NJMφ
Da Seção A.2.2, a expressão da ação adjunta Adg em se(2), escrita na forma matricial,
é obtida pela expressão
Ad(R,r) =
[1 01,2
Mr R
]⇒ Ad(r,R) =
[R Mr
01,2 1
]
4.4. MODELAGEM LAGRANGIANA 81
A conexão em coordenadas do referencial móvel segue diretamente de (3.2.5), e para
Ad(r,R)−1
AB(vq) = Adg−1A(vq)
=
[RT rcm
1TNJT ω(1T
NJ1N )−1
]
Devido a matriz J ser simétrica, observe, pelas expressões (4.3.20) que 1TNJT ω =
1TNJ1Nω1 + 1T
NJMφ, e, logo
AB(vq) =
[RT rcm
ω1
]+
11T
NJ1N
[02×1
1TNJM
]φ = TgLg−1 g +Aloc(φ)φ
Observe, da expressão acima, que TgLg−1 g = g−1g = ξB. A expressão local do tensor
de inércia travado é obtida através de (3.2.2)
Iloc(φ) = Ad∗gI(q)Adg (4.4.4)
=
[R Mrcm
01,2 1
]T [m∗I2 −m∗Mrcm
−m∗(Mrcm)T m‖rcm‖2 + 1TNJ1N
][R Mrcm
01,2 1
](4.4.5)
=
m∗ 0 0
0 m∗ 0
0 0 1TNJ1N
(4.4.6)
Para a obtenção da equação cinemática de reconstrução, faz-se necessária a determina-
ção da velocidade ξB na álgebra de Lie se(2). Fazendo µB = (µB1 , µB2 , µB3) e a partir
de (3.2.10), segue que
ξB = −Aloc(φ)r + I−1loc(r)µB
= − 11T
NJ1N
[02×1
1TNJM
]φ +
m∗ 0 0
0 m∗ 0
0 0 1TNJ1N
−1
µB1
µB2
µB3
=
µB1/m∗
µB2/m∗
µB3−(ελ(φ)+eI2)φ
eI1+2ελ(φ)+eI2
Escreve-se a equação de reconstrução g em função da expressão ξB = (ξB1 , ξB2 , ξB3)
acima, obtendo-se
g = gξB =
cos(θ) − sin(θ) rx
sin(θ) cos(θ) ry
0 0 1
0 −ξB3 ξB1
ξB3 0 ξB2
0 0 0
(4.4.7)
4.4. MODELAGEM LAGRANGIANA 82
No cálculo da reconstrução da cinemática na fibra, e diferentemente quando da obtenção
da conexão AB realizada acima, utiliza-se elementos da álgebra no referencial móvel ξB
escritos em função do momento correspondente µB. Observe, também, que os compo-
nentes do momento linear no referencial móvel são transformados ao referencial inercial
via matriz de rotação R. O termo rotational do sistema, função do momento angular µB
e que simplifica a θ, por sua vez, possui mesma representação em ambos os sistemas de
coordenadas. A equação do momento, determinada a partir de (3.4.1), toma a seguinte
forma
(µB)c = cbac(µB)bξ
aB
onde a, b, c = 1, 2, 3 e cbac são as constantes estruturais da álgebra se(2), refira à Seção
B.5. Para um elemento do grupo SE(2) na forma g = (rcm,R), são as constantes não
nulas c123 = −c1
32 = 1 e c231 = −c2
13 = 1, o que resulta no momento:
µB =
µB2ξ3B
−µB1ξ3B
µB1ξ2B − µB2ξ
1B
=
µB2
µB3−(ελ(φ)+eI2)φ
eI1+2ελ(φ)+eI2−µB1
µB3−(ελ(φ)+eI2)φ
eI1+2ελ(φ)+eI20
(4.4.8)
Note que, no referencial móvel, os componentes do momento linear não se conservam.
Procede-se, agora, com a determinação da matriz de inércia para a dinâmica do sistema
no espaço de base B. Para r = φ, tem-se, de (3.4.2):
M(φ) = G22(φ)−ATloc(φ)Iloc(φ)Aloc(φ)
= MT JM− (1TNJM)2
(1TNJ1N )
=I2I1 − (ελ(φ))2
(I1 + 2ελ(φ) + I2)(4.4.9)
O termo relativo à dinâmica centrípeta e de Coriolis é obtida avaliando-se (3.4.3) com
a expressão da matriz de inércia M acima:
C(φ) = (εd1d2 sin(φ))(ελ(φ) + I1)(ελ(φ) + I2)
(I1 + 2ελ(φ) + I2)2(4.4.10)
Como, para o sistema de dois corpos
dAloc(φ) ≡ 0 (4.4.11a)
ad∗ξµBAloc(φ) = µBAloc(φ) ≡ 0 (4.4.11b)
em (3.4.4), o termo da dinâmica N , escrito em função do momento no referencial móvel
µB, simplifica a:
N =εd1d2 sin(φ)
(I1 + 2ελ(φ) + I2)2µ2
B3(4.4.12)
4.4. MODELAGEM LAGRANGIANA 83
Finalmente, pela função de entrada τ , calcula-se a entrada na dinâmica de base segundo
a expressão
X (φ)τ = τφ − [τx, τy, τθ]Aloc(φ)
= T − [τx, τy, τθ]1
1TNJ1N
[02×1
1TNJM
]
= T − (ελ(φ) + I2)(I1 + 2ελ(φ) + I2)
τθ (4.4.13)
A equação de movimento do sistema no espaço de base B, dada por M(φ)φ+C(φ)φ2 +
N = X τ , fica
I2I1 − (ελ(φ))2
(I1 + 2ελ(φ) + I2)φ + (εd1d2 sin(φ))
(ελ(φ) + I1)(ελ(φ) + I2)(I1 + 2ελ(φ) + I2)2
φ2+
εd1d2 sin(φ)(I1 + 2ελ(φ) + I2)2
µ2B3
= T − (ελ(φ) + I2)(I1 + 2ελ(φ) + I2)
τθ
Observe que a solução da dinâmica no espaço de base é dependente das equações de
momento (4.4.8), mais especificamente, da dinâmica do momento angular µB3 .
Para corpos iguais e I1 = I2 = I, a equação de movimento acima fica
(I − ελ(φ))2
φ + K sin(φ)14φ2 +
K sin(φ)2(I + ελ(φ))2
µ2B3
= T +12τθ
Quando o momento é escrito no referencial inercial, o único termo da dinâmica de
junta φ que sofre modificação é N enquanto que os termos M(r) e C(r) permanecem
inalterados em relação às expressões obtidas no referencial móvel. Avaliando-se (3.4.5),
o termo NS fica
NS = (εd1d2 sin(φ))(xµS2 − yµS1 − µS3)
2
(I1 + 2ελ(φ) + I2)2(4.4.14)
A aplicação momento J obtida no espaço de configuração Q, parametrizado através
variáveis (θi, µi), fornece a expressão do momento total. Neste caso, fica evidente a
verificação da conservação dos momentos lineares e angulares em relação ao referencial
inercial, como previsto pelo Teorema de Noether.
Uma modelagem Lagrangiana do sistema de 2-corpos, em que θcm é definida de forma
similar a (θ1 + θ2)/2, é apresentada resumidamente em Souza e Maruyama (2007).
Resultados complementares da modelagem dos sistemas de 3 e 5 corpos são apresentados
no Apêndice C.
4.5. CONCLUSÃO 84
4.5 Conclusão
Em vista das definições da Seção 2.3 e do que foi discutido no Capítulo 3, apresentou-
se neste capítulo as equações de movimento do sistema multi-articulado, conforme a
estrutura de um sistema mecânico simples. Utilizando diferentes parametrizações do
espaço de configuração Q, quatro modelos da dinâmica do sistema foram obtidos sob
o formalismo Hamiltoniano, um deles escrito nas coordenadas do referencial móvel.
Alternativamente, um modelo do sistema foi obtido através da abordagem Lagrangiana.
A determinação dos modelos a partir do Hamiltoniano, através da estrutura simplética, é
relativamente mais simples; ao passo que o estabelecimento dos modelos pela abordagem
Lagrangiana é notadamente mais complexo, exigindo um conhecimento mais abrangente
dos elementos geométricos da mecânica envolvidos. Como o procedimento de modelagem
segundo os métodos Hamiltoniano e Lagrangiano são equivalentes, os modelos obtidos
através destes dois métodos são equivalentes. A equivalência dos modelos do sistema de
2-corpos obtidos pelas duas abordagens acima foi comprovada por simulação.
85
Capítulo 5
Análise do Sistema e
Controlabilidade
O presente capítulo apresenta uma introdução a análise da dinâmica do sistema multi-
articulado. Na primeira seção abaixo apresenta-se a análise para determinação dos
pontos de equilíbrio dinâmico do sistema através de alguns exemplos. Em seguida,
discute-se um fenômeno freqüentemente utilizado no planejamento da locomoção de
sistemas multi-articulados, denominado de fases geométricas, e que representa um fenô-
meno exclusivamente devido a uma restrição cinemática1 e, portanto, independente da
velocidade de movimento.
Finalmente, atenção será voltada à análise de controlabilidade do sistema utilizando os
resultados apresentados em (Sussmann, 1987) e (Nijmeijer e van der Shaft, 1990). Pode-
se adiantar que, em geral, verificar as características de controlabilidade de sistemas
não lineares constitui uma tarefa de relativa dificuldade, em comparação com análises
similares realizadas com as suas aproximações lineares correspondentes. Esta relativa
dificuldade deve-se à notável complexidade intrínseca da dinâmica não-linear, como a
presença de equilíbrios múltiplos ou por fenômenos de ciclo limite e oscilações, que
não estão presentes no âmbito linear. Portanto, observa-se que quanto mais geral o
modelo do sistema sendo analisado, mais difícil é estabelecer a estrutura do espaço de
evolução da dinâmica do mesmo. Além disso, a análise de controlabilidade para sistemas
lineares é local, em torno de um ponto determinado2 do espaço de estados, ao passo1Definida nos pontos em que a conexão mecânica se nula.2Em torno do qual a linearização é válida.
5.1. EQUILÍBRIO E ESTABILIDADE 86
que a verificação das características de controlabilidade dos sistemas não-lineares não
necessariamente se limita a um ponto, mas abrange um sub-conjunto do espaço de fase.
5.1 Equilíbrio e Estabilidade
O equilíbrio de um sistema dinâmico z = f(z, u) é definido pelo conjunto dos pontos
z em T ∗Q os quais z = 0 se verifica. Ou, equivalentemente, para o componente da
dinâmica livre, dado pelo campo vetorial f(.), de um sistema afim nas entradas, o
equilíbrio é verificado quando f(z) = 0.
5.1.1 Equilíbrio do Sistema Multi-corpos
O equilíbrio relativo é obtido pelo equilíbrio do sistema reduzido. Logo, das equações
do sistema reduzido em (4.2.15), segue que
φj = θj+1,j = 0, 1 ≤ j ≤ N − 1
µi = 0, 1 ≤ i ≤ N
A primeira condição acima estabelece que as velocidades angulares de todos os corpos
sejam iguais, ou seja, ωi = ω0, para i = 1, . . . , N , onde ω0 é uma função do tempo, por
exemplo. Isto equivale a restringir o estado relativo do sistema à origem do espaço de
base B. A segunda condição resulta em
∂H
∂θj+1,j= 0, 1 ≤ j ≤ N − 1
que estabelece condições para determinação do equilíbrio em relação aos φ. Note que,
todas as configurações q são equilíbrio do sistema quando o vetor vq ∈ TqQ é nulo,
ou, em particular quando ω0 ≡ 0 que representa pontos de equilíbrio triviais.
Os pontos de equilíbrio relativo para sistemas de dois e três corpos foram obtidos em
Sreenath (1987); por exemplo, para o sistema de 2-corpos, o equilíbrio relativo é dado
por θ1 = θ2 = θ e
• Para θ > 0 e φ = 0 equilíbrio estável;
• Para θ > 0 e φ = π equilíbrio instável;
5.1. EQUILÍBRIO E ESTABILIDADE 87
• Para θ = 0 infinitos pontos de equilíbrio.
Note que a existência de mais de um ponto de equilíbrio elimina a possibilidade do
sistema possuir apenas um ponto de equilíbrio global. Logo, os equilíbrios desta classe
de sistemas são locais.
O equilíbrio relativo para um sistema de N corpos pode ser determinado pela solução
do seguinte sistema de N − 1 equações algébricas:
KX = 0
onde o vetor de estados X é função das N − 1 coordenadas do espaço de base B, dadas
pelo vetor φ. Note que a matriz K possui dimensão (N−1)×N(N−1)/2, onde o número
de colunas é igual a CN,2, isto é, ao número de combinações de N números tomados 2
a 2 ou, ainda, determinado pela somatória de uma progressão aritmética unitária até
o número N − 1. A título de exemplificação do procedimento acima, toma-se N = 5.
Denominando por m∗ a massa total do sistema, segue que:
∂H
∂φ1
∣∣∣∣equil
=ω2
0
m∗ [A1 sin(φ1) + E1 sin(φ1 + φ2)+
H1 sin(φ1 + φ2 + φ3) + J1 sin(φ1 + φ2 + φ3 + φ4)] = 0
∂H
∂φ2
∣∣∣∣equil
=ω2
0
m∗ [B2 sin(φ2) + E2 sin(φ1 + φ2) + F2 sin(φ2 + φ3)+
H2 sin(φ1 + φ2 + φ3) + I2 sin(φ2 + φ3 + φ4)+
J2 sin(φ1 + φ2 + φ3 + φ4)] = 0
∂H
∂φ3
∣∣∣∣equil
=ω2
0
m∗ [C3 sin(φ3) + F3 sin(φ2 + φ3) + G3 sin(φ3 + φ4)+ (5.1.1)
H3 sin(φ1 + φ2 + φ3) + I3 sin(φ2 + φ3 + φ4)+
J3 sin(φ1 + φ2 + φ3 + φ4)] = 0
∂H
∂φ4
∣∣∣∣equil
=ω2
0
m∗ [D4 sin(φ4) + G4 sin(φ3 + φ4)+
I4 sin(φ2 + φ3 + φ4) + J4 sin(φ1 + φ2 + φ3 + φ4)] = 0
A partir das expressões acima, obtém-se o seguinte equilíbrio relativo trivial do sistema:
(φ1, φ2, φ3, φ4)|equil = ±(n1π, n2π, n3π, n4π)
ni = 0, 1, 2...
i = 1, 2, 3, 4.
5.1. EQUILÍBRIO E ESTABILIDADE 88
Em alguns casos práticos, no entanto, devido às restrições dimensionais, os corpos do
sistema não se sobrepõe, ou seja, não realizam uma rotação relativa completa entre si.
Conseqüentemente, nestes casos os inteiros ni restringem-se somente a 0.
Como exemplo, adota-se um sistema simétrico, em relação aos parâmetros de massa e
dimensões: os corpos extremos 1, 5 são idênticos com massa m1 e dimensão longitudinal
2a, os corpos 2, 4 são idênticos com massa m2 e dimensão longitudinal 2b e diferentes
do corpo central que possui massa m3 e comprimento 2c. Neste caso, tem-se que:
K1 = A1 = D4
K2 = B2 = C3
K3 = E1 = E2 = G3 = G3
K4 = F2 = F3
K5 = H1 = H2 = H3 = I2 = I3 = I4
K6 = J1 = J2 = J3 = J4
onde
K1 = abm1(2m1 + 3m2 + 2m3)
K2 = bc(2m1 + m2)m∗
K3 = acm1m∗
K4 = [b(2m1 + m2)]2
K5 = abm1(2m1 + m2)
K6 = a2m21
e m∗ = 2m1 + 2m2 + m3 é a massa total do sistema. Note que não é possível reduzir
o número de constantes Ki acima mesmo adotando um sistema cujos corpos são todos
iguais entre si. As quatro expressões (5.1.1) podem ser apresentadas de maneira mais
compacta em forma matricial, como se segue
K1 0 0 0 K3 0 0 K5 0 K6
0 K2 0 0 K3 K4 0 K5 K5 K6
0 0 K2 0 0 K4 K3 K5 K5 K6
0 0 0 K1 0 0 K3 0 K5 K6
X =
0
0
0
0
(5.1.2)
e o vetor X, função das coordenadas φ, é dado por
X(φ) = [ sin(φ1), sin(φ2), sin(φ3), sin(φ4), sin(φ1 + φ2), sin(φ2 + φ3),
sin(φ3 + φ4), sin(φ1 + φ2 + φ3), sin(φ2 + φ3 + φ4),
sin(φ1 + φ2 + φ3 + φ4)]T
5.1. EQUILÍBRIO E ESTABILIDADE 89
Até o momento de conclusão deste trabalho, não se teve conhecimento, por parte do
autor, de um método de resolução geral da equação acima. Uma alternativa é obter
famílias de solução como procede-se abaixo.
Exemplo 5.1.1. Considerando ω0 6= 0, determina-se a seguir as soluções para três
casos:
φ1 = φ3 e φ2 = φ4 Torna o sistema de equações acima simétrico de maneira que apenas
o primeiro par de equações seja necessário resolver. Obtém-se a seguinte solução
em [0, 2π[: φ1 = (0, 0, π, π), φ2 = (0, π, 0, π).
φ1, φ3 = φ e φ2, φ4 = −φ Possui uma única solução φ = 0.
φ1, φ2, φ3, φ4 = φ As quatro equações de equilíbrio simplificam em uma única expressão,
dada por
(K2 −K1) sin(φ) + K4 sin(2φ) + K5 sin(3φ) = 0
através da qual obtém-se a seguinte solução
φ =
0
π
arctan(√
Z1+2K4√
Z2
K5,−K4−
√Z2
K5 )
arctan(−1/2√
Z1+2K4√
Z2
K5,−1/2K4−
√Z2
K5)
arctan(√
Z1−2K4√
Z2
K5,−K4+
√Z2
K5)
arctan(−1/2√
Z1−2K4√
Z2
K5,−1/2K4+
√Z2
K5)
onde
Z1 = −2K24 + 12K2
5 + 4K5K2 − 4K5K1
Z2 = K24 − 4K5K2 + 4K5K1 + 4K2
5
Note que, em geral, quanto mais estrutura é dada às coordenadas φ maior é o conjunto
solução. Especula-se que não exista solução diferente da trivial para o caso geral do
equilíbrio relativo do sistema acima.
5.2. FASES GEOMÉTRICAS: ANÁLISE 90
5.2 Fases Geométricas: Análise
Como comentado no Capítulo 3, as conexões podem ser vistas como descrições da in-
fluência do movimento horizontal, ou seja, movimento descrito no espaço Hq, no mo-
vimento do sistema no espaço vertical. Em geral, esta influência não é constante mas
regida por um comportamento não linear e, em alguns casos, esta conexão pode deter-
minar uma curvatura no espaço de configuração do sistema, sendo esta descrita pelos
símbolos de Christoffel.
Em geral, pode-se esperar que um movimento cíclico descrito no espaço de base B, que
corresponde a um movimento horizontal conforme ao comentários da Seção 2.5, não
corresponda a um movimento cíclico no espaço de configuração total Q. Apesar disso,
o movimento da configuração do sistema percorrerá uma curva aberta, que descreve a
curva cíclica ou fechada quando projetada no espaço de base B, mas que sofrerá um
deslocamento equivalente em Q e correspondente aos pontos de partida e chegada do
percurso fechado em B. Este deslocamento sofrido pela configuração do sistema é um
movimento vertical, geralmente definido por um elemento da fibra G, e é denominado
de mudança de fase ou fase geométrica, como comentado na Seção B.3. Quando µS = 0,
a magnitude da mudança de fase é dependente da área interna ao percurso fechado em
B e da geometria da conexão envolvida, (Bloch, 2003; Marsden, 2004).
A importância do mecanismo que define as fases geométricas deve-se, sobretudo, à
sua aplicação no projeto de movimentos de locomoção em sistemas robóticos multi-
articulados. Um exemplo trivial, embora interessante, é dado em (Littlejohn e Reinsch,
1997). Como será mostrado a seguir, o cálculo da mudança de fase reflete a alteração
do tensor travado de inércia com relação à mudança de forma do sistema.
O momento angular do sistema µ, dado no referencial inercial, pode ser obtido a partir
da matriz de inércia J e da velocidade angular ω através da seguinte expressão:
µ = Jω (5.2.1)
O momento angular total é obtido pela expressão
µ =N∑
k=1
µk = 1TNJω (5.2.2)
onde 1N é um vetor coluna com N uns. Assume-se, na análise realizada a seguir, que o
5.2. FASES GEOMÉTRICAS: ANÁLISE 91
sistema possui momento angular total nulo. Então
1TNJω = µ = 0, ⇒ 1T
NJdθ = 0 (5.2.3)
onde dθ = [dθ1, . . . , dθN ]T . Expandindo o vetor dθ de maneira análoga ao realizado em
(4.3.20), segue que
dθ = 1Ndθ1 + Mdφ
onde M é uma matriz N×(N−1) definida em (4.3.21). Neste caso o espaço de grupo é o
grupo de Lie SO(2) e parametrizado pela coordenada θ1. Logo, considerando momento
angular nulo e a partir da Eq. (5.2.3) tem-se que
1TNJ1Ndθ1 = −1T
NJMdφ
dθ1 = − 1TNJM
1TNJ1N
dφ (5.2.4)
Como pode-se observar, o momento de inércia instantâneo 1TNJ1N é dependente da
forma do sistema e corresponde ao elemento (3, 3) do tensor travado de inércia em
(4.4.4). De (5.2.4), segue que
∆θ1 = −∫
ΓA(φ)dφ (5.2.5)
onde Γ é um caminho fechado no espaço de base B, que corresponde a um movimento
horizontal em função da conexão A(φ). O escalar 1TNJ1N corresponde à inércia travada
do sistema, cuja forma é determinada por φ. Em geral, a integral de linha acima avaliada
em um caminho fechado em B fornece um valor não nulo ∆θ1, que corresponde a um
deslocamento ou uma mudança de fase no espaço de grupo G. Esta mudança de fase
determina uma restrição linear nas velocidades angulares relativas φ. Esta restrição é
não-integrável, ou não-holonômica, no sentido de Frobenius, conforme a introdução da
Seção 2.1.2.
Observação 5.2.1. Uma dada conexão é dita plana ou chata3 se for desprovida de cur-
vatura. Neste caso, a conexão representa uma aplicação constante e a mudança de fase,
correspondente a um percurso fechado no espaço B, é dada simplesmente por um valor
proporcional à área definida pelo interior do percurso fechado em B, ou seja, proporci-
onal a uma métrica Euclidiana. Observe que, à princípio, nada pode ser concluído com
relação às fases geométricas de sistemas com conexões de curvaturas planas.
No caso G = SE(2), o componente da dinâmica rotacional da aplicação momento J em3Do inglês flat connections.
5.2. FASES GEOMÉTRICAS: ANÁLISE 92
T ∗Q, em coordenadas inerciais, é:
J(3) = (rcm × pcm) + µ = rxpy − rypx +N∑
i=1
µi = 0 (5.2.6)
onde a operação × corresponde ao produto vetorial no plano, rcm = (rx, ry)T e pcm =
(px, py)T são a posição e o momento linear do centro de massa do sistema, dados em
relação ao referencial inercial. Observe que a primeira parcela da expressão do momento
angular acima, dado por rcm×pcm, deve-se à translação do sistema com relação à origem
do referencial inercial. Neste caso, observa-se, também, componentes da mudança de
fase nos componentes de translação do sistema, (Melli et al., 2006).
5.2.1 O Contexto Geométrico
Recorda-se que o grupo de Lie SE(2) não é abeliano e que, por sua vez, rende uma ál-
gebra se(2) não abeliana, refira a Seção A.2.2 para detalhes adicionais. Pode-se mostrar
que a dinâmica no subespaço abeliano SO(2) é desacoplada do movimento no espaço
vetorial R2, sendo este último o subespaço não compacto do grupo SE(2). Um breve
detalhamento disto é feito na Seção B.2.
Observação 5.2.2. O desacoplamento ocorre apenas em um sentido, ou seja, o compo-
nente de translação depende da parte abeliana do grupo.
Observação 5.2.3. A holonomia não nula para o componente de translação da conexão
será possível apenas quando os pontos da parametrização, do deslocamento linear do
sistema, forem escolhidos diferentes do centro de massa do mesmo. Ou seja, a mudança
de fase não será observada se o centro de massa do sistema for o ponto escolhido para
parametrizar o componente de movimento linear do mesmo. Isto está em acordo com a
conservação da quantidade de movimento linear enunciado pelo Teorema de Noether.
Parametrizando-se o componente de translação do espaço do grupo SE(2) pela distância
do centro de massa do sistema rcm, a holonomia da conexão mecânica deve-se apenas à
parte abeliana de SE(2). Logo, para s(0) = e, a holonomia da parte abeliana do grupo
pode ser obtida por, (Marsden et al., 1990):
s(1) = exp(−
∫ 1
0Ag(r)r(t)dt
)= exp
(−
∫
∂ΩAg(r)dr
)= exp
(−
∫∫
ΩDAg(r)dA
)
(5.2.7)
onde Ag : TQ → g é o componente abeliano da conexão e D representa a derivada
covariante exterior. A última igualdade em (5.2.7) deve-se a generalização do Teorema
5.3. ANÁLISE DE CONTROLABILIDADE 93
de Stokes e à aplicação exp : se(2) → SE(2), dada por:
exp(ω, vx, vy) = (θ, rx, ry)
onde (ω, vx, vy) ∈ R3 ' se(2) e exp é a aplicação exponencial, detalhada para o grupo
SE(2) na Seção A.2.2. Note que a expressão (5.2.7) não envolve uma parametrização
do caminho fechado no espaço de base B. Por outro lado, a holonomia do componente
de translação de fato depende dos pontos inicial e final da parametrização escolhida.
Nos casos em que G é um grupo de simetria abeliano, a mudança de fase também
pode ser calculada através da curvatura B da conexão principal que, a partir de (5.2.7)
fornece:
holonomia := θ(1) = −∫
ΓA(φ)dφ = −
∫∫
ΩBdΩ (5.2.8)
onde Γ = ∂Ω. A magnitude da mudança de fase é função da curvatura da conexão e da
área definida pelo caminho percorrido no espaço de base.
Exemplo 5.2.1. Para o sistema de 3-corpos, em que (φ1, φ2) parametrizam o espaço
de base B, as fases geométricas podem ser calculadas segundo a expressão dada a seguir:
∆θ1 = −∫
ΓA(φ)dφ =
= −[∫ (α,0)
(0,0)f1(φ1)dφ1 +
∫ (α,β)
(α,0)f2(φ2)dφ2 +
∫ (0,β)
(α,β)f1(φ1)dφ1 +
∫ (0,0)
(0,β)f2(φ2)dφ2
]
(5.2.9)
onde Γ é o caminho fechado no espaço (φ1, φ2) dado por Γ = [(0, 0), (α, 0), (α, β), (0, β),
(0, 0)]. Alternativamente, a curvatura da conexão neste caso é obtida através, refira à
Seção B.4 para detalhes:
B = dA =(
∂f2
∂φ1− ∂f1
∂φ2
)dφ1 ∧ dφ2 (5.2.10)
As Figuras 5.1 e 5.2 ilustram a mudança de fase e a curvatura da conexão, respecti-
vamente. A Seção B.4 do Apêndice B apresenta algumas expressões para o cálculo das
fases geométricas do sistema com 5-corpos.
5.3 Análise de Controlabilidade
Seja V uma vizinhança de um ponto z ∈ M , onde M representa o espaço de fase de
velocidade TQ ou de momento P = T ∗Q do sistema, e seja dado o conjunto de controle
U ⊂ Rm tal que u : [0, T ] 7→ U , para todo T > 0.
5.3. ANÁLISE DE CONTROLABILIDADE 94
−4 −3 −2 −1 0 1 2 3 4
−4
−2
0
2
4
−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
0.2
θ23
System Phase Shift
θ12
Hol
onom
y
Figura 5.1: Mudança de fase do sistema de três corpos. A mudança de fase foi calculada
a partir de (5.2.9), para um caminho fechado no espaço de base B parametrizado por
α, β = 3. As coordenadas do espaço de base são dadas por (φ1, φ2) = (θ12, θ23).
5.3. ANÁLISE DE CONTROLABILIDADE 95
−4−3−2−101234
−4
−2
0
2
4
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
θ12
Curvature of the Connection
θ23
Cur
vatu
re B
Figura 5.2: Curvatura B relativa à conexão principal do sistema de três corpos. A
curvatura da conexão A dada em (5.2.9) foi obtida a partir de (5.2.10).
5.3. ANÁLISE DE CONTROLABILIDADE 96
Definição 5.3.1 (Conjunto Alcançável). O conjunto alcançável a partir de z0 em tempo
T , definido por RV (z0, T ) ⊂ M , é o conjunto de pontos z(t) ∈ V para os quais existem
entradas u(t) ∈ U que conduzem o estado do sistema do ponto z(0) = z0 ∈ V ao ponto
z(T ), onde 0 6 t 6 T , ou seja:
RV (z0, T ) = z ∈ M | ∃ u(t) ∈ U, z(0) = z0, z(t) ∈ V, ∀t ∈ [0, T ]
Observe, pela notação RV (.), que os critérios de acessibilidade e controlabilidade, apre-
sentados a seguir, são definidos para todas as possíveis vizinhanças do ponto z0, re-
presentadas genericamente por V . O conjunto alcançável em até o tempo T é definido
por:
RV (z0,≤ T ) =⋃
0≤t≤T
RV (z0, t). (5.3.1)
Como visto previamente no Capítulo 4, o sistema multi-articulado é um sistema me-
cânico simples. O modelo dinâmico de um sistema de controle na forma afim (Q, f,
g1, . . . , gm, U), onde dimQ = n, é tal que
z(t) = f(z) +m∑
i=1
gi(z)ui, m < n (5.3.2)
onde z ∈ P , f é o campo vetorial da dinâmica livre e os gi são os campos vetoriais de
entrada. As funções de controle são dadas por u ∈ U .
5.3.1 Álgebra e Distribuição de Acessibilidade de Sistemas Afim
Definição 5.3.2 (Acessibilidade4 Local). O sistema (5.3.2) é dito acessível a partir de
z0 ∈ T ∗Q se RV (z0,≤ T ) contém um aberto não vazio em T ∗Q, para todo V de z0 e
T > 0.
A álgebra de acessibilidade C é a menor álgebra fechada em relação ao colchete de Jacobi-
Lie que contém os campos vetoriais f, g1, . . . , gm. O próximo resultado simplifica a
obtenção desta álgebra.
Proposição 5.3.1. Qualquer iteração do colchete de Jacobi-Lie dos campos vetoriais
f, g1, . . . , gm é uma combinação linear das iterações à esquerda do colchete de Jacobi-
Lie de f, g1, . . . , gm.4Ou alcançabilidade, em algumas referências.
5.3. ANÁLISE DE CONTROLABILIDADE 97
Demonstração. Este resultado segue das propriedades das álgebras de Lie, uma vez que
um conjunto de campos vetoriais em Q munido do colchete de Lie forma uma álgebra
de Lie.
Seja Lj uma álgebra de grau j e definida pelo colchete de Lie [., .]. Por definição,
qualquer colchete de grau j + 1 pode ser escrito pelo colchete de elementos de graus j
e 1, ou seja, [Lj , L1] = Lj+1. Generalizando, mostra-se que qualquer colchete de grau
j + l pode ser escrito pelo colchete de elementos de graus j e l, isto é
[Ll, Lj ] j Ll+j
Assume-se que [Ll, Lj ] j Ll+j para todo j. Então, por indução, segue que
[Ll, Lj+1] = [Ll, [Lj , L1]] j [[Ll, L1], Lj ] + [[Ll, Lj ], L1]
j [Ll+1, Lj ] + [Ll+j , L1]
j Ll+j+1
Para mostrar a implicação inversa, ou seja, qualquer colchete de grau j é dado pelos
colchetes de j elementos de grau 1, basta mostrar que o sub-espaço de um produto de
colchetes iterados à esquerda é uma sub-álgebra da álgebra de qualquer combinação dos
colchetes. Sejam dois colchetes com graus l e j dados por
X = [Xj , ..., [[X3, X2], X1], ..., ]
Y = [Yl, ..., [[Y3, Y2], Y1], ..., ]
Por indução, pode-se mostrar que [X,Y ] faz parte desta sub-álgebra para quaisquer l
e j. Para todo Y , fixado l, verificar a tese nos casos j = 1, 2 seque diretamente das
propriedades de anti-simetria e identidade de Jacobi da álgebra de Lie. Supondo que a
mesma vale para j = k, verifica-se a condição para j = k + 1 através na expressão:
[X,Y ] = [[Xj , X′], Y ] = −[Y, [Xj , X
′]]
onde X ′ = [Xj−1, ..., [X3, [X2, X1]]...]. Pela identidade de Jacobi, segue que
[Y, [Xj , X′]] + [X ′, [Y, Xj ]] + [Xj , [X ′, Y ]] = 0
Das duas últimas expressões tem-se
[X, Y ] = −[X ′, [Y, Xj ]]− [Xj , [X ′, Y ]]
= [X ′, [Xj , Y ]]− [Xj , [X ′, Y ]]
5.3. ANÁLISE DE CONTROLABILIDADE 98
O primeiro termo [X ′, [Xj , Y ]] pertence a sub-álgebra uma vez que, pela hipótese, um
elemento de grau j = k pertence a mesma sub-álgebra e o grau de X ′ é k. Como
[X ′, Y ] pertence a sub-álgebra, o segundo termo também pertence a sub-álgebra. Logo,
um elemento genérico da álgebra pode ser reescrito na forma de produtos sucessivos à
esquerda com o colchete de Lie (sub-álgebra).
Aplicando o resultado acima à definição da álgebra de acessibilidade acima tem-se que,
para o campo vetorial Xik ∈ f, g1, . . . , gm, 0 ≤ ik ≤ m, a álgebra de acessibilidade do
sistema C, ou álgebra de Lie de controle, é obtida pela seguinte definição, empregando-se
a notação de índices múltiplos:
C(f, g1, . . . , gm) := [Xi1 , [Xi2 , . . . , [Xik−1, Xik ] . . .], k ≥ 1, 0 ≤ i1, . . . , ik ≤ m
(5.3.3)
Esta álgebra é também representada pela seguinte notação C(f, g1, . . . , gm) = Lie(f,
g1, . . . , gm). A distribuição associada a acessibilidade C é involutiva e determinada por
C(z) = spanX(z) | X ∈ C, z ∈ T ∗Q (5.3.4)
Teorema 5.3.2 (Acessibilidade Local: Suficiência, (Bloch, 2003)). Assume-se que o
sistema de controle afim (5.3.2) seja suave. Se o critério de posto pleno para acessibi-
lidade dimC(z0) = n, conhecido como a condição de posto da álgebra de Lie (LARC)5,
é verificado, então o conjunto RV (z0,≤ T ) possui interior não vazio para todo T > 0 e
o sistema é acessível a partir de z0 ∈ T ∗Q.
A condição acima pode ser observada quando:
dimC = dim(spanci) = dim(Im[ci]) = rank[C] = n (5.3.5)
Definição 5.3.3. O sistema (5.3.2) é dito acessível se a condição LARC for satisfeita
para todo z ∈ T ∗Q.
Definição 5.3.4. Um conjunto U é denominado próprio se 0 ∈ int(conv)(U), onde int
é interior do menor conjunto convexo, representado por conv, contendo U . O conjunto
convexo de U é definido por
k∑
i=1
λiui, k ∈ N : λi > 0,k∑
i=1
λi = 1
5Do inglês Lie Algebra Rank Condition.
5.3. ANÁLISE DE CONTROLABILIDADE 99
Ademais, para sistemas definidos em uma variedade analítica e quando U é próprio, a
condição de acessibilidade implica na verificação do critério de posto para acessibilidade
(LARC), ou seja, o LARC é uma condição necessária e suficiente para a acessibilidade
do sistema.
5.3.2 Controlabilidade
O conceito de controlabilidade de um sistema pode ser definido como:
Definição 5.3.5 (Controlabilidade). O sistema (5.3.2) é dito controlável de z0 ∈ T ∗Q
se, para todo z ∈ T ∗Q, existir um T > 0 tal que z ∈ RV (z0, T ), para z ∈ V .
Definição 5.3.6 (Controlabilidade em Tempo Pequeno6: (Bullo e Lewis, 2005)). O
sistema (5.3.2) é dito controlável em tempo pequeno de z0 ∈ T ∗Q se existir um T > 0
tal que RV (z0,≤ T ) contém uma vizinhança V de z0.
Note que a condição acima V ⊂ RV (z0,≤ T ) é equivalente à condição de z0 estar no
interior de RV (z0,≤ T ), ou seja z0 não pode ser um ponto limite de RV (z0,≤ T ). Esta
condição permite que a trajetória do sistema possa convergir a z0 de todas as direções;
fato que não é verificado se z0 pertence a fronteira da região RV (z0,≤ T ). Isto permite
que o estado do sistema possa ser levado ao ponto z0 em tempo suficientemente pequeno.
Seguem abaixo algumas definições necessárias a um resultado para o STLC.
Define-se por δa(B) como o número de vezes que o campo vetorial Xa, para a = 0, . . . , m,
é utilizado em B. O grau de um colchete de Lie B, simbolizado por δ(B), é obtido
fazendo-se
δ(B) =m∑
0
δa(B)
Um elemento B ∈ Br(X) é dito ruim se δ0(B) for ímpar e δi(B), i = 1, . . . , m, par
(incluindo o zero). Se um elemento B ∈ Br(X) não é ruim, ele é dito bom.
Teorema 5.3.3 (Controlabilidade em Tempo Pequeno: (Sussmann, 1987)). Seja o
sistema (5.3.2) com ponto de equilíbrio em z0 ∈ T ∗q Q, ou seja, f(z0) = 0, e assume-se
que (5.3.2) satisfaça a condição LARC em z0. Se X ∈ Br(X) for ruim, então existem
Y1, . . . , Yk tais que
X = aiYi,
6Do original Small-time local controllability - (STLC).
5.3. ANÁLISE DE CONTROLABILIDADE 100
para a1, . . . , ak ∈ R, e, para i = 1, . . . , m
δ(Yi) < δ(X)
Então o sistema (5.3.2) é STLC de z0.
Ou seja, se todo B ∈ Br(X) ruim puder ser escrito como uma combinação linear de
componentes bons de grau menor, e o sistema for acessível de z0, então o sistema é
STLC de z0. Um corolário do teorema acima estabelece que um sistema na forma afim
é STLC a partir de z0 se z0 for um ponto de equilíbrio e se o critério de acessibilidade
for verificado em z0.
Teorema 5.3.4 (Controlabilidade Especial: (Bloch, 2003)). Um sistema de controle na
forma afim cujos, campos vetoriais são analíticos, é controlável se dimC(q) = n, para
todo q ∈ Q, e se uma das seguintes condições se verificar:
• f = 0, ou
• f possui divergente nulo e Q é compacto e Riemanniano.
Observe que apenas os modelos cinemáticos do sistema multi-corpos se enquadrariam
no primeiro caso acima, Seção C.2.4. Uma particularização da segunda condição acima
diz respeito aos casos que o campo vetorial f é Hamiltoniano7. Note que, embora o
sistema mecânico em estudo seja Hamiltoniano, como observado através da dinâmica
livre dada pelo campo vetorial f em (4.2.1) e (4.2.5), o espaço de fase do mesmo não
é compacto, apesar de Riemanniano. A qualidade de não compaticidade do espaço de
fase T ∗Q deve-se ao fato do mesmo conter o espaço vetorial R2, um espaço não limitado.
Controlabilidade com o Modelo Cinemático do Sistema
Os modelos cinemáticos são, em determinadas situações,8 livres da presença do campo
vetorial relativo à dinâmica livre f e conseqüentemente são empregados na geração
de trajetórias para os modelos dinâmicos correspondentes em razão de preservarem a
estrutura dos canais de entrada τ do sistema. Um modelo cinemático, no espaço de7Consultar a Seção 2.2.8Quando tem-se momento nulo, ver Seção C.2.4.
5.3. ANÁLISE DE CONTROLABILIDADE 101
configuração Q de dimensão n, pode ser escrito como:
q =m∑
i=1
uiXi(q), m < n (5.3.6)
onde q ∈ Q é a configuração, u ∈ U ⊂ Rm são as funções de entrada e F = X1, X2, . . . , Xmé um conjunto de campos vetoriais completos em Q. Por causa da reversibilidade de
sistemas sem dinâmica livre (Sontag, 1998), a acessibilidade implica em controlabilidade
para este caso, ou seja, a controlabilidade pode ser verificada através da critério de posto
para acessibilidade.
5.3.3 Controlabilidade do Sistema de Dois Corpos
Controlabilidade com Modelo Cinemático do Sistema
ReferencialInercial
L
T
φ
x
CM
−θcm
y
f2
f1
z1
z2
Figura 5.3: Cinemática do sistema de dois corpos.
A seguir procede-se com a análise de controlabilidade para o sistema de dois corpos
articulados. O modelo cinemático do sistema de dois corpos da Figura 5.3 é dado por
x = (f1 − f2) sin(
φ
2
)cos(θ)− (f1 + f2) cos
(φ
2
)sin(θ) (5.3.7)
y = (f1 − f2) sin(
φ
2
)sin(θ) + (f1 + f2) cos
(φ
2
)cos(θ) (5.3.8)
θ = −(f1 − f2)L cos(
φ
2
)(5.3.9)
φ = T (5.3.10)
5.3. ANÁLISE DE CONTROLABILIDADE 102
que corresponde aos campos vetoriais de controle
g1 =
sin(
φ2
)cos(θ)− cos
(φ2
)sin(θ)
sin(
φ2
)sin(θ) + cos
(φ2
)cos(θ)
−L cos(
φ2
)
0
, g2 =
− sin(
φ2
)cos(θ)− cos
(φ2
)sin(θ)
− sin(
φ2
)sin(θ) + cos
(φ2
)cos(θ)
L cos(
φ2
)
0
,
g3 = [0, 0, 0, 1]T
Observe que o sistema é composto por um atuador rotativo interno T além de duas
forças propulsores f1 e f2, um em cada corpo, e responsáveis pela condução do sistema
ao longo da fibra G = SE(2).
A distribuição gerada pelos campos vetoriais é regular, ou seja, a dimensão da distri-
buição é mantida constante para todo q = (rx, ry, θ, φ) ∈ Q. Logo, a condição de LARC
é satisfeita com colchetes de grau dois ou maior, pois
rank [g1, g2, g3, [g1, g2], [g1, g3], [g2, g3]] = 4 = dimTqQ
A combinação linear de colchetes até o segundo grau é suficiente para gerar as direções do
espaço tangente à variedade de configuração Q, indicando a existência de um conjunto
de acessibilidade aberto e não vazio RV (q0, q0, T ) = Tq0Q.
Tomando-se, por exemplo, o conjunto de campos vetoriais g3, [g1, g2], [g1, g3], e [g1, [g1, g2]
pode-se facilmente verificar que estes geram um subespaço 4-dimensional de TqQ apenas
se φ não for múltiplos de π, como mostra a solução de:
det([g3, [g1, g2], [g1, g3], [g1, [g1, g2]]) = 2L4 sin(
φ
2
)cos5
(φ
2
)= 0
Uma rápida análise das equações do modelo cinemático do sistema reafirma este resul-
tado, uma vez que, em φ = π os corpos estão sobrepostos e o movimento do sistema
na fibra se restringe aos dois sentidos da linha reta, que é um espaço unidimensional.
Por outro lado, quando φ = 0, o sistema se degenera ao corpo rígido com dois propulso-
res, cuja acessibilidade é verificada no subespaço 3-dimensional TgSE(2) ⊂ TqQ, onde
g ∈ SE(2).
Controlabilidade com Modelo Dinâmico do Sistema
A análise com o modelo dinâmico do sistema de dois corpos mostrou resultado se-
melhante ao do modelo cinemático acima. Em geral, no entanto, é necessário obter
colchetes de Jacobi-Lie de grau maior que dois de modo a gerar o espaço de fase.
5.3. ANÁLISE DE CONTROLABILIDADE 103
O modelo dinâmico do sistema de 2-corpos simétrico, ou seja, em que os corpos são
idênticos com relação aos parâmetros mi, Ii, di, para i = 1, 2, mostrou-se acessível para
qualquer z = (rx, ry, θcm, φ, pcm, pφ). Para um estado diferente do nulo, são necessários
apenas colchetes de segunda e terceira ordens. Ou seja, seja a matriz C3 composta pelos
oito primeiros campos vetoriais em ordem crescente de grau, dados por f, g1, g2, g3,
[f, g1], [f, g2], [f, g3] e [f, [f, g1]]. A matriz C3 permite verificar o critério de posto
pleno verificando a condição
det(C3(z)) 6= 0, z 6= 0
Calculada para um ponto do estado na origem z = 0, a acessibilidade é alcançada
somente com a avaliação dos colchetes de grau 4, em conjunto com alguns colchetes
de menor grau obtidos acima. Com isso, obtém-se a seguinte matriz construída pelos
campos vetoriais que primeiro fornecem, na ordem de grau crescente, uma distribuição
de dimensão igual ao espaço de momento T ∗q Q:
C4(0) =
0 0 0 0 0 0 0 l2m∗(K+I)
0 0 0 −1m∗ 0 0 0 0
0 0 0 0 −l2(K+I) 0 0 0
0 0 0 0 0 2(K−I) 0 0
0 0 0 0 0 0 − l2(K+I) 0
1 0 0 0 0 0 0 0
0 l 0 0 0 0 0 0
0 0 1 0 0 0 0 0
cujas colunas correspondem aos campos vetoriais de entrada g1, g2, g3 e aos [f, g1],
[f, g2], [f, g3], [g1, [f, g2]] e [f, [g1, [f, g2]]] calculados na origem. Na matriz acima, tem-
se que K = εd1d2, como definido na Seção 4.2, e I = I1 = I2. Logo, rank(C4(0)) = n =
8. Este resultado foi obtido com o modelo, cujo a dinâmica da fibra SE(2) é dada em
função do centro de massa do sistema, apresentado em (4.3.16), e com campos vetoriais
de entrada parametrizados por (u1, u2) = (f1 + f2, f2 − f1).
Observação 5.3.1. O critério para verificar a acessibilidade localmente na origem equivale
ao critério para acessibilidade forte, uma vez que o campo vetorial relativo a dinâmica
livre nunca contribui com informação sobre o sistema, ou seja, f(0) = 0.
Analogamente, a análise do modelo do sistema de 2-corpos, em que os corpos possuem
propriedades físicas distintas, mostrou mesmo resultado ao apresentado acima. Isto
vale tanto no caso em que este é modelado sob a abordagem Hamiltoniana quanto
5.3. ANÁLISE DE CONTROLABILIDADE 104
Lagrangiana, independentemente da parametrização dos campos vetoriais relativos às
entradas.
Resultados com sistemas de três ou mais corpos cujo as juntas rotativas são todas
atuadas apresentam o mesmo resultado; como enunciado na seguinte proposição:
Proposição 5.3.5 (Controlabilidade: Sistema de N -corpos). Todo sistema multi-articu-
lado de N corpos, totalmente atuado no espaço de base B e com, ao menos, duas forças
de propulsão linearmente independentes e necessariamente aplicadas em corpos distin-
tos, é acessível e controlável dos pontos de equilíbrio.
Para um sistema multi-articulado de N corpos, cuja massa total é m∗, os campos
vetoriais da dinâmica livre e das entradas, são dados genericamente por
f =
px/m∗
py/m∗
Xθ(φ, pθ, pφ)
Xφ1(φ, pθ, pφ)...
XφN−1(φ, pθ, pφ)
0
0
0
Xpφ1(φ, pθ, pφ)
...
XpφN−1(φ, pθ, pφ)
, gi =
0
0
0
0...
0
Xvx(θcm, φ)
Xvy(θcm, φ)
Xpθ(φ)
0...
0
, i = 1, . . . , mp (5.3.11)
Faz-se importante notar que os Xθ, Xp(.)e Xφ(.)
são funções de primeira, de segunda
e de primeira ordem, respectivamente, das variáveis dos momentos pθ e pφ. Este fato
servirá, a seguir, para estabelecer limitações da iteração dos colchetes de Lie para a
construção de novas direções de movimento. Estas novas direções são representadas por
componentes não nulos dos campos vetoriais obtidos pelo colchete de Lie. Os demais
campos vetoriais, relativos aos torques nas juntas rotativas, são constantes e podem ser
parametrizados simplesmente pela base canônica de T ∗φB, quando Q possui estrutura
5.3. ANÁLISE DE CONTROLABILIDADE 105
principal, ou seja
gmp+1 =
0N+5
1
0...
0
, . . . gj =
0N+5
...
1
0...
, . . . gm =
0N+5
0
0...
1
(N − 1) (5.3.12)
Por serem constantes, tem-se que Dgj ≡ 0, rendendo o vetor nulo como único elemento
da álgebra com o colchete de Jacobi-Lie de grau maior ou igual a dois dos gj : adkgj
gl ≡ 0,
como definido na Seção A.1, para j, l = mp + 1, . . . , m e ∀k > 0. Pode-se estender este
resultado aos campos vetoriais dos propulsores.
Lema 5.3.6. Todo colchete de Jacobi-Lie dos campos vetoriais de entrada do sistema
multi-articulado é sempre nulo, ou seja, [gi, gk] = 0, para i, k = 1, . . . , m.
Note que esta afirmação decorre independentemente dos campos vetoriais serem line-
armente independentes ou não, mas é conseqüência do fato de que um componente
não-nulo dos gi, e que atua em uma determinada direção, não é uma função da variável
correspondente a esta mesma direção. Por exemplo, os componentes não nulos dos gi
sempre atuam nas direções que correspondem aos momentos lineares e angulares. No
entanto, estes não são funções das variáveis px, py, pθ, pφ que modelam as direções pois
os campos vetoriais são funções apenas da configuração g = g(q), q ∈ Q.
Explorando a estrutura dos campos vetoriais que modelam o sistema, as propriedades de
anti-simetria e da identidade de Jacobi do colchete de Lie-Jacobi podem ser utilizadas
para obtenção de expressões que auxiliam na análise da álgebra de controlabilidade para
colchetes de grau maiores ou iguais a três.
Lema 5.3.7. Para colchetes de grau três [gi, [f, gk]] = [gk, [f, gi]], i, k = 1, . . . , m.
Demonstração. Para i, k, l = 1, . . . ,m e lembrando, do Lema 5.3.6, que [gi, gk] = 0
tem-se, da identidade de Jacobi, que
[gi, [f, gk]] + [gk, [gi, f ]] + [f, [gk, gi]] = 0
[gi, [f, gk]] + [gk, [gi, f ]] + 0 = 0
[gi, [f, gk]]− [gk, [f, gi]] = 0 (anti-simetria)
[gi, [f, gk]] = [gk, [f, gi]]
5.3. ANÁLISE DE CONTROLABILIDADE 106
Lema 5.3.8. Para colchetes de grau quatro, valem os seguintes:
1. [f, [gi, [f, gi]]] = [gi, [f, [f, gi]]], i = 1, . . . , m
2. [gi, [gk, [f, gl]]] = [gk, [gi, [f, gl]]] = [gl, [gi, [f, gk]]], i, k, l = 1, . . . , m
3. [gi, [f, [f, gk]]] + [gk, [f, [f, gi]]] = 2[f, [gi, [f, gk]]], i, k = 1, . . . , m
Demonstração. Para i, k, l = 1, . . . , m, segue que:
1. Tomando [f, gi] = X, segue que
[f, [gi, X]] + [X, [f, gi]] + [gi, [X, f ]] = 0
[f, [gi, X]] + 0 + [gi, [X, f ]] = 0
[f, [gi, X]]− [gi, [f, X]] = 0 (anti-simetria)
[f, [gi, [f, gi]]] = [gi, [f, [f, gi]]]
2. Mostra-se primeiro a igualdade [gi, [gk, [f, gl]]] = [gk, [gi, [f, gl]]]. Fazendo X =
[f, gl], tem-se:
[gk, [gi, X]] + [X, [gk, gi]] + [gi, [X, gk]] = 0
[gk, [gi, X]] + 0 + [gi, [X, gk]] = 0
[gk, [gi, X]]− [gi, [gk, X]] = 0 (anti-simetria)
[gk, [gi, [f, gl]]] = [gi, [gk, [f, gl]]]
A segunda igualdade pode ser mostrada de maneira análoga a primeira, fazendo
X = [f, gk], obtendo-se [gi, [gk, [f, gl]]] = [gl, [gi, [f, gk]]].
3. Tomando X = [f, gi], tem-se:
[gk, [f, X]] + [X, [gk, f ]] + [f, [X, gk]] = 0
[gk, [f, X]]− [X, [f, gk]]− [f, [gk, X]] = 0 (anti-simetria) (5.3.13)
A partir do colchete do meio da última expressão, segue:
[[f, gi], [f, gk]] = [[f, gi], Y ] = −[Y, [f, gi]] (5.3.14)
5.3. ANÁLISE DE CONTROLABILIDADE 107
onde Y = [f, gk]. Utilizando a identidade de Jacobi no colchete obtido, segue que
[Y, [f, gi]] + [gi, [Y, f ]] + [f, [gi, Y ]] = 0
[Y, [f, gi]]− [gi, [f, Y ]] + [f, [gi, Y ]] = 0 (anti-simetria)
[Y, [f, gi]] = [gi, [f, Y ]]− [f, [gi, Y ]] = A−B (5.3.15)
Substituindo-se (5.3.14) e (5.3.14) em (5.3.13) mostra-se o resultado que
[gi, [f, [f, gk]]] + [gk, [f, [f, gi]]] = 2[f, [gi, [f, gk]]].
Fazendo uso dos resultados dos Lemas acima, apresenta-se, a seguir, uma esboço da
demonstração da Proposição 5.3.5.
Demonstração. Para que o sistema seja acessível ou controlável, a álgebra obtida a
partir dos campos vetoriais do sistema de controle, segundo o colchete de Jacobi-Lie,
deve gerar um espaço dimQ = 2(3 + (N − 1)) = (2N + 4)-dimensional. Logo, basta
avaliar os primeiros 2N + 4 elementos da álgebra que são linearmente independentes
(L.I.) entre si. Como discutido na Seção 4.2.1, o número máximo de entradas m do
sistema de N -corpos é m 6 N +(N − 1) = 2N − 1. Por exemplo, o sistema de 2-corpos
pode ser concebido com duas entradas de propulsão e uma relativo ao torque de junta.
Neste caso sistema de controle é parametrizado por 3 elementos de entrada. Um sistema
com N corpos tem a entrada parametrizada por N + 1 elementos.
5.3. ANÁLISE DE CONTROLABILIDADE 108
O jacobiano do campo vetorial f em (5.3.11) é dado por
Df =
01×3 · · · 0 · · · 1/m∗ 0
01×3 · · · 0 · · · 0 1/m∗
01×3 · · · Xθ · · · 0 0
01×3 · · · Xφ1 · · · 0 0
01×3 · · · ... · · · 0 0
01×3 · · · XφN−1· · · 0 0
03×3 03×(i−1) 03×1 03×(N−1−i) 03×1 03×1
01×3 · · · Xpφ1· · · 0 0
01×3 · · · ... · · · 0 0
01×3 · · · XpφN−1· · · 0 0
0 · · · 0 · · ·0 · · · 0 · · ·
Xθ(pφ) · · · Xθ(pθ, pφj ) · · ·Xφ1(pφ) · · · Xφ1(pθ, pφj ) · · ·
... · · · ... · · ·XφN−1
(pφ) · · · XφN−1(pθ, pφj ) · · ·
03×1 03×(i−1) 03×1 03×(N−1−i)
Xpφ1(pθ, p
2φ) · · · Xpφ1
(p2θ, p
2φj
, pφi) · · ·... · · · ... · · ·
XpφN−1(pθ, p
2φ) · · · XpφN−1
(p2θ, p
2φj
, pφi) · · ·
(5.3.16)
para 1 6 i, j 6 N − 1 e j 6= i. Na matriz acima os componentes representados por
X(.) correspondem a derivada parcial dos elementos do campo f , tomados na mesma
direção ou linha, em relação a variável (.). Com o fim de não carregar excessivamente a
notação das expressões, observe que embora todas sejam funções dos ângulos de junta φ,
apenas os momentos p(.) são representados como parâmetros dos elementos X na matriz
acima. Isto se justifica uma vez que os X são dependentes das variáveis φ através de
funções trigonométricas e, portanto, as derivadas parciais dos X sempre rendem funções
dos mesmos φ. Alternativamente, os X são funções lineares ou, no máximo, funções
de segunda ordem dos momentos p(.). Esta constatação é importante na análise para
determinação do limite de construção de elementos da álgebra com novas direções, ou
componentes não nulos, através do colchete de Jacobi-Lie. Em símbolos e generalizando
a situação acima para colchetes de qualquer grau, tem-se:
(adkigi
f)(z) = Dkipφj
Xpφj(φ, . . .) (5.3.17)
5.3. ANÁLISE DE CONTROLABILIDADE 109
ki = 0, 1, 2, . . ., i = mp, . . . , m, j = i −mp = 1, . . . , N − 1. Se ki > 2, para ∀i, então(adki
gif)(z) = 0.9
A demonstração esboçada a seguir é construtiva: a estrutura dos colchetes dos campos
vetoriais de graus crescentes da álgebra de acessibilidade são analisados de maneira que
os elementos linearmente dependentes sejam identificados e eliminados da contagem até
que a dimensão do espaço de momento, dado pelo número 2N + 4, seja atingido.
Considere a álgebra dada através do colchete de Jacobi-Lie dos campos vetoriais do sis-
tema. Observe, a partir da expressão do campo vetorial f dado em (5.3.11), de (5.3.12),
e de (5.3.16), que é possível gerar campos vetoriais com componentes não nulos em todas
as linhas do vetor que representa o campo vetorial obtido pelo colchete de Jacobi-Lie.
Faz-se necessário identificar os colchetes que são linearmente dependentes e eliminá-los
da contagem dos elementos da álgebra que geram o espaço Q. Logo, para o modelo
de um sistema com N corpos valem os seguintes, independente da parametrização do
espaço Q escolhida:
Os colchetes de primeiro grau totalizam m+1 elementos da álgebra. Se todas as juntas
são atuadas, mt = N − 1, e q 6= 0, a álgebra de grau um fornece, ao máximo, N + 2
elementos L.I.: N + 1 devido às entradas se dois propulsores forem utilizados mais 1
relativo a dinâmica livre f ; e N + 3 elementos L.I.: N + 2 devido às entradas com três
ou mais propulsores mais 1 da dinâmica livre f . Quando z = 0, f se anula e o número
máximo de elementos L.I. é sempre N + 1, para dois ou mais propulsores.
O número total de colchetes de segundo grau totalizam um arranjo de m + 1 elementos
tomados dois a dois, ou seja, A(m+1),2 = m(m + 1). No entanto, da propriedade de
anti-simetria do colchete de Jacobi-Lie e utilizando o Lemma 5.3.6, apenas m elemen-
tos, seriam L.I.. Como alguns destes m elementos são colchetes de campos vetoriais que
foram eliminados na análise de colchetes de grau um, por serem linearmente dependen-
tes, a análise prossegue. Quando B é totalmente atuado e q 6= 0, a álgebra de grau dois
fornece, ao máximo, N + 1 elementos L.I., devido às entradas se dois propulsores forem
utilizados, e N + 2 elementos L.I., devido às entradas com três ou mais propulsores.
Quando q = 0, o número máximo de elementos L.I. é sempre N + 1, para dois ou mais9Utilizando indices múltiplos, para agrupar derivadas em relação a mesma variável, tem-se a seguinte
expressão geral
(adkilgil
f)(z) =Y
l=1
D
P=il
kilpφjl
Xpφjl(φ, . . .) (5.3.18)
5.3. ANÁLISE DE CONTROLABILIDADE 110
propulsores.
Os colchetes de terceiro grau contam com um total de (m − 1)m(m + 1) elementos, o
que corresponde a um arranjo de m + 1 tomados três a três. Entretanto, utilizando a
identidade de Jacobi e o Lema 5.3.7, apenas m + Sm ou 2m + Cm,2 colchetes seriam
L.I., onde Cm,2 = m(m + 1)/2 é uma combinação de m elementos tomados dois a dois.
Observe que elementos da forma [gk, [f, gj ]], onde j, k = 1, . . . , mt, apenas contribuem
com elementos L.I. para a álgebra quando j 6= k. Com isto, mt elementos devem ser
desconsiderados acima pois são L.D.. Portanto, tem-se que m + Sm −mt elementos de
grau três são candidatos a completarem a distribuição da álgebra de forma que a sua
dimensão seja dimT ∗Q = 2N +4. Para qi, pi 6= 0, os colchetes obtidos até grau três são
suficientes para gerarem o fibrado cotangente T ∗Q.
Os colchetes de grau quatro são necessários à análise apenas para sistemas com dois
propulsores e quando z = 0. Este fato foi confirmado através de avaliações simbólicas
com modelos dos sistemas de 2 e 3 corpos. Os colchetes de grau quatro são A(m+1),4 =
(m+1)m(m−1)(m−2) no total. Utilizando o Lema 5.3.8 pode-se separar os elementos
em grupos:
• m: com estrutura [f, [f, [f, gj ]]]
• m: dados por [f, [gj , [f, gj ]]], que são iguais aos [gj , [f, [f, gj ]]]
• Am,2: com a forma [gj , [f, [f, gk]]] e [gk, [f, [f, gj ]]]
• Cm,3: com estrutura [gj , [gl, [f, gk]]]
• Am,2: com estrutura [gj , [gj , [f, gk]]] e [gj , [gk, [f, gk]]]
• mp: com estrutura [gj , [gj , [f, gj ]]]
No ponto z = 0, o campo vetorial da dinâmica livre f se anula (f(0) ≡ 0), assim como
todos os elementos com estrutura [f, . . . , [f, gi]], com grau maior ou igual que três, pois
todos os componentes não nulos do campo vetorial são lineares nos momentos. Para
z = 0 apenas um determinado grupo de elemento contribui para a álgebra. Este grupo
é caracterizado por campos vetoriais em que alguns componentes são funções afim nos
momentos. Como comentado no início da demonstração, as dinâmicas dos momentos
angulares, presente em f , são polinômios de segundo grau das coordenadas que repre-
sentam os momentos angulares. Após um número sucessivo de diferenciações parciais,
5.3. ANÁLISE DE CONTROLABILIDADE 111
determinado pelos jacobianos da iteração com colchete de Jacobi-Lie dos elementos de
álgebra, o grau dos polinômios decresce até o zero e, finalmente, o polinômio se anula.
Quando o polinômio possui grau zero, este é dado apenas por um valor independente
da coordenada do momento angular que corresponde a aquela direção. Logo, este valor
nunca se anula em z = 0. Sob uma determinada combinação iterativa dos elementos da
álgebra de acessibilidade, pode-se obter campos vetoriais com elementos não nulos nas
direções, ou componentes, que faltam para completar o número de geradores do espaço
fibrado T ∗Q e, desta forma, atingir a dimensão dimT ∗Q desejada.
Resultados em que uma ou mais juntas não são atuadas, ou seja, são deixadas passivas,
devem ser consideradas com maior atenção. Neste caso, devido a ausência do torque de
junta, não existe o cancelamento do efeito das forças de propulsão nas juntas passivas,
como considerado no segundo caso de parametrização dos torques de juntas adotada na
Seção 4.2.1. Logo, a modelagem do efeito das forças de propulsão nas juntas passivas
deve ser considerada na análise de controlabilidade do sistema multi-articulado. É
possível verificar que o sistema de 2-corpos é acessível, a partir de todo z 6= 0, através
da análise da sub-álgebra obtida pelos colchetes, a partir dos dois campos vetoriais de
propulsão, com até grau três; semelhantemente ao caso acima em que todos as juntas
do sistema são atuadas.
Faz-se importante observar que controlabilidade linear implica na controlabilidade não
linear avaliado através do colchete de Jacobi-Lie. A implicação inversa, em geral, não
é satisfeita. Embora o critério de controlabilidade “não-linear”, verificado pelo cálculo
das distribuições sucessivas em função dos campos vetoriais, seja atendido, o sistema
não é controlável, como mostra a análise de posto pleno, segundo o critério de Kal-
man10, da aproximação linear da dinâmica do sistema, provida pelo truncamento da
expansão em série de Taylor das equações de movimento do sistema na primeira par-
cela (linear). Esta aparente contradição dos resultados de análise pode ser facilmente
desfeita se considerado que a análise de controlabilidade não linear estabelece “novas”
direções possíveis de movimento construídas através de deslocamentos sucessivos - e
infinitesimais se necessário - nas direções que são diretamente atuadas. Ou seja, avalia
o movimento nas direções que não são atuadas em função do movimento nas direções
que são diretamente controladas. Como comentado anteriormente, esta avaliação é re-
alizada em função da comutação de curvas integrais dos campos vetoriais do sistema.10Verificado nos pontos z do espaço de fase que não tornam a aproximação linear do sistema dege-
nerada, ou seja, quando a matriz Df(z) perde estrutura devido ao ponto z escolhido.
5.4. CONCLUSÃO 112
Em contraste, o critério de controlabilidade linear fornece um resultado instantâneo,
independente do movimento; podendo-se associar a idéia de controlabilidade estática.
Como será discutido no próximo capítulo, são necessárias três ou mais entradas de
propulsão de modo a tornar o sistema linearmente controlável na origem do espaço de
fase T ∗Q.
5.4 Conclusão
Nos parágrafos acima, foram revisados alguns critérios de controlabilidade para a aná-
lise de sistemas não-lineares. Alguns destes foram aplicados aos modelos cinemático e
dinâmico do sistema de 2 e 3 corpos. Apresentou-se uma generalização do critério de
acessibilidade para um sistema de N corpos da classe considerada.
113
Capítulo 6
Estabilização e Planejamento de
Trajetórias
Avalia-se, a seguir, as condições e os métodos em que o sistema multi-articulado permite
ser estabilizado. Assim como para a discussão de controlabilidade no capítulo anterior,
a análise das distribuições geradas pelos campos vetoriais do sistema, em especial das
características dos campos vetoriais relativos às entradas, é decisiva na determinação
destas condições e métodos.
Uma estratégia possível para a estabilização do sistema, em torno dos pontos de equi-
líbrio, consiste em aplicar técnicas de estabilização clássicas ao modelo linearizado do
sistema. Neste caso, o projeto do controlador consiste simplesmente em projetar uma
matriz de ganhos1, alocando os pólos do sistema linear em malha fechada, de modo a
tornar o sistema estável e com propriedades dinâmicas bem determinadas.
Com vista à estabilização de versões lineares do modelo do sistema, emprega-se um
método de linearização por realimentação, (Hunt, Su e Meyer, 1983; Isidori, 1995), a
alguns casos do modelo não linear do sistema, como apresentado no Capítulo 4. Nos
casos em que o sistema não é totalmente controlável no espaço de fase, no entanto, outras
técnicas são empregadas para compensar o baixo número de entradas do sistema. Neste
caso, considerou-se a seguir a teoria de análise da estabilidade de Lyapunov para o
projeto do controle de estabilização do sistema (Khalil, 2002).1Várias técnicas são disponíveis para a determinação do ganho de realimentação, como técnica de
controle linear robusto H∞, por exemplo.
6.1. ESTABILIZAÇÃO 114
6.1 Estabilização
A estabilização2 do sistema a um ponto do espaço de fase é desejado em muitas situações
práticas, como o posicionamento do sistema em relação a um referencial inercial, por
exemplo. A definição de estabilização para o corpo rígido, cujo modelo é apresentado
no Apêndice C, é feita abaixo.
Definição 6.1.1 (Estabilização Assintótica do Corpo Rígido). Sejam dados os campos
vetoriais da dinâmica livre f(q, p) e de entrada g1(q) e g2(q) que definem um corpo
rígido com dois propulsores. O ponto (q, p) = (q0, 0) é equilíbrio do sistema, para
qualquer q0 ∈ Q. Estabilizar o sistema f no equilíbrio consiste em regular o sistema em
(q0, 0) utilizando uma lei de realimentação τ = g1u1 + g2u2, para as funções de controle
ui = ui(q, p).
Quando o ponto final z0 corresponde a um ponto de equilíbrio estável, isto é f(q) = 0,
e na ausência de distúrbios externos, então pode-se tomar u(.) ≡ 0 após a estabilização
em z0. Isto pode não ser verdade para um ponto final z0 que não seja um ponto de
equilíbrio ou quando este é um ponto de equilíbrio instável, uma vez que qualquer
perturbação, não modelada na dinâmica nominal f , leva o sistema a deixar a condição
de estabilidade. A definição do problema de estabilização para um sistema de N corpos
é feita a seguir.
Definição 6.1.2 (Estabilização Sistema Multi-Articulado). Sejam dados os campos
vetoriais da dinâmica livre f(q, p) e de entrada g1(q), . . . , gm(q) que definem o modelo
dinâmico do sistema multi-articulado. Seja z0 um ponto no espaço de fase de equilíbrio
do sistema multi-articulado obtido a partir do modelo do sistema. A estabilização
assintótica da dinâmica do sistema consiste em determinar funções de controle u(q, p) ∈U , onde u = (u1, . . . , um) e
τ = g1(q)u1 + . . . + gm(q)um
de maneira que o estado do sistema no espaço de fase seja levado um ponto de equilí-
brio z0 em tempo finito e partindo de um ponto inicial pertencente a uma vizinhança
suficientemente pequena de z0.2Observe que a estabilização é um realizada mediante funções de controle em malha fechada, ao passo
que o procedimento denominado “Planejamento de trajetórias”, discutido posteriormente, é realizado
em malha aberta.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 115
Os resultados de estudo e implementação de estratégias de realimentação visando a
estabilização do sistema são apresentados.
6.2 Linearização por Realimentação
A linearização por realimentação representa um método de linearização exata, em con-
traste com a linearização por truncamento da série de Taylor, relativo às equações
dinâmicas do sistema. Quanto a linearização por Taylor, faz-se necessária a realização
de simulações com fim na validação do modelo linear em relação ao não-linear original.
Seja o sistema dinâmico afim nas entradas dado por
z = f(z) +m∑
i=1
gi(z)ui = f(z) + G(z)u
y = h(z) (6.2.1)
A linearização por realimentação consiste da determinação de uma lei de realimentação
do estado da forma
u(z) = α(z) + β(z)v,
onde α e β são operadores obtidos em relação aos campos vetoriais do sistema e v repre-
senta a nova entrada do sistema composto, aliado a uma transformação de coordenadas
Φ(z) de maneira a obter uma versão linear do sistema. Como ambas as operações não
são válidas globalmente, isto é, para todo z ∈ P , a linearização por realimentação é um
procedimento geralmente com validade local, ou seja, válida em uma vizinhança de um
ponto z0. Os operadores α e β são obtidos por, (Isidori, 1995):
α(z) = −A−1(z)b(z)
β(z) = A−1(z)
onde, para o grau de relatividade do sistema r1, . . . , rm, a matriz A é obtida, em
função da derivada direcional L dos campos f e g e da função h, pela expressão
A(z) =
Lg1Lr1−1f h1(z) · · · LgmLr1−1
f h1(z)
Lg1Lr2−1f h1(z) · · · LgmLr2−1
f h2(z)
· · · ... · · ·Lg1L
rm−1f hm(z) · · · LgmLrm−1
f hm(z)
, (6.2.2)
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 116
de maneira que esta seja não singular em uma vizinhança de z0; e o vetor coluna b é
dado por
b(z) =
Lr1f h1(z)
Lr2f h2(z)
...
Lrmf hm(z)
(6.2.3)
A transformação de coordenadas ξ = Φ(z) é dada pelo seguinte difeomorfismo
Φ(z) =
L0fh1(z)
Lk−1f h1(z)
...
Lk−1f hi(z)
...
Lrmf hm(z)
, 1 6 k 6 ri, 1 6 i 6 m
obtendo-se uma dinâmica linear do sistema
ξi1 = ξi
2
... =...
ξiri−1 = ξi
ri
ξiri
= bi(ξ) + A(ξ)iu
onde Ai é a i-ésima linha da matriz A.
Em geral o sistema na forma linear, escrito nas novas coordenadas, fornece uma de-
composição da dinâmica controlável e da dinâmica zero, usualmente representada por
η = fcn(ξ, η), (Isidori, 1995). A dinâmica zero está relacionada com os zeros de trans-
missão da aproximação linear do modelo não-linear do sistema. Entretanto, esta não
será importante para a análise de estabilização do sistema em consideração.
Observe que, aplicando (6.2.2) e (6.2.3) nas equações acima sob as novas coordenadas,
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 117
obtém-se o sistema linear e controlável ξ = Aξξ + Bξv, onde, para j = 1, . . . , m, tem-se
Aξ = diag(Aj), Aj =
0 1 0 · · · 0
0 0 1... 0
...... · · · · · · ...
0 0 0 · · · 1
0 0 0 · · · 0
e
Bξ = diag(bj), bj =
0
0...
0
1
Para estabilizar o sistema linearizado, pode-se impor uma realimentação do estado ξ,
segundo v = Kξ, onde K é uma matriz de ganhos, através de métodos de controle
lineares como H∞ ou Linear Quadrático (LQ), por exemplo, ou ainda por técnicas de
controle clássicas.
Definição 6.2.1. Sejam as distribuições Gi determinadas pelos campos vetoriais do
sistema através da expressão
Gi = spangj , . . . , adlfgj , j = 1, . . . , m, 0 6 l 6 i
onde o operador ad é definido na Seção A.1.
Teorema 6.2.1 (Linearização por Realimentação: (Isidori, 1995)). Seja o sistema dinâ-
mico (6.2.1), onde dim z = n e dimh(z) = dim g(z), ou seja, os espaços de entradas u e
saídas y do sistema possuem mesma dimensão3. (6.2.1) é linearizável por realimentação
em uma vizinhança do ponto z0 se e somente se
• as distribuições Gi, para 0 6 i 6 n − 1, possuírem dimensão constante em uma
vizinhança de z0;
• a distribuição Gn−1 tiver dimensão n;
• as distribuições Gi, para 0 6 i 6 n− 2, forem involutivas.3Sistemas quadrados.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 118
Note que este corresponde a um resultado local, ou seja, válido apenas em uma vizi-
nhança de um ponto z0 do espaço de estados.
Outros resultados prevêem a linearização entrada-estado do sistema, ver as referências
(Charlet, Lévine e Marino, 1989), (Charlet, Lévine e Marino, 1991) e (Krener, 1999),
de certa forma abrangendo a limitação de considerar sistemas quadrados para sistemas
com número de entradas e saídas diferentes, se tomadas as saídas equivalentes ao estado.
Determinou-se, entretanto, que as distribuições G1 dos campos vetoriais dos sistemas de
2 e 3 corpos, com apenas duas entradas de propulsão, não são involutivos. Conseqüen-
temente, nestes casos, não é possível verificar as condições que tornam o sistema lineari-
zável por realimentação. Em geral, é possível mostrar que todo sistema multi-articulado
da classe considerada e com apenas duas entradas de propulsão possui distribuições não
involutivas.
Proposição 6.2.2. Seja o sistema multi-articulado dado, na forma afim, por (5.3.2)
com duas entradas de propulsão. Então existe pelo menos uma distribuição Gi não
involutiva.
Demonstração. Apresenta-se primeiramente um resultado que será útil na seqüência.
Uma distribuição D(q) ⊂ TqQ é involutiva, para todo q ∈ Q, se seguinte igualdade for
verdadeira
dim(spanX1(q), . . . , Xd(q)) = dim(spanX1(q), . . . , Xd(q), [Xi, Xj ](q)) (6.2.4)
para 1 6 i, j 6 d e onde X1, . . . , Xd ∈ D e dimD = d.
Para provar a proposição faz-se importante observar que ela é conseqüência direta da
Proposição 5.3.5, uma vez que a acessibilidade do sistema nunca é alcançada apenas
com os colchetes de primeiro ou segundo graus.
A distribuição G0 sempre será involutiva uma vez que contém apenas os campos vetoriais
da entrada gj e, do Lema 5.3.6, os colchetes de Jacobi-Lie dos gj sempre são nulos, ou
seja, não contribuem com novas direções.
Os elementos que compõe a álgebra G1 são da forma [f, gj ]. Para q 6= 0, por exemplo, a
distribuição G1 possui dimensão máxima igual a 2m < n, ou seja, os colchetes de grau
dois de G1 não possui a mesma dimensão do espaço de fase do sistema. No entanto, a
partir da análise da álgebra de acessibilidade da Proposição 5.3.5, apenas com a álgebra
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 119
2-corpos (n = 8) mp = 2 (m = 3): sub-atuado dimG0 = 3, dimG1 = 6
3-corpos (n = 12) mp = 2 (m = 4): sub-atuado dimG0 = 4, dimG1 = 8
mp = 3 (m = 5): atuado dimG0 = 5, dimG1 = 10
mp = 2 (m = 5): sub-atuado dimG0 = 5, dimG1 = 10
4-corpos (n = 12) mp = 3 (m = 6): atuado dimG0 = 6, dimG1 = 12
mp = 4 (m = 7): sobre-atuado dimG0 = 6, dimG1 = 12
mp = 2 (m = 6): sub-atuado dimG0 = 6, dimG1 = 12
5-corpos (n = 14) mp = 3 (m = 7): atuado dimG0 = 7, dimG1 = 14
mp = 4 (m = 8): sobre-atuado dimG0 = 7, dimG1 = 14
mp = 5 (m = 9): sobre-atuado dimG0 = 7, dimG1 = 14
Tabela 6.1: Dimensão das primeiras distribuições Gi dos sistemas com N 6 5, para
z 6= 0. As atribuições sub-atuado, atuado e sobre-atuado designam, respectivamente,
sistemas com número menor, igual e maior de entradas que a dimensão do espaço de
configuração Q correspondente.
dos colchetes de grau menor e igual a três é possível verificar esta condição. Logo, é
possível gerar as direções restantes do espaço de fase com os elementos de G1, gerando
produtos da forma [gk, [f, gj ]], k 6= j. Logo, de (6.2.4), a distribuição G1 não é involutiva.
Para z = 0, a argumentação para a não involutividade de G2 é análoga a acima.
Logo, o sistema multi-articulado proposto com apenas duas entradas de propulsão nunca
é linearizável por realimentação.
Exemplo 6.2.3. Resume-se na tabela abaixo as distribuições G0 e G1 para alguns sis-
temas e casos de entradas de propulsão. O espaço de base B é totalmente atuado por
torques nas juntas.
Os sistemas com N > 3 com três ou mais entradas de propulsão, entretanto, são sempre
linearizáveis por realimentação estática, pois G0, dimG0 < n, é sempre involutiva e Gi
i > 1 são sempre involutivas, dado que dimGi = n.
Exemplo 6.2.4. Apresenta-se a seguir um resultado de estabilização do sistema de 3-
corpos com três entradas de propulsão. O sistema possui m = 5 entradas e n = 10
estados.
A função de saída escolhida é dada apenas pela configuração q ∈ Q por h(z) = q, ou
seja, h(q) = (rx, ry, θcm, φ1, φ2). Com isto, o sistema possui grau de relatividade ri = 2,
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 120
para i = 1, . . . , 5. A transformação de coordenadas para obter ξ através de Φ é realizada
segundo
Φ(z) =
h1(q)
Lfh1(q)
h2(q)
Lfh2(q)
h3(q)
Lfh3(q)
h4(q)
Lfh4(q)
h5(q)
Lfh5(q)
=
rx
vx/m∗
ry
vx/m∗
θcm
Lfh3(q)
φ1
Lfh4(q)
φ2
Lfh5(q)
Empregando-se uma realimentação do estado ξ, projetou-se uma matriz de ganhos K de
maneira que os pólos do sistema (Aξ, Bξ) em malha fechada sejam estáveis e localizados
no plano complexo em
−1.0± 1.0i
−1.0± 1.0i
−1.4± 1.0i
−1.5± 1.0i
−1.5± 1.0i
As Figuras 6.1 e 6.2 mostram os resultados de estabilização do sistema de 3-corpos.
Uma possível solução para estabilizar sistemas com menos de três entradas de propul-
são consiste em adicionar integradores ao sistema, obtendo-se um sistema estendido de
maneira que as distribuições Gi geradas, a partir deste sistema estendido, sejam involu-
tivas. O procedimento que lineariza de forma exata o sistema, empregando este método
acima, é conhecido como linearização por realimentação dinâmica, em contraste com
o método anterior utilizado acima, em que a linearização por realimentação é estática.
A designação dos termos “estática” e “dinâmica”, para os métodos de linearização por
realimentação, referem-se ao fato dos compensadores obtidos pelo método dinâmico pos-
suírem uma dinâmica interna e regida por equações diferenciais de estados internos. Em
contraste, nos compensadores obtidos pelo método estático, a realimentação é realizada
por uma equação algébrica, sem dinâmica interna.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 121
0 1 2 3 4 5 6−10.05
−10
−9.95
−9.9
−9.85
tempo (s)
coor
dena
da x
(m
) xyθ
(a) Deslocamento do centro do massa rx.
0 1 2 3 4 5 6−5.15
−5.1
−5.05
−5
−4.95
tempo (s)
coor
dena
da y
(m
) xyθ
(b) Deslocamento do centro do ry.
0 1 2 3 4 5 61.95
2
2.05
2.1
time (s)
com
pone
nte
φ 1 (ra
d)
φ1
φ2
pφ1
pφ2
(c) Trajetória do ângulo de junta φ1.
0 1 2 3 4 5 6−2.1
−2.05
−2
−1.95
tempo (s)
coor
dena
das
φ 2 (ra
d)φ
1φ
2pφ
1pφ
2
(d) Trajetória do ângulo de junta φ2.
0 1 2 3 4 5 6−1.58
−1.575
−1.57
−1.565
−1.56
−1.555
−1.55
−1.545
−1.54
−1.535
−1.53
tempo (s)
coor
dena
da θ
(ra
d)
xyθ
(e) Trajetória da orientação θcm.
Figura 6.1: Resultados da estabilização da configuração no ponto
(−9.90,−5.10,−1.55, 2.00, −2.00) do sistema de 3-corpos, através de linearização
por realimentação.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 122
0 1 2 3 4 5 6−0.25
−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
0.2
0.25
tempo (s)
px
py
pθp
x
pθ
py
(a) Trajetórias dos momentos da fibra px, py, pθcm .
0 1 2 3 4 5 6−0.1
−0.08
−0.06
−0.04
−0.02
0
0.02
0.04
0.06
0.08
0.1
tempo (s)
coor
dena
das
p φ 1, pφ 2 (
mK
g2 /s)
φ1
φ2
pφ1
pφ2
(b) Trajetórias dos momentos do espaço de base pφ1 , pφ2 .
Figura 6.2: Resultados da estabilização do momento do sistema de 3-corpos, através de
linearização por realimentação.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 123
6.2.1 Linearização por Realimentação Dinâmica
Sabe-se, como comentado em Charlet et al. (1991), que o corpo rígido não é linearizável
por realimentação estática. Isto se deve à qualidade das distribuições geradas pelos
campos vetoriais do sistema de controle do corpo rígido não serem involutivas. A versão
plana do mesmo sistema, assim como o modelo do uniciclo no plano (Respondek, 2002),
igualmente não pode ser linearizado por uma lei de realimentação estática. Uma maneira
de contornar esta limitação destes sistemas, de maneira a permitir a estabilização do
sistema via linearização por realimentação, constitui na adição de integradores à função
de realimentação (Charlet et al., 1989; Krener, 1999).
Em (Battilotti e Califano, 2004) encontra-se um algoritmo para determinar os índices µ
tais que o sistema seja linearizável por prolongamentos. A aplicação do mesmo mostrou-
se, no entanto, demasiadamente complexa com a classe de sistemas em estudo; inclusive
com o exemplo de sistema mais simples com apenas 2-corpos.
Considere um sistema controlável na forma afim
z = f(z) +m∑
i=1
gi(z)ui = f(z) + G(z)u (6.2.5)
Definem-se as distribuições em relação ao sistema afim acima
∆0 = spangk : µk = 0∆i + 1 = ∆i + adf∆i + spangk : µk = i + 1, i ≥ 0
Note, pela definição, que valem as relações ∆0 ⊂ ∆1 ⊂ · · · ⊂ ∆i · · · .
Usando a notação de diferenciação de ordem genérica, em que u(µ) corresponde a deri-
vada da função dµu/dtµ, o compensador com realimentação dinâmica aqui considerado
é da forma, (Charlet et al., 1991):
u(µ1)1...
u(µm)m
= α(z, ζ) + β(z, ζ)
v1
...
v′m
onde ζ representa um estado interno ao compensador e v(.), as novas entradas do sistema
em malha fechada. O sistema em malha fechada fica, então, definido pela dinâmica
z = f(z) + G(z, ζ)α(z, ζ) + G(z, ζ)β(z, ζ)v
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 124
onde a nova entrada é dada por v ∈ Rm′ . O compensador acima pode ser realizado pela
integração “pura” do sinal de entrada v, conforme (Battilotti e Califano, 2004):
uj = ζj(1), (6.2.6)
ζj = Ajζj + Bjvj , j = 1, . . . , m (6.2.7)
onde
Aj =
[0(µj−1)×1 I(µj−1)
0 01×(µj−1)
]
µj×µj
Bj =
[0(µj−1)×1
1
]
µj×1
onde ζj ∈ Rµj . Em (6.2.6), faz-se uj = vj quando µj = 0.4 O sistema em malha fechada
fica, então, definido pela seguinte dinâmica
z = f(z) + G(z, ζ)α(z, ζ) + G(z, ζ)β(z, ζ)v (6.2.8)
ζ = Aζ + Bv (6.2.9)
com entrada v ∈ Rm′ . Quando m′ = m, pode-se escolher a saída do sistema como u.
As condições suficientes para linearização local por realimentação dinâmica devem-se
do seguinte resultado.
Teorema 6.2.5 (Linearização por Realimentação Dinâmica - Suficiência (Charlet et al.,
1991)). Se existirem inteiros 0 ≤ µ1 ≤ · · · ≤ µm, tais que, em uma vizinhança de x0,
• ∆i sejam involutivos e dimensão constante para 0 ≤ i ≤ n + µm − 1
• dim(∆n+µm−1) = n
• [gs, ∆i] ⊂ ∆i+1, ∀s tal que µs ≥ 1 e ∀i, 0 ≤ i ≤ n + µm − 1,
então (6.2.5) é localmente linearizável por realimentação dinâmica com indices de pro-
longamento µ1, . . . , µm.
Observação 6.2.1. O Teorema acima diz que se o sistema é acessível, se as distribuições
∆s são involutivas - que também representam a condições necessárias - e se [gs, ∆i] ⊂∆i+1, então o sistema é dinamicamente linearizável por realimentação.
4Em um sistema linearizável por realimentação dinâmica pelo método de linearização por reali-
mentação com prolongamentos, pelo menos um dos índices de prolongamentos deve ser nulo, ou seja,
0 = µ1 ≤ µ2 ≤ · · · ≤ µm.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 125
6.2.2 O Sistema Multi-Articulado
Considere um exemplo de aplicação do método acima ao sistema de 2-corpos.
Exemplo 6.2.6. Considere o sistema de 2-corpos onde o número de estados é dado por
n = 8 e o número de entradas m = 3. Aplica-se o Teorema 6.2.5 acima ao modelo do
sistema de 2-corpos.
Após algumas iterações de tentativa e erro, obteve-se os seguintes índices de prolonga-
mento µ = [µ1, µ2, µ3] = [0, 4, 4] para o sistema de 2-corpos. Observe que, para µ dado
acima, e de acordo com o Teorema (6.2.5), é necessário verificar as distribuições ∆i,
para 0 ≤ i ≤ n + µm − 1 = 11. Vale mencionar que os sistemas multi-corpos em geral,
do qual a classe de sistemas aqui proposta faz parte, são caracterizados por equações de
movimento racionais, isto é, por funções das variáveis de estado no denominador de
frações, originários do acoplamento do tensor de inércia. Isto representa um entrave
de considerável dificuldade no cálculo iterativo dos colchetes de Lie, uma vez que podem
resultar no aumento progressivo da complexidade das funções componentes dos campos
vetoriais. Logo, calcular distribuições de colchetes de Lie de ordem elevadas de certos
sistemas, pode representar uma tarefa quase impraticável.
No entanto, no decurso das primeiras iterações, pôde-se observar que nem todas as dis-
tribuições precisaram ser verificadas. No que diz respeito às duas primeiras condições
suficientes do Teorema (6.2.5), observou-se que foi necessária a verificação das distribui-
ções até, e incluindo, ∆5, uma vez que dim∆i = n = 8, para i ≥ 5, sendo involutivas5.
Isto permite evitar o cálculo de colchetes de Lie com campos vetoriais de ordem elevada,
isto é, maiores que os contidos em ∆5, pois não agregam direções alcançáveis adicionais
no espaço cotangente T ∗q Q, sendo, portanto, desnecessárias.
Para atender a terceira condição suficiente do Teorema (6.2.5), assim como nos dois
primeiros, não se faz necessário calcular todas as relações [gs, ∆i] ⊂ ∆i+1, para 0 ≤i ≤ n + µm − 1. Pode-se observar, como comentado em (Charlet et al., 1991), que as
primeira e terceira condições são parcialmente redundantes.
Logo, é suficiente verificar apenas as condições [gj , ∆i] ⊂ ∆i+1, tal que µj > i + 1 e5Uma distribuição regular D ⊂ TQ ∼ Rn tal que dim D = n é sempre involutiva, pois o colchete de
Lie dos campos vetoriais que a geram nunca contribuirão para alterar a dimensão de D.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 126
i ≥ 0. Ou seja,
[gj ,∆0] ⊂ ∆1
[gj ,∆1] ⊂ ∆2
[gj ,∆2] ⊂ ∆3
para j = 2, 3 apenas, uma vez que µ1 = 0. Utilizando os índices de prolongamentos
dados por µ = [0, 4, 4], a lei de realimentação dinâmica é dada por
u1 = v1,
u2
ζ2(2)
ζ2(3)
ζ2(4)
=
ζ2(1)
ζ2(3)
ζ2(4)
v2
,
u3
ζ3(2)
ζ3(3)
ζ3(4)
=
ζ3(1)
ζ3(3)
ζ3(4)
v3
Neste caso a saída do sistema é dada por u = (v1, ζ2(1), ζ3(1))T .
Note que neste caso, o difeomorfismo ϕ, relativo a transformação de coordenadas de z
para z′, é constante e dado pela matriz identidade.
Não obstante a verificação de atendimento do sistemas multi-corpos para com todos os
ítens do Teorema 6.2.5, uma condição necessária para a linearização por realimentação
dinâmica consiste da controlabilidade linear, na origem, ou seja, a aproximação linear
(por Taylor) do sistema afim deve ser controlável na origem. As versões lineares dos
modelos do corpo rígido e do sistema multi-corpos com duas entradas de propulsão não
são controláveis em z 6= 0, como pode-se facilmente mostrar pelo critério de Kalman, e
na origem, pois rende um jacobiano degenerado, o que qualifica-os como sub-atuados.
Logo, apesar de ser possível obter modelos lineares dos sistema por realimentação dinâ-
mica, estes modelos lineares não são linearmente controláveis e, conseqüentemente, não
estabilizáveis a um ponto de equilíbrio por uma realimentação suave.
Embora seja possível mostrar que o sistema multi-corpos é controlável, criando-se “no-
vas” direções - através dos colchetes dos campos vetoriais do sistema segundo o critério
STLC - até gerar todo o espaço de fase em um ponto de equilíbrio do sistema, a con-
trolabilidade6 determinada pelas parcelas da dinâmica do sistema até a primeira ordem
(linear) ditam até que ponto as entradas podem influenciar a dinâmica do mesmo.
Portanto, sistemas não (linearmente) controláveis não podem ser assintoticamente (ou
suavemente) estabilizados.6Realizada nos pontos z do espaço de fase que não tornam a aproximação linear do sistema degene-
rada.
6.2. LINEARIZAÇÃO POR REALIMENTAÇÃO 127
A estabilização por realimentação não-contínua ou adição de mais uma entrada ao sis-
tema, que não gere componentes no espaço de fase que são linearmente dependentes em
relação as outras entradas, são possíveis soluções.
Pode-se mostrar que o sistema multi-corpos é controlável em um sub-espaço do espaço
de fase que não contém a origem; pois a origem implica na origem do espaço de base B e
das coordenadas φ = 0. Estas representam, como definido acima, um sistema na forma
de uma linha reta. Em princípio seria possível linearizar o sistema por realimentação em
vizinhanças dos pontos deste sub-espaço. Observe, no entanto, que não seria possível
estabilizá-lo em torno da origem, ou seja, partindo ou chegando ao repouso uma vez
que as distribuições se anulam com momentos e configuração nulos. Propõe-se, uma
transformação de variáveis para contornar o problema.
Exemplo 6.2.7. Considere o sistema de 3-corpos com três entradas de propulsão e
com as duas juntas ativas e cujos corpos estão disposto na forma de um triângulo.
Quando todos os corpos são iguais o sistema é simétrico e nesta disposição forma um
triângulo eqüilátero. Neste caso, o sistema não é linearmente controlável pois, apesar
dos dois torques de junta, as três entradas de propulsão não produzem torque em relação
ao centro de massa, dado que as direções de ação das mesmas passam pelo centro de
massa. Note que isto ocorre porque, neste caso, as três forças linearmente dependentes
entre si. Entretanto, o sistema nesta disposição é linearmente controlável nas direções
lineares, o que permite linearizá-lo dinamicamente, pelo método discutido acima por
exemplo, e estabilizá-lo na origem se o mesmo for operado como corpo rígido. Como
os ângulos de junta não são nulos nesta configuração, recorre-se a uma transformação
de coordenadas. Definindo-se esta formação como a nova “origem” do espaço de base
B por uma transformação de coordenadas estática que consiste apenas em reposicionar
a origem no espaço de base B, é possível estabilizar o sistema na origem de Q. A
transformação proposta é dada por
φ′ = φ + 2π/3
Note que, por ser estática, e exceto pela modificação das coordenadas originais φ do
espaço de base B, esta transformação mantém inalteradas as expressões para φ e pφ.
Exemplo 6.2.8. Para um sistema de N -corpos, é sempre possível arranjá-lo na forma
de um polígono convexo de N lados; que se torna regular quando o mesmo for composto
por corpos idênticos. Neste caso particular, as direções das forças de propulsão passam
pelo centro de massa do sistema, ou polígono. Se o número de entradas de propulsão
for mp > 3, ou seja, se o sistema conta com ao menos três entradas de propulsão cujos
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 128
campos vetoriais correspondentes são linearmente independentes, o sistema é controlável
na origem a menos de uma transformação das coordenadas do espaço de base. Excluem-
se do conjunto de campos vetoriais da entrada L.I. os campos vetoriais dados quando o
sistema forma um polígono convexo regular, por exemplo.
6.3 Controle de Sistemas Sub-atuados
Byrnes e Isidori (1991) mostraram que veículos sub-atuados e na ausência de campos
restaurativos, gravitacional e empuxo, por exemplo, não podem ser assintoticamente
estabilizados por uma lei de realimentação do estado de classe C1. Mostrou-se em
(Pettersen e Egeland, 1996) que para campos restaurativos, como os devidos à gravidade
e ao empuxo hidrostático, em geral não é possível estabilizar sistema sub-atuados com
realimentações contínuas ou descontínuas. Nestes casos, a estabilização assintótica é
possível através de uma realimentação do estado cujos termos, da lei de realimentação,
são funções explícitas do tempo.
Como mencionado anteriormente, o presente estudo considera um sistema livre da ação
de campos restaurativos. Por este motivo, uma realimentação contínua ou descontínua
é suficiente para a estabilização assintótica do sistema, como em (Fantoni et al., 1999).
Neste caso, a análise de convergência das leis de controle obtidas seguem da teoria de
estabilidade de Lyapunov (Khalil, 2002). Semelhantemente não é possível estabilizar su-
avemente sistemas não-holonômicos a um ponto de equilíbrio através uma realimentação
suave (Bloch, Reyhanoglu e McClamroch, 1992).
Faz-se necessário a apresentação de alguns resultados para a discussão que segue.
Teorema 6.3.1 (Método direto de Lyapunov (Khalil, 2002)). Seja z = 0 um ponto de
equilíbrio do sistema (6.2.5). Seja V : Rn → R uma função de classe C1 tal que
Definida positiva: V (z) > 0, ∀z 6= 0 e V (0) = 0
Radialmente não-limitada: ‖z‖ → ∞⇒ V (z) →∞
Definida negativa: V (z) < 0, ∀z 6= 0
então z = 0 é global e assintoticamente estável.
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 129
A função V , como definida acima, é denominada função de Lyapunov. Quando não é
possível determinar se V é definida e negativa, faz-se uso do Princípio de Invariância de
LaSalle:
Teorema 6.3.2 (Princípio de Invariância de LaSalle). Seja z = 0 um ponto de equilíbrio
do sistema (6.2.5) e D ⊂ Rn um domínio contendo z = 0. Seja V : [0,∞[×D → R uma
função C1, definida e positiva em D. Seja S = z ∈ D | V (z) = 0 e suponha que apenas
a solução trivial z(t) ≡ 0 esteja contida em S. Então, a origem é assintoticamente
estável.
Para sistemas não autônomos, ou seja, variantes no tempo, tem-se o seguinte resultado.
Teorema 6.3.3 (Método direto: sistemas não autônomos (Khalil, 2002)). Seja z = 0
um ponto de equilíbrio do sistema (6.2.5) e D ⊂ Rn um domínio contendo z = 0. Seja
V : [0,∞[×D → R uma função de classe C1 tal que
k1‖z‖a 6 V (t, z) 6 k2‖z‖a (6.3.1)∂V
∂t+
∂V
∂zf(t, z) 6 −k3‖z‖a (6.3.2)
para ∀t > 0 e ∀z ∈ D, onde k1, k2, k3 e a são constantes positivas. Então, z = 0 é
exponencialmente estável. Se as hipóteses são verificadas globalmente, então z = 0 é
global e exponencialmente estável.
A utilidade do Teorema 6.3.3, devido a estabilidade de Lyapunov para sistemas não-
autônomos, será justificada quando a função de Lyapunov for variante no tempo, por
ocasião dos sinais de referência das equações cinemáticas do sistema, como mostrado no
final desta seção.
Exemplo 6.3.4 ((Fantoni et al., 1999)). Seja um hovercraft definido por corpo rígido
no plano sob ação de uma entrada de propulsão e um torque no centro de massa. A
transformação de coordenadas de velocidade entre os referenciais móvel e inercial segue
da expressão
rcm = RθcmvB ⇒ rx = cos(θcm)u− sin(θcm)v
ry = sin(θcm)u + cos(θcm)v
onde vB = (u, v) é a velocidade no referencial móvel e r = θcm. Define-se um difeomor-
fismo global determinando por coordenadas fictícias da posição do sistema em relação
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 130
ao referencial móvel:
z = RTθcm
rcm ⇒ z1 = cos(θcm)rx + sin(θcm)ry
z2 = − sin(θcm)rx + cos(θcm)ry
Diferenciando-se no tempo as duas coordenadas z1, z2 acima, obtém-se
z1 = u + z2r
z2 = v − z1r
O modelo de velocidade do hovercraft, dado por um corpo rígido, é dado por
u = vr + τu (6.3.3)
v = −ur (6.3.4)
r = τr (6.3.5)
O componente da velocidade v do corpo rígido não é diretamente controlado. Deseja-se
estabilizar a posição do sistema rcm em relação ao referencial inercial. A orientação do
sistema θcm será deixada “livre” e sua evolução no tempo será determinada pela lei de
controle. Como proposto em (Fantoni et al., 1999), é possível mostrar a estabilização
do sistema acima mediante a função de Lyapunov
V =12(u2 + v2 + (r − v)2) (6.3.6)
e as funções de controle que estabilizam o sistema na origem são dadas por
τu = −kuu
τr = −ur − kr(r − v)
A variação temporal de (6.3.6) fornece
V = uu + vv + (r − v)(r − v) (6.3.7)
6.3.1 O Sistema de 2-Corpos
Sem perda de generalidade, considere o sistema de equações, com massa e inércia unitá-
rios, que modelam a dinâmica do sistema de 2-corpos em relação ao referencial móvel:
u = vr + τu (6.3.8)
v = −ur − τv (6.3.9)
r = τr (6.3.10)
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 131
onde as entradas τu, τv, τr para cada uma das três direções acima são dadas por
τu = cos(φ/2)(f1 + f2)
τv = 2 sin(φ/2)/(L(cos(φ) + 1))τr
τr = L(cos(φ) + 1)/2(f2 − f1)
onde o ângulo de junta é representado por φ. Note que r é acionado diretamente e
que τr possui influência direta na dinâmica v apenas quando φ 6= 0, ou seja, quando o
sistema degenera-se no corpo rígido em (Fantoni et al., 1999). Observe que é possível
estabilizar a origem de ambas as direções u e v através de τu e todas as direções (u, v, r)
com τr, como indicam análises segundo o critério de controlabilidade de Kalman.
Note também que é possível estabilizar (6.3.8)-(6.3.10) na origem através de uma lei de
realimentação linear simples, sem, no entanto, a convergência de r a zero.
Objetiva-se extender o resultado de estabilização do corpo rígido acima para o sistema
de 2-corpos de maneira que o primeiro represente um caso particular do segundo. Para
este propósito, entretanto, as tentativas de manter a estrutura da função em (6.3.6) para
análise de Lyapunov, da Proposição 6.3.1, não foram válidas.7 O projeto de estabilização
do modelo pode partir da adição de um integrador com a função de desacoplamento entre
τr e a dinâmica v. Neste caso, adotando-se uma variável auxiliar s cuja taxa temporal
será usada para designar a entrada τr, assim como r.8 O sistema dinâmico passa a ter
a seguinte forma:
u = vr + τu
v = −ur − C(φ)s
s = τr
r = τr
7Observe que, embora seja possível mostrar que a velocidade sistema é estabilizável através da função
dada em (6.3.6) e das leis de controle
τu = −kuu− C(φ)r[(2v − r)− kr/u]
τr = −ur − kr(r − v)
estas não correspondem a uma solução cabível uma vez que τu é racional em u e representa uma divisão
por 0 quando u << 0 e este converge mais rapidamente para 0 do que v ou r. Ademais, a lei de controle
τr = −ur− kr(r− v)u2 fornece V com uma estrutura da forma −fcnu2. Esta estrutura não é desejável
uma vez que u = 0 pode render uma estabilização de v e r em pontos diferentes da origem.8Embora s e r representam a mesma grandeza, adota-se variáveis distintas apenas com a finalidade
de facilitar os cálculos intermediários. Ao final destes, toma-se s ≡ r.
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 132
onde C(φ) = 2 sin(φ/2)/(L(cos(φ) + 1)). Adotando-se uma função de Lyapunov, modi-
ficada em relação ao caso anterior, e igual a
V =12(u2 + v2 + (r − v)2 + (s− v)2),
tem-se, para as funções de entrada
τu = −kuu
τr = −ur − kr(r − v)− 32C(φ)s
que a taxa temporal de V é definida negativa e, fazendo a substituição s ≡ r, dada por
V = −kuu2 − kr(r − v)− C(φ)r2
Logo, pela Proposição 6.3.1 e pelo Princípio de LaSalle, o único ponto possível para
V (z) = 0 é z = 0 e as leis de controle obtidas estabilizam global e assintoticamente o
subsistema de velocidade do sistema de 2-corpos. A validade global do controle deve-se
a característica de V ser radialmente não-limitada (Khalil, 2002). As leis de controle
acima são válidas apenas nos intervalos em que f não muda de sinal, como pode-se
observar a partir da última expressão. Note que o resultado, para o sistema de dois
corpos, obtido acima generaliza o obtido para o corpo rígido em (Fantoni et al., 1999).
A Figura 6.3 mostra a convergência do sistema para a origem sob ação das leis de
controle obtidas. O projeto acima é válido quando a forma do sistema é mantida fixa;
ou seja, para o ângulo φ estático. Pode-se, no entanto, obter uma realimentação em que
φ é dinamicamente alterado para melhorar o desempenho de estabilização do sistema.
Considerando a dinâmica da junta, tem-se
u = vr + τu
v = −ur − C(φ)r
r = τr
pφ = Xpφ+ T
onde Xpφé a dinâmica do momento de junta e a entrada T corresponde ao torque da
junta que atua diretamente na variação do ângulo φ. Note que, de acordo com a hipótese
de parametrização adotada na Seção 4.2.1, T atua exclusivamente na dinâmica de φ.
Deseja-se avaliar a possibilidade de se variar φ de forma a melhorar o desempenho do
sistema. Adotando-se, portanto, uma curva de referência φref ao qual φ deve rastrear,
define-se a seguinte função de Lyapunov
Vφ(φ, pφ) =12(φ− φref )2 +
12(pφ − pφref
)2
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 133
0 5 10 15 20 25 30 35 40 45 500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
tempo (s)
Vel
ocid
ades
(u,
v,r)
uvr
u
v
r
Figura 6.3: Estabilização da velocidade do sistema de 2-corpos.
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 134
Escolhe-se a entrada T de maneira a cancelar a dinâmica de junta Xpφ:
T = −Xpφ−Kφ(φ− φref )−Kpφ
(pφ − pφref) + pφref
Tomando eφ = φ − φref e epφ= pφ − pφref
, a dinâmica de junta em malha fechada é
equivalente a
eφ = fcn(epφ)
epφ= −Kφeφ −Kpφ
epφ
Sem maiores detalhamentos aqui, mostra-se que a dinâmica do erro acima converge
para zero pelos argumentos de passivação por realimentação, (Khalil, 2002). Apresenta-
se abaixo um exemplo de como φref pode ser escolhido para melhorar o desempenho do
sistema.
Exemplo 6.3.5. Deseja-se levar o sistema de 2-corpos em repouso de uma configuração
inicial, no instante t0, à origem do referencial inercial em tempo t1 − t0.
Relembrando as equações de movimento do centro de massa do sistema, tem-se
px = − sin(θcm − φ/2)f1 − sin(θcm + φ/2)f2 (6.3.11)
py = cos(θcm − φ/2)f1 + cos(θcm + φ/2)f2 (6.3.12)
Para descrever um movimento horizontal, implica-se ter py = 0 e px > 0, se o mesmo
ocorre para a direita, ou px < 0, para um movimento à esquerda.
Especificando-se t0 e t1, construiu-se curvas para as coordenadas θcm, φ através de
equações algébricas de segundo grau. Das equações acima, observa-se que, para uma
orientação inicial θcm(t0) qualquer, o sistema é igualmente controlável em ambas as
direções de translação com φ = π/2. Tomando-se a derivada da equação do momento
pθcm = 2θcm(I + K cos(φ)), com relação ao tempo, tem-se que
pθcm =2L
(1 + cos(φ))(f2 − f1) (6.3.13)
Resolvendo a expressão acima para f2, substitui-se o resultado em (6.3.12) para py = 0
obtendo-se
f1 =−2 cos(θcm + φ/2)
L(1 + cos(φ))(cos(θcm − φ/2) + cos(θcm + φ/2))pθcm
A entrada f2 pode ser determinada substituindo-se a curva encontrada para f1 acima
na equação do momento (6.3.13). Como as curvas θcm(t) e φ(t) foram construídas
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 135
de maneira que o sistema se desloque para a direita, pode-se verificar que a expressão
(6.3.11) é sempre positiva. As Figuras 6.4 e 6.5 ilustra o movimento do sistema obtido.
Note, portanto, que é possível planejar uma trajetória em função de φ de forma a me-
lhorar o desempenho de estabilização: neste caso um funcional é otimizado para menor
trajetória.
O projeto da estabilização cinemática segue igualmente de (Fantoni et al., 1999). A
síntese do controle de estabilização da posição do centro de massa do sistema é feita
com base nas expressões da cinemática
z1 = u + z2r
z2 = v − z1r
φ = pφ/Iφ
para entradas u, r e pφ, onde Iφ é uma constante para cada φ. Pelo fato da controlabi-
lidade na direção v ser deficitária, impõe-se a convergência do movimento vertical para
a origem, equilíbrio do sistema cinemático, segundo a expressão
v + z2 := −(v + z2)
A expressão acima estabelece que a composição da velocidade v e a coordenada de
deslocamento correspondente z2, definidas no referencial móvel, possuem variação com
taxa negativa. A partir da expressão acima e das equações cinemáticas, obtém-se as
seguintes leis de controle para as velocidades de translação u e rotação r
u = −z1 +12
√v2 + z2
2 (6.3.14)
r =4v + 2z2√
v2 + z22 + 2C
(6.3.15)
As expressões acima são variantes no tempo e representam sinais de referência para a
malha de controle da dinâmica da velocidade do sistema. Ou seja, a malha de controle
do sub-sistema cinemático fornece os sinais de referência do sub-sistema dinâmico.
Emprega-se a função de Lyapunov para o sub-sistema cinemático Vc
Vc(z) =12(z2
1 + z21) +
14(v + z2)2 ⇒ Vc(z) = z1u− 1
2(v2 + z2
2)
Substituindo as leis de controle (6.3.14) e (6.3.15) em V e V , segue que
Vc(z) = −z21 −
12(v2 + z2
2) +12z1
√v2 + z2
2
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 136
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−2
−1.5
−1
−0.5
0
0.5
1
Angulos θ1(t), θ
2(t) & θ
cm(t) projetados
tempo (s)
θ1
θ2
θcm
θ2 θ
cm
θ1
(a) Projeto das curvas de orientação θcm(t) e (θ1(t), θ2(t)).
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 18
9
10
11
12
13
14
Propulsao f1(t) projetada
tempo (s)0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−13
−12
−11
−10
−9
−8
−7
−6
−5
−4
−3
Propulsao f2(t) projetada
tempo (s)
(b) Forças de propulsão (f1, f2)(t) projetadas.
Figura 6.4: Planejamento de trajetória do sistema de 2-corpos.
6.3. CONTROLE DE SISTEMAS SUB-ATUADOS 137
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−10
−5
0
5
tempo (s)
rx
ry
θ
θcm
ry
rx
(a) Deslocamento do centro de massa no plano rx − ry.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−15
−10
−5
0
5
10
15
tempo (s)
px
py
pθ
px
py
θcm
(b) Trajetórias das coordenadas de momento (px, py, pθcm).
Figura 6.5: Resultados de simulação em malha aberta do planejamento de trajetória do
sistema de 2-corpos.
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 138
Completando as expressões de Vc e Vc de maneira a obter-se o quadrado perfeito, tem-se
que
18(z2
1 + z21 + v2) 6 Vc(z) 6 (z2
1 + z21 + v2)
Vc(z) 6 −14(z2
1 + z21 + v2)
Logo, pela Proposição 6.3.3, o sistema é global e exponencialmente estável. Além disso,
pode-se mostrar que a velocidade de rotação r tende a zero para alguns casos.
Proposição 6.3.6. Seja o sistema de 2-corpos com o controle de realimentação cine-
mático dados por (6.3.14) e (6.3.15). Se φ 6= 0 então r tende a zero quando z2, v → 0.
Demonstração. Este resultado é uma extensão em relação ao caso do corpo rígido, uma
vez que, para a função de Lyapunov e as leis de controle para este sistema, r é apenas
limitado.
Tomando o limite em (6.3.15) quando z2, v → 0, observe que (6.3.15) pode ser reescrita
por uma função que tende a zero multiplicada por outra que é limitada se 0 < φmin < φ.
Logo, pelo resultado do Cálculo Diferencial, o limite de r quando z2, v → 0 é zero.
A Figura 6.6 ilustra o resultado de estabilização pela composição das leis de controle
cinemática e de velocidade obtidas acima.
6.4 Planejamento de Trajetórias e Controle Ótimo
Definição 6.4.1 (Planejamento de Trajetória do Sistema de 2-corpos). Dados dois
pontos de configuração qi, qf ∈ Q, determinar uma função u = [u1, u2, u3] tal que o
sistema
z(t) = f(z(t)) + g1(q(t))u1(t) + g2(q(t))u2(t) + g3(q(t))u3(t)
parametrizado pela curva z(t) = [q(t), p(t)] : [0, tf ] → T ∗q(t)Q e partindo do ponto
(q(0), p(0)) = (qi, 0), seja conduzido ao ponto (q(tf ), p(tf )) = (qf , 0) em tempo tf .
Pode-se, adicionalmente, estabelecer penalidades sobre um ou todos a função u, os
estados q ou o tempo tf a serem minimizados quando da determinação do planejamento
da trajetória. Este procedimento é conhecido como controle ótimo e será comentado
mais detalhadamente a seguir.
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 139
0 10 20 30 40 50 60 70 80 90 100−1.5
−1
−0.5
0
0.5
1
1.5
2
tempo (s)
Coo
rden
adas
[z1,z
2]=m
Estabilizacao posicao
z1
z2
z1
z2
(a) Estabilização da posição (z1, z2).
0 10 20 30 40 50 60 70 80 90 100−1
−0.5
0
0.5
1
1.5
2
2.5
3
3.5
tempo (s)
Vel
ocid
ade
[u,v
]=m
, [r]
=ra
d/s
Estabilizacao velocidade
uvr
r
u
v
(b) Estabilização da velocidade (u, v, r).
Figura 6.6: Resultados de estabilização de posição e velocidade pela composição das leis
de controle.
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 140
6.4.1 Controle Ótimo do Modelo Cinemático
O planejamento de trajetórias para o sistema multi-articulado pretendido neste trabalho
é tratado como um projeto de determinação da solução de um problema de controle
ótimo. Para este fim, utiliza-se o modelo cinemático associado do sistema. Logo, para
as considerações a seguir considera-se o modelo cinemático do sistema controlável, como
mostrado anteriormente na Seção 5.3.3.
Diferentemente da formulação da mecânica não-holonômica, o problema de controle
ótimo é um problema variacional. Considere, primeiramente, uma subvariedadeD ⊂ TQ
do espaço tangente de uma variedade suave Q. Seja uma função escalar F = F (q(t)).
Percorrida a curva q(t) : [0, tf ] → Q, entre os dois pontos distintos qi, qf ∈ Q, avalia-se
o valor da integral de linha
IP =∫ tf
0F (q(t))dt
que corresponde ao custo do percurso q(t) em Q. A trajetória em D que liga qi a qf e
cujo resultado minimiza IP dentre todas as possíveis trajetórias em D é denominada de
ótima. Uma condição necessária para a obtenção do mínimo, ou extremo, do custo IP
é que a integral de F , avaliada nas variações de q(t), possua deslocamento infinitesimal
nulo9, ou seja
δIP = 0
Definição 6.4.2 (Controle Ótimo). Admite-se queD possua pontos, ou seções de q ∈ Q,
com a seguinte parametrização ξ = G(π(ξ), u1, . . . , um) ∈ D, onde G ∈ C∞ e onde
u = (u1, . . . , um) ∈ U ⊂ Rm e π é a projeção de TQ em Q. Logo, as trajetórias, em D,
que ligam os pontos qi e qf são dadas por
q(t) = G(q(t), u(t))
Então o custo do percurso partindo de qi até qf é obtido pela expressão
IP =∫ tf
0F G(q(t))dt
Neste caso, a tarefa de determinar as trajetórias ótimas é reinterpretada naquela em
que se deseja determinar o controle ótimo u1, . . . , um, ou seja, a parametrização das
trajetórias em D.9Demonstra-se, que este resultado generaliza às equações de Euler-Lagrange para a função F em
x(t).
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 141
O controle ótimo tem sido aplicado para resolver problemas de minimização da energia
quando o controle age apenas no espaço de base, refira a (Yang, 1992). Estes problemas
de controle ótimo são definidos conforme o seguinte: Dados os pontos de configuração
inicial qi e final qf em (B × G,B, π, G), ambos na mesma fibra, determinar o controle
u(t) que conduz o sistema (Q,D, 〈〈., .〉〉, G, H) de qi a qf minimizando
IP =∫ tf
ti
C(r) + 〈u, u〉Bdt
para a métrica Riemanniana 〈., .〉B em B e sujeito às equações da cinemática do sistema.
Entretanto, tem-se o interesse em minimizar funcionais, não apenas das trajetórias no
espaço de base B, mas também, das trajetórias na fibra.
Nos parágrafos a seguir, realiza-se um exemplo numérico com o modelo cinemático do
sistema de 2-corpos apresentado na Seção 5.3.3. Para o sistema de dois corpos em
questão (5.3.7), o vetor de configuração é q(t) = (x, y, θ, φ)(t), as condições terminais
(dqi = dqf = 0) de posição e atitude
x(ti) = xi x(tf ) = xf
y(ti) = yi y(tf ) = yf
θ(ti) = θi θ(tf ) = θf
φ(ti) = φi φ(tf ) = φf
e de velocidade q(t) ∈ TQ
x(ti) = xi = 0 x(tf ) = xf = 0
y(ti) = yi = 0 y(tf ) = yf = 0
θ(ti) = θi = 0 θ(tf ) = θf = 0
φ(ti) = φi = 0 φ(tf ) = φf = 0
Vínculos de controle nas variáveis f1, f2, T
0 = fmin ≤f1, f2
f1, f2 ≤ fmax
Tmin ≤T ≤ Tmax
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 142
Alguns índices de desempenho de interesse estão sendo utilizados. Entre estes:
IP1 =∫ tf
ti
1dt = tf (∃ u ≤ umax)
IP2 =∫ tf
ti
x2(t) + y2(t) + θ2(t) + φ2(t)dt
IP3 = IP2 +∫ tf
ti
f21 (t) + f2
2 (t) + T 2(t)dt
Devido à existência do número relativamente elevado de restrições ou vínculos nas variá-
veis de controle e de estado, optou-se por uma investigação numérica, como alternativa
de se evitar a complexidade inerente à obtenção da solução por métodos analíticos nestes
casos.
Para tanto, fez-se uso do toolbox de controle ótimo para MatLab denominado RIOTS -
Recursive Integration Optimal Trajectory Solver, (Schwartz, Polak e Yangquan, 1997) e
as suas referências. Maiores detalhes a respeito da implementação do RIOTS não serão
aqui considerados. Uma recente e detalhada descrição da teoria do funcionamento do
RIOTS pode ser encontrada em (Menegaldo, 2000).
As Figuras 6.7 e 6.8 mostram os resultados da sintonização do controle ótimo aplicado ao
modelo cinemático do sistema de dois corpos (5.3.7) utilizando o RIOTS. O referencial
móvel é localizado na junta rotativa do sistema, com eixo horizontal direcionado ao
corpo direito e eixo vertical, restrito ao plano, é perpendicular ao horizontal, conforme
a Fig. 5.3. O procedimento numérico considerou tempo fixo de 2.4s e otimização o índice
de desempenho IP3 dado acima. O controle u é restrito aos valores −1 6 f1, f2 6 1
e −0.2 6 T 6 0.2. O sistema parte da origem no plano x − y inercial, totalmente
estendido φi = 0 e com orientação inicial θi = −π/2, isto é, eixo vertical alinhado com o
eixo x inercial. O sistema é levado ao ponto (−1, 1) do plano, φf = 0 e com orientação
final θf = π/4.
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 143
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.60
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Trajetória Ótima no plano x−y
xop
y op
(a) Deslocamento ótimo do centro do referencial móvel no plano
x− y.
0 0.5 1 1.5 2 2.5−2
−1.5
−1
−0.5
0
0.5
1
1.5
2Trajetória Ótimas
tempo (s)
x(t)
op, y
(t) op
, θ(t
) op
(b) Trajetórias ótimas das coordenadas de fibra (rx, ry, θcm).
Figura 6.7: Resultados do controle ótimo aplicado ao modelo cinemático do sistema de
dois corpos.
6.4. PLANEJAMENTO DE TRAJETÓRIAS E CONTROLE ÓTIMO 144
0 0.5 1 1.5 2 2.5−0.1
−0.05
0
0.05
0.1
0.15
0.2
0.25
0.3Evolução Ótima da variável da Base
tempo (s)
φ(t)
op
(a) Trajetória ótima das coordenadas da base φ(t).
0 0.5 1 1.5 2 2.5−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
1.2Controle Ótimo
tempo (s)
Con
trol
uop
(b) Controle ótimo u(t) = (f1, f2, T )(t).
Figura 6.8: Resultados do controle ótimo aplicado ao modelo cinemático do sistema de
dois corpos.
6.5. CONCLUSÃO 145
6.5 Conclusão
A partir das considerações acima, determinou-se algumas condições, e os respectivos
métodos, em que o sistema é estabilizável.
Os sistemas com apenas duas entradas de propulsão não são linearizáveis por realimen-
tação estática uma vez que os seus campos vetoriais geram distribuições não involutivas.
Além disso, estes sistemas não são linearizáveis por realimentação dinâmica, pois as suas
aproximações lineares não são controláveis, ou seja, são sistemas sub-atuados. Neste
caso, recorre-se a técnicas de estabilização não suaves ou variantes no tempo. Para este
propósito, considerou-se aqui uma extensão de um resultado obtido para a estabilização
no plano do corpo rígido sub-atuado através do procedimento de análise e síntese do
controlador segundo a teoria de estabilidade de Lyapunov.
Os sistemas com três ou mais entradas de propulsão, que geram direções de propulsão
linearmente independentes, são linearizáveis por realimentação e, portanto, estabilizá-
veis por uma realimentação do estado obtida através de técnicas de controle lineares,
por exemplo.
Apresentou-se, ainda, exemplos analítico e numérico do planejamento de trajetória do
sistema de 2-corpos.
146
Capítulo 7
Conclusões
Modelagem
Apresentou-se, neste trabalho, as equações de movimento dinâmico de uma classe de
sistemas multi-corpos em que os corpos componentes são fisicamente acoplados por
articulações rotativas. Além das articulações, ou juntas, ativas, o sistema é dotado de
propulsores que atuam na variação da posição do centro de massa do sistema.
Como mencionado no Capítulo 3, a dinâmica de sistema em geral associada às restri-
ções de movimento implicam em uma dinâmica não-holonômica. A dinâmica do sistema
multi-articulado, apesar de caracterizada por medidas não integráveis no sentido de Fro-
benius, dado pelo momento angular, foi aqui considerado livre de restrições cinemáticas
no espaço bidimensional. Logo, as equações de Euler-Lagrange foram utilizadas para a
modelagem Lagrangiana do sistema.
Na presença de restrições não-holonômicas de velocidade, no entanto, a modelagem
do sistema deve seguir pela formulação do Princípio de Lagrange d’Alembert, como
discutido no Capítulo 3. Neste caso, a dinâmica não é obtida por um procedimento
variacional, que caracteriza os problemas de controle ótimo, uma vez que a variação das
curvas é tomada sem as restrições.
Além desta, a modelagem Hamiltoniana do sistema foi apresentada segundo duas para-
metrizações da orientação do centro de massa do sistema.
7.1. SUGESTÕES PARA TRABALHOS FUTUROS 147
Controlabilidade
A importância da análise de acessibilidade não-linear de sistemas dinâmicos reside na
análise com vista a obtenção de controle e da síntese de algoritmos de planejamento de
trajetória, atividade não realizada neste trabalho mas reservada como um dos tema de
trabalhos futuros.
O sistema proposto, com pelo menos duas entradas de propulsão e com o espaço de base
totalmente atuado, sempre é acessível em todo espaço de configuração Q, independente
do número de corpos. Isto decorre do fato de que, para um conjunto de sistemas com N
crescente, o número de direções de movimento possíveis, e construídas pelos colchetes
de Jacobi-Lie, cresce mais rapidamente que o número de estados ou dimensão do espaço
de fase para o qual a dimensão da álgebra de acessibilidade deve alcançar.
Estabilização
O método utilizado para a estabilização do sistema no plano é dependente do número de
entradas; em particular, do número de entradas de propulsão. Pode-se enfatizar que, em
geral, este número de entradas é também função da quantidade de direções linearmente
independentes que os campos vetoriais correspondentes podem gerar.
Para sistemas da classe, em que o espaço de base é totalmente controlado, com três
ou mais entradas de propulsão é possível estabilizar o sistema a um ponto de equilíbrio
empregando-se técnicas lineares de controle ao modelo linear do mesmo. O procedimento
considerado para a linearização do modelo do sistema é exato e realizado por um método
de linearização por realimentação. Note que, pela definição da classe de sistemas no
primeiro capítulo, não é possível utilizar esta solução de estabilização para o sistema
com apenas dois corpos, uma vez que possui apenas duas entradas de propulsão. Neste
caso, assim como para sistemas de N corpos mas com apenas dois propulsores, utilizou-
se uma técnica derivada da teoria de estabilidade de Lyapunov para estabilização da
dinâmica do sistema.
7.1 Sugestões para Trabalhos Futuros
Algumas possíveis contribuições futuras são resumidas a seguir:
7.1. SUGESTÕES PARA TRABALHOS FUTUROS 148
• Modelagem tridimensional do sistema. A extensão dos modelos obtidos no plano
ao espaço de três dimensões não é trivial e requer atenção com relação ao apare-
cimento de singularidades;
• Análise da dinâmica: estabilidade, bifurcações e caos;
• Modelagem do sistema sob ação de forças dissipativas ou potenciais: como no caso
de robôs submarinos e terrestres;
• Planejamento de trajetórias construtiva, com embasamento nos resultados de aces-
sibilidade do sistema;
• Planejamento de trajetórias através de uma abordagem analítico-numérica do con-
trole ótimo. Otimização da configuração de entradas, isto é, determinar uma
combinação ótima de entradas, propulsores e atuadores rotativos, para uma de-
terminada trajetória dada;
• Investigação de outras técnicas não-lineares de estabilização. Considerar técnicas
de rastreamento.
149
Referências Bibliográficas
Arnold, V. I. (1989). Mathematical Methods of Classical Mechanics, Vol. 60 of Graduate
Texts in Mathematics, 2 edn, Springer-Verlag.
Battilotti, S. e Califano, C. (2004). A constructive condition for dynamic feedback
linearization, System Control & Letters 52: 329–338.
Bloch, A. M. (2003). Nonholonomic Mechanics and Control, Vol. 24 of Interdisciplinary
Applied Mathematics, 1 edn, Springer.
Bloch, A. M., Krishnaprasad, P. S., Marsden, J. E. e Murray, R. M. (1996). Nonho-
lonomic mechanical systems with symmetry, Archive for Rational Mechanics and
Analysis 136: 21–99.
Bloch, A. M., Reyhanoglu, M. e McClamroch, N. H. (1992). Control and stabiliza-
tion of nonholonomic dynamic systems, IEEE Transactions on Automatic Control
37(11): 1746Ű1757.
Bullo, F. e Lewis, A. D. (2005). Geometric Control of Mechanical Systems: Modeling,
Analysis, and Design for Simple Mechanical Systems, Vol. 49 of Texts in Applied
Mathematics, Springer.
Byrnes, C. I. e Isidori, A. (1991). On the attitude stabilization of rigid spacecraft,
Automatica 27: 87–95.
Charlet, B., Lévine, J. e Marino, R. (1989). On dynamic feedback linearization, System
Control & Letters 13: 143–151.
Charlet, B., Lévine, J. e Marino, R. (1991). Sufficient conditions for dynamic state
feedback linearization, SIAM Journal of Control and Optimization 29(1): 38–57.
REFERÊNCIAS BIBLIOGRÁFICAS 150
Dubowsky, S. e Papadopoulos, E. (1993). The kinematics, dynamics, and control of
free-flying and free-floating space robotic systems, IEEE Transactions on Robotics
and Automation 9(5): 531–543.
Fantoni, I., Lozano, R., Mazenc, F. e Pettersen, K. Y. (1999). Stabilization of a Non-
linear Underactuated Hovercraft, Proc. 38th IEEE Conference on Decision
and Control, Phoenix, USA pp. 2533–2538.
Fernandes, C., Gurvits, L. e Li, Z. (1994). Near-optimal nonholonomic motion planning
for a system of coupled rigid bodies, IEEE Transactions of Automatic Control
39(3): 450–463.
Hunt, L. R., Su, R. e Meyer, G. (1983). Design for multi-input nonlinear systems,
in R. Brockett e R. S. M. H. J. Sussmann (eds), Differential Geometric Control
Theory, Vol. 27 of Progress in Mathematics, Birkhäuser, chapter 9, pp. 268–298.
Isidori, A. (1995). Nonlinear Control Systems, Communication and Control Engi-
neering Series, 3 edn, Springer-Verlag.
Kallem, V. e Cowan, N. J. (2007). Image-guided control of flexible beveltip nee-
dles, IEEE International Conference on Robotics and Automation, Rome, Italy
p. 3015Ű3020.
Khalil, H. K. (2002). Nonlinear Systems, 3 edn, Prentice Hall.
Koningstein, R. e Cannon Jr., R. H. (1995). Experiments with model-simplified
computed-torque manipulator controllers for free-flying robots, AIAA Journal of
Guidance, Control and Dynamics 18(6): 1386–1390.
Krener, A. J. (1999). Mathematical control theory, Springer, chapter Feedback Lineari-
zation, p. 360.
Lanczos, C. (1977). The Variational Principles of Mechanics, 4 edn, Dover Publi-
cations, Inc.
Littlejohn, R. e Reinsch, M. (1997). Gauge fields in the separation of rotation and
internal motions in the n-body problem, Reviews of Modern Physics 69(1): 213–
275.
Manikonda, V. (1998). Control and stabilization of a class of nonlinear system with
symmetry, Ph.D. Report TR 98-2, University of Maryland, College Park.
REFERÊNCIAS BIBLIOGRÁFICAS 151
Marsden, J. E. (2004). Lectures on Mechanics, Vol. 174 of Lecture notes series, sept04
draft version edn, Cambridge University Press.
Marsden, J. E., Montgomery, R. e Ratiu, T. S. (1990). Reduction, symmetry, and phases
in mechanics, Memoirs American Mathematical Society 436.
Marsden, J. E. e Ostrowski, J. (1998). Symmetries in motion: Geometric foundations
of motion control, Nonlinear Science Today pp. 1–21.
Marsden, J. E. e Ratiu, T. S. (1999). Introduction to Mechanics and Symmetry, Vol. 17
of Texts in Applied Mathematics, 2 edn, Springer. 3rd printing.
Marsden, J. E. e Scheurle, J. (1993). The reduced euler-lagrange equations, Fields
Institute Communications (1): 139–164.
Marsden, J., Ratiu, T. e Weinstein, A. (1984). Semidirect products and reduction in
mechanics, Transactions on the AMS 281(1): 147–177.
Mather, J. (2005). Mat-327: Differential geometry, Undergraduate class notes, Dept. of
Mathematics, Princeton University.
McLain, T. W., Rock, S. M. e Lee, M. J. (1995). Experiments in the Coordination
of Underwater Manipulator and Vehicle Control, Proceedings of the MTS/IEEE
OCEANS ’95 2: 1208–1215.
Meirovitch, L. (1970). Methods of Analytical Dynamics, McGraw-Hill, NY.
Melli, J. B., Rowley, C. W. e Rufat, D. S. (2006). Motion planning for an articulated
body in a perfect fluid, Submitted to SIADS .
Menegaldo, L. L. (2000). Modelagem Biomecânica e Controle Ótimo da Postura Humana
Através de Algoritmos Baseados na Teoria das Aproximações Consistentes, Tese de
doutoramento, EPUSP.
Murray, R. M. (1997). Nonlinear control of mechanical systems: A lagrangian perspec-
tive, Annual Reviews in Control 21: 31–45.
Nijmeijer, H. e van der Shaft, A. (1990). Nonlinear Dynamical Control Systems,
Springer-Verlag.
Ostrowski, J. P. (1995). The Mechanics and Control of Undulatory Robotic Locomotion,
Ph.d. thesis, California Institute of Technology.
REFERÊNCIAS BIBLIOGRÁFICAS 152
Ostrowski, J. P. (1999). Computing reduced equations for robotic systems with
constraints and symmetries, IEEE Transactions on Robotics and Automation
15(1): 111–123.
Pettersen, K. Y. e Egeland, O. (1996). Exponential Stabilization of an Underactuated
Surface Vessel, Proc. 35th IEEE Conference on Decision and Control, Kobe,
Japan pp. 967–971.
Respondek, W. (2002). Geometry of static and dynamic feedback, Warsaw-Poland
Summer School on Mathematical Control Theory Lecture Notes.
Reyhanoglu, M. e McClamroch, N. H. (1991). Controllability and stabilizability of pla-
nar multibody systems with angular momentum preserving control torques, Proc.
1991 American Control Conference, Boston pp. 1102–1107.
Rui, C., Kolmanovsky, I. V. e McClamroch, N. H. (2000). Nonlinear attitude and
shape control of spacecraft with articulated appendages and reaction wheels, IEEE
Transactions on Automatic Control 45(8): 1455–1469.
Schutz, B. (1980). Geometrical Methods of Mathematical Physics, Cambridge University
Press.
Schwartz, A., Polak, E. e Yangquan, C. (1997). RIOTS 95TM : A MatLab Toolbox for
Solving Optimal Control Problems, windows version 1.0 edn, Dept. of Electrical
Engineering, Stanford University.
Shapere, A. e Wilczeck, F. (1987). Self-propulsion at low reynoilds number, Physics
Review and Letters 58: 2051–2054.
Shen, J. (2002). Nonlinear Control of Multibody Systems with Symmetries via Shape
Change, Ph.d. report, University of Michigan.
Sontag, E. D. (1998). Mathematical Control Theory: Deterministic Finite-Dimensional
Systems, Vol. 6 of Texts in Applied Mathematics, 2 edn, Springer-Verlag.
Souza, E. C. e Maruyama, N. (2007). Lagrangian modeling for a class of mobile mul-
tibody systems, 3rd IFAC Symposium on Systems, Structures and Control, Foz do
Iguaçu, Brasil .
Spivak, M. (1999). A Comprehensive Introduction to Differential Geometry, Vol. I, 3
edn, Publish or Perish, Inc.
REFERÊNCIAS BIBLIOGRÁFICAS 153
Sreenath, N. (1987). Modeling and Control of Multibody Systems, Ph.d. thesis report,
University of Maryland.
Sussmann, H. J. (1987). A general theorem on local controllability, SIAM Journal of
Control and Optimization 25(1): 158–194.
UUVMP Committee (2004). The navy unmanned undersea vehicle (uuv) master plan,
Master plan, Department of the Navy, United States of America.
Walsh, G. C. e Sastry, S. S. (1995). On reorienting linked rigid bodies using internal
motions, IEEE Transactions on Robotics and Automation 11(1): 139–146.
Wittenburg, J. (1977). Dynamics of Systems of Rigid Bodies, Teubner, Stuttgart.
Yang, R. (1992). Nonholonomic Geometry, Mechanics and Control, Ph.d. thesis, Sys-
tems Research Institute, Univ. of Maryland.
Yuh, J. e West, M. (2001). Underwater robotics, Advanced Robotics 15(5): 609–639.
Review paper.
154
Apêndice A
Fundamentos Gerais
A.1 Aplicações e Conjuntos Usuais na Mecânica Geomé-
trica
Seja um grupo de Lie G agindo em uma variedade M e g a álgebra de Lie correspondente
ao grupo G. Para x ∈ M , g ∈ G, e ξ, η ∈ g, definem-se os seguintes.
Para uma curva, t-parametrizada, tξ em g e t ∈ R, a aplicação exponencial é dada pelo
subgrupo de um parâmetro γξ(t) tal que
exp : g → G : tξ 7→ exp(tξ) = γξLt (e)
A órbita da ação Φ de G em M corresponde a uma variedade imersa de M
Orb(x) = Φg(x) | g ∈ G ⊂ M (A.1.1)
A aplicação de projeção π e o espaço quociente estão relacionados pelas seguintes ex-
pressões
π : M → M/G
x 7→ Orb(x)
Seja ξ ∈ g. A R-ação em M segue da relação
Φξ(t, x) = Φξt (x) = Φ(exp(tξ), x) = Φexp(tξ)(x) (A.1.2)
A.1. APLICAÇÕES E CONJUNTOS USUAIS NA MECÂNICA GEOMÉTRICA 155
Seja Φ : G × M → M uma ação de grupo suave à esquerda. O gerador infinitesimal
de Φ é definido como o campo vetorial relativo a ação de grupo Φ dada pela aplicação
exponencial de uma trajetória na álgebra g parametrizada por t, ou seja
ξM (x) :=d
dt
∣∣∣∣t=0
Φexp(tξ)(x)
Automorfismo interno, ou aplicação conjugação, é definida por
Ig : G → G (A.1.3)
h 7→ Ig(h) = Rg−1 Lg(h) = ghg−1 (A.1.4)
A ação adjunta de g ∈ G em ξ ∈ g corresponde a aplicação Ad : G× g → g. Esta repre-
senta uma transformação de similaridade para Lie álgebras de matrizes. Sob o contexto
da cinemática do corpo rígido, a aplicação adjunta representa uma transformação do
sistema de coordenadas de referência
Adg = TeIg : g → g (A.1.5)
ξ 7→ Te(Rg−1 Lg)(ξ) =d
dε
∣∣∣∣ε=0
gh(ε)g−1 = gξg−1 (A.1.6)
onde ξ é a tangente da curva h(ε) em ε = 0. A ação coadjunta de g ∈ G em µ ∈ g∗ é a
aplicação Ad∗ : G× g∗ → g∗ ou
Ad∗g−1 : g∗ → g∗ (A.1.7)
onde
〈Ad∗g−1(µ), ξ〉 = 〈µ,Adg−1(ξ)〉 (A.1.8)
observe que Ad∗g não é definida como a aplicação coadjunta, mas representa simples-
mente a aplicação dual de Adg e que Ad∗g = AdTg para grupos de matrizes. O operador
adjunto ou, simplesmente, ad, é definido por
adξ : g → g (A.1.9)
η 7→ ξg(η) = [ξ, η] (A.1.10)
onde o gerador infinitesimal ξg para a ação adjunta é dado por
ξg(η) =d
dt
∣∣∣∣t=0
Adexp(tξ)(η)
Sejam X e Y dois campos vetoriais e a álgebra definida pelo operador adjunto adXY =
[X,Y ]. A iteração do colchete de Jacobi-Lie por l vezes é dada por adlXY = [X, . . . , [X, Y ] . . .].
Define-se ad0XY = Y .
A.2. REPRESENTAÇÕES ESPACIAIS COM A ÁLGEBRA DO GRUPO 156
O operador coadjunto
ad∗ξ : g∗ → g∗ (A.1.11)
onde
〈ad∗ξ(α), η〉 = 〈α, adξ(η)〉 (A.1.12)
Assim como no caso da aplicação adjunta, vale a relação ad∗ = adT para grupos de
matrizes.
A.2 Representações Espaciais com a Álgebra do Grupo
A.2.1 Representações entre Referenciais
Para g = ξ ∈ TgG a representação inercial, respectivamente de corpo, é dada pela
translação à direita, respectivamente esquerda, em TG ou, para grupos de matrizes,
ξS = TgRg−1(ξ) = gg−1 e ξB = TgLg−1(ξ) = g−1g. (A.2.1)
onde ξ(.) pertence a Lie álgebra de G, isto é, ξ(.) ∈ TeG ≡ g.
Para g∗ = µ ∈ T ∗g G a representação inercial de µ é dada por sua translação à direita
em T ∗G ou
µS = T ∗e Rg(µ). (A.2.2)
Analogamente, a representação de corpo de µ é dada pela translação à esquerda em T ∗G
ou
µB = T ∗e Lg(µ). (A.2.3)
onde µ(.) pertence a Lie álgebra de G∗, ou seja, µ(.) ∈ T ∗e G ≡ g∗.
Para grupos de matrizes, tem-se
ξS = AdgξB = gξBg−1 (A.2.4)
Logo, a relação entre as representações nos referenciais inercial e móvel em TG, respec-
tivamente T ∗G, são dadas pela aplicação adjunta
ξS = Adg ξB ⇔ ξB = Adg−1 ξS e (A.2.5)
µS = Ad∗g−1 µB ⇔ µB = Ad∗g µS (A.2.6)
A.2. REPRESENTAÇÕES ESPACIAIS COM A ÁLGEBRA DO GRUPO 157
A ponte entre a algebra de Lie e a sua representação dual é feita pelo levantamento
cotangente da ação de grupo Φg, (g ∈ G) e dada pelo pareamento da álgebra
〈T ∗e Φgπ, ξ〉 = 〈π, TeΦgξ〉 (A.2.7)
onde ξ ∈ g e π ∈ T ∗g G. Logo, para manipulações com matrizes, onde o elemento
identidade e é dado pela matriz identidade (e = I), e para uma ação de grupo à
esquerda Φg = Lg, (A.2.7) é definida por
〈T ∗I Lgπ, ξB〉 = 〈π, TILgξB〉 = tr(πT gξB) = tr(ξTB gT π)
= 〈ξB, gT π〉 = 〈ξB, T ∗I Lgπ〉 ∈ R
onde tr é a operação traço, definida no espaço matrizes quadradas. Portanto
µB = T ∗I Lgπ = gT π ∈ g∗ (A.2.8)
A.2.2 O Grupo SE(2)
Para R = R(θ) ∈ SO(2), onde θ é a parametrização de um elemento do círculo S1 e
r = (x, y)T ∈ R2, tem-se que
g =
[R r
01×2 1
]∈ SE(2) (A.2.9)
O elemento inverso correspondente
g−1 =
[R−1(θ) −R−1(θ)r
01×2 1
]=
[RT (θ) −RT (θ)r
01×2 1
]∈ SE(2) (A.2.10)
pois R−1(θ) = RT (θ) = R(−θ). Como mencionado anteriormente, qualquer elemento
g de SE(2) pode ser parametrizado pela tripla (x, y, θ) e
g =
[R r
01×2 0
]∈ TgSE(2) = T(R,r)SE(2) = T(θ,x,y)SE(2) (A.2.11)
Os elementos da Lie álgebra para SE(2) podem ser obtidos pela translação dos pontos
do espaço tangente TgSE(2) aos pontos do espaço tangente na origem TeSE(2). As
translações à esquerda fornecem representações do espaço de fase do sistema no referen-
cial móvel; alternativamente, as translações à direita fornecem representações do espaço
de fase do sistema no referencial inercial. Uma translação à direita de g por g−1 fornece
ξS = gg−1 =
[RRT −RRT r + r
01×2 0
]=
[−ωM v
01×2 0
]∈ TI3SE(2) ≡ se(2) (A.2.12)
A.2. REPRESENTAÇÕES ESPACIAIS COM A ÁLGEBRA DO GRUPO 158
onde v = r + ωMr, ω = θ ∈ R, o elemento identidade e do grupo SE(2) é a matriz
identidade I3 e M é a matriz (quadrada) simplética de dimensão 2 dada por
M =
[0 1
−1 0
]
Note que é possível tomar se(2) ' R3 e os elementos ξS podem ser definidos pela
parametrização ξS = (ω,v).
Ademais, para µS = T ∗e Rgπ e utilizando o pareamento entre os elementos dos espaços
duais, tem-se
〈T ∗e Rgπ, ξS〉 = 〈π, TeRgξS〉 = tr(µSξS) = ϕω + α · v = 〈(ϕ,α), (ω,v)〉
Portanto, os elementos da Lie álgebra dual se∗(2) possuem a seguinte estrutura
µS =
[ϕ2M 02×1
α 0
]∈ T ∗I3SE(2) ≡ se∗(2) ' R3
onde ϕ ∈ R e α ∈ R2. Identificando se(2) ' R3 ' se∗(2) o pareamento entre se(2) e
se∗(2) corresponde ao produto interno usual em R3, como mostrado acima.
Para elementos de grupo parametrizados por g = (R, r), a ação adjunta Adg na álgebra
se(2), relativa ao referencial móvel, fica
Ad(R,r)ξB = g ξB g−1 =
[−ωM r + ωMr
01×2 0
]= ξS (A.2.13)
que recupera (A.2.12), ao passo que a ação adjunta inversa Ad−1g em ξS fornece
Ad(R,r)−1 ξS = g−1ξS g =
[−ωM RT r
01×2 0
]= ξB (A.2.14)
o que recupera o elemento correspondente no referencial móvel ξB. Sob o contexto em
que operações são realizadas com vetores, ao contrário de quando com matrizes, pode-
se obter a representação matricial da ação adjunta aplicada a ξS = (ω,v) através da
expressão
Ad(R,r) =
[1 01,2
Mr R
]⇒ Ad(R,r)(ω,v) =
[1 01,2
Mr R
](ω
v
)=
(ω
ωMr + Rv
)
(A.2.15)
que parametriza o resultado em (A.2.13). Analogamente, a representação matricial da
ação adjunta inversa Adg−1 fica
Ad(R,r)−1 =
[1 01×2
−RTMr RT
]
A.2. REPRESENTAÇÕES ESPACIAIS COM A ÁLGEBRA DO GRUPO 159
que fornece Adg−1 ξS = g−1ξSg = ξB quando aplicado em ξS , ou seja:
Ad(R,r)−1(ω,v) =
[1 01×2
−RTMr RT
](ω
v
)=
(ω
RT r
)(A.2.16)
No resultado acima utilizou-se (A.2.12). Observe, também, que este condiz com a
expressão obtida em (A.2.14). Alternativamente, é possível obter expressões da ação
adjunta para elementos de grupo dados por g = (r,R), como apresenta a seguinte
expressão
Ad(R,r) =
[1 01,2
Mr R
]⇒ Ad(r,R) =
[R Mr
01,2 1
]
Neste caso, a representação matricial da ação adjunta de ξS = (v, ω) é obtida pela
expressão
Ad(r,R)(v, ω) =
[R Mr
01,2 1
](v
ω
)=
(ωMr + Rv
ω
)(A.2.17)
que corresponde ao resultado de (A.2.15), como esperado. A aplicação adjunta inversa
correspondente, equivalente ao resultado em (A.2.16), é dada por
Ad(r,R)−1(v, ω) =
[RT −RTMr
01,2 1
](v
ω
)=
(RT r
ω
)(A.2.18)
Note que [Adg−1 ] = [Adg]−1. Observe, também, que a ação adjunta inversa Adg−1 ,
anula a ação da ação adjunta direta, como esperado; ou seja, AdgAdg−1 = I3 para um
sistema plano. O mesmo vale para a ação coadjunta Ad∗g. A velocidade do corpo rígido
no referencial móvel ξB ∈ se(2) é obtida segundo a expressão
ξB = g−1g =
[RT R RT r
01×2 0
]=
[−ωM RT r
01×2 0
]
Mostrar que a álgebra se(2) não é abeliana é trivial. Sejam dois os elementos da álgebra
se(2) dados por ξ1 = (ω1, u1, v1) e ξ2 = (ω2, u2, v2). Calcula-se, então
ξ1ξ2 =
−ω1ω2 0 −ω1v2
0 −ω1ω2 ω1u2
0 0 0
e
ξ2ξ1 =
−ω1ω2 0 −ω2v1
0 −ω1ω2 ω2u1
0 0 0
A.2. REPRESENTAÇÕES ESPACIAIS COM A ÁLGEBRA DO GRUPO 160
Logo, ξ1 e ξ2 não comutam. Observe, no entanto, que, assim como ocorre com o grupo
SO(2), os elementos da álgebra so(2) comutam.
A aplicação exponencial exp : se(2) → SE(2) : (ω, vx, vy) 7→ (θ, rx, ry), também conhe-
cida por hélice, provem da fórmula de Rodrigues, veja (Bullo e Lewis, 2005):
θ = ω (A.2.19)
[rx
ry
]=
[vx
vy
], para ω = 0 (A.2.20a)
[sin ω
ω(1−cos ω)
ω−(1−cos ω)
ωsin ω
ω
][vx
vy
], para ω 6= 0 (A.2.20b)
161
Apêndice B
Resultados Auxiliares
Resultados auxiliares para mecânica geométrica são detalhados a seguir.
B.1 Superfície de Energia Constante para o Sistema de 2-
corpos
No que segue, apresenta-se o cálculo das superfícies iso-energia (energia constante) para
a dinâmica rotacional do sistema de dois corpos interconectados. Para isto, deseja-se
reduzir o Hamiltoniano do sistema (4.2.18) a T ∗S1. Definem-se os parâmetros µ e ν
como
µ = µ1 + µ2 = µ ν =µ2 − µ1
2Parametriza-se o momento angular como
µ1 = −ν + 1
2µ
µ2 = ν + 12µ
Substituindo estas definições em (4.2.18), tem-se:
2∆H =
[I2
(−ν +
12µ
)2
− 2ελ
(−ν +
12µ
)(ν +
12µ
)+ I1
(ν +
12µ
)2]
=[(I1 + I2 + 2ελ)ν2 + (I1 − I2)µν +
14µ2(I1 + I2 − 2ελ)
](B.1.1)
B.2. DESACOPLAMENTO DOS COMPONENTES DA SE(2) 162
A parametrização para a plotagem no espaço 3D é feita através de coordenadas cilín-
dricas: x = µ cos(φ)
y = µ sin(φ)⇒
µ =
√x2 + y2
φ = arctan( y
x
) (B.1.2)
Substituindo µ e φ em (B.1.1) e resolvendo a equação algébrica de segunda ordem para
a componente vertical ν, para um dado valor de H, determina a superfície iso-bárica.
B.2 Desacoplamento dos Componentes da se(2)
Tem-se o interesse de mostrar aqui a estrutura desacoplada dos componentes da álgebra
de Lie de grupos com produto semi-direto. Uma abordagem similar a encontrada em
Marsden, Ratiu e Weinstein (1984) será tomada a seguir. Como caso especial, pode-se
mostrar o desacoplamento dos componentes de se(2), que resulta do fato da estrutura
do grupo SO(2) de SE(2) estar desacoplada da estrutura do espaço vetorial R2.1
Seja a ação de um grupo de Lie G no espaço vetorial V . Para g1, g2 ∈ G e v1, v2 ∈ V , a
estrutura de grupo GsV é definida por
(g1, v1) · (g2, v2) = (g1g2, g1v2 + v1) (B.2.1)
onde s determina o produto semi-direto. Denomina-se por S o grupo dado pelo produto
semi-direto do grupo de Lie G com o espaço vetorial V ,
S = GsV = G×ρ V
O símbolo ×ρ é empregado em Marsden et al. (1984) para representar a mesma estrutura
de produto dada por s. Logo, para g ∈ G e u ∈ V , tem-se (g,u) ∈ S. A álgebra de
Lie associada é
s = gsV = g×ρ′ V
onde V ' TeV V e eV é o elemento identidade do espaço vetorial V . Isto pode ser
explicitado pela seguinte identidade: (0,v) = (eV ,v) ∈ TeV V ' V . Logo, os elementos
da álgebra Lie e da sua dual são
ξ ∈ g, v ∈ V ⇒ (ξ,v) ∈ s (B.2.2)
µ ∈ g∗, a ∈ V ∗ ⇒ (µ,a) ∈ s∗ (B.2.3)
1Observe que, apesar de ambos SO(2) e R2 serem abelianos, a estrutura do produto semi-direto de
SE(2) não é abeliana.
B.3. EQUAÇÃO DA CONEXÃO HORIZONTAL E HOLONOMIA 163
Ademais, o fibrado tangente possui a seguinte estrutura
vh ∈ ThG, w ∈ TvV ' V ⇒ (vh,v,w) ∈ T(h,v)(G× V ) (B.2.4)
αh ∈ T ∗hG, a ∈ T ∗vV ' V ⇒ (αh,v,a) ∈ T ∗(h,v)(G× V ) (B.2.5)
A ação à esquerda L de (g,u) em (h,v) é
L(g,u)(h,v) = (gh,u + ρ(g)v) (B.2.6)
Por causa da estrutura de um produto semi-direto de S, o elemento inverso de S é
(g,v)−1 =(g−1,−ρ(g−1)v
),2 onde ρ é um automorfismo de G em V . Segue que
L(g,u)−1(h,v) =(g−1h, g−1v − ρ(g−1)u
)
Uma translação genérica, no fibrado tangente, de (h,v) no ponto (g,u) é dada por
T(h,v)L(g,u)(vh,v,w) = (ThLgvh,u + ρ(g)v, ρ(g)w)
A translação à esquerda para a álgebra de Lie s fica
T(h,v)L(h,v)−1(vh,v,w) =(ThLh−1vh,−ρ(h−1)v + ρ(h−1)v, ρ(h−1)w
)
=(h−1vh,0, ρ(h−1)w
)
=(h−1h,0, ρ(h−1)w
)
= (ξG, eV , ξV ) ∈ s
Observe, da última igualdade, que a álgebra do espaço vetorial é dependente do elemento
de grupo h. Alternativamente, a álgebra de grupo é independente do espaço vetorial V .
Pode-se também verificar o desacoplamento da álgebra abeliana de grupo g da álgebra
do espaço vetorial V através da obtenção das constantes estruturais cbac da álgebra s.
Refira a Seção B.5.
B.3 Equação da Conexão Horizontal e Holonomia
Seja Q dado por uma estrutura principal (s, r) ∈ G×B. A solução da equação diferencial
relativa ao componente horizontal de uma conexão de Ehresman A é dada por:
s(t) = −s(t)A(r(t))r(t) = −TeLg(t)ξ(t), s(0) = e. (B.3.1)2Isto pode ser mostrado fazendo
(g,v) · (g,v)−1 = (g,v) · `g−1,−ρ(g−1)v´
=`gg−1,v − ρ(g)ρ(g−1)v
´= (e,0)
Pela natureza comutativa da ação de grupo, o elemento identidade pode ser obtido quando o elemento
inverso age à esquerda de (g,v).
B.4. CURVATURA DA CONEXÃO 164
Denominando-se s(t)−1s(t) = η(t) ∈ g, onde η(0) = 0, pode-se proceder segundo∫ t
0η dt = η(t)− η(0) = η(t) =
(−
∫ t
0A(r)r dt
)=
(−
∫ t
0ξ(t) dt
)(B.3.2)
A solução da equação diferencial (B.3.1), como discutido em Marsden et al. (1990), é
da forma
s(t) = exp(η(t)) (B.3.3)
e
s(t) = η(t) exp (η(t)) (B.3.4)
Substituindo (B.3.3) e (B.3.4) em (B.3.1), segue que
η exp(η(t)) = − exp(η(t))A(r)r ⇒ (B.3.5)
−A(r)r exp(−
∫ t
0A(r)r dt
)= − exp
(−
∫ t
0A(r)r dt
)A(r)r (B.3.6)
Ambos os lados da última expressão são iguais somente se seus fatores comutarem, ou
seja, se (condição suficiente) o grupo de Lie G for abeliano.
B.4 Curvatura da Conexão
A finalidade desta seção é mostrar como obter as expressões para o cálculo das fases ge-
ométricas de um sistema de corpos articulados. Algumas definições que serão utilizadas
abaixo podem ser encontradas no Capítulo 4 de (Marsden e Ratiu, 1999). As expressões
serão escritas para um sistema de (N = 5)-corpos. O vetor orientação θ e de formato
do sistema φ são dados por:
θ =
θ1
θ2
θ3
θ4
θ5
, φ =
φ1
φ2
φ3
φ4
=
θ21
θ32
θ43
θ54
=
θ2 − θ1
θ3 − θ2
θ4 − θ3
θ5 − θ4
, M =
0 0 0 0
1 0 0 0
1 1 0 0
1 1 1 0
1 1 1 1
Seja dxi, i = 1, . . . , n, a base dual para um dado sistema de coordenadas de uma
variedade genérica. Para uma função real f arbitrária, tem-se
d(f) = gradf · dx = (gradf)[ =∂f
∂x1dx1 +
∂f
∂x2dx2 +
∂f
∂x3dx3 + · · ·+ ∂f
∂xndxn (B.4.1)
Seja dφi, i = 1, . . . , N − 1, a base dual de um sistema de coordenadas para um espaço
de base.
B.4. CURVATURA DA CONEXÃO 165
Partindo de (5.2.4), define-se a função vetorial F como
F (φ) = − 1TNJ(φ)M
1TNJ(φ)1N
= (f1, f2, f3, f4)(φ) : R(N−1) → R(N−1)
onde as funções reais fi, ou também 0-formas, são dadas por
fi = fi(φ) : R(N−1) → R(N−1), i = 1, ..., N − 1
Transformando o vetor F em uma 1-forma por meio de um operador bemol [, segue que
F [ = f1dφ1 + f2dφ2 + f3dφ3 + f4dφ4 = A1i (φ)dφi
Observe que F [ corresponde à 1-forma da conexão A(φ)dφ no espaço de base. A
derivada exterior de F [, simbolizada por d(F [), é obtida segundo a expressão
d(F [) = df1 ∧ dφ1 − f1 ∧ d(dφ1) + df2 ∧ dφ2 − f2 ∧ d(dφ2)
+ df3 ∧ dφ3 − f3 ∧ d(dφ3) + df4 ∧ dφ4 − f4 ∧ d(dφ4)
Note o uso do operador produto exterior ∧, agora que dfi é composta por 1-formas.
Sabe-se também, das propriedades gerais de diferenciação externa das formas, que
ddφi = 0. Utilizando (B.4.1), tem-se
d(F [) = df1 ∧ dφ1 + df2 ∧ dφ2 + df3 ∧ dφ3 + df4 ∧ dφ4
=(
∂f1
∂φ1dφ1 +
∂f1
∂φ2dφ2 +
∂f1
∂φ3dφ3 +
∂f1
∂φ4dφ4
)∧ dφ1
+(
∂f2
∂φ1dφ1 +
∂f2
∂φ2dφ2 +
∂f2
∂φ3dφ3 +
∂f2
∂φ4dφ4
)∧ dφ2
+(
∂f3
∂φ1dφ1 +
∂f3
∂φ2dφ2 +
∂f3
∂φ3dφ3 +
∂f3
∂φ4dφ4
)∧ dφ3
+(
∂f4
∂φ1dφ1 +
∂f4
∂φ2dφ2 +
∂f4
∂φ3dφ3 +
∂f4
∂φ4dφ4
)∧ dφ4
Utilizando a propriedade de anti-comutatividade do produto exterior para 1-formas,
obtém-se dx∧ dy = −dy ∧ dx e dx∧ dx = 0. Agrupando os termos com fatores comuns,
chega-se a expressão
d(F [) =(
∂f2
∂φ1− ∂f1
∂φ2
)dφ1 ∧ dφ2 +
(∂f3
∂φ2− ∂f2
∂φ3
)dφ2 ∧ dφ3
+(
∂f4
∂φ3− ∂f3
∂φ4
)dφ3 ∧ dφ4 +
(∂f4
∂φ1− ∂f1
∂φ4
)dφ1 ∧ dφ4
+(
∂f3
∂φ1− ∂f1
∂φ3
)dφ1 ∧ dφ3 +
(∂f4
∂φ2− ∂f2
∂φ4
)dφ2 ∧ dφ4 (B.4.2)
B.4. CURVATURA DA CONEXÃO 166
Para o espaço R3, a expressão geral do equacionamento acima segue da seguinte equação
d(F [) = n · curlF dΩ
onde a função curl de F é (∗d(F [))\ e dΩ é o elemento infinitesimal da área sobre o
qual a integração da forma da curvatura é realizada, (Spivak, 1999).
Para uma k-forma genérica no espaço vetorial dual n-dimensional T ∗q Q (k < n) e com
a base dx1, . . . , dxk, tem-se que
ω =∑
I
ωIdxI =∑
i1<···<ik
ωi1,...,ikdxi1 ∧ · · · ∧ dxik (B.4.3)
onde a notação multi-índice I = (i1, . . . , ik) é definida acima. Observe que uma seqüên-
cia de produtos exteriores dos elementos da base acima define a função determinante
usual no espaço de matrizes GL(k,R).3 O diferencial da forma ω é
dω =∑
I
dωIdxI =∑
I
n∑
α=1
∂ω
∂xαdxα ∧ dxI (B.4.4)
Especializa-se, agora, as expressões acima para a conexão principal (k = 1) e para a
curvatura de formas (k = 2). A holonomia para o sistema pode ser computada através
de
holonomia :=∫∫
Ωd(F [) =
∫∫
ΩBdΩ
onde d(F [), para o sistema de 5-corpos, é dada por (B.4.2). Para um sistema de
3-corpos, uma holonomia não nula pode ser obtida variando-se as duas variáveis do
espaço de base. Dada a conexão A : TSO3(2) → so(2) em SO3(2)/SO(2) segue que,
para um movimento horizontal, o movimento na direção da fibra é obtida através da
integração de
Aloc(φ) =∑
ik
aikdφik = a1dφ1 + a2dφ2 (B.4.5)
O sinal negativo é omitido na expressão acima. Por outro lado, para a curvatura B
B = b12dφ1 ∧ dφ2 (B.4.6)
onde b12 pode ser escrita como uma função de aI , usando (B.4.4), como
b12 =∂a2
∂φ1− ∂a1
∂φ2(B.4.7)
3O operador determinante de matrizes é um exemplo de um tensor alternante.
B.5. CONSTANTES ESTRUTURAIS DA ÁLGEBRA SE(2) 167
Note que, por so(2) ser abeliana, o termo restante do colchete de Lie não entra nas
fórmulas de curvatura. Isto pode ser facilmente verificado observando que a única
constante estrutural nula é c111 = 0, uma vez que a álgebra é uni-dimensional.
No fibrado principal, a expressão para os componentes da curvatura da conexão é Bloc(r)·(r1, r2) = Bb
αβ r1r2eb, onde
Bbαβ =
(∂Ab
β
∂rα− ∂Ab
α
∂rβ− cb
acAaαAc
β
)
e onde as cbac são as constantes estruturais detalhadas na Seção B.5.
B.5 Constantes estruturais da álgebra se(2)
Seja g a álgebra de Lie algebra do grupo de Lie G. As constantes estruturais da álgebra
g são os escalares cbac, para a, b, c = 1, ..., n, onde n é a dimensão da álgebra g. Dada
uma base da álgebra e1, e2, ..., en, as constantes estruturais são determinadas através
de
[ea, ec] = cbaceb
onde [., .] representa a operação dada pelos colchetes de Lie. Para o grupo SE(2),
parametrizado pelos elementos com a estrutura g = (rx, ry, θ), tem-se os seguintes com-
ponentes da base para a álgebra correspondente se(2)
e1 =
0 0 1
0 0 0
0 0 0
, e2 =
0 0 0
0 0 1
0 0 0
, e3 =
0 −1 0
1 0 0
0 0 0
pois dim se(2) = 3. Utilizando esta base no cálculo das constantes estruturais através
dos colchetes de Lie, obtém-se
c1ac =
0 0 0
0 0 1
0 −1 0
, c2
ac =
0 0 −1
0 0 0
1 0 0
, c3
ac = 03×3 (B.5.1)
B.6 Espaço Tangente à Órbita do Grupo
O espaço tangente à órbita do grupo pelo ponto q ∈ Q é definido pela expressão
TqOrb(q) = ξQ(q) | ξ ∈ g ⊂ TqQ
B.6. ESPAÇO TANGENTE À ÓRBITA DO GRUPO 168
Para G = SO(2) e um elemento ω ∈ so(2), o espaço TqOrb(q) fica
TqOrbSO(2)(q) = ω
(∂
∂θ1+
∂
∂θ2+ · · ·+ ∂
∂θN
)
= span
∂
∂θ1+
∂
∂θ2+ · · ·+ ∂
∂θN
pois SO(2) age igualmente em todos os corpos e ω = θ = θ1 = · · · = θN . Quando
G = SE(2) e para um elemento da álgebra ξ ∈ se(2), em função das coordenadas
(ω, vx, vy), tem-se que o espaço TqOrbG(q) toma a seguinte forma
TqOrbSE(2)(q) = vx∂
∂rx+ vy
∂
∂ry+ ω
(−ry
∂
∂rx+ rx
∂
∂ry+
∂
∂θ1+
∂
∂θ2+ · · ·+ ∂
∂θN
)
= span
∂
∂rx,
∂
∂ry,−ry
∂
∂rx+ rx
∂
∂ry+
∂
∂θ1+
∂
∂θ2+ · · ·+ ∂
∂θN
Observe que TqOrbG(q) é um espaço tridimensional, ou seja, dimTqOrbG(q) = 3, mer-
gulhado no espaço tangente TqQ, cuja dimensão, em função do número de corpos com-
ponentes do sistema, é 2(N + 2).
B.6.1 Gerador Infinitesimal de SE(2)
O objetivo desta seção consiste em obter o gerador infinitesimal da álgebra do grupo
SE(2) no espaço de configuração Q. A título de exemplificação, utilizar-se-á o espaço
de configuração do sistema de dois corpos (N = 2). Revisa-se, primeiramente, a ação
do grupo G na variedade Q. Seja G = SE(2) o grupo de Lie, dado por g = (R, r) ∈ G,
agindo nele mesmo, ou seja em Q = SE(2), onde q = (R1, rcm) = (θ1, rx, ry) ∈ Q. Este
é o típico caso de transformações da configuração do corpo rígido no plano. Portanto,
a ação à esquerda Φg do grupo SE(2) em Q fica
Φg(q) =
[R r
0 1
][R1 rcm
0 1
]=
[RR1 Rrcm + r
0 1
](B.6.1)
Seja agora a ação de SE(2), com a mesma parametrização acima, em Q = S1×S1×R2,
onde q = (R1,R2, rcm) = (θ1, θ2, rx, ry) ∈ Q. Logo, a ação à esquerda Φg é
Φg(q) =
[R r
0 1
][R1 R2 rcm
0 0 1
]=
[RR1 RR2 Rrcm + r
0 0 1
](B.6.2)
Observe que a orientação relativa entre os corpos 1 e 2, dada pela coordenada φ do
espaço de base B, não é alterada com a ação de grupo. Isto equivale a dizer que a
B.6. ESPAÇO TANGENTE À ÓRBITA DO GRUPO 169
ação de grupo se aplica somente à componente da fibra G do espaço de configuração Q,
permanecendo inalteradas as coordenadas do espaço de base B.
Seja o elemento da álgebra de Lie se(2) dado por ξ = (ω,v) = (ω, vx, vy), onde ω define
a matriz anti-simétrica Ω como
Ω =
[0 −ω
ω 0
]= ωM ∈ so(2)
onde M é a matriz simplética definida na Seção A.2.2. Seja uma curva na álgebra se(2)
parametrizada por t e dada por tξ = t(ω, vx, vy) ∈ se(2). Para computar a exp de tξ
observe que, para tω 6= 0, tem-se
exp(tξ) =
[R(tω) p(t)
0 1
]∈ SE(2) (B.6.3)
onde
p(t) =1tω
[sin(tω) −(1− cos(tω))
1− cos(tω) sin(tω)
][tvx
tvy
](B.6.4)
Quando tω = 0, segue, da regra de diferenciação de l’Hospital, que exp(tξ) é simples-
mente tξ. Portanto
Φexp(tξ)(q) =
(R(tω)R1,R(tω)R2,R(tω)r + p(t)), para ω 6= 0 (B.6.5a)
(R(tω)R1,R(tω)R2,R(tω)r + tv), para ω = 0 (B.6.5b)
Logo, o gerador infinitesimal é dado por
ξQ(q) =d
dt
∣∣∣∣t=0
Φexp(tξ)(q) (B.6.6)
=(ΩR1, ΩR2, Ωr + v
)(B.6.7)
pois
d
dt
∣∣∣∣t=0
R(tω) =
R(tω)Ω∣∣∣t=0
= Ω, ou (B.6.8a)
ΩR(tω)∣∣∣t=0
= Ω (B.6.8b)
ed
dt
∣∣∣∣t=0
p(t) =1ω
ωR(tω)∣∣∣∣t=0
v = I2v = v (B.6.9)
Procura-se, agora, obter uma base para o espaço gerado pela Álgebra de Lie, parametri-
zado por ξ, na variedade de quatro dimensões Q. Qualquer elemento do espaço tangente
B.6. ESPAÇO TANGENTE À ÓRBITA DO GRUPO 170
sobre Q tem coordenadas dadas por (x, y, θ1, θ2). De (B.6.7), segue que
q = x∂
∂x+ y
∂
∂y+ θ1
∂
∂θ1+ θ2
∂
∂θ2
= (−yω + vx)∂
∂x+ (xω + vy)
∂
∂y+ ω
∂
∂θ1+ ω
∂
∂θ2(θ1 = θ2 = θ = ω)
= vx∂
∂x+ vy
∂
∂y+ ω
(−y
∂
∂x+ x
∂
∂y+
∂
∂θ1+
∂
∂θ2
)= ξQ(q)
Ou, equivalentemente
ξQ(q) = (vx − ryω)∂
∂x+ (vy + rxω)
∂
∂y+ ω
∂
∂θ1+ ω
∂
∂θ2
O espaço gerado pela Álgebra de Lie, através de ξ, em Q é denominada espaço tangente
á órbita do grupo em q e representado por TqOrb(q). Segundo a descrição do caso
acima, este espaço é construído da seguinte maneira
TqOrb(q) = span
∂
∂x,
∂
∂y,−y
∂
∂x+ x
∂
∂y+
∂
∂θ1+
∂
∂θ2
⊂ TqQ
e, portanto, dimTqOrb(q) = 3. Logo, uma base natural para o gerador de se(2) em Q é
(1, 0, 0)Q =∂
∂x
(0, 1, 0)Q =∂
∂y
(0, 0, 1)Q = −y∂
∂x+ x
∂
∂y+
∂
∂θ1+
∂
∂θ2
Observe que o quando espaço de configuração Q é dado por uma estrutura principal
G × B, o gerador infinitesimal em Q não apresenta influência da ação de grupo nas
direções do espaço de base B. No caso estudado acima, o gerador infinitesimal adquire
a seguinte forma:
(1, 0, 0)Q =∂
∂x
(0, 1, 0)Q =∂
∂y
(0, 0, 1)Q = −y∂
∂x+ x
∂
∂y+
∂
∂θ1+ 0
∂
∂φ
171
Apêndice C
Modelagem Complementar
C.1 O Corpo Rígido
Centro deMassa
f1
f2
Referencial
ReferencialMovel
Inercial
y
x
z1
z2
Figura C.1: O corpo rígido com dois propulsores no SE(2).
Considere um corpo rígido no plano com dois propulsores f1, f2 alinhados na direção
longitudinal do corpo e localizados simetricamente em ambos os lados do centro de
massa. Note, pela Fig. C.1, que os propulsores atuam na direção v do referencial do
móvel do corpo.
As coordenadas inerciais são determinadas por (rx, ry, θ) e por µS = (px, py, pθ), onde
rx, ry, θ são as coordenadas de grupo SE(2) do centro de massa do corpo. O movi-
mento no referencial do corpo é parametrizado por µB = (Px, Py, Pθ). As equações de
C.1. O CORPO RÍGIDO 172
movimento, no referencial inercial, são dadas por:
rx = px/m (C.1.1)
ry = py/m (C.1.2)
θ = pθ/I (C.1.3)
px = −(f1 + f2) sin(θ) (C.1.4)
py = (f1 + f2) cos(θ) (C.1.5)
pθ = (f2 − f1)L (C.1.6)
Note que a aplicação momento fornece o momento total do sistema com relação à origem
do referencial inercial:
J(vq) = µS =
px
py
rxpy − rypx + pθ
=
mrx
mry
m(rxry − ry rx) + Iθ
Na ausência de esforços externos, a taxa de variação temporal do momento total µS ≡ 0,
como previsto pelo Teorema de Noether.
Observe que a estrutura das equações acima em muito se assemelha à estrutura das
equações cinemáticas do uniciclo, dadas por
rx = u1 cos(θ)
ry = u1 sin(θ)
θ = u2
e parametrizadas pela entrada (u1, u2). Sabe-se que estas equações não são lineari-
záveis por realimentação estática (Respondek, 2002), pela falta de involutividade de
determinadas distribuições geradas pelos campos vetoriais do modelo. As equações de
movimento (dinâmica) do uniciclo são dadas por
rx = px/m (C.1.7)
ry = py/m (C.1.8)
θ = pθ/I (C.1.9)
px = u1 cos(θ) (C.1.10)
py = u1 sin(θ) (C.1.11)
pθ = u2 (C.1.12)
C.1. O CORPO RÍGIDO 173
Observe a semelhança das equações acima com as equações de movimento do corpo
rígido (C.1.1). Isto pode ser verificado por uma reparametrização das variáveis de
entrada, em relação aos parâmetros de entrada originais (f1, f2), definida por[u1
u2
]=
[1 1
−1 1
][f1
f2
]=
[f1 + f2
f2 − f1
]
O corpo rígido com dois propulsores possui todos os seus autovalores nulos, quando
o modelo dinâmico correspondente é expresso nas coordenadas do referencial inercial
(rx, ry, θ, px, py,Π). Neste referencial o sistema é controlável na fibra, ou na álgebra
se(2)∗, uma vez que o critério de posto pleno (LARC) é satisfeito para um sistema com
campo vetorial f(z) identicamente nulo. O equilíbrio do corpo rígido dado no referencial
inercial é dado por (q, p) = (q0, 0), fixada uma configuração q0 qualquer.
Obtendo-se o momento correspondente no referencial móvel, através de µB = Ad∗g−1µS ,
tem-se
µB =
cos(θ)px + sin(θ)py
− sin(θ)px + cos(θ)py
Iθ
=
Px
Py
Pθ
Como, no caso plano, um dos eixos está sempre alinhado, tem-se que Pθ = pθ = Iθ e,
portanto, quando da conservação do momento angular pθ = Pθ = 0. As equações de
movimento escritas no referencial móvel, utilizando o momento linear acima, são dadas
por:
rx =1m
(Px cos(θ)− Py sin(θ)) (C.1.13)
ry =1m
(Px sin(θ) + Py cos(θ)) (C.1.14)
θ = Pθ/I (C.1.15)
Px = Pθ/IPy (C.1.16)
Py = −Pθ/IPx + (f1 + f2) (C.1.17)
Pθ = (f2 − f1)L (C.1.18)
Quando expresso nas coordenadas do referencial móvel (rx, ry, θ, Px, Py,Π), entretanto,
pode-se verificar a existência de dois autovalores no eixo imaginário (±iΠ/I) e os quatro
autovalores restantes são nulos. Neste caso, o campo vetorial das variáveis em se(2)∗ é
não-nulo.
C.2. SISTEMA MULTI-CORPOS 174
C.2 Sistema Multi-Corpos
C.2.1 Matriz de Inércia do Sistema
Detalha-se nesta seção o algoritmo iterativo para determinação da matriz de inércia Joriginalmente apresentado em Sreenath (1987), mas mostrado corretamente a seguir. A
matriz de inércia é utilizada no modelo analítico apresentado na Seção 4.1.
Considera-se o referencial móvel localizado no centro de massa do sistema. A posição
do centro de massa do sistema, em relação ao referencial inercial Figura C.2, é dado por
r =1m
N∑
i=1
mkrk (C.2.1)
ReferencialMovel
Centro deMassa
ReferencialInercial
r
corpo k + 1
corpo k
αkβk
corpo k − 1
rk
r0k
Figura C.2: Esquema para a modelagem da matriz de inércia do sistema multi-articulado
J.
Para um sistema de N corpos interconectados note que α1, β1@. Adicionalmente, β2 é
o vetor do centro de massa do corpo 1 a junta com o corpo 2.
A posição do k-ésimo corpo em relação ao baricentro do sistema, é dado, em coordenadas
C.2. SISTEMA MULTI-CORPOS 175
inerciais, por
r0k = −
N∑
l=2
εl
∑
i ∈ S0,l
i 6= 1
βi
+
[−
N∑
l=2
εlαl
]+
∑
j ∈ S0,k
j 6= 1
βj + αk
= −N∑
l=2
εl
[N∑
i=1
Il,iβi
]+
N∑
i=1
Ik,iβi −N∑
l=2
εlαl + αk
= −N∑
i=1
[N∑
l=2
εl
]Il,iβi +
N∑
i=1
Ik,iβi −N∑
i=2
εiαi + αk
=N∑
i=1
[Ik,i −
N∑
l=2
Il,iεl
]βi +
N∑
i=1
bk,iαi
=N∑
i=1
[ak,iβi + bk,iαi]
Os vetores rk e r0k são dados no referencial inercial. A inércia expandida é obtida
fazendo-se
Ik = Ik +N∑
j=1
mj‖δkj‖2 (C.2.2)
onde
δkj = bkjαj +∑
∀ i tal queJ(i) = j
akiβi (C.2.3)
onde os coeficientes acima são definidos por
aki = Iki −N∑
l=2
Iliεl, (C.2.4)
bki =
1− εi, para k = i e i 6= 1 (C.2.5a)
0, para k = i = 1 (C.2.5b)
−εi, para k 6= i e i 6= 1, (C.2.5c)e
Ili =
1, se i ∈ S0,l e i 6= 1 (C.2.6a)
0, caso contrário (C.2.6b)
O processo iterativo inicia-se no corpo denominado corpo 1. Note que, ao começar a
iteração do corpo 1, α1 and β1 não são definidos.
C.2. SISTEMA MULTI-CORPOS 176
Observação C.2.1. A matriz de inércia J é invariante a ação da fibra SE(2), como
pode ser observado pela ausência de coordenadas do grupo, mas função apenas das
coordenadas φ do espaço de base B. Além disso, a matriz de inércia determinada pelo
algoritmo acima é definida positiva e simétrica e, portanto, invertível e diagonalizável,
respectivamente, como esperado.
C.2.2 Modelo do sistema de 3-corpos
A matriz de inércia do sistema é dada por
J =
J11 J12 J13
J21 J22 J23
J31 J32 J33
(C.2.7)
onde, lembrando que J = JT , e
J11 = I1 + [m1(−e2 − e3)2 + (m2 + m3)(1− e2 − e3)2]d21
J22 = I2 + [m1(−e2 − 2e3)2 + m2(1− e2 − 2e3)2 + m3(2− e2 − 2e3)2]d22
J33 = I3 + [(m1 + m2)e23 + m3(1− e3)2]d2
3
J12 = J21 = [m1(e2 + e3)(e2 + 2e3) + (m2(1− e2 − 2e3) + m3(2− e2 − 2e3))
(1− e2 − e3)]d1d2 cos(φ1)
J13 = J31 = [m1e3(e2 + e3)− (m2e3 −m3(1− e3))(1− e2 − e3)]d1d3 cos(φ1 + φ2)
J23 = J32 = [(m1(e2 + 2e3)−m2(1− e2 − 2e3))e3 + m3(2− e2 − 2e3)(1− e3)]
d2d3 cos(φ2)
Adotando m1 = m2 = m3 = m, I1 = I2 = I3 = I, e d1 = d2 = d3 = d, J simplifica na
J =
I + 23md2 md2 cos(φ1) 1
3md2 cos(φ1 + φ2)
md2 cos(φ1) I + 2md2 md2 cos(φ2)13md2 cos(φ1 + φ2) md2 cos(φ2) I + 2
3md2
(C.2.8)
As equações do movimento de translação, quando apenas as forças de propulsão f1 e f3
estão presentes, são dadas por
rx =px
m1 + m2 + m3=
px
3m
ry =py
m1 + m2 + m3=
py
3m
px = − sin(θ1)f1 − sin(θ1 + φ1 + φ2)f3
py = cos(θ1)f1 + cos(θ1 + φ1 + φ2)f3
C.2. SISTEMA MULTI-CORPOS 177
A dinâmica da orientação do sistema θ1 segue da expressão
θ =∂H
∂µ1
= 3µ1(5m2d4 + 16Imd2 + 6I2) + md2(2I + md2)(3µ2 cos(φ1) + µ3 cos(φ1 + φ2))
18∆+
+ 3m2d4(3µ3 cos(φ1 − φ2) + µ2 cos(φ1 + 2φ2)− 3µ1 cos(2φ2))
18∆
onde ∆ = det(J) e
∆ = I3 + md2(103
I2 +3718
Imd2 +518
m2d4) +118
m2d4(md2 − I) cos(2φ2 + 2φ1)−
− 16m2d4(md2 + 3I)(cos(2φ1) + cos(2φ2))
Utilizando a parametrização θcm = (θ1+θ3)/2, os campos vetoriais relativos às entradas
(f1, f2), T1 e T2 são os seguintes
g1 =
0
0
0
0
0
sin(−θcm + (φ1 + φ2)/2)
cos(−θcm + (φ1 + φ2)/2)
d(−2/3− cos(φ1)− cos(φ1 + φ2)/3)
0
0
, g2 =
0
0
0
0
0
− sin(θcm + (φ1 + φ2)/2)
cos(θcm + (φ1 + φ2)/2)
d(cos(φ1 + φ2)/3 + cos(φ2) + 2/3)
0
0
Os campos vetoriais dos torques são dados por g3 = [0, 0, 0, 0, 0, 0, 0, 0, 1, 0] e g4 =
[0, 0, 0, 0, 0, 0, 0, 0, 0, 1].
C.2.3 Modelo do sistema de 5-corpos
Para N = 5 onde tomam-se mi = m, Ii = I, e di = d, i = 1, . . . , 5, a matriz de inércia
J simplifica a
J =
I + 4/5md2 7/5md2 cos(θ21) md2 cos(θ31) 3/5md2 cos(θ41) 1/5md2 cos(θ51)
7/5md2 cos(θ21) I + 16/5md2 3md2 cos(θ32) 9/5md2 cos(θ42) 3/5md2 cos(θ52)
md2 cos(θ31) 3md2 cos(θ32) I + 4md2 3md2 cos(θ43) md2 cos(θ53)
3/5md2 cos(θ41) 9/5md2 cos(θ42) 3md2 cos(θ43) I + 16/5md2 7/5md2 cos(θ54)
1/5md2 cos(θ51) 3/5md2 cos(θ52) md2 cos(θ53) 7/5md2 cos(θ54) I + 4/5md2
C.2. SISTEMA MULTI-CORPOS 178
As equações do movimento de translação são dadas por
rx =px
m1 + m2 + m3 + m4 + m5=
px
5m
ry =py
m1 + m2 + m3 + m4 + m5=
py
5m
px = − sin(θ1)f1 − sin(θ1 + φ1 + φ2 + φ3 + φ4)f5
py = cos(θ1)f1 + cos(θ1 + φ1 + φ2 + φ3 + φ4)f5
A dinâmica rotacional do sistema é determinada por
θi,i−1 =∂H0
∂µi− ∂H0
∂µi−1, i = 2, .., N
µ1 =∂H0
∂θ2,1− T1 + T ext
1
µ2 =∂H0
∂θ3,2− ∂H0
∂θ2,1− T2 + T1
µ3 =∂H0
∂θ4,3− ∂H0
∂θ3,2− T3 + T2
µ4 =∂H0
∂θ5,4− ∂H0
∂θ4,3− T4 + T3
µ5 = − ∂H0
∂θ5,4+ T4 + T ext
5
onde T ext1 e T ext
5 são determinadas em (4.2.9), para k = 1, 5. As demais equações da
dinâmica serão omitidas por serem demasiadamente extensas.
C.2.4 Modelo Cinemático do Sistema
O modelo cinemático para o sistema multi-corpos é composto pelo componente cine-
mático em (3.4.1), descrevendo o movimento do sistema na fibra G, cujas entradas são
dadas pelas coordenadas de velocidades que parametrizam o momento do sistema. Além
da expressão acima, a cinemática do sistema é definida pelas equações em B
φi = θi+1 − θi, i = 1, . . . , N − 1
Observe que, quando o momento do sistema não representa uma entrada mas apenas
um parâmetro não-nulo do movimento, o sistema cinemático é caracterizado por um
componente de dinâmica livre.
C.2. SISTEMA MULTI-CORPOS 179
C.2.5 Modelagem Lagrangiana
Reproduz-se nas próximas páginas o artigo Souza e Maruyama (2007), publicado no
3rd IFAC Symposium on Systems, Structures and Control - SSSC, realizado em Fóz do
Iguaçú em Outubro de 2007.