jéssica neckel cavalheiro a forma canônica de jordan
-
Upload
truongngoc -
Category
Documents
-
view
222 -
download
1
Transcript of jéssica neckel cavalheiro a forma canônica de jordan
UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC
CENTRO DE CIÊNCIAS TECNOLÓGICAS - CCT
CURSO DE LICENCIATURA EM MATEMÁTICA
TRABALHO DE CONCLUSÃO DE CURSO
A FORMA CANÔNICA DE JORDAN
JÉSSICA NECKEL CAVALHEIRO
JOINVILLE, 2015
JÉSSICA NECKEL CAVALHEIRO
A FORMA CANÔNICA DE JORDAN
Trabalho de Graduação apresentado ao
Curso de Licenciatura em Matemática
do Centro de Ciências Tecnológicas,
da Universidade do Estado de Santa
Catarina, como requisito parcial para
a obtenção do grau de Licenciatura em
Matemática.
Orientador(a): Prof. Ms. Marnei
Luis Mandler
JOINVILLE, SC
2015
A minha família.
Agradecimentos
Primeiramente agradeço a Deus que me concedeu a oportuni-
dade de realizar este curso.
Sou grata a todas as minhas amigas que de alguma forma me
ajudaram durante o curso, em especial as meninas Andressa Mocellin,
Bruna Corso, Evelyn Freitas, Joyce Finamor e Karla Prudencio.
Agradeço a professora Viviane, pois sem ela este trabalho não
seria possível. E ao professor Marnei que aceitou gentilmente o desafio
de orientar este trabalho e por sempre acreditar em mim.
E finalmente, a minha família pelo apoio e amor que me deram.
Resumo
CAVALHEIRO, Jéssica Neckel. A Forma Canônica de Jor-
dan. 2015. 101p.. Trabalho de Conclusão de Curso (Graduaçãoem Licenciatura em Matemática) - Universidade do Estado deSanta Catarina, Joinville, 2015.
A Forma Canônica de Jordan é um conceito bastante importanteda Álgebra Linear, pois fornece a representação matricial maissimples possível para um operador linear não diagonalizável de-finido num espaço vetorial de dimensão finita. Para construir ateoria que permeia a construção da Forma de Jordan utilizam-se,neste trabalho, os conceitos, propriedades e resultados referentesa Somas Diretas, Subespaços Invariantes, Decomposição Primá-ria, Operadores Nilpotentes, Autovetores Generalizados, dentreoutros. Prova-se que a Forma Canônica de Jordan pode ser ob-tida quando o polinômio característico do operador consideradopuder ser decomposto em fatores lineares, o que sempre ocorreno corpo dos complexos. A existência da Forma de Jordan paraum operador qualquer será uma consequência da sua existênciapara operadores nilpotentes. Com o auxílio dos autovetores ge-neralizados será possível exibir uma base para o espaço vetorialem relação à qual a representação matricial do operador linearconsiderado estará na Forma de Jordan. Diversos exemplos sãoresolvidos detalhadamente, incluindo uma aplicação da Formade Jordan na resolução de Sistema de Equações Diferenciais Or-dinárias.
Palavras-chave: Álgebra Linear. A Forma Canônica de Jordan.Operadores Nilpotentes. Decomposição Primária.
Abstract
CAVALHEIRO, Jéssica Neckel. The Jordan Canonical Form.2015. 101p.. Work of Course Conclusion (Graduate Degree inMathematics) - Santa Catarina State University, Joinville, 2015.
The Jordan’s canonical form is a important concept in linearalgebra, because it provides the simplest possible matrix repre-sentation to the linear operator not diagonalizable in a vectorspace of finite dimension. To develop the theory construction ofthe Jordan’s canonical form, was used in this bachelor work, theconcepts, properties and results for the Direct Sums, InvariantSubspaces, Primary Decomposition, Nilpotent Operator, Gener-alized Eigenvectors, etc. Prove up that the Jordan’s canonicalform can be obtained when the characteristic polynomial of thisoperator can be decomposed into linear factors, and this alwayshappens when it is in the field of the complexes. The existence ofthe Jordan’s form for any operator will be a consequence of itsexistence for nilpotent operators. With the aid of the generalizedeigenvectors, it is possible to show a basis for vector space forwhich the matrix representation of linear operator is consideredin Jordan’s form. Several examples are solved in detail, includingan application of Jordan’s form to solve the system of ordinarydifferential equation.
Key-words: Linear Algebra. The Jordan Canonical Form. Nilpo-tent Operators. Primary Decomposition.
Lista de símbolos
R Conjunto dos números reais
K Corpo (real ou complexo)
Mn(K) Conjunto das matrizes quadradas de ordem n sobre
K
P (K) Conjunto dos polinômios sobre K
dim(V ) Dimensão do Espaço Vetorial V
Im(T ) Imagem do operador T
Nuc(T ) Núcleo do operador T
T |U Restrição do operador linear T : V −→ V a um
subespaço vetorial U ⊂ V[
T]
Representação matricial do operador T na base canô-
nica[
T]
γRepresentação matricial do operador T na base γ
detA Determinante da matriz A
mdc(p1, p2) Máximo divisor comum entre p1(x) e p2(x)[
v1, v2, · · · , vn
]
Subespaço vetorial gerado pelos vetores
v1, v2, · · · , vn
Sumário
INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1 CONCEITOS PRELIMINARES . . . . . . . . . . . . . . . . 19
1.1 SOMA DIRETA . . . . . . . . . . . . . . . . . . . . . . 19
1.2 SUBESPAÇOS INVARIANTES . . . . . . . . . . . . . . 24
1.3 POLINÔMIOS DE MATRIZES . . . . . . . . . . . . . . 29
1.4 AUTOVALOR E AUTOVETOR . . . . . . . . . . . . . 32
1.5 OPERADORES DIAGONALIZÁVEIS . . . . . . . . . . 43
2 FORMA CANÔNICA RACIONAL . . . . . . . . . . . . . . 47
2.1 DECOMPOSIÇÃO PRIMÁRIA . . . . . . . . . . . . . . 47
2.2 SUBESPAÇOS CÍCLICOS . . . . . . . . . . . . . . . . 53
2.3 FORMA CANÔNICA RACIONAL . . . . . . . . . . . . 59
3 A FORMA CANÔNICA DE JORDAN . . . . . . . . . . . . 63
3.1 OPERADORES NILPOTENTES . . . . . . . . . . . . . 63
3.2 AUTOVETORES GENERALIZADOS . . . . . . . . . . 75
3.3 A FORMA CANÔNICA DE JORDAN . . . . . . . . . . 78
CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Apêndices 97
APÊNDICE A PROPRIEDADES . . . . . . . . . . . . . . . . 99
17
INTRODUÇÃO
Durante o curso de graduação em Licenciatura em Matemática,
o estudo dos operadores lineares fica basicamente restrito aos diagona-
lizáveis, ou seja, àqueles cujos autovetores formam uma base para o
espaço vetorial e, portanto, podem ser representados através de uma
matriz diagonal, sendo esta a melhor representação para estes casos.
Porém, não é estudado, ao longo da graduação, se existe uma forma de
representar os operadores que não são diagonalizáveis de uma maneira
mais simples. Veremos que existem outras formas que possibilitam esta
representação, uma delas é através da Forma Canônica Racional, que
abordaremos de forma sucinta neste trabalho, visto que nosso maior
objetivo é estudar a Forma Canônica de Jordan.
Para realizar o estudo referente aos operadores não diagona-
lizáveis, aprofundaremos e ampliaremos muitos dos conhecimentos já
vistos na disciplina de Álgebra Linear. Portanto, ao longo deste traba-
lho, será realizada uma revisão teórica dos conceitos necessários para
que seja possível definir a Forma Canônica de Jordan de um operador
linear definido num espaço vetorial de dimensão finita.
Apesar de não ser possível encontrar uma base formada por
autovetores, no caso dos operadores não diagonalizáveis, veremos que
através da Forma Canônica de Jordan, existe uma base formada por
autovetores generalizados a qual fornece uma representação matricial
cuja diagonal é constituída por blocos de Jordan. Os blocos de Jordan
são matrizes tais que sua diagonal principal é formada pelos autovalores
do operador, logo abaixo desta diagonal os elementos são todos iguais
a 1 e os restantes são todos nulos.
Para construir a Forma Canônica de Jordan recorremos aos
operadores nilpotentes, operadores que se anulam quando elevados a
18 Introdução
uma determinada potência, pois a existência da Forma Canônica de
Jordan para estes operadores possibilita sua existência para qualquer
operador linear.
Este trabalho consiste em uma pesquisa bibliográfica, pau-
tada essencialmente em Coelho e Lourenço (2010), Lipschutz e Lipson
(2011), Lima (2009) e Hoffman e Kunze (1971). No Capítulo 1 será
feita uma revisão de alguns conceitos de Álgebra Linear. No Capítulo 2
será abordado a Forma Canônica Racional e o Decomposição Primária.
E finalmente, no Capítulo 3 será apresentada a construção da Forma
Canônica de Jordan, exibindo diversos exemplos.
19
1 CONCEITOS PRELIMINARES
Para compreendermos a Forma Canônica de Jordan será neces-
sário discorrer sobre alguns conceitos preliminares de Álgebra Linear
que serão necessários para a sua construção.
1.1 SOMA DIRETA
Indicaremos V como um espaço vetorial sobre o corpo K, real
ou complexo, e U , W como subespaços vetoriais de V . Em nosso es-
tudo será necessário escrever V como a soma de subespaços vetoriais,
isto nos auxiliará a demonstrar alguns resultados e, muitas vezes, será
conveniente que estes subespaços sejam ditos T-invariantes.
Quando V = U + W , isto significa que para qualquer v ∈ V
temos que v = u + w, onde u ∈ U e w ∈ W . Desta forma, podemos
definir a soma direta de subespaços vetoriais.
Definição 1.1. Dizemos que V é uma soma direta de U e W se para
todo elemento de v ∈ V , tem-se v = u + w, com u ∈ U e w ∈ W , de
maneira única.
Da mesma forma, se V = U + W e U ∩ W = {−→0 }, então
podemos afirmar que a soma entre U e W é direta. Assim, temos o
seguinte teorema.
Teorema 1.1. Seja V um espaço vetorial sobre o corpo K e sejam U
e W dois subespaços de V. Se V = U + W e U ∩W = {−→0 }, então a
soma é direta.
Demonstração: Seja v ∈ V tal que v = u + w, sendo u ∈ U
e w ∈ W . Para provar que a soma é direta precisamos mostrar que
20 Capítulo 1. CONCEITOS PRELIMINARES
v = u + w é escrito de forma única. Assim, sejam u′ ∈ U e w′ ∈ V tal
que v = u′ + w′. Desta forma
u + w = u′ + w′
e então,
u− u′ = w′ − w
com u− u′ ∈ U e w′ − w ∈ W . Como U ∩W = {−→0 }, temos
u− u′ = w′ − w = 0
Donde, u− u′ = 0 e w′ − w = 0, desta forma u = u′ e w = w′.
Logo, v = u + w é escrito de forma única.
Observação 1.1. Quando V é escrito numa soma direta de subespaços
U e W, denotamos
V = U ⊕W.
A seguir, veremos que se V = U + W podemos encontrar a
dimensão desta soma através da expressão
dim(U + W ) = dim(U) + dim(W )− dim(U ∩W ).
Porém, se a soma é direta fica evidente que dim(U + W ) =
dim(U) + dim(W ). Para demonstrar o Teorema referente à esta di-
mensão, utilizaremos o seguinte Lema, baseado em Lipschutz e Lipson
(2010).
Lema 1.1. Sejam V um espaço vetorial de dimensão finita e α =
{u1, u2, . . . , ur} um conjunto de vetores linearmente independente em
V. Então α pode ser estendido para uma base de V.
Teorema 1.2. Sejam U e W subespaços vetoriais de V com dimensão
finita. Então:
dim(U + W ) = dimU + dimW − dim(U ∩W ).
1.1. SOMA DIRETA 21
Demonstração:
Sejam dimU = m, dimW = n e dim(U ∩W ) = r. Suponhamos
que α = {v1, v2, . . . , vr} é uma base de U ∩W .
Pelo Lema 1.1, podemos estender α a uma base de U e a uma
base de W . Assim, obtemos β = {v1, . . . , vr, u1, u2, . . . , um−r} uma base
de U e γ = {v1, . . . , vr, w1, w2, . . . , wn−r} uma base de W e considere-
mos
δ = {v1, . . . , vr, u1, . . . , um−r, w1, . . . , wn−r}.
Observe que δ tem m + n − r elementos. Precisamos mostrar
que δ é uma base de U + W . Como β gera U e γ gera W , então a união
de β com γ, que denotamos por δ, gera U + W .
Agora basta provar que γ é linearmente independente. Supo-
nhamos que existem escalares ai, bj , ck, com 1 ≤ i ≤ r, 1 ≤ j ≤ m− r
e 1 ≤ k ≤ n− r, tais que:
a1v1 + . . .+arvr +b1u1 + . . .+bm−rum−r +c1w1 + . . .+cn−rwn−r =−→0 .
(1.1)
Seja,
v = a1v1 + . . . + arvr + b1u1 + . . . + bm−rum−r. (1.2)
Por 1.1, obtemos:
v = −c1w1 − . . .− cn−rwn−r. (1.3)
Como β é uma base de U , então v ∈ U . Por 1.3 concluímos que
v ∈ W . Desta forma, v ∈ U ∩W .
Como α é base de U ∩ W , então existem escalares d1, . . . , dr
tais que
v = d1v1 + . . . + drvr.
Por 1.3, temos
d1v1 + . . . + drvr = −c1w1 − . . .− cn−rwn−r
22 Capítulo 1. CONCEITOS PRELIMINARES
isto é,
d1v1 + . . . + drvr + c1w1 + . . . + cn−rwn−r =−→0 .
Como o conjunto γ é linearmente independente, temos que
c1 = · · · = cn−r = 0. Assim, a equação 1.1 resulta em
a1v1 + . . . + arvr + b1u1 + . . . + bm−rum−r =−→0 .
Como β é linearmente independente, temos que
a1 = · · · = ar = b1 = · · · = bm−r = 0.
Logo, de 1.1 concluímos que todos os coeficientes ai, bj , ck são
nulos, portanto δ é linearmente independente, finalizando a demonstra-
ção.
Depois de comprovado o Teorema 1.2, a demonstração do pró-
ximo Corolário é trivial.
Corolário 1.1. Se V é um espaço vetorial sobre K de dimensão finita
e V = U ⊕W , então
dim(V ) = dim(U) + dim(W ).
Demonstração: Como a soma de U e W é direta, temos que
U ∩W = {−→0 }. Assim, dim(U ∩W ) = 0. Portanto, pelo Teorema 1.2
concluímos que dim(V ) = dim(U) + dim(W ).
Se V = U ⊕W e são conhecidas às bases de U e W , é possível
encontrar uma base para o espaço vetorial V , basta apenas fazer a
união de uma das bases de U com uma base de W , conforme o próximo
Teorema.
Teorema 1.3. Suponha que V = U ⊕W e que B′ = {u1, . . . , um} e
B′′ = {w1, . . . , wn} sejam subconjuntos linearmente independentes de
U e W , respectivamente. Então, são válidas as seguintes afirmações:
1.1. SOMA DIRETA 23
(i) B = B′ ∪B′′ é linearmente independente;
(ii) Se B′ e B′′ forem bases de U e W , respectivamente, então B =
B′ ∪B′′ é uma base de V .
Demonstração: (i) Suponhamos que existam escalares ai, bj
pertencentes ao corpo K , 1 ≤ i ≤ m, 1 ≤ j ≤ n, tais que
a1u1 + · · ·+ amum + b1w1 + · · ·+ bnwn =−→0 .
Então,
(a1u1 + · · ·+ amum) + (b1w1 + · · ·+ bnwn) =−→0 +
−→0
onde a1u1+· · ·+amum ∈ U e b1w1+· · ·+bnwn ∈ W . Como V = U⊕W ,
então esta soma para−→0 é única, assim
a1u1 + · · ·+ amum =−→0 e b1w1 + · · ·+ bnwn =
−→0 .
Como B′ e B′′ são conjuntos linearmente independentes então, os es-
calares ai e bj são todos nulos. Portanto, B = B′ ∪ B′′ é linearmente
independente.
(ii) Pelo item anterior, B = B′∪B′′ é linearmente independente, assim
basta mostrar que B gera V . Seja v ∈ U + W , então v = u + w, com
u ∈ U e w ∈ W . Como B′ é base de U e B′′ base de W , temos
u = a1u1 + · · ·+ amum w = b1w1 + · · ·+ bnwn,
com ai, bj ∈ K. Então,
v = u + w = a1u1 + · · ·+ amum + b1w1 + · · ·+ bnwn.
Desta forma, B = B′ ∪ B′′ gera U + W , completando a de-
monstração.
Os resultados apresentados nesta seção usam o fato de V ser
decomposto em uma soma de dois subespaços. Porém, este resultados
permanecem válidos quando a soma se referir a qualquer quantidade
finita de subespaços vetoriais.
24 Capítulo 1. CONCEITOS PRELIMINARES
1.2 SUBESPAÇOS INVARIANTES
Os subespaços invariantes são fundamentais para o nosso es-
tudo e os usaremos nos próximos capítulos. Lima (2009) define estes
subespaços da seguinte forma:
Definição 1.2. Um subespaço vetorial W ⊂ V é dito invariante pelo
operador T : V −→ V quando, para qualquer v ∈ W , T (v) ∈ W ,
ou ainda, T (W ) ⊂ W . Podemos também chamar este subespaço de
T-invariante.
Exemplo 1.1. Considere o subespaço W = {(x, y, z) ∈ R3/y = 2x}.
Para o operador T (x, y, z) =(
x2 , y
2 , 10z)
, o subespaço W é T -invariante,
pois
T (x, 2x, z) =
(
x
2,
2x
2, 10z
)
=(x
2, x, 10z
)
∈ W.
Ao longo do trabalho denotaremos o núcleo e a imagem do ope-
rador linear T por Nuc(T ) e Im(T ), respectivamente. Estes subespaços
são T-invariantes, conforme mostraremos na seguinte proposição:
Proposição 1.1. Seja V um espaço vetorial de dimensão finita sobre
o corpo K e considere o operador linear T : V → V . Então
(i) os subespaços Nuc(T) e Im(T) são T-invariantes;
(ii) dado W ⊂ V subespaço vetorial e λ ∈ K, W é (λI − T )-invariante
se, e somente se, W for T − invariante.
Demonstração: (i) Sabemos que para qualquer v ∈ Nuc(T )
temos T (v) =−→0 , como
−→0 ∈ Nuc(T ), então T (v) ∈ Nuc(T ). Por-
tanto, Nuc(T ) é um subespaço T-invariante. Ainda, para qualquer
u ∈ V , T (u) ∈ Im(T ), então é evidente que Im(T ) é um subespaço
T-invariante.
(ii) Seja W um subespaço (λI − T )-invariante. Dado w ∈ W temos
que
(λI − T )w ∈ W.
1.2. SUBESPAÇOS INVARIANTES 25
Seja w′ ∈ W tal que
(λI − T )(w) = w′
ou seja,
λw − T (w) = w′.
Isto é,
T (w) = λw − w′ ∈ W.
Logo, W é T -invariante.
Suponhamos agora que W é T -invariante assim, T (w) = w′′ ∈
W , para todo w ∈ W . Desta forma, para todo w ∈ W temos
λw − T (w) = λw − w′′ ∈ W.
Assim,
(λI − T )(w) ∈ W.
Portanto, W é (λI − T )-invariante.
Ao estudarmos o operador linear T estaremos muito interes-
sados em decomposições em somas diretas V = W1 ⊕ · · · ⊕Wn, onde
cada um dos subespaços Wi seja T-invariante. Com isso, será conveni-
ente olharmos para as restrições do operador linear nos subespaços Wi
que nos permitirá obter algumas informações sobre T . Com base nesta
decomposição, o Teorema 1.4 nos possibilitará representar a matriz do
operador T em um "formato" de matriz diagonal.
Teorema 1.4. Seja T : V −→ V um operador linear e V = W1 ⊕W2,
onde W1, W2 são subespaços T-invariantes. Sejam T1 = T |W1e T2 =
T |W2restrições do operador T nos subespaços W1 e W2, respectiva-
mente, então:
[T ] =
(
[T1] 0
0 [T2]
)
.
26 Capítulo 1. CONCEITOS PRELIMINARES
Demonstração: Sejam α = {v1, . . . , vn} uma base de W1 e
β = {u1, . . . , um} uma base de W2. Como W1 e W2 são T-invariantes,
temos que
T (vi) ∈ W1, 1 ≤ i ≤ n
e
T (uj) ∈ W2, 1 ≤ j ≤ m.
Como V = W1 ⊕W2, pelo Teorema 1.3, temos que
γ = {v1, . . . , vn, u1, . . . , um}
é uma base para V. Assim, obteremos a representação matricial de T
na base γ da seguinte forma:
T (v1) = a11v1 + · · ·+ an1vn + 0 · u1 + · · ·+ 0 · um
T (v2) = a12v1 + · · ·+ an2vn + 0 · u1 + · · ·+ 0 · um
...
T (vn) = a1nv1 + · · ·+ annvn + 0 · u1 + · · ·+ 0 · um.
E ainda,
T (u1) = 0 · v1 + · · ·+ 0 · vn + b11u1 + · · ·+ bm1um
T (u2) = 0 · v1 + · · ·+ 0 · vn + b12u1 + · · ·+ bm2um
...
T (um) = 0 · v1 + · · ·+ 0 · vn + b1mu1 + · · ·+ bmmum.
Portanto,
[T ]γ =
a11 a12 a1n · · · 0 0 · · · 0...
...... · · ·
...... · · ·
...
an1 an2 ann · · · 0 0 · · · 0
0 0 0 · · · b11 b12 · · · b1m
......
... · · ·...
... · · ·...
0 0 0 · · · bm1 bm2 · · · bmm
.
1.2. SUBESPAÇOS INVARIANTES 27
Denotando as matrizes de T1 = T |W1e T2 = T |W2
respectiva-
mente por [T1]α = [aii] e [T2]β = [bjj ], obtemos, facilmente, que
[T ]γ =
(
[T1]α 0
0 [T2]β
)
.
Suponhamos que V = W1⊕W2⊕· · ·⊕Wn, sendo Wi subespaço
T-invariante. Seja αi uma base de Wi, com 1 ≤ i ≤ n. Conforme o
Teorema 1.3, podemos escrever a base α de V como α = α1 ∪ · · · ∪ αn.
Generalizando o Teorema 1.4, representamos a matriz de T : V −→ V
da seguinte forma:
[T ]α =
[T1]α10 · · · 0
0 [T2]α2· · · 0
......
. . ....
0 0 · · · [Tn]αn
.
Um resultado interessante referente aos subespaços Im(T ) e
Nuc(T ) T-invariantes é que, dado uma transformação T : V −→ W ,
sendo V e W espaços vetoriais de dimensão finita, temos que
dim(V ) = dim(Nuc(T )) + dim(Im(T )).
Este resultado, intitulado de Teorema do Núcleo e da Imagem,
utiliza o fato de que se α = {T (u1), . . . , T (up)} e β = {v1, . . . , vq} são
bases de Im(T ) e Nuc(T ), respectivamente, então existe uma base para
V da forma:
γ = {u1, . . . , up, v1, . . . , vq}.
Elon (2009) enuncia o Teorema do Núcleo e da Imagem da seguinte
forma:
Teorema 1.5 (Teorema do Núcleo e da Imagem). Sejam V, W espaços
vetoriais de dimensão finita. Se T : V → W é uma transformação linear
28 Capítulo 1. CONCEITOS PRELIMINARES
qualquer, então
dim(V ) = dim(Nuc(T )) + dim(Im(T )).
Demonstração: Sejam α e β bases de Im(T ) e Nuc(T ),
respectivamente, dadas por
α = {T (u1), . . . , T (up)} e β = {v1, . . . , vq}.
Se tivermos
a1u1 + · · ·+ apup + b1v1 + · · ·+ bqvq =−→0 (1.4)
então, aplicando a transformação T em ambos os lados da igualdade,
obtemos
a1T (u1) + · · ·+ apT (up) + b1T (v1) + · · ·+ bqT (vq) =−→0 .
Como os vetores v1, . . . , vq fazem parte do Núcleo de T , então
a1T (u1) + · · ·+ apT (up) =−→0 .
Como os vetores T (u1), . . . , T (up) são linearmente independentes, segue
que a1 = · · · = ap = 0. Da igualdade 1.4, obtemos
b1v1 + · · ·+ bqvq =−→0 .
Assim, temos que b1 = · · · = bq = 0, pois os vetores v1, . . . , vp
são linearmente independentes. Desta forma, sabemos que os vetores
u1, . . . , up, v1, . . . , vq são linearmente independentes. Neste momento,
precisamos mostrar que para qualquer w ∈ V tem-se
w = a1u1 + · · ·+ apup + b1v1 + · · ·+ bqvq.
Se w ∈ V então, T (w) ∈ Im(T ). Desta forma podemos escrever T (w)
como uma combinação linear da base α. Assim,
T (w) = a1T (u1) + · · ·+ apT (up). (1.5)
1.3. POLINÔMIOS DE MATRIZES 29
Reescrevendo a igualdade 1.5, temos
T (w)− a1T (u1)− · · · − apT (up) =−→0 ,
isto é,
T (w − (a1u1 + · · ·+ apup)) =−→0 .
Então, o vetor w − (a1u1 + · · · + apup) pertence ao Nuc(T ) e
assim podemos escrevê-lo como uma combinação linear dos vetores da
base β. Portanto,
w − (a1u1 + · · ·+ apup) = b1v1 + · · ·+ bqvq,
isto é,
w = a1u1 + · · ·+ apup + b1v1 + · · ·+ bqvq.
Logo, o conjunto {u1, . . . , up, v1, . . . , vq} gera o espaço vetorial V e por-
tanto forma uma base de V . Desta forma,
dim(V ) = p + q = dim(Nuc(T )) + dim(Im(T )).
1.3 POLINÔMIOS DE MATRIZES
O objetivo desta seção é estabelecer algumas das propriedades
básicas referentes a polinômios de matrizes, as quais enunciaremos no
Teorema 1.6. Estas propriedades serão úteis na demonstração de alguns
resultados posteriores.
Seja p(x) um polinômio de grau n, definido da seguinte forma:
p(x) = anxn + · · ·+ a1x + a0.
Se A é uma matriz quadrada, definimos o polinômio da matriz A, atra-
vés de
p(A) = anAn + · · ·+ a1A + a0I.
Dizemos que A é raiz do polinômio p(x) quando p(A) é a matriz nula.
30 Capítulo 1. CONCEITOS PRELIMINARES
Teorema 1.6. Sejam p(x) e q(x) polinômios representados por
p(x) = anxn + · · ·+ a1x + a0 e q(x) = bmxm + · · ·+ b1x + b0,
onde x ∈ K. Dados qualquer matriz quadrada A e qualquer escalar k,
valem as seguintes propriedades:
(i) (kp + q)(A) = kp(A) + q(A).
(ii) (pq)(A) = p(A)q(A).
(iii) p(A)q(A) = q(A)p(A).
Demonstração: (i) Seja kp(x) = kanxn + · · ·+ ka1x + ka0.
Suponhamos que m ≤ n e assim definiremos
(kp + q)(x) = (kan + bn)xn + · · ·+ (ka1 + b1)x + (ka0 + b0),
com bi = 0 quando i > m. Assim,
(kp + q)(A) = (kan + bn)An + · · ·+ (ka1 + b1)A + (ka0 + b0)I
= kanAn + bnAn + · · ·+ ka1A + b1A + ka0I + b0I
= (kanAn + · · ·+ ka1A + ka0I) + (bnAn + · · ·+ b1A + b0I)
= k(anAn + · · ·+ a1A + a0I) + (bnAn + · · ·+ b1A + b0I)
= kp(A) + q(A).
Logo,
(kp + q)(A) = kp(A) + q(A).
(ii) Lipschutz e Lipson (2011) definem o polinômio (pq)(x) da seguinte
forma:
(pq)(x) = cn+mxn+m + · · ·+ c1x + c0
=n+m∑
r=0
crxr,
sendo cr = a0br + a1br−1 + · · ·+ arb0 =r∑
i=0
aibr−1. Assim, segue que
(pq)(A) =
n+m∑
r=0
crAr.
1.3. POLINÔMIOS DE MATRIZES 31
E, portanto
p(A)q(A) =
(
n∑
i=0
aiAi
)
m∑
j=0
bjAj
=n
∑
i=0
m∑
j=0
aibjAi+j
=
n+m∑
r=0
crAr
= (pq)(A).
Logo,
p(A)q(A) = (pq)(A).
(iii) Como a igualdade p(x)q(x) = q(x)p(x) é verdadeira, para qualquer
x ∈ K, pelo item (ii) temos
p(A)q(A) = (pq)(A) = (qp)(A) = q(A)p(A).
Exemplo 1.2. Sejam p1(x) = x2−3x + 7 e p2(x) = x2−6x + 13, para
A =
(
1 −2
4 5
)
, temos que
p1(A) = A2 − 3A + 7I
=
(
1 −2
4 5
)(
1 −2
4 5
)
− 3
(
1 −2
4 5
)
+ 7
(
1 0
0 1
)
=
(
−7 −12
24 17
)
+
(
−3 6
−12 −15
)
+
(
7 0
0 7
)
=
(
−3 −6
12 9
)
.
32 Capítulo 1. CONCEITOS PRELIMINARES
E,
p2(A) = A2 − 6A + 13I
=
(
1 −2
4 5
)(
1 −2
4 5
)
− 6
(
1 −2
4 5
)
+ 13
(
1 0
0 1
)
=
(
−7 −12
24 17
)
+
(
−6 12
−24 −30
)
+
(
13 0
0 13
)
=
(
0 0
0 0
)
.
Note que p2(A) resulta na matriz nula, assim A é raiz do polinômio p2.
Sejam T : V −→ V um operador linear sobre um espaço veto-
rial sobre K e p(x) = anxn+· · ·+a1x+a0. Identificando a representação
matricial de T por A, podemos definir p(T ) da mesma forma como foi
feito para p(A), isto é,
p(T ) = anT n + · · ·+ a1T + a0I.
Com isso, as relações estabelecidas no Teorema 1.6 permanecem válidas
para operadores lineares.
1.4 AUTOVALOR E AUTOVETOR
Ao longo desta seção discutiremos sobre os polinômios caracte-
rístico e minimal de um operador linear e suas relações. Nosso objetivo
principal será mostrar o Teorema de Cayley-Hamilton que afirma que
um operador sempre anula o seu polinômio característico.
Primeiramente, definiremos autovalor e autovetor, conceitos
que estão relacionados com estes dois polinômios.
Definição 1.3. Seja T : V −→ V um operador linear. Um autovalor
de T é um escalar λ em K tal que exista v 6=−→0 em V com T (v) = λv.
Assim, o vetor v ∈ V , v 6=−→0 , tal que T (v) = λv é chamado autovetor
de T associado ao autovalor λ.
1.4. AUTOVALOR E AUTOVETOR 33
Teorema 1.7. Seja T : V −→ V um operador linear. As seguintes
afirmações são equivalentes:
(i) λ é autovalor de T ;
(ii) O operador (λI − T ) é singular;
(iii) det(λI − [T ]) = 0.
Demonstração: Se λ é autovalor de T então existe um vetor
não nulo v ∈ V tal que T (v) = λv. Desta forma, (λI − [T ])v =−→0 . A
partir disso é fácil perceber que as afirmações são equivalentes.
Considere o polinômio p(x) = det(xI − T ) de grau n e cujo
termo líder é xn. Este polinômio é chamado de polinômio característico
de T e suas raízes, de acordo com o Teorema 1.7, são os autovalores de
T.
Lema 1.2. Matrizes semelhantes têm o mesmo polinômio caracterís-
tico.
Demonstração: Sejam A e B duas matrizes semelhantes.
Logo existe P inversível tal que
A = PBP−1.
Assim,
det(xI −A) = det(xI − PBP−1)
= det(xPIP−1 − PBP−1)
= det(P (xI −B)P−1)
= detP · det(xI −B) · detP−1
= detP · det(xI −B)1
detP= det(xI −B).
Logo, as matrizes A e B possuem o mesmo polinômio característico.
34 Capítulo 1. CONCEITOS PRELIMINARES
Como podemos representar um operador linear matricialmente,
então o Lema acima aplica-se também aos operadores.
Se T : V −→ V é um operador linear e V = W1 ⊕ W2,
então é possível escrever o polinômio característico de T em função
dos polinômios característicos das restrições de T a W1 e W2. Este
resultado nos auxiliará na demonstração do Teorema que constrói a
forma de Jordan de um operador linear.
Proposição 1.2. Seja V = W1 ⊕W2, onde W1 e W2 são subespaços
T -invariantes. Considere o operador linear T : V −→ V e sejam T1 =
T |W1e T2 = T |W2
, então
p(x) = p1(x) · p2(x)
onde p(x), p1(x) e p2(x) são os polinômios característicos de T, T1 e T2,
respectivamente.
Demonstração: Segundo o Teorema 1.4, podemos represen-
tar o operador linear T da seguinte maneira:
[T ] =
(
[T1] 0
0 [T2]
)
.
Desta forma, obtemos facilmente o polinômio p(x). Assim,
p(x) = det(xI − [T ])
= det
(
xI − [T1] 0
0 xI − [T2]
)
= det((xI − [T1]) · (xI − [T2]))
= det(xI − [T1]) · det(xI − [T2])
= p1(x) · p2(x).
Antes de demonstrarmos o Teorema de Cayley-Hamilton va-
mos definir, baseado em Coelho e Lourenço (2010) e Lipchutz e Lipson
1.4. AUTOVALOR E AUTOVETOR 35
(2011), o conceito de uma Matriz Adjunta, pois o usaremos em nossa
demonstração.
Definição 1.4. Seja Mn(K) o conjunto das matrizes quadradas de
ordem n sobre K. Dado A ∈ Mn(K), a matriz adjunta de A será a
transposta da matriz B = [bij ] tal que bij = (−1)i+jdet(Aij) onde Aij
é a matriz em Mn−1(K) formada a partir de A retirando-se sua i-
ésima linha e sua j-ésima coluna. Dizemos que os elementos bij são os
cofatores de A.
Exemplo 1.3. Seja A =
2 3 −4
0 −4 2
1 −1 5
, encontraremos a matriz
adjunta B.
Cada elemento da matriz B é escrito da seguinte forma:
b11 = (−1)1+1 · det
(
−4 2
−1 5
)
= −20 + 2 = −18
b12 = (−1)1+2 · det
(
0 2
1 5
)
= 2
b13 = (−1)1+3 · det
(
0 −4
1 −1
)
= 4
b21 = (−1)2+1 · det
(
3 −4
−1 5
)
= −(15− 4) = −11
b22 = (−1)2+2 · det
(
2 −4
1 5
)
= 10 + 4 = 14
b23 = (−1)2+3 · det
(
2 3
1 −1
)
= −(−2− 3) = 5
b31 = (−1)3+1 · det
(
3 −4
−4 2
)
= 6− 16 = −10
36 Capítulo 1. CONCEITOS PRELIMINARES
b32 = (−1)3+2 · det
(
2 −4
0 2
)
= −4
b33 = (−1)3+3 · det
(
2 3
0 −4
)
= −8
Logo, a adjunta de A é a matriz
B =
−18 −11 −10
2 14 −4
4 5 −8
.
Note que detA = −46 e que
AB =
−46 0 0
0 −46 0
0 0 −46
= BA
Esta é uma propriedade geral satisfeita por uma matriz e sua adjunta.
Lema 1.3. Para qualquer matriz quadrada A, sendo B sua adjunta, é
válido que
A ·B = B ·A = detA · I
Utilizando este Lema, cuja demonstração pode ser obtida em
Lipschutz e Lipson (2011), conseguiremos provar o Teorema a seguir.
Teorema 1.8 (Cayley-Hamilton). Se T é um operador linear sobre V
e se p(x) é o polinômio característico de T , então p([T ]) = 0.
Demonstração: Sejam A = [T ] e p(x) o polinômio caracte-
rístico de A, dado por:
p(x) = det(xI −A) = xn + an−1xn−1 + · · ·+ a1x + a0.
Denotemos por B(x) a matriz adjunta de (xI − A), onde os
elementos de B(x) são cofatores da matriz (xI − A). Observe que po-
demos escrever cada elemento de B(x) como um polinômio de grau no
1.4. AUTOVALOR E AUTOVETOR 37
máximo igual a n − 1. Assim, vamos decompor a matriz adjunta da
seguinte forma:
B(x) = Bn−1xn−1 + · · ·+ B1x + B0.
Usando o Lema 1.3, temos que
p(x) · I = det(xI −A) · I
= (xI −A) ·B(x)
= (xI −A) · (Bn−1xn−1 + · · ·+ B1x + B0)
= Bn−1xn + · · ·+ B1x2 + B0x−ABn−1 − · · · −AB1x−AB0.
(1.6)
Por outro lado,
p(x) · I = (xn + an−1xn−1 + · · ·+ a1x + a0) · I
= xnI + an−1xn−1I + · · ·+ a1xI + a0I. (1.7)
Igualando as equações 1.6 e 1.7 e comparando os coeficientes das po-
tências correspondentes de x, obtemos
Bn−1 = I
Bn−2 −ABn−1 = an−1I
Bn−3 −ABn−2 = an−2I...
......
B1 −AB2 = a2I
B0 −AB1 = a1I
−AB0 = a0I
.
Multiplicando essas equações respectivamente por An, An−1, . . . , A, I,
obtemos
38 Capítulo 1. CONCEITOS PRELIMINARES
AnBn−1 = An
An−1Bn−2 −AnBn−1 = an−1An−1
An−2Bn−3 −An−1Bn−2 = an−2An−2
......
...
A2B1 −A3B2 = a2A
AB0 −A2B1 = a1A
−AB0 = a0I
.
Somando estas equações, obtemos
0 = An + an−1An−1 + · · ·+ a1A + a0I.
Portanto,
p(A) = p([T ]) = 0.
O Teorema de Cayley-Hamilton afirma que a matriz de um
operador linear sempre é um zero do seu polinômio característico.
Exemplo 1.4. Seja T : R2 → R2 um operador linear dado por
T (x, y, z) = (x + 2y, 4y).
Denotaremos A = [T ]. Representando o operador matricialmente, te-
mos
A =
(
1 2
0 4
)
.
Para obter o polinômio característico de T , basta calcular o det(xI−A),
assim
p(x) = det(xI −A) = det
(
x− 1 −2
0 x− 4
)
= (x− 1)(x− 4)
= x2 − 5x + 4.
1.4. AUTOVALOR E AUTOVETOR 39
Portanto, o polinômio característico de T é dado por p(x) = x2−5x+4.
Calculando p(A), temos
p(A) = A2 − 5A + 4I.
Assim,
p(A) =
(
1 2
0 4
)(
1 2
0 4
)
− 5
(
1 2
0 4
)
+ 4
(
1 0
0 1
)
=
(
1 10
0 16
)
−
(
5 10
0 20
)
+
(
4 0
0 4
)
=
(
4 0
0 4
)
−
(
4 0
0 4
)
=
(
0 0
0 0
)
.
Logo, p([T ]) = 0.
Um polinômio m(x) é chamado T-anulador se m(T )(v) =−→0 ,
para qualquer v ∈ V , com base nisso definiremos o polinômio minimal
de acordo com Coelho e Lourenço (2010).
Definição 1.5. O polinômio minimal de um operador T é o polinômio
mônico m(x) de menor grau tal que m(T )(v) =−→0 , para qualquer v ∈
V .
Conforme o Teorema de Cayley-Hamilton, o polinômio carac-
terístico é um polinômio T-anulador, porém não necessariamente será
o minimal.
Estas informações nos ajudam a perceber que o polinômio mi-
nimal do operador T divide qualquer polinômio T-anulador.
Algumas conclusões podem ser obtidas a respeito do polinô-
mio característico p(x) e o polinômio minimal m(x). Estes polinômios
possuem as mesmas raízes (a menos de multiplicidade) e o minimal é
divisor do característico.
40 Capítulo 1. CONCEITOS PRELIMINARES
Conforme Coelho e Lourenço (2010) e Lipschutz e Lipson (2011)
enunciaremos o próximo Teorema que estabelece essas relações.
Teorema 1.9. Seja T : V −→ V operador linear sobre um espaço V
em um corpo K. São válidas as seguintes afirmações:
(i) m(x) divide p(x);
(ii) m(x) possui as mesmas raízes de p(x), a menos de multiplicidade.
Demonstração: Seja P (K) o conjunto de polinômios sobre
o corpo K. Pelo algoritmo de divisão de Euclides, existem polinômios
q, r ∈ P (K) tais que
p(x) = m(x)q(x) + r(x), ∀x ∈ K (1.8)
onde r(x) = 0 ou grau(r(x)) < grau(m(x)).
Aplicando a equação 1.8 em T (v), obtemos
p(T )(v) = m(T )(v)q(T )(v) + r(T )(v).
Por definição m(T )(v) =−→0 e pelo Teorema 1.8 temos p(T )(v) =
−→0 , assim r(T )(v) =
−→0 , para qualquer v ∈ V .
Se r(x) 6= 0, então r(x) é um polinômio que tem grau menor do
que m(x). Porém, r(x) possui T como raiz, o que contradiz a definição
de polinômio minimal. Portanto, r(x) = 0 e assim
p(x) = m(x)q(x), ∀x ∈ K
isto é, m(x) divide p(x).
(ii) Precisamos provar que se λ for raiz de p(x), então também será
raiz de m(x). Analogamente, se λ for raiz de m(x), terá que ser raiz de
p(x).
Se p(λ) = 0, então λ é autovalor de T. Assim, existe v ∈ V tal
que T (v) = λv, com v 6=−→0 . Observe que, para cada i ≥ 1, temos
T i(v) = λiv.
1.4. AUTOVALOR E AUTOVETOR 41
Escrevendo m(x) = xm + am−1xm−1 + · · ·+ a1x + a0, obtemos−→0 = m(T )(v)
= T m(v) + am−1T m−1(v) + · · ·+ a1T (v) + a0(v)
= λm(v) + am−1λm−1(v) + · · ·+ a1λ(v) + a0(v)
= (λm +m−1∑
i=0
aiλi)(v).
Como v 6=−→0 , então
λm +m−1∑
i=0
aiλi = 0.
Ou seja, m(λ) = 0. Portanto, λ é raiz de m(x).
Suponhamos agora que m(λ) = 0, então podemos escrever
m(x) da seguinte forma
m(x) = (x− λ)q(x).
Pela minimalidade de m(x), podemos afirmar que q(T ) 6= 0, então
existe u ∈ V tal que q(T )(u) 6=−→0 . Seja v = q(T )(u), assim
−→0 = m(T )(u)
= (T − λI)q(T )(u)
= (T − λI)(v).
Desta forma, T (v) = λv, logo λ é autovalor de T, ou seja, p(λ) = 0.
Exemplo 1.5. Seja T : R4 → R4 operador linear dado por
T (x, y, z, t) = (2x− y + t, 3y − z, y + z,−y + 3t).
O operador T possui representação matricial na base canônica
da forma
[T ] =
2 −1 0 1
0 3 −1 0
0 1 1 0
0 −1 0 3
.
42 Capítulo 1. CONCEITOS PRELIMINARES
Observe que o polinômio p(x) = det(xI − T ) = (x − 2)3(x − 3) é
o polinômio característico de T . O polinômio minimal de T deve ser
mônico e possuir as mesmas raízes que o polinômio característico, então
os polinômios (x − 2)(x − 3), (x − 2)2(x − 3) e (x − 2)3(x − 3) são
possíveis minimais. Como o polinômio minimal deve ser o de menor
grau tal que m([T ]) = 0, então denotando m1(x) = (x − 2)(x − 3),
m2(x) = (x− 2)2(x− 3) e m3(x) = (x− 2)3(x− 3), temos
m1([T ]) = (T − 2)(T − 3)
=
0 −1 0 1
0 1 −1 0
0 1 −1 0
0 −1 0 1
−1 −1 0 1
0 0 −1 0
0 1 −2 0
0 −1 0 0
=
0 −1 1 0
0 −1 1 0
0 −1 1 0
0 −1 1 0
.
m2([T ]) = (T − 2)2(T − 3)
=
0 −2 1 1
0 0 0 0
0 0 0 0
0 −2 1 1
−1 −1 0 1
0 0 −1 0
0 1 −2 0
0 −1 0 0
=
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
.
Logo, o polinômio m2(x) = (x−2)2(x−3) é o polinômio de menor grau
tal que anula o operador, portanto m2(x) é o minimal.
1.5. OPERADORES DIAGONALIZÁVEIS 43
1.5 OPERADORES DIAGONALIZÁVEIS
Considere uma matriz quadrada A de ordem n. Dizemos que
A é semelhante a uma matriz diagonal se existir uma matriz inversível
P tal que
A = PDP−1,
sendo D uma matriz diagonal.
Através dos autovetores de A é possível verificar se ela é di-
agonalizável, basta constatar se A possui n autovetores linearmente
independentes, conforme enunciado no Teorema 1.10.
Teorema 1.10. Uma matriz A de ordem n é diagonalizável se, e so-
mente se, possui n autovetores linearmente independentes.
Demonstração: (⇒) Se A é uma matriz diagonalizável, então
existe uma matriz inversível P tal que
A = PDP−1
isto é,
AP = PD (1.9)
sendo
D =
λ1 0 · · · 0 0
0 λ2 · · · 0 0
0 0 · · · 0 0...
.... . .
......
0 0 · · · 0 λn
.
Seja P uma matriz cujas colunas são constituídas pelos vetores
v1, v2, . . . , vn, denotada por
P = [v1 v2 . . . vn].
Temos que
AP = [Av1 Av2 . . . Avn]
44 Capítulo 1. CONCEITOS PRELIMINARES
e
PD = [λ1v1 λ2v2 . . . λnvn]
assim, por 1.9:
[Av1 Av2 . . . Avn] = [λ1v1 λ2v2 . . . λnvn].
Logo, Avi = λivi e consequentemente, vi é um autovetor de A associado
ao autovalor λi, para 1 ≤ i ≤ n. Como a matriz P é inversível, segue
que suas colunas são linearmente independentes. Portanto, A possui n
vetores linearmente independentes.
(⇐) Seja P = [v1 v2 . . . vn] a matriz formada pelos autovetores de
A em suas colunas. Assim
AP = [Av1 Av2 . . . Avn]. (1.10)
Como v1, v2, . . . , vn são autovetores linearmente independentes de A, a
igualdade 1.10 resulta em
AP = [λ1v1 λ2v2 . . . λnvn].
isto é,
AP = [v1 v2 . . . vn] · diag(λ1, λ2, . . . , λn).
Portanto, AP = PD. Como as colunas de P são linearmente indepen-
dentes, então existe P−1 tal que
A = PDP−1.
Logo, a matriz A é diagonalizável.
O Teorema 1.10 é válido da mesma forma para operadores,
basta tomar A como a representação matricial de um operador linear
qualquer. Com base nestas informações, definiremos um operador dia-
gonalizável. Hoffman e Kunze (1971) o definem da seguinte forma:
Definição 1.6. O operador T : V −→ V , onde V é um espaço vetorial
de dimensão finita, é diagonalizável se existe uma base de V formada
por autovetores de T.
1.5. OPERADORES DIAGONALIZÁVEIS 45
Observe que se α é uma base de autovetores e λi são autovalores
do operador T, então a matriz de T em relação à base ordenada α é
diagonal, ou seja,
[T ]α =
λ1 0 0 . . . 0
0 λ2 0 . . . 0
0 0 λ3 . . . 0...
......
. . ....
0 0 0 . . . λn
.
Necessitamos entender o conceito de Operadores Diagonalizá-
veis para que futuramente obtermos a Forma Canônica de Jordan dos
operadores que não são diagonalizáveis, ou seja, no caso em que a repre-
sentação de T não poderá ser uma matriz diagonal, porém será obtido
uma matriz “quase” diagonal.
47
2 FORMA CANÔNICA RACIONAL
O foco deste trabalho não está na construção da Forma Canô-
nica Racional, porém durante nossos estudos descobrimos que esta
forma pode ser utilizada mesmo quando os polinômios característico
e minimal não podem ser fatorados em polinômios lineares, o que não
ocorre com a Forma Canônica de Jordan. Então, achamos importante
para o conhecimento o estudo sucinto da Forma Canônica Racional,
onde a matriz de um operador é formada por blocos de "Matrizes Com-
panheiras".
2.1 DECOMPOSIÇÃO PRIMÁRIA
A Decomposição Primária nos auxilia na obtenção de uma
forma canônica para o operador linear T . Esta decomposição mostra
que qualquer operador linear T : V −→ V pode ser decomposto em
operadores cujos polinômios minimais são potências de polinômios ir-
redutíveis.
A proposição seguinte descreve, conforme Lang e Jutuca (2003),
uma decomposição para V numa soma direta de subespaços invarian-
tes, obtida a partir de um polinômio que é escrito como um produto
de dois polinômios cujo máximo divisor comum é 1. Iremos demons-
trar apenas um caso particular, porém este resultado também é válido
quando este polinômio é expresso como o produto de uma quantidade
finita de fatores.
Proposição 2.1. Seja P (K) o conjunto de polinômios sobre o corpo
K. Dado m(x) ∈ P (K) um polinômio com
m(x) = p1(x)p2(x)
48 Capítulo 2. FORMA CANÔNICA RACIONAL
sendo p1 e p2 polinômios de grau maior ou igual a 1 tais que
mdc(p1(x), p2(x)) = 1.
Se T : V −→ V é um operador linear tal que m(T )(v) =−→0 , para
qualquer v ∈ V , então
V = Nuc(p1(T ))⊕Nuc(p2(T )).
Demonstração: Vamos denotar os núcleos de p1(T ) e p2(T ),
respectivamente, como W1 e W2. Como mdc(p1(x), p2(x)) = 1, então
existem polinômios q1(x) e q2(x) tais que,
p1(x)q1(x) + p2(x)q2(x) = 1,∀x ∈ K.
Portanto,
p1(T )q1(T ) + p2(T )q2(T ) = I (2.1)
onde I é o operador identidade. Tomando v ∈ V , temos
p1(T )q1(T )(v) + p2(T )q2(T )(v) = v.
Podemos observar que p1(T )q1(T )v ∈ W2, pois
p2(T )(p1(T )q1(T )(v)) = p2(T )p1(T )q1(T )(v)
= p1(T )p2(T )(v) · q1(T )(v)
= m(T )(v) · q1(T )(v)
= 0 · q1(T )(v)
=−→0 .
Da mesma forma p2(T )q2(T )v ∈ W1, pois
p1(T )(p2(T )q2(T )(v)) = p1(T )p2(T )q2(T )(v)
= p1(T )p2(T )(v) · q2(T )(v)
= m(T )(v) · q2(T )(v)
= 0 · q2(T )(v)
=−→0 .
2.1. DECOMPOSIÇÃO PRIMÁRIA 49
Logo, v ∈ V pode ser escrito como a soma de um vetor de W1 com um
vetor de W2, isto é, V = W1 + W2.
Para mostrar que esta soma é direta, é necessário provar que a
igualdade
v = w1 + w2 (2.2)
está determinada de modo único, onde w1 ∈ W1 e w2 ∈ W2. De fato,
aplicando p1q1(T ) a 2.2, obtemos
p1q1(T )(v) = p1q1(T )(w1) + p1q1(T )(w2)
= p1(T )(w1) · q1(T )(w1) + p1(T )(w2) · q1(T )(w2).
Como w1 ∈ W1 = Nuc(p1(T )) então p1(T )(w1) =−→0 . Desta forma,
p1q1(T )(v) =−→0 · q1(T )(w1) + p1(T )(w2) · q1(T )(w2)
= p1(T )q1(T )(w2)
= p1q1(T )(w2). (2.3)
Aplicando 2.1 em w2, temos
p1(T )q1(T )(w2) + p2(T )q2(T )(w2) = w2.
Como w2 ∈ W2 = Nuc(p2(T )), então p2(T )(w2) =−→0 , desta forma
p1(T )q1(T )(w2) + 0 · q2(T )(w2) = w2. (2.4)
De 2.3 e 2.4, obtemos
w2 = p1(T )q1(T )(v)
e portanto w2 está determinado de maneira única. Da mesma forma,
encontramos w1 = p2(T )q2(T )v de maneira única.
Portanto, pelo Teorema 1.1, V = W1 ⊕W2.
Proposição 2.2. Sob as mesmas hipóteses da Proposição 2.1, se m(x)
o polinômio minimal de T e p1(x), p2(x) mônicos, então p1(x) e p2(x)
são os polinômios minimais das restrições de T a W1 e W2, respectiva-
mente.
50 Capítulo 2. FORMA CANÔNICA RACIONAL
Demonstração: Sejam T1 = T |W1e T2 = T |W2
sendo m1(x)
e m2(x) seus polinômios minimais, respectivamente.
Como W1 = Nuc(p1(T )) e W2 = Nuc(p2(T )), temos que
p1(T1)(v) =−→0 e p2(T2)(v) =
−→0 , para qualquer v ∈ V . De modo
similiar ao que foi mostrado no Teorema 1.9 segue que m1(x) divide
p1(x) e m2(x) divide p2(x). Assim, existem polinômios q1(x), q2(x) tais
que
p1(x) = m1(x)q1(x) (2.5)
e
p2(x) = m2(x)q2(x). (2.6)
Pela Proposição 2.1, temos que
m(x) = m1(x)m2(x).
De 2.5 e 2.6, resulta
m(x) = p1(x)p2(x) = m1(x)q1(x)m2(x)q2(x)
= m1(x)m2(x)q1(x)q2(x)
= m(x)q1(x)q2(x).
Da última igualdade obtemos,
q1(x)q2(x) = 1.
Como os polinômios p1(x), p2(x), m1(x) e m2(x) são mônicos temos
que
q1(x) = q2(x) = 1.
Assim,
p1(x) = m1(x)
e
p2(x) = m2(x).
2.1. DECOMPOSIÇÃO PRIMÁRIA 51
Com base nas proposições anteriores temos condições de de-
monstrar o Teorema da Decomposição Primária. De acordo com Lips-
chutz e Lipson (2011) e Bueno (2006) enunciaremos da seguinte forma:
Teorema 2.1 (Teorema da Decomposição Primária). Considere o ope-
rador linear T : V −→ V cujo polinômio característico é da forma
p(x) = p1(x)m1p2(x)m2 . . . pr(x)mr
e o seu polinômio minimal é dado por
m(x) = p1(x)n1p2(x)n2 . . . pr(x)nr
com 0 < ni ≤ mi e sendo pi(x) polinômios distintos, mônicos e irredu-
tíveis. Seja Wi o núcleo de pi(T )ni , com i = 1, . . . , r. Então,
V = W1 ⊕W2 ⊕ · · · ⊕Wr
onde Wi é T -invariante e além disso pi(x)ni é o polinômio minimal da
restrição de T a Wi.
Demonstração: Provaremos este teorema usando o princípio
de indução em r.
Se r = 1, temos que m(x) = p1(x)n1 um polinômio mônico e
irredutível como o minimal de T. Assim,
∀v ∈ V ⇒ m(T )(v) =−→0 ⇒ p1(T )n1(v) =
−→0
⇒ v ∈ Nuc(p1(T )n1).
Logo, V ⊂ Nuc(p1(T )n1). Como Nuc(p1(T )n1) ⊂ V ocorre trivial-
mente, temos
V = Nuc(p1(T )n1) = W1.
Além disso, W1 é obviamente T -invariante e p1(T )n1 é o polinômio
minimal de T |W1= T |V = T .
Suponhamos que o teorema seja válido para r = k. Vamos
provar sua validade para r = k +1. Para isso, supomos que o polinômio
52 Capítulo 2. FORMA CANÔNICA RACIONAL
minimal de T : V −→ V seja
f(x) = p1(x)n1p2(x)n2 . . . pk(x)nk pk+1(x)nk+1
com pi(x) polinômios mônicos, irredutíveis e distintos entre si.
Como f(x) é o polinômio minimal de T , temos que f(T ) = 0 e
tomando
g(x) = p1(x)n1p2(x)n2 . . . pk(x)nk e h(x) = pk+1(x)nk+1
temos que g e h são primos entre si. Portanto, podemos aplicar a Pro-
posição 2.1 e obter que
V = W ⊕ U (2.7)
onde
W = Nuc(g(T )) = Nuc(p1(T )n1p2(T )n2 . . . pk(T )nk )
e
U = Nuc(h(T )) = Nuc(pk+1(T )nk+1
são ambos T -invariantes.
Ainda, como g e h são mônicos e f é o polinômio minimal de
T , podemos aplicar a Proposição 2.2 e garantir que g e h são, respec-
tivamente, os polinômios minimais das restrições de T a W e U .
Com isso, g é o minimal de T1 = T |W e admite k fatores
mônicos, irredutíveis e distintos. Pela hipótese de indução, temos então
que
W = W1 ⊕W2 ⊕ · · · ⊕Wk
onde
Wi = Nuc(pi(T1)ni), i = 1, 2, . . . , k
e tal que pi(x)ni é o polinômio minimal de T1 restrito a Wi. Portanto,
tomando Wk+1 = U e substituindo em 2.7 temos
V = W ⊕ U = W1 ⊕W2 ⊕ · · · ⊕Wk ⊕Wk+1
2.2. SUBESPAÇOS CÍCLICOS 53
com Wi T -invariante, para i = 1, 2, . . . , k + 1.
Falta mostrar que, para i = 1, 2, . . . , k
Wi = Nuc(pi(T )ni)
e que (pi(x)ni) é o polinômio minimal de T restrito a Wi. Como pi(x)ni
divide p1(x)n1p2(x)n2 . . . pk(x)nk temos que
v ∈ Nuc(pi(T )ni) ⇒ pi(T )ni(v) =−→0
⇒ (p1(T )n1p2(T )n2 . . . pk(T )nk )(v) =−→0
⇒ v ∈ Nuc(p1(T )n1p2(T )n2 . . . pk(T )nk )
⇒ v ∈ W.
Como T1 = T |W , temos que
Nuc(pi(T )ni) = Nuc(pi(T1)ni) = Wi.
E ainda, a restrição de T em Wi é igual a de T1 a Wi e portanto pi(x)ni é
o polinômio minimal de T restrito a Wi, completando a demonstração.
2.2 SUBESPAÇOS CÍCLICOS
Os subespaços cíclicos podem ser definidos como a interseção
de todos os subespaços T -invariantes de V que contém um dado vetor
v ∈ V , com v 6=−→0 . Porém, seguiremos o exposto em Lipschitz e Lipson
(2011) para definirmos estes subespaços. Para isso, sejam T : V −→ V
um operador linear, onde V é um espaço vetorial de dimensão finita
sobre K e v ∈ V um vetor não nulo. Como a dimensão de V é finita,
ao tomarmos os vetores
v, T (v), T 2(v), . . . , T i(v), . . . i ∈ N
temos que existe um menor natural n para o qual T n(v) é uma combi-
nação linear dos vetores que o precedem nesta sequência. Portanto, o
54 Capítulo 2. FORMA CANÔNICA RACIONAL
subespaço vetorial gerado por
β = {v, T (v), T 2(v), . . . , T n−1(v)}
será chamado de subespaço T -cíclico e denotado por Z(v, T ), com v ∈
V , v 6=−→0 , dito vetor T -cíclico, de acordo com a seguinte definição:
Definição 2.1. Seja T : V −→ V um operador linear sendo V um
espaço vetorial de dimensão finita sobre K. Dados v ∈ V , v 6=−→0 , o
conjunto Z(v, T ) ⊂ V é um subespaço T -cíclico de V se for gerado pelo
conjunto {v, T (v), T 2(v), . . . , T n−1(v)}.
De acordo com Coelho e Lourenço (2010) e Lipschutz e Lipson
(2011) construiremos o polinômio mv que é o único polinômio de menor
grau tal que mv(T )(v) =−→0 . Este polinômio é dito T-anulador de v e de
Z(v, T ). Assim, considerando o conjunto {v, T (v), T 2(v), . . . , T n−1(v)},
tomemos T n(v) ∈ Z(v, T ), então podemos escrevê-lo como uma combi-
nação linear dos vetores do conjunto {v, T (v), T 2(v), . . . , T n−1(v)}, ou
seja,
T n(v) = −a0v − a1T (v)− · · · − an−1T n−1(v)
com ai ∈ K, 0 ≤ i ≤ n− 1. Com isso,
T n(v) + a0v + a1T (v) + · · ·+ an−1T n−1(v) =−→0 .
Definimos assim o polinômio T -anulador como
mv(x) = xn + an−1xn−1 + · · ·+ a1x + a0.
A seguir, mostraremos um teorema que se refere ao polinômio
que definimos acima. Com base em Lipschutz e Lipson (2011) o enun-
ciaremos da seguinte forma:
Teorema 2.2. Sejam Z(v, T ) um subespaço T − cíclico, Tv a restrição
de T a Z(v, T ) e mv(x) = xn+an−1xn−1+· · ·+a1x+a0 o T−anulador
de v. Valem as seguintes afirmações:
(i) O conjunto β = {v, T (v), T 2(v), . . . , T n−1(v)} é uma base de Z(v, T );
2.2. SUBESPAÇOS CÍCLICOS 55
(ii) O polinômio minimal de Tv é mv(x);
(iii) A representação matricial de Tv na base β é chamada matriz com-
panheira de mv(x), dada por
[Tv]β =
0 0 0 . . . 0 −a0
1 0 0 . . . 0 −a1
0 1 0 . . . 0 −a2
......
.... . .
......
0 0 0 . . . 0 −an−2
0 0 0 . . . 1 −an−1
Demonstração: (i) Por definição, Z(v, T ) é gerado por β =
{v, T (v), T 2(v), . . . , T n−1(v)}, onde n é o menor natural para o qual
T n(v) é uma combinação linear dos vetores de β.
Desta forma, para todo i ≤ n−1 temos que T i(v) ∈ β não pode
ser escrito como combinação linear dos demais vetores de β. Portanto,
β é linearmente independente e sendo assim, uma base para Z(v, T ).
(ii) Seja m(x) = xs + bs−1xs−1 + · · · + b1x + b0 o polinômio minimal
de Tv, assim m(Tv) = 0, com bi ∈ K, 1 ≤ i ≤ s− 1. Como v ∈ Z(v, T ),
temos
−→0 = m(Tv)(v) = m(T )(v)
= T s(v) + bs−1T s−1(v) + · · ·+ b1T (v) + b0v
sendo n ≤ s. Como mv(x) é T -anulador, temos
−→0 = mv(T )(v) = T n(v) + an−1T n−1(v) + · · ·+ a1T (v) + a0v
= mv(Tv)(v).
Assim, mv(Tv) = 0. Temos que m(x) divide mv(x)(argumento seme-
lhante ao mostrado no Teorema 1.9), assim s ≤ n. Logo, n = s. Como
o polinômio mv(x) é o único de menor grau tal que mv(T )(v), então
mv(x) = m(x). Portanto, o polinômio mv(x) é o minimal de Tv.
56 Capítulo 2. FORMA CANÔNICA RACIONAL
(iii) Seja β = {v, T (v), T 2(v), · · · , T n−1(v)}. Para calcularmos [Tv]β ,
aplicamos Tv nos vetores de β, obtendo
Tv(v) = T (v) = 0 · v + 1 · T (v) + 0 · T 2(v) + . . . + 0 · T n−1(v).
Da mesma forma, para obter a segunda coluna de [Tv]β , fazemos
Tv(T (v)) = T (T (v)) = T 2(v)
= 0 · v + 0 · T (v) + 1 · T 2(v) + . . . + 0 · T n−1(v).
Para a penúltima coluna, tomamos
Tv(T n−2(v)) = T (T n−2(v))
= T n−1(v)
= 0 · v + 0 · T (v) + · · ·+ 1 · T n−1(v).
Para a última coluna da matriz, vamos utilizar o polinômio mv(x) =
xn + an−1xn−1 + · · ·+ a1x + a0, assim obtemos
−→0 = mv(Tv(v)) = mv(T (v))
= T n(v) + an−1T n−1(v) + · · ·+ a1T (v) + a0v.
Portanto,
T n(v) = −an−1T n−1(v)− · · · − a1T (v)− a0v.
Assim,
Tv(T n−1(v)) = T (T n−1(v)) = T n(v)
= −a0v − a1T (v)− · · · − an−1T n−1(v).
Logo, obtemos a matriz
[Tv]β =
0 0 0 . . . 0 −a0
1 0 0 . . . 0 −a1
0 1 0 . . . 0 −a2
......
.... . .
......
0 0 0 . . . 0 −an−2
0 0 0 . . . 1 −an−1
2.2. SUBESPAÇOS CÍCLICOS 57
que é chamada de matriz companheira do polinômio mv(x).
Quando se trata de subespaços cíclicos observamos que estes possuem
uma peculiaridade. Se V = Z(v, T ) então o polinômio característico do
operador linear T sempre coincidirá com o polinômio minimal. Para
mostrar esta afirmação são necessários alguns resultados que mostrare-
mos a seguir, baseados em Coelho e Lourenço (2010).
Lema 2.1. Se T : V −→ V é um operador linear onde V é um espaço
vetorial sobre um corpo K de dimensão finita, então existe um vetor
v ∈ V tal que o polinômio T -anulador é igual ao polinômio minimal de
T .
Demonstração: Sejam m(x) e mv(x) polinômios minimal e
anulador de T , respectivamente. Mostraremos apenas um caso particu-
lar, no qual m(x) = f(x)m, sendo f um polinômio irredutível em P (K),
porém o resultado também é válido quando m(x) = f1(x)m1 · · · fr(x))mr .
Sabemos que o polinômio minimal m(x) é o polinômio de menor
grau tal que m(T )(u) =−→0 , para qualquer u ∈ V . Assim, existe v ∈ V
de tal forma que f(T )m−1v 6= 0. Como mv(x) divide m(x) (argumento
semelhante ao mostrado no Teorema 1.9) e f(x) é irredutível, segue que
mv(x) = f(x)l para algum l ≤ m.
Como mv(T ) = 0 e usando o fato que f(T )m−1v 6= 0, concluí-
mos que
f(T )m(v) = f(T )l(v).
Desta forma,
m(x) = mv(x)
.
Corolário 2.1. Se T : V −→ V é um operador linear onde V é um
espaço vetorial sobre um corpo K de dimensão finita, então existe um
subespaço T-cíclico de V com dimensão igual ao grau do polinômio
minimal de T .
58 Capítulo 2. FORMA CANÔNICA RACIONAL
Demonstração: Conforme o Lema 2.1, sabemos que existe
v ∈ V tal que m(x) = mv(x). Seja ϕv : P (K) −→ f(T ) uma transfor-
mação onde ϕv(f) = f(T )(v).
Note que Im(ϕv) = [v, T (v), T 2(v) . . . T m−1(v)] para algum m.
Desta forma, Im(ϕv) é um subespaço T-cíclico de V, com dimensão
igual a m.
Como temos que v ∈ V é tal que m(x) = mv(x), então o grau
de m(x) também é m.
A seguir enunciaremos o Teorema que caracteriza os subespa-
ços T-cíclicos, relacionando os polinômios característico e minimal do
operador T . Através do Lema 2.1 e o Corolário 2.1 conseguiremos rea-
lizar sua demonstração.
Teorema 2.3. Seja T : V −→ V um operador linear onde V é um
espaço vetorial sobre K de dimensão n. As seguintes afirmações são
equivalentes:
(i) V = Z(v, T );
(ii)o grau de m(x) é n;
(iii) m(x) = p(x).
Demonstração: (i)⇒(ii) Como V = Z(v, T ) então existe
v ∈ V tal que V = [v, T (v), T 2(v) . . . T n−1(v)].
Com isso, o grau de mv(x) é n. Como dimV = n, então o grau
de m(x) deve ser no máximo n. Segue que mv(x) divide m(x). Mas a
única maneira disto ocorrer é quando o grau de m(x) é igual a n.
(ii)⇒(iii) Se dimV = n, então seu polinômio característico possui
grau n. Pelo Teorema de Cayley-Hamilton, m(x) divide p(x), logo
m(x) = p(x), pois ambos são polinômios mônicos e por hipótese, tem
o mesmo grau.
(iii)⇒(i) Pelo Corolário 2.1, existe um subespaço T -cíclico Z(v, T ) de
2.3. FORMA CANÔNICA RACIONAL 59
V com dimensão igual a de m(x). Como o grau de m(x) é n temos que
Z(v, T ) = V.
Exemplo 2.1. Seja T : R2 → R
2 o operador dado por T (x, y) =
(2x− 4y, 2x− 2y) tal que
[T ] =
(
2 −4
2 −2
)
.
Calculando o polinômio característico de T , obtemos
p(x) = det
(
x− 2 4
−2 x + 2
)
= (x− 2)(x + 2) = x2 + 4.
Observe que o polinômio característico é igual ao polinômio minimal.
Assim pelo Teorema 2.3, existe v = (a, b) ∈ R2, com v 6=
−→0 , tal que
β = {(a, b), T (a, b)}
é uma base para R2. Como para qualquer v = (a, b) ∈ R
2 o conjunto β
é linearmente independente, temos que
[T ]β =
(
0 −4
1 0
)
é a matriz companheira do polinômio x2 + 4. Logo, R2 = Z(v, T ).
2.3 FORMA CANÔNICA RACIONAL
Com base no que foi visto na seção anterior, enunciaremos dois
resultados essenciais para a construção da Forma Canônica Racional. O
primeiro diz que o espaço vetorial V pode ser decomposto por somas de
subespaços T-cíclicos. E o segundo resultado diz que o operador T pode
ser representado de maneira única por uma matriz cuja diagonal é for-
mada por matrizes companheiras. Conforme Lipschutz e Lipson (2011),
enunciaremos o seguinte Lema que nos fornece esta decomposição de
V.
60 Capítulo 2. FORMA CANÔNICA RACIONAL
Lema 2.2 (Decomposição Racional). Se T : V −→ V é um operador
linear cujo polinômio minimal é p(x)n, em que p(x) é um polinômio
mônico irredutível, então V é a soma direta
V = Z(v1, T )⊕ · · · ⊕ Z(vr, T )
dos subespaços T-cíclicos Z(vi, T ) com T-anuladores correspondentes
p(x)n1 , p(x)n2 , . . . , p(x)nr , n = n1 ≥ n2 ≥ . . . ≥ nr.
Além disso, qualquer outra decomposição de V em subespa-
ços T -cíclicos tem o mesmo número de componentes e mesmos T -
anuladores.
De acordo com o Teorema da Decomposição Primária, pode-
mos escrever V = W1 ⊕ · · · ⊕ Wr quando o polinômio minimal é da
forma m(x) = p1(x)n1p2(x)n2 · · · ps(x)ns , sendo Wi = Nuc(pni
i ). E jun-
tamente com o Lema 2.2, conseguimos representar o operador T como
uma matriz cuja diagonal é composta por matrizes companheiras. É o
que nos diz o seguinte teorema:
Teorema 2.4. Se T : V −→ V é um operador com polinômio minimal
m(x) = p1(x)n1p2(x)n2 · · · ps(x)ns
em que os pi(x) são polinômios mônicos irredutíveis distintos, então T
tem uma única representação matricial diagonal em blocos, da forma
[T ]α =
C11 0 . . . 0 . . . 0 0 . . . 0
0 C12 . . . 0 . . . 0 0 . . . 0...
.... . .
......
......
......
0 0 . . . C1r1. . . 0 0 . . . 0
......
......
. . ....
......
...
0 0 0 0 . . . Cs1 0 . . . 0
0 0 0 0 . . . 0 Cs2 . . . 0...
......
......
......
. . ....
0 0 0 0 . . . 0 0 . . . Csrs
2.3. FORMA CANÔNICA RACIONAL 61
onde Cirisão matrizes companheiras dos polinômios pi(x)niri , com
ni = mi1 ≥ mi2 ≥ · · · ≥ miri, 1 ≤ i ≤ s.
O Teorema 2.4 mostra uma representação matricial de T que
é denominada forma canônica racional. Para entendermos melhor, ve-
jamos o exemplo a seguir.
Exemplo 2.2. Sejam V um espaço vetorial sobre R , com dim(V ) = 7
e T : V −→ V um operador linear cujo polinômio minimal é
m(x) = (x2 − 2x + 5)(x− 3)3.
Vamos obter todas as possíveis formas canônicas racionais de
T. Como dimV = 7, temos duas possibilidades para o polinômio carac-
terístico:
p1(x) = (x2 − 2x + 5)2(x− 3)3 ou p2(x) = (x2 − 2x + 5)(x− 3)5.
Como m(x) = (x2 − 2x + 5)(x − 3)3, então obrigatoriamente devemos
ter os blocos C1(x2− 2x + 5) e C2((x− 3)3) = C2(x3− 9x2 + 27x− 27).
Se o polinômio característico for p1, então temos uma possibilidade
para a representação matricial de T na forma racional:
[T ]α =
(
0 −5
1 2
)
(
0 −5
1 2
)
0 0 27
1 0 −27
0 1 9
.
Se o polinômio característico for p2, então temos duas possibi-
lidades, pois podemos escrever o polinômio p2 de duas formas:
p2 = (x2−2x+5)(x−3)3(x−3)2 e p2 = (x2−2x+5)(x−3)3(x−3)(x−3).
62 Capítulo 2. FORMA CANÔNICA RACIONAL
Considerando a primeira opção, obtemos os seguintes blocos:
C1(x2 − 2x + 5), C2((x− 3)3) e C3((x− 3)2).
Assim, a representação matricial do operador T é dada por:
[T ]α =
(
0 −5
1 2
)
0 0 27
1 0 −27
0 1 9
(
0 −9
1 6
)
.
Considerando a segunda opção, obtemos os seguintes blocos:
C1(x2 − 2x + 5), C2((x− 3)3), C3(x− 3) e C4(x− 3).
Desta forma, a representação matricial do operador T é dada
por:
[T ]α =
(
0 −5
1 2
)
0 0 27
1 0 −27
0 1 9
(
3)
(
3)
.
Portanto, a forma canônica racional de T é uma das matrizes
[T ]α exibidas, nos quais os elementos que não estão indicados são todos
nulos.
63
3 A FORMA CANÔNICA DE JOR-
DAN
No capítulo 1 deste trabalho revisamos alguns conceitos de Ál-
gebra Linear e juntamente com a Decomposição Primária apresentada
no capítulo 2 temos condições de construir a Forma Canônica de Jor-
dan. Esta forma existe sempre que os polinômios característico e mini-
mal são escritos como um produto de fatores lineares. Observe que isto
sempre acontece quando estamos trabalhando no corpo dos complexos,
com isso qualquer operador T : V −→ V pode ser representado na
Forma Canônica de Jordan.
Veremos que, através da Forma Canônica de Jordan, é possível
exibir a matriz de um operador linear não diagonalizável por meio de
uma matriz que possui uma forma “quase diagonal”, isto é, constituída
por blocos de matrizes triangulares inferiores, cujos elementos das dia-
gonais principais são todos iguais a um mesmo número (os autovalores
do operador), cujos elementos imediatamente abaixo destas diagonais
são todos iguais a 1 e os elementos restantes são todos nulos.
A fim de definir e estudar tudo o que se refere a essa forma, ire-
mos nos basear essencialmente nos livros de Coelho e Lourenço (2010),
Hoffman e Kunze (1971), Lima (2009), Lipschutz e Lipson (2011) e
Pellegrini (2013).
3.1 OPERADORES NILPOTENTES
Neste momento serão estudados os operadores nilpotentes, que
são de grande importância para o entendimento da construção da Forma
Canônica de Jordan. Assim, segue sua definição baseado nos autores
Coelho e Lourenço (2010) e Lima (2009).
64 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Definição 3.1. Um operador linear T : V −→ V é dito nilpotente
quando existe k ∈ N tal que T k = 0. É chamado de índice de nilpotência
o menor número k ∈ N tal que T k = 0, ou seja, T i 6= 0, para todo i < k.
Exemplo 3.1. Seja Pm(R) o espaço vetorial dos polinômios de grau
m com entradas reais. Considere o operador T : Pm(R) → Pm(R) que
é dado por T (p(x)) = p(x)′.
Observe que T é o operador derivação e que T m(p(x)) = c,
onde c ∈ R. Aplicando novamente o operador temos
T (T m(p(x))) = T m+1(p(x)) = 0.
Desta forma, T é nilpotente de índice m + 1.
Exemplo 3.2. Considere o operador T : R3 → R
3 definido como
T (x, y, z) = (0, x, y). Este operador é nilpotente de índice k = 3. De
fato,
T (x, y, z) = (0, x, y),
T 2(x, y, z) = T (0, x, y) = (0, 0, x),
T 3(x, y, z) = T (0, 0, x) = (0, 0, 0).
Assim, T 3 = 0.
Uma característica dos operadores nilpotentes é possuírem ape-
nas o zero como autovalor. Esta afirmação é facilmente mostrada a
seguir:
Proposição 3.1. Se T : V −→ V é um operador linear nilpotente de
índice k, então zero é o seu único autovalor.
Demonstração: Por hipótese temos que para qualquer v ∈
V tem-se T k(v) =−→0 , assim seja v um autovetor de T associado ao
autovalor λ. Então−→0 = T k(v) = λkv
3.1. OPERADORES NILPOTENTES 65
isto é,
λkv =−→0 .
Como v 6=−→0 , concluímos que λ = 0.
Quando trabalhamos com um espaço vetorial de dimensão fi-
nita podemos obter uma decomposição em subespaços T -invariantes,
sendo que quando restringirmos o operador em um desses subespaços
teremos um operador nilpotente e no outro subespaço teremos um ope-
rador inversível.
Teorema 3.1. Se V é um espaço vetorial de dimensão finita (real ou
complexo) onde T : V −→ V é um operador linear, então existe uma
decomposição V = U ⊕W , sendo U,W subespaços T -invariantes, onde
T é inversível em U e nilpotente em W. E ainda, tal decomposição é
única.
Demonstração: Considerando os operadores T l, l > 1, pode-
mos obter uma sequência de subespaços T -invariantes de V, tomando
V ⊃ Im(T ) ⊃ Im(T 2) ⊃ · · · ⊃ Im(T l) · · · .
Como a dimensão de V é finita, então esta sequência não po-
derá ser estritamente decrescente para sempre. Assim, seja k > 0 o
menor número natural que satisfaz a igualdade Im(T k) = Im(T k+1).
Afirmamos que Im(T k+1) = Im(T k+2), de fato:
Im(T k+2) = T (Im(T k+1)) = T (Im(T k)) = Im(T k+1).
Da mesma maneira, Im(T k+2) = Im(T k+3) = Im(T k+4) · · · . Igual-
mente obtemos,
Nuc(T ) ⊆ Nuc(T 2) ⊆ · · · ⊆ Nuc(T k) = Nuc(T k+1) = · · ·
pois pelo Teorema do Núcleo e da Imagem, concluímos que
dimNuc(T k+1) = dim(V )− dimIm(T k+1)
= dim(V )− dimIm(T k)
= dimNuc(T k).
66 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Sejam U = Im(T k) e W = Nuc(T k). Queremos mostrar que
V = U + W.
Tomando v ∈ V temos que existe x ∈ V tal que T k(v) =
T 2k(x), pois Im(T k) = Im(T 2k). Então, escrevendo
v = v + (T k(x)− T k(x))
= v + (−T k(x) + T k(x))
= (v − T k(x)) + T k(x)
temos que T k(v − T k(x)) = T k(v) − T 2k(x) =−→0 . Logo, o vetor v −
T k(x) ∈ W e obrigatoriamente T k(x) ∈ U . Assim, mostramos que
V = U + W .
Para que esta soma seja direta, falta mostrar que U∩W = {−→0 }.
Sabendo que dim(U +W ) = dim(U)+dim(W )−dim(U ∩W ) e usando
o Teorema do Núcleo e da Imagem, obtemos
dim(V ) = dim(U + W )
= dim(Im(T k)) + dim(Nuc(T k))− dim(U ∩W )
= dim(V )− dim(U ∩W )
e então
dim(U ∩W ) = 0.
Logo, U ∩W = {−→0 }.
Considere as restrições H1 = T |U e H2 = T |W . É evidente que
H1 é nilpotente, pois Hk1 (v) = T k(v) =
−→0 . E H2 é sobrejetor pois,
H2(U) = T (U) = T (Im(T k)) = Im(T k+1) = Im(T k) = U.
Desta forma, H2 é inversível, por ser um operador linear sobre-
jetor.
Ainda falta provar que essa decomposição é única, para isso
suponhamos que existam E1 e E2 subespaços T-invariantes onde
V = E1 ⊕ E2.
3.1. OPERADORES NILPOTENTES 67
Sejam T1 e T2 operadores tais que T1 = T |E1é nilpotente de
índice k′ e T2 = T |E2é inversível. Definimos agora m = max{k, k′} e
tomando w1 ∈ W ⊂ V , como V = E1⊕E2 então conseguimos escrever
este vetor w1 como a soma dos vetores e1 e e2, onde e1 ∈ E1, e2 ∈ E2.
Então, a igualdade T m(w1) =−→0 é válida, pois se m = k,
temos T m(w1) = T k(w1) =−→0 devido a T ser operador nilpotente
de índice k. Se m = k′, temos T m(w1) = T k′(w1) =−→0 devido a
w1 ∈ W = Nuc(T k) ⊂ Nuc(T k′), como visto anteriormente. Assim,
−→0 = T m(w1) = T m(e1 + e2)
= T m(e1) + T m(e2)
= T m1 (e1) + T m
2 (e2).
Concluímos que T m(e1) =−→0 , pois se m = k, temos T m(e1) =
T k(e1) =−→0 , devido a T ser operador nilpotente de índice k. Se m = k′,
temos T m(e1) = T k′
1 (e1) =−→0 , pois e1 ∈ U1 e T1 é nilpotente de índice
k′.
Com isso, temos T m2 (e2) =
−→0 . Como T2 é inversível, segue que
e2 = 0, fazendo com que w1 = e1. Assim, W ⊆ E1.
Analogamente, mostramos que E1 ⊆ W , portanto E1 = W =
Nuc(T k).
Seja agora u1 ∈ U . Como U = Im(T k), existe v ∈ V tal que
T k(v) = u1. Escrevendo v = b1 + b2, onde b1 ∈ E1, b2 ∈ E2, obtemos:
u1 = T k(v) = T k(b1 + b2) = T k(b1) + T k(b2).
Segue que T k(b1) = 0, pois b1 ∈ E1 = Nuc(T k) e assim
u1 = T k(b2).
Como E2 é T-invariante, segue que u1 ∈ E2, portanto U ⊆ E2.
Seja agora b2 ∈ E2 ⊂ V , como V = U ⊕ W então podemos
escrever b2 = u2 + w2, com u2 ∈ U e w2 ∈ W . Assim, w2 = b2 − u2 ∈
68 Capítulo 3. A FORMA CANÔNICA DE JORDAN
E1 ∩E2 = {−→0 }, pois W = E1 e U ⊆ E2. Dessa forma, b2 = u2 e segue
que E2 ⊆ U , fazendo com que U = E2. Logo, a decomposição é única.
A Proposição a seguir nos auxiliará na obtenção de uma base
em relação a qual a matriz que representa o operador T é composta
por blocos da forma
0 0 · · · 0 0
1 0 · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 0
em sua diagonal.
Proposição 3.2. Considere o operador linear T : V −→ V nilpotente
de índice k ≥ 1, se v ∈ V é um vetor tal que T k−1(v) 6=−→0 e T k(v) =
−→0 , então:
(i) O conjunto {v, T (v), T 2(v), . . . , T k−1(v)} é l.i.
(ii) Existe um subespaço T-invariante W de V tal que V = U ⊕ W ,
onde U = [v, T (v), T 2(v), . . . , T k−1(v)].
Demonstração: (i) Para mostrar que o conjunto
{v, T (v), T 2(v), . . . , T k−1(v)}
é linearmente independente, precisamos primeiramente tomar uma com-
binação linear nula com os elementos do conjunto. Assim, consideremos
a0v + a1T (v) + a2T 2(v) + . . . + ak−1T k−1(v) =−→0 .
Aplicando o operador T k−1 em ambos os lados, obtemos
a0T k−1(v) + a1T k(v) + a2T k+1(v) + . . . + ak−1T 2k−2(v) =−→0 .
Por hipótese temos T k(v) = T k+1(v) = . . . = T 2k−2(v) =−→0 . Logo,
a0T k−1(v) =−→0 .
3.1. OPERADORES NILPOTENTES 69
No entanto, T k−1(v) 6=−→0 , portanto a0 = 0.
Da mesma forma, aplicando o operador T k−2 temos que a1 = 0.
Prosseguindo analogamente, temos a0 = a1 = a2 = . . . = ak−1 = 0.
Sendo assim o conjunto {v, T (v), T 2(v), . . . , T k−1(v)} é linearmente in-
dependente.
(ii) Primeiramente, note que U é T -invariante, pois tomando u ∈ U
podemos escrevê-lo da seguinte forma:
u = a0v + a1T (v) + a2T 2(v) + · · ·+ ak−1T k−1(v)
onde ai ∈ K, 0 ≤ i ≤ k − 1. Assim,
T (u) = T (a0v + a1T (v) + a2T 2(v) + · · ·+ ak−1T k−1(v))
= T (a0v) + T (a1T (v)) + T (a2T 2(v)) + · · ·+ T (ak−1T k−1(v))
= a0T (v) + a1T 2(v) + a2T 3(v) + · · ·+ ak−1T k(v).
Por hipótese segue que ak−1T k(v) =−→0 . Consequentemente,
T (u) = a0T (v) + a1T 2(v) + a2T 3(v) + · · ·+ ak−2T k−1(v) ∈ U.
Logo, U é T -invariante.
Para mostrarmos o resultado desejado, usaremos o princípio de
indução sobre k.
Quando k = 1, teríamos U = [v] = Nuc(T ), pois v 6=−→0 e
T (v) =−→0 e obviamente W = Im(T ) é T -invariante e V = U ⊕W .
Suponhamos que a decomposição é válida para todos os opera-
dores nilpotentes com índices menores que k, com k > 1.
Podemos observar que Im(T ) é um subespaço T -invariante e
que a restrição de T em Im(T ) gera um operador tal que
T k−1(T (v)) = T k(v) =−→0
e
T k−2(T (v)) = T k−1(v) 6=−→0 .
70 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Assim, T |Im(T ) é um operador nilpotente de índice k − 1.
Vamos escrever um subespaço U1 como U1 = U∩Im(T ), devido
a interseção de U e Im(T ) podemos concluir que
U1 = [T (v), T 2(v), . . . , T k−1(v)].
Utilizando a hipótese de indução temos que Im(T ) = U1⊕W1,
onde W1 é um subespaço T -invariante de V.
Considere o subespaço W2 = {w ∈ V | T (w) ∈ W1}. Precisa-
mos primeiramente mostrar duas afirmações:
V = U + W2 e U ∩W1 = {−→0 }.
Se u ∈ V , teremos T (u) ∈ Im(T ) e assim, representamos T (u) como
a soma de um vetor de U1 e outro de W1, ou seja, T (u) = u1 + w1,
u1 ∈ U1 e w1 ∈ W1.
Como U1 = [T (v), T 2(v), . . . , T k−1(v)], existem a1, a2, . . . , ak−1 ∈
K tais que,
u1 =k−1∑
i=1
aiTi(v) = T
(
k−1∑
i=1
aiTi−1(v)
)
= T (u2),
onde denotamos u2 =k−1∑
i=1
aiTi−1(v) e temos que u2 ∈ U . Assim,
T (u) = T (u2) + w1
ou seja,
T (u)− T (u2) = w1
isto é,
T (u− u2) = w1 ∈ W1.
Pela forma que W2 foi definido, concluímos que u − u2 ∈ W2.
Logo,
u = u2 + (u− u2) ∈ U + W2
3.1. OPERADORES NILPOTENTES 71
de modo que provamos a primeira afirmação.
Considere agora u ∈ U ∩W1. Por U e W1 serem T -invariantes
temos que T (u) ∈ U ∩ Im(T ) e T (u) ∈ W1. Com isso,
T (u) ∈ U ∩ Im(T ) ∩W1 = U1 ∩W1.
Como
Im(T ) = U1 ⊕W1
então
T (u) ∈ U1 ∩W1 = {−→0 }.
Logo T (u) =−→0 .
Como u ∈ U , existem escalares a0, a1, · · · , ak−1 ∈ K, tais que
u =k−1∑
i=0
aiTi(v),
Portanto,
−→0 = T (u) = T
(
k−1∑
i=0
aiTi(v)
)
=
k−1∑
i=0
aiTi+1(v)
= a0T (v) + a1T 2(v) + · · ·+ ak−2T k−1(v) + ak−1T k(v).
Visto que T k(v) =−→0 , nos resta
a0T (v) + a1T 2(v) + · · ·+ ak−2T k−1(v) =−→0 .
Dado que o conjunto {T (v), T 2(v), . . . , T k−1} é linearmente in-
dependente, então a0 = a1 = · · · = ak−2 = 0 e u = ak−1T k−1(v) ∈
Im(T ). Assim, u ∈ U ∩ Im(T ) = U1. Logo, u ∈ U1 ∩ W1 = {−→0 },
portanto
U ∩W1 = {−→0 }.
72 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Conforme a igualdade U ∩W1 = {−→0 }, temos que
U ∩W2 ∩W1 = {−→0 }
e como U ∩ W2 e W1 estão contidos em W2, pois W1 é T -invariante,
segue que existe um subespaço W , tal que
W2 = W ⊕W1 ⊕ (U ∩W2). (3.1)
Afirmamos que W = W ⊕W1 é o subespaço que estamos procurando.
De fato, W ⊆ W2 e W ∩ (U ∩ W2) = {−→0 }, assim U ∩ W = {
−→0 }.
Utilizando a primeira afirmação, V = U + W2 e o Teorema 1.2, temos
dim(V ) = dim(U + W2) = dim(U) + dim(W2)− dim(U ∩W2). (3.2)
Por 3.1, temos
dim(W2)− dim(U) ∩W2 = dim(W ⊕W1) = dim(W ). (3.3)
Subtraindo as equações 3.2 e 3.3, temos
dim(V )− dim(W ) = dim(U)
e assim,
dim(V ) = dim(U) + dim(W ).
Logo, V = W + U como queríamos. Basta apenas mostrar que
W é um subespaço T -invariante. De fato, como W ⊆ W2, teremos
T (W ) ⊆ W1 ⊆ W , finalizando a demonstração.
Considere um operador linear T : V → V , onde V possui
dimensão n ≥ 1. Suponhamos que o polinômio característico de T seja
da forma p(x) = (x − λ)n e que o índice de nilpotência do operador
(T − λ) seja n. Pela Proposição 3.2, existe um conjunto
β = {v, (T − λI)(v), (T − λI)2(v), . . . , (T − λI)(v)n−1}
3.1. OPERADORES NILPOTENTES 73
que é linearmente independente. Como β possui n vetores e dim(V ) =
n, temos que β é base de V . Em relação a base β, a representação
matricial de (T − λI) é dada por
[T − λI ]β =
0 0 · · · 0 0
1 0 · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 0
.
Assim,
[T − λI ]β = [T ]β −
λ 0 · · · 0 0
0 λ · · · 0 0
0 0 · · · 0 0...
.... . .
......
0 0 · · · 0 λ
=
0 0 · · · 0 0
1 0 · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 0
.
Isto é,
[T ]β =
λ 0 · · · 0 0
0 λ · · · 0 0
0 0 · · · 0 0...
.... . .
......
0 0 · · · 0 λ
+
0 0 · · · 0 0
1 0 · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 0
.
Logo,
[T ]β =
λ 0 · · · 0 0
1 λ · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 λ
.
Desta forma, quando o operador T : V −→ V possui polinômio
característico da forma p(x) = (x − λ)n, conseguimos representar este
operador através de uma matriz cuja diagonal principal é formada pelo
74 Capítulo 3. A FORMA CANÔNICA DE JORDAN
autovalor λ e os elementos imediatamente abaixo da diagonal principal
são iguais a 1 e os demais elementos são todos nulos. Baseado nisto,
definiremos um bloco de Jordan.
Definição 3.2. Um bloco de Jordan n × n é uma matriz triangular
inferior dada por:
J(λ, n) =
λ 0 · · · 0 0
1 λ · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 λ
.
Neste momento, nosso objetivo é encontrar uma base onde
qualquer operador linear T é representado através de uma matriz for-
mada por blocos de Jordan em sua diagonal. Tal matriz será chamada
de Forma Canônica de Jordan.
Teorema 3.2. Se T : V −→ V é um operador linear nilpotente com
índice de nilpotência k ≥ 1, onde V é um espaço vetorial sobre o corpo
K de dimensão finita, então existem números positivos t, k1, . . . , kt e
vetores v1, . . . , vt ∈ V tais que:
(a) k = k1 ≥ k2 ≥ k3 ≥ · · · ≥ kt.
(b)O conjunto γ = {v1, T (v1), . . . , T k1−1(v1), . . . , vt, T (vt), . . . , T kt−1(vt)}
é uma base de V.
(c)T ki(vi) =−→0 para cada i = 1, . . . , t.
Demonstração: Como T é nilpotente de índice k, existe
v1 ∈ V tal que T k−1(v1) 6=−→0 . Utilizando a Proposição 3.2 temos
um conjunto β1 = {v1, T (v1), T 2(v1), . . . , T k−1(v1)} linearmente inde-
pendente, onde v1 ∈ V e ainda, podemos escrever
V = U1 ⊕W1
onde U1 é gerado por β1 e W1 é subespaço T -invariante.
3.2. AUTOVETORES GENERALIZADOS 75
Seja k = k1. Fazendo T1 = T |W1, temos que T1 será nilpo-
tente com o índice que denotaremos k2, sendo que k2 ≤ k1. Da mesma
maneira, existe v2 ∈ W1 tal que T k2−11 (v2) = T k2−1(v2) 6=
−→0 e pela
Proposição 3.2 temos
W1 = U2 ⊕W2
onde U2 é gerado por β2 = {v2, T (v2), T 2(v2), . . . , T k2−1(v2)} , que é um
conjunto linearmente independente, e W2 é um subespaço T -invariante.
Fazendo T2 = T |W2teremos um operador nilpotente de índice
k3, com k3 ≤ k2. Como a dimensão de V é finita, se repetirmos este
processo, chegaremos que k1 ≥ k2 ≥ k3 ≥ · · · ≥ kt.
Além disso,vemos que γ = β1 ∪ β2 ∪ · · · ∪ βt é uma base de V ,
pois de acordo com a Proposição 3.2 temos V = U1 ⊕ U2 ⊕ · · · ⊕ Ut.
Por fim, T ki(vi) =−→0 para cada i = 1, · · · , t, pois T |Wi
é
sempre nilpotente de índice ki.
O Teorema 3.2 nos garante que existe uma base em que a repre-
sentação matricial de um operador nilpotente será formada por blocos
de Jordan, porém não especifica quem são os elementos desta base.
Na próxima seção, teremos como objetivo reescrever o Teorema 3.2 em
termos de autovetores generalizados, que nos permitirá explicitar esta
base.
3.2 AUTOVETORES GENERALIZADOS
Sempre que temos um operador linear T : V −→ V diagonalizá-
vel, podemos afirmar que existe uma base de V formada por autovetores
de T . Porém, quando T não é diagonalizável, não haverá autovetores
suficientes para compor uma base de V . Neste caso, veremos que existe
uma base constituída pelo que chamaremos de cadeia de Jordan.
Definição 3.3 (Autovetores generalizados). Seja T : V −→ V um
operador linear. Se existirem escalares λ e p, com p positivo, tais que:
(T − λI)p(v) =−→0
76 Capítulo 3. A FORMA CANÔNICA DE JORDAN
e
(T − λI)p−1(v) 6=−→0
então v é chamado de autovetor generalizado de T .
Observe que se p = 1 então v é um autovetor de T .
Exemplo 3.3. Seja T : R3 → R3 o operador linear dado por
[T ] =
0 0 1
1 1 0
1 0 0
.
O vetor v = (1, 0, 1) é um autovetor generalizado de T associ-
ado ao autovalor 1, com p = 2. De fato,
(T − I)2(v) =
2 0 −2
−1 0 1
−2 0 2
1
0
1
=
0
0
0
porém,
(T − I)(v) =
−1 0 1
1 0 0
1 0 −1
1
0
1
=
0
1
0
.
Definição 3.4. Seja λ um autovalor do operador linear T : V → V.
Uma cadeia de Jordan é uma sequência de vetores da forma:
v, (T − λI)(v), (T − λI)2(v), . . . , (T − λI)p−1(v)
sendo v um autovetor generalizado de T .
Exemplo 3.4. Retomando o exemplo 3.3, temos que a sequência
v = (1, 0, 1), (T − I)(v) = (0, 1, 0)
é uma cadeia de Jordan associado ao autovalor 1.
Teorema 3.3. Uma cadeia de Jordan é formada por vetores linear-
mente independentes.
3.2. AUTOVETORES GENERALIZADOS 77
Demonstração: Seja T um operador linear tal que a sequên-
cia
v, (T − λI)(v), . . . , (T − λI)p−1(v)
é uma cadeia de Jordan, com (T −λI)p(v) =−→0 e (T −λI)p−1(v) 6=
−→0 .
Suponhamos que
a0v + a1(T − λI)(v) + . . . + ap−1(T − λI)p−1(v) =−→0 . (3.4)
Aplicando o operador (T − λI)p−1 em ambos os lados, obtemos
a0(T − λI)p−1(v) + a1(T − λI)p(v) + . . . + ap−1(T − λI)2p−2(v) =−→0 .
Como (T − λI)i(v) =−→0 , para todo i ≥ p, então a igualdade anterior
se reduz a
a0(T − λI)p−1(v) =−→0 .
Como (T−λI)p−1(v) 6=−→0 , temos que a0 = 0. Reescrevendo a igualdade
3.4, temos
a1(T − λI)(v) + . . . + ap−1(T − λI)p−1(v) =−→0 . (3.5)
Aplicando (T − λI)p−2 em ambos os lados, temos
a1(T − λI)p−1(v) + a2(T − λI)p(v) + . . . + ap−1(T − λI)2p−3(v) =−→0
que se reduz a
a1(T − λI)p−1 =−→0
e portanto a1 = 0, visto que (T − λI)p−1 6=−→0 . De modo análogo,
concluímos que a2 = · · · = ap−1 = 0. Logo, a cadeia de Jordan é
linearmente independente.
Podemos generalizar o resultado do Teorema 3.3 para uma
quantidade finita de cadeias de Jordan. Ou seja, a união de cadeias
associadas a autovalores distintos é linearmente independente.
Seja T : V −→ V um operador linear cujo polinômio caracte-
rístico é dado por p(x) = (x − λ)n, considere as seguintes cadeias de
78 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Jordan associadas ao autovalor λ:
v1, (T − λI)(v1), . . . , (T − λI)k1−1(v1),
v2, (T − λI)(v2), . . . , (T − λI)k2−1(v2),
...
vt, (T − λI)(vt), . . . , (T − λI)kt−1(vt).
Observe que (T − λI)ki(vi) =−→0 , para cada i = 1, . . . , t, e que o
operador (T − λI) é nilpotente de índice menor ou igual a n, pois
p(T ) = (T − λI)n = 0. Assim, conforme o Teorema 3.2 estas cadeias
formam uma base para V . Logo, existe uma base formada por cadeias
de Jordan tal que a representação de T nesta base está na forma de
Jordan.
3.3 A FORMA CANÔNICA DE JORDAN
Nesta seção, temos como finalidade utilizar os resultados vistos
para construir a chamada forma canônica de Jordan, ou simplesmente,
forma de Jordan de um operador linear qualquer. A existência da forma
de Jordan para um operador qualquer decorre da sua existência para
operadores nilpotentes. Mostraremos isto através do próximo Teorema
que Coelho e Lourenço (2010) enuncia da seguinte forma:
Teorema 3.4. Seja V um espaço vetorial de dimensão finita sobre K.
Se T : V −→ V é um operador linear cujo polinômio característico é
da forma
p(x) = (x− λ1)m1 · · · (x− λr)mr
com mi > 1 e λi 6= λj, se i 6= j, então
V = W1 ⊕W2 ⊕ · · · ⊕Wr
onde, para cada 1 ≤ i ≤ r, tem-se que:
(i) a restrição do operador T − λiI a Wi é nilpotente;
(ii) Wi é T -invariante;
(iii) dim(Wi) = mi.
3.3. A FORMA CANÔNICA DE JORDAN 79
Demonstração: Considere a transformação (T − λiI) : V →
V . Vamos denotar esta transformação por Ti = (T −λiI), para 1 ≤ i ≤
r.
Pelo Teorema 3.1 existe uma decomposição V = Wi⊕Ui, sendo
Wi e Ui subespaços Ti-invariantes e as restrições de Ti a Wi e a Ui nilpo-
tente e inversível, respectivamente. Desta forma, provamos o primeiro
item.
Como Wi é T -invariante e Ti = (T − λiI), pela Proposição
1.1, podemos afirmar que Wi e Ui são T -invariantes, provando assim o
segundo item.
Sejam agora T ′ = T |Wie T ′′ = T |Ui
, como V = Wi ⊕Ui então
pela Proposição 1.2 temos que o polinômio característico de T é escrito
como
p(x) = p′(x) p′′(x)
sendo p′(x) e p′′(x) os polinômios característico de T ′ e T ′′, respectiva-
mente.
Conforme a Proposição 3.1, temos que o operador T ′ − λiI
possui apenas o zero como autovalor. Desta forma, para algum w ∈ Wi,
com w 6=−→0 , temos
(T ′ − λiI)(w) = 0 · w
isto é,
(T ′ − λiI)(w) =−→0
assim,
T ′(w)− λiw =−→0 ⇒ T ′(w) = λiw.
Portanto, λi é o único autovalor de T ′. Como
(T ′′ − λiI) = (T |Ui− λiI) = (T − λiI)|Ui
= Ti|Ui
é inversível, temos que λi não é autovalor de T ′′, em outras palavras
det(T ′′ − λiI) 6= 0.
80 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Assim concluímos que p′(x) = (x − λi)mi . Como p′(x) é o polinômio
característico de T ′ : Wi → Wi, então concluímos que dim(Wi) = mi,
provando o terceiro item.
Como p(x) = (x− λ1)m1 · · · (x− λr)mr , temos que
dim(V ) = m1 + m2 + · · ·+ mr
Pelo item (iii), obtemos
dim(V ) = dim(W1) + dim(W2) + · · ·+ dim(Wr).
E como Wi ∩ (W1 + · · ·+ Wi−1 + Wi+1 + · · ·+ Wr) = {−→0 }, então
dim(V ) = dim(W1 + W2 + · · ·+ Wr).
Logo,
V = W1 ⊕W2 ⊕ · · · ⊕Wr.
Observe que para um operador T : V −→ V cujo polinômio
característico é da forma p(x) = (x−λ1)m1 · · · (x−λr)mr , tem-se que o
polinômio minimal de T será dado por m(x) = (x−λ1)n1 · · · (x−λr)nr ,
com ni ≤ mi. Assim, pelo Teorema da Decomposição Primária temos
que os subespaços Wi do Teorema 3.4 são os núcleos de (T − λiI)ni .
De acordo com o Teorema 3.4 o espaço vetorial V pode ser
decomposto como uma soma direta de subespaços Wi que satisfazem
os itens (i),(ii) e (iii).
Tomando o operador Ti sendo a restrição de T a Wi, para cada
i = 1, 2, . . . , r, temos que (Ti − λiI) é nilpotente. Observe que os po-
linômios característico e minimal do operador Ti são, respectivamente
p(x) = (x− λi)mi e m(x) = (x− λi)
ni
3.3. A FORMA CANÔNICA DE JORDAN 81
Segundo o Teorema 3.2, existe uma base γi de Wi tal que
[Ti − λiI]γi=
0 0 · · · 0 0
1 0 · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 0
isto é,
[Ti ]γi=
λi 0 · · · 0 0
1 λi · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 λi
mi×mi
Podemos reescrever a matriz acima de tal forma que, para ni =
ni1 ≥ ni2 ≥ · · · ≥ nij , sua diagonal é formada por blocos de Jordan,
desta forma
[Ti ]γi=
J(λi, ni1) 0 · · · 0
0 J(λi, ni2) · · · 0...
.... . .
...
0 0 · · · J(λi, nij)
mi×mi
sendo cada bloco dado por
J (λi , nij) =
λi 0 · · · 0 0
1 λi · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 λi
nij×nij
para cada i = 1, . . . , r e j = 1, . . . , ti. Segundo o Teorema 1.3, existe
uma base de V que é a união das bases γi de Wi, ou seja,
γ = γ1 ∪ γ2 ∪ · · · ∪ γr.
82 Capítulo 3. A FORMA CANÔNICA DE JORDAN
E finalmente, obtemos
[T ]γ =
[T1]γ10 · · · 0
0 [T2]γ2· · · 0
......
. . ....
0 0 · · · [Tr]γr
que é dita a forma de Jordan de T .
Pode-se demonstrar que a Forma Canônica de Jordan de um
operador linear é única, a menos da posição dos blocos de Jordan ao
longo da diagonal principal, conforme demonstrado por Lima (2009).
Note que o polinômio minimal de T é dado por
m(x) = (x− λ1)n1 · · · (x− λr)nr
e assim, para cada J(λi, nij) há ao menos um bloco com ordem ni,
sendo que os outros são de ordem menor ou igual a ni. Isto decorre do
fato que o operador (Ti − λiI)ni = 0. E ainda, a soma das ordens dos
J(λi, nij) é mi.
Para identificar quantos blocos J(λi, nij) a matriz do operador
possui, basta observar a multiplicidade geométrica de λi.
Com base nas informações obtidas, temos condições de encon-
trar a Forma de Jordan para qualquer operador T : V → V , sendo
V de dimensão finita. Vale salientar que T pode ser posto na Forma
de Jordan quando seus polinômios característico e minimal são escritos
como um produto de fatores lineares, e isto sempre acontece no corpo
dos complexos.
Exemplo 3.5. Seja T : R3 → R3 operador linear dado por
T (x, y, z) = (2x + 6y − 15z, x + y − 5z, x + 2y − 6z).
O operador T possui a representação matricial na base canônica
3.3. A FORMA CANÔNICA DE JORDAN 83
da forma
[T ] =
2 6 −15
1 1 −5
1 2 −6
portanto, p(x) = (x + 1)3. As possibilidades para o polinômio minimal
são
m(x) = (x + 1), m(x)(x + 1)2 ou m(x) = (x + 1)3.
Como (T + I) 6= 0 e (T + I)2 = 0, então o polinômio minimal
de T é dado por m(x) = (x + 1)2.
Pelo Teorema da Decomposição Primária temos
R3 = Nuc(T + I)2.
Através do sistema (T + I)(v) =−→0 é possível encontrar dois
autovetores associados a λ = −1, assim a multiplicidade geométrica de
λ = −1 é igual a 2, de modo que haverá dois blocos referentes a este
autovalor. Resolvendo o sistema
3 6 −15
1 2 −5
1 2 −5
x
y
z
=
0
0
0
obtemos os autovetores (−2, 1, 0) e (5, 0, 1).
Precisamos encontrar uma base γ tal que a matriz [T ] esteja
na forma de Jordan. Com isso, conforme o Teorema 3.2, resolvendo o
sistema (T +I)2(v) =−→0 para obter a cadeia de Jordan, encontramos os
autovetores generalizados (1, 0, 0), (0, 1, 0) e (0, 0, 1). Escolhendo v1 =
(1, 0, 0), temos que o vetor (T + I)(v1) = (3, 1, 1) compõe a base γ.
Tomando v2 = (−2, 1, 0), obtemos γ = {(1, 0, 0), (3, 1, 1), (−2, 1, 0)}.
Logo, a matriz [T ]γ é representada por
[T ]γ =
(
−1 0
1 −1
)
(
−1)
84 Capítulo 3. A FORMA CANÔNICA DE JORDAN
nos quais os elementos que não estão indicados são todos nulos.
Exemplo 3.6. Seja T : R4 → R4 operador linear dado por
T (x, y, z, t) = (2x− y + t, 3y − z, y + z,−y + 3t).
O operador T possui representação matricial na base canônica
da forma
[T ] =
2 −1 0 1
0 3 −1 0
0 1 1 0
0 −1 0 3
.
Conforme o exemplo 1.5, temos que os polinômios característico
e minimal de T são dados por
p(x) = (x− 2)3(x− 3) e m(x) = (x− 2)2(x− 3).
Pelo Teorema da Decomposição Primária, o espaço vetorial R4
pode ser escrito como R4 = Nuc(T − 2I)2 ⊕Nuc(T − 3I).
Para λ = 2, encontraremos os vetores que satisfazem a igual-
dade (T − 2I)(v) =−→0 . Resolvendo o sistema
0 −1 0 1
0 1 −1 0
0 1 −1 0
0 −1 0 1
x
y
z
t
=
0
0
0
0
encontramos os autovetores (0, 1, 1, 1) e (1, 0, 0, 0).
Como a multiplicidade algébrica de λ = 2 é igual a 3, diferen-
temente da sua multiplicidade geométrica que é 2, então precisamos
resolver outro sistema para obter um autovetor generalizado, ou seja,
encontrar os vetores que satisfazem a igualdade (T − 2I)2(v) =−→0 .
3.3. A FORMA CANÔNICA DE JORDAN 85
Resolvendo o sistema
0 −2 1 1
0 0 0 0
0 0 0 0
0 −2 1 1
x
y
z
t
=
0
0
0
0
encontramos os autovetores generalizados (0, 1, 0, 2), (0, 0, 1,−1) e (1, 0, 0, 0).
Escolhendo o vetor v1 = (0, 0, 1,−1), temos pelo Teorema 3.2
que o vetor (T − 2I)(v1) = (−1,−1,−1,−1) compõe a base γ.
Note que teremos dois blocos associados ao autovalor λ = 2,
com isso escolhemos o autovetor v2 = (0, 1, 1, 1).
Para λ = 3, encontraremos um vetor v tal que (T−3I)(v) =−→0 .
Resolvendo o sistema
−1 −1 0 1
0 0 −1 0
0 1 −2 0
0 −1 0 0
x
y
z
t
=
0
0
0
0
encontramos o autovetor v3 = (1, 0, 0, 1). Como a multiplicidade geo-
métrica do autovalor λ = 3 é igual a 1, então há somente um bloco
referente a este autovalor.
Logo, encontramos uma base
γ = {(0, 0, 1,−1), (−1,−1,−1,−1), (0, 1, 1, 1), (1, 0, 0, 1)}
tal que a representação de T nesta base é dada por
[T ]γ =
(
2 0
1 2
)
(
2)
(
3)
que é a forma de Jordan de T .
86 Capítulo 3. A FORMA CANÔNICA DE JORDAN
Exemplo 3.7. Seja T : R6 → R6 operador linear dado por
T (x, y, z, t, w, p) = (2x, x + 2y,−x + 2z, y + 2t, x + y + z + t + 2w, w−p)
cuja representação na base canônica é
[T ] =
2 0 0 0 0 0
1 2 0 0 0 0
−1 0 2 0 0 0
0 1 0 2 0 0
1 1 1 1 2 0
0 0 0 0 1 −1
.
Os polinômios característico e minimal de T são
p(x) = (x− 2)5(x + 1) e m(x) = (x− 2)4(x + 1)
e segue que R6 = Nuc(T − 2I)4 ⊕Nuc(T + I).
Para λ = 2, temos o sistema
0 0 0 0 0 0
1 0 0 0 0 0
−1 0 0 0 0 0
0 1 0 0 0 0
1 1 1 1 0 0
0 0 0 0 1 −3
x
y
z
t
w
p
=
0
0
0
0
0
0
,
que fornece os autovetores (0, 0,−1, 1, 0, 0) e (0, 0, 0, 0, 3, 1).
Através do sistema (T − 2I)4(v) =−→0 , obtemos os autoveto-
res generalizados (−6, 10, 0, 0, 0, 0), (−9, 0, 10, 0, 0, 0), (−9, 0, 0, 10, 0, 0),
(27, 0, 0, 0, 10, 0), (−81, 0, 0, 0, 0, 10). Escolhendo v1 = (−6, 10, 0, 0, 0, 0),
temos que os vetores
v1 = (−6, 10, 0, 0, 0, 0)
(T − 2I)(v1) = (0,−6, 6, 10, 4, 0),
(T − 2I)2(v1) = (0, 0, 0,−6, 10, 4),
(T − 2I)3(v1) = (0, 0, 0, 0,−6,−2)
3.3. A FORMA CANÔNICA DE JORDAN 87
formam uma cadeia de Jordan para λ = 2.
Como a multiplicidade geométrica é igual a 2, haverá dois blo-
cos associados a λ = 2. Assim, seja v2 = (0, 0,−1, 1, 0, 0).
Para λ = −1, temos o sistema
3 0 0 0 0 0
1 3 0 0 0 0
−1 0 3 0 0 0
0 1 0 3 0 0
1 1 1 1 3 0
0 0 0 0 1 0
x
y
z
t
w
p
=
0
0
0
0
0
0
que fornece o autovetor v3 = (0, 0, 0, 0, 0, 1).
Logo, γ = {(−6, 10, 0, 0, 0, 0), (0,−6, 6, 10, 4, 0), (0, 0, 0,−6, 10, 4),
(0, 0, 0, 0,−6,−2), (0, 0,−1, 1, 0, 0), (0, 0, 0, 0, 0, 1)} e assim a forma de
Jordan de T é
[T ]γ =
2 0 0 0
1 2 0 0
0 1 2 0
0 0 1 2
(
2)
(
1)
.
Exemplo 3.8. Seja T um operador linear cujos polinômios caracterís-
tico e minimal são, respectivamente
p(x) = (x− 5)4(x− 1)3 e m(x) = (x− 5)2(x− 1)2.
Podemos encontrar as possíveis formas de Jordan com as in-
formações dadas.
Se o operador T possui dois autovetores independentes associ-
88 Capítulo 3. A FORMA CANÔNICA DE JORDAN
ados a λ = 5, então sua forma de Jordan é dada por
(
5 0
1 5
)
(
5 0
1 5
)
(
1 0
1 1
)
(
1)
.
No entanto, se possuir três autovetores independentes associa-
dos a λ = 5 sua forma de Jordan será
(
5 0
1 5
)
(
5)
(
5)
(
1 0
1 1
)
(
1)
.
Uma das aplicações da Foma Canônica de Jordan se encontra
na resolução de sistemas de equações diferenciais lineares. Ao estudar o
caso geral da equação diferencial linear x′ = Ax, onde A é uma matriz
de ordem n×n, temos que a solução geral do problema de valor inicial
(PVI) linear{
x′ = Ax
x(0) = x0
é dada por x(t) = eAtx0. Assim, para obtermos a solução do sistema
é necessário calcular a matriz eAt, cuja obtenção é simplificada com o
uso da Forma Canônica de Jordan, como veremos no exemplo abaixo.
Exemplo 3.9. Seja o PVI da forma{
x′(t) = Ax(t)
x(0) = x0
3.3. A FORMA CANÔNICA DE JORDAN 89
sendo
A =
3 0 0
1 4 1
2 3 6
e x0 =
1
2
−1
Primeiramente, verificamos que a forma de Jordan de A, que
denotaremos por J e com os polinômios característico e minimal da
forma pA(x) = mA(x) = (x− 3)2(x− 7), é dada por
J =
(
3 0
1 3
)
(
7)
associada a base γ = {(4, 0,−3), (0, 1,−1), (0, 1, 3)}. Assim, a matriz P
de mudança de base, tal que J = P−1AP , é igual a
P =
4 0 0
0 1 1
−3 −1 3
.
Para determinar a solução x(t) = eAtx0, precisamos calcular
a matriz eAt. Para isso, conforme Figueiredo e Neves (2008), algumas
propriedades são necessárias:
1) Se P é uma matriz inversível então,
eP−1AP = P−1eAP.
2) AB = BA se, e somente se e(A+B)t = eAteBt, para todo t.
3) Usando a propriedade 2 e a expansão em série de MacLaurin
eA =
∞∑
i=0
Ai
i!,
90 Capítulo 3. A FORMA CANÔNICA DE JORDAN
temos
eJ(λi,ni)t = e(λiI+Ni)t = eλiteNit
= eλit
(
I + Nit +N2
i
2!t2 + · · ·+
Nni−1i
(ni − 1)!tni−1
)
= eλit
1 0 0 0 0
t 1 0 0 0t2
2! t 1 0 0...
.... . .
. . ....
tni−1
(ni−1)!tni−2
(ni−2)! · · · t 1
ni×ni
(3.6)
onde Ni é uma matriz nilpotente do tipo
Ni =
0 0 · · · 0 0
1 0 · · · 0 0
0 1 · · · 0 0...
.... . .
......
0 0 · · · 1 0
ni×ni
Note que a série∞∑
i=0
Ai
i!é a soma de infinitos termos, porém se a matriz
A for nilpotente esta soma se torna finita, pois a partir de uma certa
potência a matriz se anula. Portanto, a exponencial eP−1AP é formada
por blocos do tipo 3.6.
Observe que os blocos de Jordan de A são
J(3, 2) =
(
3 0
1 3
)
e J(7, 1) = (7) .
Conforme as propriedades acima, temos
eJ(3,2)t = e(3I+N1)t = e3It+N1t = e3teN1t
= e3t
(
1 0
t 1
)
=
(
e3t 0
te3t e3t
)
3.3. A FORMA CANÔNICA DE JORDAN 91
e
eJ(7,1)t = e(7I+N2)t = e7It+N2t = e7teN2t
= e7t(1)
= (e7t).
Logo,
eJt =
e3t 0 0
te3t e3t 0
0 0 e7t
.
Com as informações obtidas, temos condições de encontrar a
matriz eAt. Assim,
eAt = PeJtP−1
=
4 0 0
0 1 1
−3 −1 3
e3t 0 0
te3t e3t 0
0 0 e7t
14 0 0
− 316
34 −1
43
1614
14
=
e3t 0 0te3t
4 − 3e3t
16 + 3e7t
163e3t
4 + e7t
4 − e3t
4 + e7t
4
− 3e3t
4 − te3t
4 + 3e3t
16 + 9e7t
16 −3e3t
4 + 3e7t
4e3t
4 + 3e7t
4
Logo, a solução geral do sistema de equações diferenciais é dada
por
x(t) =
e3t 0 0te3t
4 − 3e3t
16 + 3e7t
163e3t
4 + e7t
4 − e3t
4 + e7t
4
−3e3t
4 − te3t
4 + 3e3t
16 + 9e7t
16 − 3e3t
4 + 3e7t
4e3t
4 + 3e7t
4
1
2
−1
=
e3t
te3t
4 + 25e3t
16 + 7e7t
16
−13e3t
16 − te3t
4 + 21e7t
16
.
93
CONCLUSÃO
O curso de Licenciatura em Matemática permite ao acadêmico
uma visão de várias áreas da matemática. E este trabalho teve como
um dos seus objetivos ampliar os conhecimentos referentes à Álgebra
Linear. A construção da Forma Canônica de Jordan requer o estudo
destes conhecimentos, para atingir tal objetivo se explorou alguns con-
ceitos não abordados na graduação. Dentre eles, o estudo relativo aos
operadores não diagonalizáveis.
A Forma Canônica de Jordan possibilita uma representação
matricial de um operador linear não diagonalizável de maneira mais
simples possível, visto que este operador não possui uma base cons-
tituída por autovetores, assim não podendo ser representado por uma
matriz diagonal. No entanto, através de uma base constituída por auto-
vetores generalizados, este operador possui uma representação matricial
formada por blocos de Jordan.
Os operadores nilpotentes são de suma importância para a
forma de Jordan, pois por meio deles a existência da forma de Jor-
dan pode ser estendida para qualquer operador linear, quando este
possui polinômios característico e minimal escritos como um produto
de fatores lineares.
Com isso, a forma de Jordan tem aplicabilidade na resolução
de sistemas de equações diferenciais de primeira ordem. A resolução
se torna simples quando a matriz dos coeficientes deste sistema for
diagonalizável. Porém, quando esta matriz não é diagonalizável, pode-
se reduzir o sistema a outro equivalente, cuja nova matriz esta na Forma
de Jordan.
As pesquisas realizadas neste trabalho despertaram o interesse
em aprofundar ainda mais o conhecimento a respeito da Forma de Jor-
94 Conclusão
dan, de outras formas canônicas existentes e suas aplicações.
95
Referências
BUENO, H. P. Álgebra linear: Um segundo curso. Rio de Janeiro:
IMPA, 2006.
COELHO, F. U.; LOURENÇO, M. L. Um curso de álgebra linear. 2.ed.
São Paulo; EDUSP, 2010.
FIGUEIREDO, D. G.; NEVES, A. F. Equações Diferenciais Aplicadas.
3. Ed. Rio de Janeiro: IMPA, 2009.
HOFFMAN, K; KUNZE, R. Linear Algebra. 2. ed. Rio de Janeiro:
Prentice Hall, 1971.
LANG, S.; JUTUCA, L. P. S. G. Álgebra linear. Rio de Janeiro: Ciência
Moderna, 2003.
LIMA, E. L. Álgebra Linear. 7. ed. Coleção Matemática Universitária.
Rio de Janeiro: IMPA, 2009.
LIPSCHUTZ, S; LIPSON, M. Álgebra Linear. 4.ed. Coleção Schaum.
Porto Alegre: Bookman, 2011.
PELLEGRINI J. C.. Álgebra Linear - notas de aula - versão 114. Dispo-
nível em <http://aleph0.info/cursos/al/notas/al.pdf>. Data de acesso:
12 de junho de 2015.
Apêndices
99
APÊNDICE A – PROPRIEDADES
Para a resolução do sistema de equações diferenciais do exem-
plo 3.9, foram utilizadas algumas propriedades, sendo duas delas de-
monstradas a seguir.
Propriedade A.1. Se P é uma matriz inversível então,
eP−1AP = P−1eAP.
Demonstração: Utilizado a expansão em série de MacLaurin
eA =∞∑
i=0
Ai
i!,
temos que
eP−1AP =
∞∑
i=0
(P−1AP )i
i!
Como (P−1AP )i = P−1AiP , segue que
eP−1AP =∞∑
i=0
(P−1AP )i
i!
=∞∑
i=0
P−1AiP
i!
= P−1
(
∞∑
i=0
Ai
i!
)
P
= P−1eAP.
Logo,
eP−1AP = P−1eAP.
100 APÊNDICE A. PROPRIEDADES
Propriedade A.2. AB = BA se, e somente se e(A+B)t = eAteBt, para
todo t.
Demonstração: (⇒) Precisamos mostrar que x1(t) = eAteBt
e x2(t) = e(A+B)t satisfazem o PVI dado por x′(t) = (A+B)x2(t), com
x(0) = I. Pela regra do produto, segue que
x′1(t) = AeAteBt + eAtBeBt. (A.1)
Observe que eAtB = BeAt, pois
eAtB =
∞∑
i=0
(At)i
i!B
= I ·B + At ·B +A2t2
2·B + · · ·+
Antn
n·B.
Como as matrizes A e B comutam, segue que
eAtB = B · I + B ·At + B ·A2t2
2+ · · ·+ B ·
Antn
n
= B∞∑
i=0
(At)i
i!
= BeAt.
Retornando para a equação A.1, obtemos
x′1(t) = AeAteBt + BeAteBt
= (A + B)eAteBt.
Pela unicidade de solução de equações diferenciais, temos que
e(A+B)t = eAteBt.
(⇐) Derivando ambos os lados da igualdade e(A+B)t = eAteBt, obtemos
(A + B)e(A+B)t = AeAteBt + eAtBeBt.
Derivando novamente, obtemos
(A + B)2e(A+B)t = A2eAteBt + AeAtBeBt + AeAtBeBt + eAtB2eBt.
101
Fazendo t = 0, temos
(A + B)2 = A2 + AB + AB + B2
(A + B)(A + B) = A2 + 2AB + B2
A2 + AB + BA + B2 = A2 + 2AB + B2
AB + BA = 2AB
BA = AB.
Logo, as matrizes A e B comutam.