jéssica neckel cavalheiro a forma canônica de jordan

UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC

CENTRO DE CIÊNCIAS TECNOLÓGICAS - CCT

CURSO DE LICENCIATURA EM MATEMÁTICA

TRABALHO DE CONCLUSÃO DE CURSO

A FORMA CANÔNICA DE JORDAN

JÉSSICA NECKEL CAVALHEIRO

JOINVILLE, 2015

JÉSSICA NECKEL CAVALHEIRO

A FORMA CANÔNICA DE JORDAN

Trabalho de Graduação apresentado ao

Curso de Licenciatura em Matemática

do Centro de Ciências Tecnológicas,

da Universidade do Estado de Santa

Catarina, como requisito parcial para

a obtenção do grau de Licenciatura em

Matemática.

Orientador(a): Prof. Ms. Marnei

Luis Mandler

JOINVILLE, SC

2015

A minha família.

Agradecimentos

Primeiramente agradeço a Deus que me concedeu a oportuni-

dade de realizar este curso.

Sou grata a todas as minhas amigas que de alguma forma me

ajudaram durante o curso, em especial as meninas Andressa Mocellin,

Bruna Corso, Evelyn Freitas, Joyce Finamor e Karla Prudencio.

Agradeço a professora Viviane, pois sem ela este trabalho não

seria possível. E ao professor Marnei que aceitou gentilmente o desafio

de orientar este trabalho e por sempre acreditar em mim.

E finalmente, a minha família pelo apoio e amor que me deram.

Resumo

CAVALHEIRO, Jéssica Neckel. A Forma Canônica de Jor-

dan. 2015. 101p.. Trabalho de Conclusão de Curso (Graduaçãoem Licenciatura em Matemática) - Universidade do Estado deSanta Catarina, Joinville, 2015.

A Forma Canônica de Jordan é um conceito bastante importanteda Álgebra Linear, pois fornece a representação matricial maissimples possível para um operador linear não diagonalizável de-finido num espaço vetorial de dimensão finita. Para construir ateoria que permeia a construção da Forma de Jordan utilizam-se,neste trabalho, os conceitos, propriedades e resultados referentesa Somas Diretas, Subespaços Invariantes, Decomposição Primá-ria, Operadores Nilpotentes, Autovetores Generalizados, dentreoutros. Prova-se que a Forma Canônica de Jordan pode ser ob-tida quando o polinômio característico do operador consideradopuder ser decomposto em fatores lineares, o que sempre ocorreno corpo dos complexos. A existência da Forma de Jordan paraum operador qualquer será uma consequência da sua existênciapara operadores nilpotentes. Com o auxílio dos autovetores ge-neralizados será possível exibir uma base para o espaço vetorialem relação à qual a representação matricial do operador linearconsiderado estará na Forma de Jordan. Diversos exemplos sãoresolvidos detalhadamente, incluindo uma aplicação da Formade Jordan na resolução de Sistema de Equações Diferenciais Or-dinárias.

Palavras-chave: Álgebra Linear. A Forma Canônica de Jordan.Operadores Nilpotentes. Decomposição Primária.

Abstract

CAVALHEIRO, Jéssica Neckel. The Jordan Canonical Form.2015. 101p.. Work of Course Conclusion (Graduate Degree inMathematics) - Santa Catarina State University, Joinville, 2015.

The Jordan’s canonical form is a important concept in linearalgebra, because it provides the simplest possible matrix repre-sentation to the linear operator not diagonalizable in a vectorspace of finite dimension. To develop the theory construction ofthe Jordan’s canonical form, was used in this bachelor work, theconcepts, properties and results for the Direct Sums, InvariantSubspaces, Primary Decomposition, Nilpotent Operator, Gener-alized Eigenvectors, etc. Prove up that the Jordan’s canonicalform can be obtained when the characteristic polynomial of thisoperator can be decomposed into linear factors, and this alwayshappens when it is in the field of the complexes. The existence ofthe Jordan’s form for any operator will be a consequence of itsexistence for nilpotent operators. With the aid of the generalizedeigenvectors, it is possible to show a basis for vector space forwhich the matrix representation of linear operator is consideredin Jordan’s form. Several examples are solved in detail, includingan application of Jordan’s form to solve the system of ordinarydifferential equation.

Key-words: Linear Algebra. The Jordan Canonical Form. Nilpo-tent Operators. Primary Decomposition.

Lista de símbolos

R Conjunto dos números reais

K Corpo (real ou complexo)

Mn(K) Conjunto das matrizes quadradas de ordem n sobre

K

P (K) Conjunto dos polinômios sobre K

dim(V ) Dimensão do Espaço Vetorial V

Im(T ) Imagem do operador T

Nuc(T ) Núcleo do operador T

T |U Restrição do operador linear T : V −→ V a um

subespaço vetorial U ⊂ V[

T]

Representação matricial do operador T na base canô-

nica[

T]

γRepresentação matricial do operador T na base γ

detA Determinante da matriz A

mdc(p1, p2) Máximo divisor comum entre p1(x) e p2(x)[

v1, v2, · · · , vn

]

Subespaço vetorial gerado pelos vetores

v1, v2, · · · , vn

Sumário

INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1 CONCEITOS PRELIMINARES . . . . . . . . . . . . . . . . 19

1.1 SOMA DIRETA . . . . . . . . . . . . . . . . . . . . . . 19

1.2 SUBESPAÇOS INVARIANTES . . . . . . . . . . . . . . 24

1.3 POLINÔMIOS DE MATRIZES . . . . . . . . . . . . . . 29

1.4 AUTOVALOR E AUTOVETOR . . . . . . . . . . . . . 32

1.5 OPERADORES DIAGONALIZÁVEIS . . . . . . . . . . 43

2 FORMA CANÔNICA RACIONAL . . . . . . . . . . . . . . 47

2.1 DECOMPOSIÇÃO PRIMÁRIA . . . . . . . . . . . . . . 47

2.2 SUBESPAÇOS CÍCLICOS . . . . . . . . . . . . . . . . 53

2.3 FORMA CANÔNICA RACIONAL . . . . . . . . . . . . 59

3 A FORMA CANÔNICA DE JORDAN . . . . . . . . . . . . 63

3.1 OPERADORES NILPOTENTES . . . . . . . . . . . . . 63

3.2 AUTOVETORES GENERALIZADOS . . . . . . . . . . 75

3.3 A FORMA CANÔNICA DE JORDAN . . . . . . . . . . 78

CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Apêndices 97

APÊNDICE A PROPRIEDADES . . . . . . . . . . . . . . . . 99

17

INTRODUÇÃO

Durante o curso de graduação em Licenciatura em Matemática,

o estudo dos operadores lineares fica basicamente restrito aos diagona-

lizáveis, ou seja, àqueles cujos autovetores formam uma base para o

espaço vetorial e, portanto, podem ser representados através de uma

matriz diagonal, sendo esta a melhor representação para estes casos.

Porém, não é estudado, ao longo da graduação, se existe uma forma de

representar os operadores que não são diagonalizáveis de uma maneira

mais simples. Veremos que existem outras formas que possibilitam esta

representação, uma delas é através da Forma Canônica Racional, que

abordaremos de forma sucinta neste trabalho, visto que nosso maior

objetivo é estudar a Forma Canônica de Jordan.

Para realizar o estudo referente aos operadores não diagona-

lizáveis, aprofundaremos e ampliaremos muitos dos conhecimentos já

vistos na disciplina de Álgebra Linear. Portanto, ao longo deste traba-

lho, será realizada uma revisão teórica dos conceitos necessários para

que seja possível definir a Forma Canônica de Jordan de um operador

linear definido num espaço vetorial de dimensão finita.

Apesar de não ser possível encontrar uma base formada por

autovetores, no caso dos operadores não diagonalizáveis, veremos que

através da Forma Canônica de Jordan, existe uma base formada por

autovetores generalizados a qual fornece uma representação matricial

cuja diagonal é constituída por blocos de Jordan. Os blocos de Jordan

são matrizes tais que sua diagonal principal é formada pelos autovalores

do operador, logo abaixo desta diagonal os elementos são todos iguais

a 1 e os restantes são todos nulos.

Para construir a Forma Canônica de Jordan recorremos aos

operadores nilpotentes, operadores que se anulam quando elevados a

18 Introdução

uma determinada potência, pois a existência da Forma Canônica de

Jordan para estes operadores possibilita sua existência para qualquer

operador linear.

Este trabalho consiste em uma pesquisa bibliográfica, pau-

tada essencialmente em Coelho e Lourenço (2010), Lipschutz e Lipson

(2011), Lima (2009) e Hoffman e Kunze (1971). No Capítulo 1 será

feita uma revisão de alguns conceitos de Álgebra Linear. No Capítulo 2

será abordado a Forma Canônica Racional e o Decomposição Primária.

E finalmente, no Capítulo 3 será apresentada a construção da Forma

Canônica de Jordan, exibindo diversos exemplos.

19

1 CONCEITOS PRELIMINARES

Para compreendermos a Forma Canônica de Jordan será neces-

sário discorrer sobre alguns conceitos preliminares de Álgebra Linear

que serão necessários para a sua construção.

1.1 SOMA DIRETA

Indicaremos V como um espaço vetorial sobre o corpo K, real

ou complexo, e U , W como subespaços vetoriais de V . Em nosso es-

tudo será necessário escrever V como a soma de subespaços vetoriais,

isto nos auxiliará a demonstrar alguns resultados e, muitas vezes, será

conveniente que estes subespaços sejam ditos T-invariantes.

Quando V = U + W , isto significa que para qualquer v ∈ V

temos que v = u + w, onde u ∈ U e w ∈ W . Desta forma, podemos

definir a soma direta de subespaços vetoriais.

Definição 1.1. Dizemos que V é uma soma direta de U e W se para

todo elemento de v ∈ V , tem-se v = u + w, com u ∈ U e w ∈ W , de

maneira única.

Da mesma forma, se V = U + W e U ∩ W = {−→0 }, então

podemos afirmar que a soma entre U e W é direta. Assim, temos o

seguinte teorema.

Teorema 1.1. Seja V um espaço vetorial sobre o corpo K e sejam U

e W dois subespaços de V. Se V = U + W e U ∩W = {−→0 }, então a

soma é direta.

Demonstração: Seja v ∈ V tal que v = u + w, sendo u ∈ U

e w ∈ W . Para provar que a soma é direta precisamos mostrar que

20 Capítulo 1. CONCEITOS PRELIMINARES

v = u + w é escrito de forma única. Assim, sejam u′ ∈ U e w′ ∈ V tal

que v = u′ + w′. Desta forma

u + w = u′ + w′

e então,

u− u′ = w′ − w

com u− u′ ∈ U e w′ − w ∈ W . Como U ∩W = {−→0 }, temos

u− u′ = w′ − w = 0

Donde, u− u′ = 0 e w′ − w = 0, desta forma u = u′ e w = w′.

Logo, v = u + w é escrito de forma única.

Observação 1.1. Quando V é escrito numa soma direta de subespaços

U e W, denotamos

V = U ⊕W.

A seguir, veremos que se V = U + W podemos encontrar a

dimensão desta soma através da expressão

dim(U + W ) = dim(U) + dim(W )− dim(U ∩W ).

Porém, se a soma é direta fica evidente que dim(U + W ) =

dim(U) + dim(W ). Para demonstrar o Teorema referente à esta di-

mensão, utilizaremos o seguinte Lema, baseado em Lipschutz e Lipson

(2010).

Lema 1.1. Sejam V um espaço vetorial de dimensão finita e α =

{u1, u2, . . . , ur} um conjunto de vetores linearmente independente em

V. Então α pode ser estendido para uma base de V.

Teorema 1.2. Sejam U e W subespaços vetoriais de V com dimensão

finita. Então:

dim(U + W ) = dimU + dimW − dim(U ∩W ).

1.1. SOMA DIRETA 21

Demonstração:

Sejam dimU = m, dimW = n e dim(U ∩W ) = r. Suponhamos

que α = {v1, v2, . . . , vr} é uma base de U ∩W .

Pelo Lema 1.1, podemos estender α a uma base de U e a uma

base de W . Assim, obtemos β = {v1, . . . , vr, u1, u2, . . . , um−r} uma base

de U e γ = {v1, . . . , vr, w1, w2, . . . , wn−r} uma base de W e considere-

mos

δ = {v1, . . . , vr, u1, . . . , um−r, w1, . . . , wn−r}.

Observe que δ tem m + n − r elementos. Precisamos mostrar

que δ é uma base de U + W . Como β gera U e γ gera W , então a união

de β com γ, que denotamos por δ, gera U + W .

Agora basta provar que γ é linearmente independente. Supo-

nhamos que existem escalares ai, bj , ck, com 1 ≤ i ≤ r, 1 ≤ j ≤ m− r

e 1 ≤ k ≤ n− r, tais que:

a1v1 + . . .+arvr +b1u1 + . . .+bm−rum−r +c1w1 + . . .+cn−rwn−r =−→0 .

(1.1)

Seja,

v = a1v1 + . . . + arvr + b1u1 + . . . + bm−rum−r. (1.2)

Por 1.1, obtemos:

v = −c1w1 − . . .− cn−rwn−r. (1.3)

Como β é uma base de U , então v ∈ U . Por 1.3 concluímos que

v ∈ W . Desta forma, v ∈ U ∩W .

Como α é base de U ∩ W , então existem escalares d1, . . . , dr

tais que

v = d1v1 + . . . + drvr.

Por 1.3, temos

d1v1 + . . . + drvr = −c1w1 − . . .− cn−rwn−r


isto é,

d1v1 + . . . + drvr + c1w1 + . . . + cn−rwn−r =−→0 .

Como o conjunto γ é linearmente independente, temos que

c1 = · · · = cn−r = 0. Assim, a equação 1.1 resulta em

a1v1 + . . . + arvr + b1u1 + . . . + bm−rum−r =−→0 .

Como β é linearmente independente, temos que

a1 = · · · = ar = b1 = · · · = bm−r = 0.

Logo, de 1.1 concluímos que todos os coeficientes ai, bj , ck são

nulos, portanto δ é linearmente independente, finalizando a demonstra-

ção.

Depois de comprovado o Teorema 1.2, a demonstração do pró-

ximo Corolário é trivial.

Corolário 1.1. Se V é um espaço vetorial sobre K de dimensão finita

e V = U ⊕W , então

dim(V ) = dim(U) + dim(W ).

Demonstração: Como a soma de U e W é direta, temos que

U ∩W = {−→0 }. Assim, dim(U ∩W ) = 0. Portanto, pelo Teorema 1.2

concluímos que dim(V ) = dim(U) + dim(W ).

Se V = U ⊕W e são conhecidas às bases de U e W , é possível

encontrar uma base para o espaço vetorial V , basta apenas fazer a

união de uma das bases de U com uma base de W , conforme o próximo

Teorema.

Teorema 1.3. Suponha que V = U ⊕W e que B′ = {u1, . . . , um} e

B′′ = {w1, . . . , wn} sejam subconjuntos linearmente independentes de

U e W , respectivamente. Então, são válidas as seguintes afirmações:

1.1. SOMA DIRETA 23

(i) B = B′ ∪B′′ é linearmente independente;

(ii) Se B′ e B′′ forem bases de U e W , respectivamente, então B =

B′ ∪B′′ é uma base de V .

Demonstração: (i) Suponhamos que existam escalares ai, bj

pertencentes ao corpo K , 1 ≤ i ≤ m, 1 ≤ j ≤ n, tais que

a1u1 + · · ·+ amum + b1w1 + · · ·+ bnwn =−→0 .

Então,

(a1u1 + · · ·+ amum) + (b1w1 + · · ·+ bnwn) =−→0 +

−→0

onde a1u1+· · ·+amum ∈ U e b1w1+· · ·+bnwn ∈ W . Como V = U⊕W ,

então esta soma para−→0 é única, assim

a1u1 + · · ·+ amum =−→0 e b1w1 + · · ·+ bnwn =

−→0 .

Como B′ e B′′ são conjuntos linearmente independentes então, os es-

calares ai e bj são todos nulos. Portanto, B = B′ ∪ B′′ é linearmente

independente.

(ii) Pelo item anterior, B = B′∪B′′ é linearmente independente, assim

basta mostrar que B gera V . Seja v ∈ U + W , então v = u + w, com

u ∈ U e w ∈ W . Como B′ é base de U e B′′ base de W , temos

u = a1u1 + · · ·+ amum w = b1w1 + · · ·+ bnwn,

com ai, bj ∈ K. Então,

v = u + w = a1u1 + · · ·+ amum + b1w1 + · · ·+ bnwn.

Desta forma, B = B′ ∪ B′′ gera U + W , completando a de-

monstração.

Os resultados apresentados nesta seção usam o fato de V ser

decomposto em uma soma de dois subespaços. Porém, este resultados

permanecem válidos quando a soma se referir a qualquer quantidade

finita de subespaços vetoriais.


1.2 SUBESPAÇOS INVARIANTES

Os subespaços invariantes são fundamentais para o nosso es-

tudo e os usaremos nos próximos capítulos. Lima (2009) define estes

subespaços da seguinte forma:

Definição 1.2. Um subespaço vetorial W ⊂ V é dito invariante pelo

operador T : V −→ V quando, para qualquer v ∈ W , T (v) ∈ W ,

ou ainda, T (W ) ⊂ W . Podemos também chamar este subespaço de

T-invariante.

Exemplo 1.1. Considere o subespaço W = {(x, y, z) ∈ R3/y = 2x}.

Para o operador T (x, y, z) =(

x2 , y

2 , 10z)

, o subespaço W é T -invariante,

pois

T (x, 2x, z) =

(

x

2,

2x

2, 10z

)

=(x

2, x, 10z

)

∈ W.

Ao longo do trabalho denotaremos o núcleo e a imagem do ope-

rador linear T por Nuc(T ) e Im(T ), respectivamente. Estes subespaços

são T-invariantes, conforme mostraremos na seguinte proposição:

Proposição 1.1. Seja V um espaço vetorial de dimensão finita sobre

o corpo K e considere o operador linear T : V → V . Então

(i) os subespaços Nuc(T) e Im(T) são T-invariantes;

(ii) dado W ⊂ V subespaço vetorial e λ ∈ K, W é (λI − T )-invariante

se, e somente se, W for T − invariante.

Demonstração: (i) Sabemos que para qualquer v ∈ Nuc(T )

temos T (v) =−→0 , como

−→0 ∈ Nuc(T ), então T (v) ∈ Nuc(T ). Por-

tanto, Nuc(T ) é um subespaço T-invariante. Ainda, para qualquer

u ∈ V , T (u) ∈ Im(T ), então é evidente que Im(T ) é um subespaço

T-invariante.

(ii) Seja W um subespaço (λI − T )-invariante. Dado w ∈ W temos

que

(λI − T )w ∈ W.

1.2. SUBESPAÇOS INVARIANTES 25

Seja w′ ∈ W tal que

(λI − T )(w) = w′

ou seja,

λw − T (w) = w′.

Isto é,

T (w) = λw − w′ ∈ W.

Logo, W é T -invariante.

Suponhamos agora que W é T -invariante assim, T (w) = w′′ ∈

W , para todo w ∈ W . Desta forma, para todo w ∈ W temos

λw − T (w) = λw − w′′ ∈ W.

Assim,

(λI − T )(w) ∈ W.

Portanto, W é (λI − T )-invariante.

Ao estudarmos o operador linear T estaremos muito interes-

sados em decomposições em somas diretas V = W1 ⊕ · · · ⊕Wn, onde

cada um dos subespaços Wi seja T-invariante. Com isso, será conveni-

ente olharmos para as restrições do operador linear nos subespaços Wi

que nos permitirá obter algumas informações sobre T . Com base nesta

decomposição, o Teorema 1.4 nos possibilitará representar a matriz do

operador T em um "formato" de matriz diagonal.

Teorema 1.4. Seja T : V −→ V um operador linear e V = W1 ⊕W2,

onde W1, W2 são subespaços T-invariantes. Sejam T1 = T |W1e T2 =

T |W2restrições do operador T nos subespaços W1 e W2, respectiva-

mente, então:

[T ] =

(

[T1] 0

0 [T2]

)

.


Demonstração: Sejam α = {v1, . . . , vn} uma base de W1 e

β = {u1, . . . , um} uma base de W2. Como W1 e W2 são T-invariantes,

temos que

T (vi) ∈ W1, 1 ≤ i ≤ n

e

T (uj) ∈ W2, 1 ≤ j ≤ m.

Como V = W1 ⊕W2, pelo Teorema 1.3, temos que

γ = {v1, . . . , vn, u1, . . . , um}

é uma base para V. Assim, obteremos a representação matricial de T

na base γ da seguinte forma:

T (v1) = a11v1 + · · ·+ an1vn + 0 · u1 + · · ·+ 0 · um

T (v2) = a12v1 + · · ·+ an2vn + 0 · u1 + · · ·+ 0 · um

...

T (vn) = a1nv1 + · · ·+ annvn + 0 · u1 + · · ·+ 0 · um.

E ainda,

T (u1) = 0 · v1 + · · ·+ 0 · vn + b11u1 + · · ·+ bm1um

T (u2) = 0 · v1 + · · ·+ 0 · vn + b12u1 + · · ·+ bm2um

...

T (um) = 0 · v1 + · · ·+ 0 · vn + b1mu1 + · · ·+ bmmum.

Portanto,

[T ]γ =

a11 a12 a1n · · · 0 0 · · · 0...

...... · · ·

...... · · ·

...

an1 an2 ann · · · 0 0 · · · 0

0 0 0 · · · b11 b12 · · · b1m

......

... · · ·...

... · · ·...

0 0 0 · · · bm1 bm2 · · · bmm

.

1.2. SUBESPAÇOS INVARIANTES 27

Denotando as matrizes de T1 = T |W1e T2 = T |W2

respectiva-

mente por [T1]α = [aii] e [T2]β = [bjj ], obtemos, facilmente, que

[T ]γ =

(

[T1]α 0

0 [T2]β

)

.

Suponhamos que V = W1⊕W2⊕· · ·⊕Wn, sendo Wi subespaço

T-invariante. Seja αi uma base de Wi, com 1 ≤ i ≤ n. Conforme o

Teorema 1.3, podemos escrever a base α de V como α = α1 ∪ · · · ∪ αn.

Generalizando o Teorema 1.4, representamos a matriz de T : V −→ V

da seguinte forma:

[T ]α =

[T1]α10 · · · 0

0 [T2]α2· · · 0

......

. . ....

0 0 · · · [Tn]αn

.

Um resultado interessante referente aos subespaços Im(T ) e

Nuc(T ) T-invariantes é que, dado uma transformação T : V −→ W ,

sendo V e W espaços vetoriais de dimensão finita, temos que

dim(V ) = dim(Nuc(T )) + dim(Im(T )).

Este resultado, intitulado de Teorema do Núcleo e da Imagem,

utiliza o fato de que se α = {T (u1), . . . , T (up)} e β = {v1, . . . , vq} são

bases de Im(T ) e Nuc(T ), respectivamente, então existe uma base para

V da forma:

γ = {u1, . . . , up, v1, . . . , vq}.

Elon (2009) enuncia o Teorema do Núcleo e da Imagem da seguinte

forma:

Teorema 1.5 (Teorema do Núcleo e da Imagem). Sejam V, W espaços

vetoriais de dimensão finita. Se T : V → W é uma transformação linear


qualquer, então

dim(V ) = dim(Nuc(T )) + dim(Im(T )).

Demonstração: Sejam α e β bases de Im(T ) e Nuc(T ),

respectivamente, dadas por

α = {T (u1), . . . , T (up)} e β = {v1, . . . , vq}.

Se tivermos

a1u1 + · · ·+ apup + b1v1 + · · ·+ bqvq =−→0 (1.4)

então, aplicando a transformação T em ambos os lados da igualdade,

obtemos

a1T (u1) + · · ·+ apT (up) + b1T (v1) + · · ·+ bqT (vq) =−→0 .

Como os vetores v1, . . . , vq fazem parte do Núcleo de T , então

a1T (u1) + · · ·+ apT (up) =−→0 .

Como os vetores T (u1), . . . , T (up) são linearmente independentes, segue

que a1 = · · · = ap = 0. Da igualdade 1.4, obtemos

b1v1 + · · ·+ bqvq =−→0 .

Assim, temos que b1 = · · · = bq = 0, pois os vetores v1, . . . , vp

são linearmente independentes. Desta forma, sabemos que os vetores

u1, . . . , up, v1, . . . , vq são linearmente independentes. Neste momento,

precisamos mostrar que para qualquer w ∈ V tem-se

w = a1u1 + · · ·+ apup + b1v1 + · · ·+ bqvq.

Se w ∈ V então, T (w) ∈ Im(T ). Desta forma podemos escrever T (w)

como uma combinação linear da base α. Assim,

T (w) = a1T (u1) + · · ·+ apT (up). (1.5)

1.3. POLINÔMIOS DE MATRIZES 29

Reescrevendo a igualdade 1.5, temos

T (w)− a1T (u1)− · · · − apT (up) =−→0 ,

isto é,

T (w − (a1u1 + · · ·+ apup)) =−→0 .

Então, o vetor w − (a1u1 + · · · + apup) pertence ao Nuc(T ) e

assim podemos escrevê-lo como uma combinação linear dos vetores da

base β. Portanto,

w − (a1u1 + · · ·+ apup) = b1v1 + · · ·+ bqvq,

isto é,

w = a1u1 + · · ·+ apup + b1v1 + · · ·+ bqvq.

Logo, o conjunto {u1, . . . , up, v1, . . . , vq} gera o espaço vetorial V e por-

tanto forma uma base de V . Desta forma,

dim(V ) = p + q = dim(Nuc(T )) + dim(Im(T )).

1.3 POLINÔMIOS DE MATRIZES

O objetivo desta seção é estabelecer algumas das propriedades

básicas referentes a polinômios de matrizes, as quais enunciaremos no

Teorema 1.6. Estas propriedades serão úteis na demonstração de alguns

resultados posteriores.

Seja p(x) um polinômio de grau n, definido da seguinte forma:

p(x) = anxn + · · ·+ a1x + a0.

Se A é uma matriz quadrada, definimos o polinômio da matriz A, atra-

vés de

p(A) = anAn + · · ·+ a1A + a0I.

Dizemos que A é raiz do polinômio p(x) quando p(A) é a matriz nula.


Teorema 1.6. Sejam p(x) e q(x) polinômios representados por

p(x) = anxn + · · ·+ a1x + a0 e q(x) = bmxm + · · ·+ b1x + b0,

onde x ∈ K. Dados qualquer matriz quadrada A e qualquer escalar k,

valem as seguintes propriedades:

(i) (kp + q)(A) = kp(A) + q(A).

(ii) (pq)(A) = p(A)q(A).

(iii) p(A)q(A) = q(A)p(A).

Demonstração: (i) Seja kp(x) = kanxn + · · ·+ ka1x + ka0.

Suponhamos que m ≤ n e assim definiremos

(kp + q)(x) = (kan + bn)xn + · · ·+ (ka1 + b1)x + (ka0 + b0),

com bi = 0 quando i > m. Assim,

(kp + q)(A) = (kan + bn)An + · · ·+ (ka1 + b1)A + (ka0 + b0)I

= kanAn + bnAn + · · ·+ ka1A + b1A + ka0I + b0I

= (kanAn + · · ·+ ka1A + ka0I) + (bnAn + · · ·+ b1A + b0I)

= k(anAn + · · ·+ a1A + a0I) + (bnAn + · · ·+ b1A + b0I)

= kp(A) + q(A).

Logo,

(kp + q)(A) = kp(A) + q(A).

(ii) Lipschutz e Lipson (2011) definem o polinômio (pq)(x) da seguinte

forma:

(pq)(x) = cn+mxn+m + · · ·+ c1x + c0

=n+m∑

r=0

crxr,

sendo cr = a0br + a1br−1 + · · ·+ arb0 =r∑

i=0

aibr−1. Assim, segue que

(pq)(A) =

n+m∑

r=0

crAr.

1.3. POLINÔMIOS DE MATRIZES 31

E, portanto

p(A)q(A) =

(

n∑

i=0

aiAi

)

m∑

j=0

bjAj

=n

∑

i=0

m∑

j=0

aibjAi+j

=

n+m∑

r=0

crAr

= (pq)(A).

Logo,

p(A)q(A) = (pq)(A).

(iii) Como a igualdade p(x)q(x) = q(x)p(x) é verdadeira, para qualquer

x ∈ K, pelo item (ii) temos

p(A)q(A) = (pq)(A) = (qp)(A) = q(A)p(A).

Exemplo 1.2. Sejam p1(x) = x2−3x + 7 e p2(x) = x2−6x + 13, para

A =

(

1 −2

4 5

)

, temos que

p1(A) = A2 − 3A + 7I

=

(

1 −2

4 5

)(

1 −2

4 5

)

− 3

(

1 −2

4 5

)

+ 7

(

1 0

0 1

)

=

(

−7 −12

24 17

)

+

(

−3 6

−12 −15

)

+

(

7 0

0 7

)

=

(

−3 −6

12 9

)

.


E,

p2(A) = A2 − 6A + 13I

=

(

1 −2

4 5

)(

1 −2

4 5

)

− 6

(

1 −2

4 5

)

+ 13

(

1 0

0 1

)

=

(

−7 −12

24 17

)

+

(

−6 12

−24 −30

)

+

(

13 0

0 13

)

=

(

0 0

0 0

)

.

Note que p2(A) resulta na matriz nula, assim A é raiz do polinômio p2.

Sejam T : V −→ V um operador linear sobre um espaço veto-

rial sobre K e p(x) = anxn+· · ·+a1x+a0. Identificando a representação

matricial de T por A, podemos definir p(T ) da mesma forma como foi

feito para p(A), isto é,

p(T ) = anT n + · · ·+ a1T + a0I.

Com isso, as relações estabelecidas no Teorema 1.6 permanecem válidas

para operadores lineares.

1.4 AUTOVALOR E AUTOVETOR

Ao longo desta seção discutiremos sobre os polinômios caracte-

rístico e minimal de um operador linear e suas relações. Nosso objetivo

principal será mostrar o Teorema de Cayley-Hamilton que afirma que

um operador sempre anula o seu polinômio característico.

Primeiramente, definiremos autovalor e autovetor, conceitos

que estão relacionados com estes dois polinômios.

Definição 1.3. Seja T : V −→ V um operador linear. Um autovalor

de T é um escalar λ em K tal que exista v 6=−→0 em V com T (v) = λv.

Assim, o vetor v ∈ V , v 6=−→0 , tal que T (v) = λv é chamado autovetor

de T associado ao autovalor λ.

1.4. AUTOVALOR E AUTOVETOR 33

Teorema 1.7. Seja T : V −→ V um operador linear. As seguintes

afirmações são equivalentes:

(i) λ é autovalor de T ;

(ii) O operador (λI − T ) é singular;

(iii) det(λI − [T ]) = 0.

Demonstração: Se λ é autovalor de T então existe um vetor

não nulo v ∈ V tal que T (v) = λv. Desta forma, (λI − [T ])v =−→0 . A

partir disso é fácil perceber que as afirmações são equivalentes.

Considere o polinômio p(x) = det(xI − T ) de grau n e cujo

termo líder é xn. Este polinômio é chamado de polinômio característico

de T e suas raízes, de acordo com o Teorema 1.7, são os autovalores de

T.

Lema 1.2. Matrizes semelhantes têm o mesmo polinômio caracterís-

tico.

Demonstração: Sejam A e B duas matrizes semelhantes.

Logo existe P inversível tal que

A = PBP−1.

Assim,

det(xI −A) = det(xI − PBP−1)

= det(xPIP−1 − PBP−1)

= det(P (xI −B)P−1)

= detP · det(xI −B) · detP−1

= detP · det(xI −B)1

detP= det(xI −B).

Logo, as matrizes A e B possuem o mesmo polinômio característico.


Como podemos representar um operador linear matricialmente,

então o Lema acima aplica-se também aos operadores.

Se T : V −→ V é um operador linear e V = W1 ⊕ W2,

então é possível escrever o polinômio característico de T em função

dos polinômios característicos das restrições de T a W1 e W2. Este

resultado nos auxiliará na demonstração do Teorema que constrói a

forma de Jordan de um operador linear.

Proposição 1.2. Seja V = W1 ⊕W2, onde W1 e W2 são subespaços

T -invariantes. Considere o operador linear T : V −→ V e sejam T1 =

T |W1e T2 = T |W2

, então

p(x) = p1(x) · p2(x)

onde p(x), p1(x) e p2(x) são os polinômios característicos de T, T1 e T2,

respectivamente.

Demonstração: Segundo o Teorema 1.4, podemos represen-

tar o operador linear T da seguinte maneira:

[T ] =

(

[T1] 0

0 [T2]

)

.

Desta forma, obtemos facilmente o polinômio p(x). Assim,

p(x) = det(xI − [T ])

= det

(

xI − [T1] 0

0 xI − [T2]

)

= det((xI − [T1]) · (xI − [T2]))

= det(xI − [T1]) · det(xI − [T2])

= p1(x) · p2(x).

Antes de demonstrarmos o Teorema de Cayley-Hamilton va-

mos definir, baseado em Coelho e Lourenço (2010) e Lipchutz e Lipson


(2011), o conceito de uma Matriz Adjunta, pois o usaremos em nossa

demonstração.

Definição 1.4. Seja Mn(K) o conjunto das matrizes quadradas de

ordem n sobre K. Dado A ∈ Mn(K), a matriz adjunta de A será a

transposta da matriz B = [bij ] tal que bij = (−1)i+jdet(Aij) onde Aij

é a matriz em Mn−1(K) formada a partir de A retirando-se sua i-

ésima linha e sua j-ésima coluna. Dizemos que os elementos bij são os

cofatores de A.

Exemplo 1.3. Seja A =

2 3 −4

0 −4 2

1 −1 5

, encontraremos a matriz

adjunta B.

Cada elemento da matriz B é escrito da seguinte forma:

b11 = (−1)1+1 · det

(

−4 2

−1 5

)

= −20 + 2 = −18

b12 = (−1)1+2 · det

(

0 2

1 5

)

= 2

b13 = (−1)1+3 · det

(

0 −4

1 −1

)

= 4

b21 = (−1)2+1 · det

(

3 −4

−1 5

)

= −(15− 4) = −11

b22 = (−1)2+2 · det

(

2 −4

1 5

)

= 10 + 4 = 14

b23 = (−1)2+3 · det

(

2 3

1 −1

)

= −(−2− 3) = 5

b31 = (−1)3+1 · det

(

3 −4

−4 2

)

= 6− 16 = −10


b32 = (−1)3+2 · det

(

2 −4

0 2

)

= −4

b33 = (−1)3+3 · det

(

2 3

0 −4

)

= −8

Logo, a adjunta de A é a matriz

B =

−18 −11 −10

2 14 −4

4 5 −8

.

Note que detA = −46 e que

AB =

−46 0 0

0 −46 0

0 0 −46

= BA

Esta é uma propriedade geral satisfeita por uma matriz e sua adjunta.

Lema 1.3. Para qualquer matriz quadrada A, sendo B sua adjunta, é

válido que

A ·B = B ·A = detA · I

Utilizando este Lema, cuja demonstração pode ser obtida em

Lipschutz e Lipson (2011), conseguiremos provar o Teorema a seguir.

Teorema 1.8 (Cayley-Hamilton). Se T é um operador linear sobre V

e se p(x) é o polinômio característico de T , então p([T ]) = 0.

Demonstração: Sejam A = [T ] e p(x) o polinômio caracte-

rístico de A, dado por:

p(x) = det(xI −A) = xn + an−1xn−1 + · · ·+ a1x + a0.

Denotemos por B(x) a matriz adjunta de (xI − A), onde os

elementos de B(x) são cofatores da matriz (xI − A). Observe que po-

demos escrever cada elemento de B(x) como um polinômio de grau no


máximo igual a n − 1. Assim, vamos decompor a matriz adjunta da

seguinte forma:

B(x) = Bn−1xn−1 + · · ·+ B1x + B0.

Usando o Lema 1.3, temos que

p(x) · I = det(xI −A) · I

= (xI −A) ·B(x)

= (xI −A) · (Bn−1xn−1 + · · ·+ B1x + B0)

= Bn−1xn + · · ·+ B1x2 + B0x−ABn−1 − · · · −AB1x−AB0.

(1.6)

Por outro lado,

p(x) · I = (xn + an−1xn−1 + · · ·+ a1x + a0) · I

= xnI + an−1xn−1I + · · ·+ a1xI + a0I. (1.7)

Igualando as equações 1.6 e 1.7 e comparando os coeficientes das po-

tências correspondentes de x, obtemos

Bn−1 = I

Bn−2 −ABn−1 = an−1I

Bn−3 −ABn−2 = an−2I...

......

B1 −AB2 = a2I

B0 −AB1 = a1I

−AB0 = a0I

.

Multiplicando essas equações respectivamente por An, An−1, . . . , A, I,

obtemos


AnBn−1 = An

An−1Bn−2 −AnBn−1 = an−1An−1

An−2Bn−3 −An−1Bn−2 = an−2An−2

......

...

A2B1 −A3B2 = a2A

AB0 −A2B1 = a1A

−AB0 = a0I

.

Somando estas equações, obtemos

0 = An + an−1An−1 + · · ·+ a1A + a0I.

Portanto,

p(A) = p([T ]) = 0.

O Teorema de Cayley-Hamilton afirma que a matriz de um

operador linear sempre é um zero do seu polinômio característico.

Exemplo 1.4. Seja T : R2 → R2 um operador linear dado por

T (x, y, z) = (x + 2y, 4y).

Denotaremos A = [T ]. Representando o operador matricialmente, te-

mos

A =

(

1 2

0 4

)

.

Para obter o polinômio característico de T , basta calcular o det(xI−A),

assim

p(x) = det(xI −A) = det

(

x− 1 −2

0 x− 4

)

= (x− 1)(x− 4)

= x2 − 5x + 4.


Portanto, o polinômio característico de T é dado por p(x) = x2−5x+4.

Calculando p(A), temos

p(A) = A2 − 5A + 4I.

Assim,

p(A) =

(

1 2

0 4

)(

1 2

0 4

)

− 5

(

1 2

0 4

)

+ 4

(

1 0

0 1

)

=

(

1 10

0 16

)

−

(

5 10

0 20

)

+

(

4 0

0 4

)

=

(

4 0

0 4

)

−

(

4 0

0 4

)

=

(

0 0

0 0

)

.

Logo, p([T ]) = 0.

Um polinômio m(x) é chamado T-anulador se m(T )(v) =−→0 ,

para qualquer v ∈ V , com base nisso definiremos o polinômio minimal

de acordo com Coelho e Lourenço (2010).

Definição 1.5. O polinômio minimal de um operador T é o polinômio

mônico m(x) de menor grau tal que m(T )(v) =−→0 , para qualquer v ∈

V .

Conforme o Teorema de Cayley-Hamilton, o polinômio carac-

terístico é um polinômio T-anulador, porém não necessariamente será

o minimal.

Estas informações nos ajudam a perceber que o polinômio mi-

nimal do operador T divide qualquer polinômio T-anulador.

Algumas conclusões podem ser obtidas a respeito do polinô-

mio característico p(x) e o polinômio minimal m(x). Estes polinômios

possuem as mesmas raízes (a menos de multiplicidade) e o minimal é

divisor do característico.


Conforme Coelho e Lourenço (2010) e Lipschutz e Lipson (2011)

enunciaremos o próximo Teorema que estabelece essas relações.

Teorema 1.9. Seja T : V −→ V operador linear sobre um espaço V

em um corpo K. São válidas as seguintes afirmações:

(i) m(x) divide p(x);

(ii) m(x) possui as mesmas raízes de p(x), a menos de multiplicidade.

Demonstração: Seja P (K) o conjunto de polinômios sobre

o corpo K. Pelo algoritmo de divisão de Euclides, existem polinômios

q, r ∈ P (K) tais que

p(x) = m(x)q(x) + r(x), ∀x ∈ K (1.8)

onde r(x) = 0 ou grau(r(x)) < grau(m(x)).

Aplicando a equação 1.8 em T (v), obtemos

p(T )(v) = m(T )(v)q(T )(v) + r(T )(v).

Por definição m(T )(v) =−→0 e pelo Teorema 1.8 temos p(T )(v) =

−→0 , assim r(T )(v) =

−→0 , para qualquer v ∈ V .

Se r(x) 6= 0, então r(x) é um polinômio que tem grau menor do

que m(x). Porém, r(x) possui T como raiz, o que contradiz a definição

de polinômio minimal. Portanto, r(x) = 0 e assim

p(x) = m(x)q(x), ∀x ∈ K

isto é, m(x) divide p(x).

(ii) Precisamos provar que se λ for raiz de p(x), então também será

raiz de m(x). Analogamente, se λ for raiz de m(x), terá que ser raiz de

p(x).

Se p(λ) = 0, então λ é autovalor de T. Assim, existe v ∈ V tal

que T (v) = λv, com v 6=−→0 . Observe que, para cada i ≥ 1, temos

T i(v) = λiv.


Escrevendo m(x) = xm + am−1xm−1 + · · ·+ a1x + a0, obtemos−→0 = m(T )(v)

= T m(v) + am−1T m−1(v) + · · ·+ a1T (v) + a0(v)

= λm(v) + am−1λm−1(v) + · · ·+ a1λ(v) + a0(v)

= (λm +m−1∑

i=0

aiλi)(v).

Como v 6=−→0 , então

λm +m−1∑

i=0

aiλi = 0.

Ou seja, m(λ) = 0. Portanto, λ é raiz de m(x).

Suponhamos agora que m(λ) = 0, então podemos escrever

m(x) da seguinte forma

m(x) = (x− λ)q(x).

Pela minimalidade de m(x), podemos afirmar que q(T ) 6= 0, então

existe u ∈ V tal que q(T )(u) 6=−→0 . Seja v = q(T )(u), assim

−→0 = m(T )(u)

= (T − λI)q(T )(u)

= (T − λI)(v).

Desta forma, T (v) = λv, logo λ é autovalor de T, ou seja, p(λ) = 0.

Exemplo 1.5. Seja T : R4 → R4 operador linear dado por

T (x, y, z, t) = (2x− y + t, 3y − z, y + z,−y + 3t).

O operador T possui representação matricial na base canônica

da forma

[T ] =

2 −1 0 1

0 3 −1 0

0 1 1 0

0 −1 0 3

.


Observe que o polinômio p(x) = det(xI − T ) = (x − 2)3(x − 3) é

o polinômio característico de T . O polinômio minimal de T deve ser

mônico e possuir as mesmas raízes que o polinômio característico, então

os polinômios (x − 2)(x − 3), (x − 2)2(x − 3) e (x − 2)3(x − 3) são

possíveis minimais. Como o polinômio minimal deve ser o de menor

grau tal que m([T ]) = 0, então denotando m1(x) = (x − 2)(x − 3),

m2(x) = (x− 2)2(x− 3) e m3(x) = (x− 2)3(x− 3), temos

m1([T ]) = (T − 2)(T − 3)

=

0 −1 0 1

0 1 −1 0

0 1 −1 0

0 −1 0 1

−1 −1 0 1

0 0 −1 0

0 1 −2 0

0 −1 0 0

=

0 −1 1 0

0 −1 1 0

0 −1 1 0

0 −1 1 0

.

m2([T ]) = (T − 2)2(T − 3)

=

0 −2 1 1

0 0 0 0

0 0 0 0

0 −2 1 1

−1 −1 0 1

0 0 −1 0

0 1 −2 0

0 −1 0 0

=

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

.

Logo, o polinômio m2(x) = (x−2)2(x−3) é o polinômio de menor grau

tal que anula o operador, portanto m2(x) é o minimal.

1.5. OPERADORES DIAGONALIZÁVEIS 43

1.5 OPERADORES DIAGONALIZÁVEIS

Considere uma matriz quadrada A de ordem n. Dizemos que

A é semelhante a uma matriz diagonal se existir uma matriz inversível

P tal que

A = PDP−1,

sendo D uma matriz diagonal.

Através dos autovetores de A é possível verificar se ela é di-

agonalizável, basta constatar se A possui n autovetores linearmente

independentes, conforme enunciado no Teorema 1.10.

Teorema 1.10. Uma matriz A de ordem n é diagonalizável se, e so-

mente se, possui n autovetores linearmente independentes.

Demonstração: (⇒) Se A é uma matriz diagonalizável, então

existe uma matriz inversível P tal que

A = PDP−1

isto é,

AP = PD (1.9)

sendo

D =

λ1 0 · · · 0 0

0 λ2 · · · 0 0

0 0 · · · 0 0...

.... . .

......

0 0 · · · 0 λn

.

Seja P uma matriz cujas colunas são constituídas pelos vetores

v1, v2, . . . , vn, denotada por

P = [v1 v2 . . . vn].

Temos que

AP = [Av1 Av2 . . . Avn]


e

PD = [λ1v1 λ2v2 . . . λnvn]

assim, por 1.9:

[Av1 Av2 . . . Avn] = [λ1v1 λ2v2 . . . λnvn].

Logo, Avi = λivi e consequentemente, vi é um autovetor de A associado

ao autovalor λi, para 1 ≤ i ≤ n. Como a matriz P é inversível, segue

que suas colunas são linearmente independentes. Portanto, A possui n

vetores linearmente independentes.

(⇐) Seja P = [v1 v2 . . . vn] a matriz formada pelos autovetores de

A em suas colunas. Assim

AP = [Av1 Av2 . . . Avn]. (1.10)

Como v1, v2, . . . , vn são autovetores linearmente independentes de A, a

igualdade 1.10 resulta em

AP = [λ1v1 λ2v2 . . . λnvn].

isto é,

AP = [v1 v2 . . . vn] · diag(λ1, λ2, . . . , λn).

Portanto, AP = PD. Como as colunas de P são linearmente indepen-

dentes, então existe P−1 tal que

A = PDP−1.

Logo, a matriz A é diagonalizável.

O Teorema 1.10 é válido da mesma forma para operadores,

basta tomar A como a representação matricial de um operador linear

qualquer. Com base nestas informações, definiremos um operador dia-

gonalizável. Hoffman e Kunze (1971) o definem da seguinte forma:

Definição 1.6. O operador T : V −→ V , onde V é um espaço vetorial

de dimensão finita, é diagonalizável se existe uma base de V formada

por autovetores de T.

1.5. OPERADORES DIAGONALIZÁVEIS 45

Observe que se α é uma base de autovetores e λi são autovalores

do operador T, então a matriz de T em relação à base ordenada α é

diagonal, ou seja,

[T ]α =

λ1 0 0 . . . 0

0 λ2 0 . . . 0

0 0 λ3 . . . 0...

......

. . ....

0 0 0 . . . λn

.

Necessitamos entender o conceito de Operadores Diagonalizá-

veis para que futuramente obtermos a Forma Canônica de Jordan dos

operadores que não são diagonalizáveis, ou seja, no caso em que a repre-

sentação de T não poderá ser uma matriz diagonal, porém será obtido

uma matriz “quase” diagonal.

47

2 FORMA CANÔNICA RACIONAL

O foco deste trabalho não está na construção da Forma Canô-

nica Racional, porém durante nossos estudos descobrimos que esta

forma pode ser utilizada mesmo quando os polinômios característico

e minimal não podem ser fatorados em polinômios lineares, o que não

ocorre com a Forma Canônica de Jordan. Então, achamos importante

para o conhecimento o estudo sucinto da Forma Canônica Racional,

onde a matriz de um operador é formada por blocos de "Matrizes Com-

panheiras".

2.1 DECOMPOSIÇÃO PRIMÁRIA

A Decomposição Primária nos auxilia na obtenção de uma

forma canônica para o operador linear T . Esta decomposição mostra

que qualquer operador linear T : V −→ V pode ser decomposto em

operadores cujos polinômios minimais são potências de polinômios ir-

redutíveis.

A proposição seguinte descreve, conforme Lang e Jutuca (2003),

uma decomposição para V numa soma direta de subespaços invarian-

tes, obtida a partir de um polinômio que é escrito como um produto

de dois polinômios cujo máximo divisor comum é 1. Iremos demons-

trar apenas um caso particular, porém este resultado também é válido

quando este polinômio é expresso como o produto de uma quantidade

finita de fatores.

Proposição 2.1. Seja P (K) o conjunto de polinômios sobre o corpo

K. Dado m(x) ∈ P (K) um polinômio com

m(x) = p1(x)p2(x)

48 Capítulo 2. FORMA CANÔNICA RACIONAL

sendo p1 e p2 polinômios de grau maior ou igual a 1 tais que

mdc(p1(x), p2(x)) = 1.

Se T : V −→ V é um operador linear tal que m(T )(v) =−→0 , para

qualquer v ∈ V , então

V = Nuc(p1(T ))⊕Nuc(p2(T )).

Demonstração: Vamos denotar os núcleos de p1(T ) e p2(T ),

respectivamente, como W1 e W2. Como mdc(p1(x), p2(x)) = 1, então

existem polinômios q1(x) e q2(x) tais que,

p1(x)q1(x) + p2(x)q2(x) = 1,∀x ∈ K.

Portanto,

p1(T )q1(T ) + p2(T )q2(T ) = I (2.1)

onde I é o operador identidade. Tomando v ∈ V , temos

p1(T )q1(T )(v) + p2(T )q2(T )(v) = v.

Podemos observar que p1(T )q1(T )v ∈ W2, pois

p2(T )(p1(T )q1(T )(v)) = p2(T )p1(T )q1(T )(v)

= p1(T )p2(T )(v) · q1(T )(v)

= m(T )(v) · q1(T )(v)

= 0 · q1(T )(v)

=−→0 .

Da mesma forma p2(T )q2(T )v ∈ W1, pois

p1(T )(p2(T )q2(T )(v)) = p1(T )p2(T )q2(T )(v)

= p1(T )p2(T )(v) · q2(T )(v)

= m(T )(v) · q2(T )(v)

= 0 · q2(T )(v)

=−→0 .

2.1. DECOMPOSIÇÃO PRIMÁRIA 49

Logo, v ∈ V pode ser escrito como a soma de um vetor de W1 com um

vetor de W2, isto é, V = W1 + W2.

Para mostrar que esta soma é direta, é necessário provar que a

igualdade

v = w1 + w2 (2.2)

está determinada de modo único, onde w1 ∈ W1 e w2 ∈ W2. De fato,

aplicando p1q1(T ) a 2.2, obtemos

p1q1(T )(v) = p1q1(T )(w1) + p1q1(T )(w2)

= p1(T )(w1) · q1(T )(w1) + p1(T )(w2) · q1(T )(w2).

Como w1 ∈ W1 = Nuc(p1(T )) então p1(T )(w1) =−→0 . Desta forma,

p1q1(T )(v) =−→0 · q1(T )(w1) + p1(T )(w2) · q1(T )(w2)

= p1(T )q1(T )(w2)

= p1q1(T )(w2). (2.3)

Aplicando 2.1 em w2, temos

p1(T )q1(T )(w2) + p2(T )q2(T )(w2) = w2.

Como w2 ∈ W2 = Nuc(p2(T )), então p2(T )(w2) =−→0 , desta forma

p1(T )q1(T )(w2) + 0 · q2(T )(w2) = w2. (2.4)

De 2.3 e 2.4, obtemos

w2 = p1(T )q1(T )(v)

e portanto w2 está determinado de maneira única. Da mesma forma,

encontramos w1 = p2(T )q2(T )v de maneira única.

Portanto, pelo Teorema 1.1, V = W1 ⊕W2.

Proposição 2.2. Sob as mesmas hipóteses da Proposição 2.1, se m(x)

o polinômio minimal de T e p1(x), p2(x) mônicos, então p1(x) e p2(x)

são os polinômios minimais das restrições de T a W1 e W2, respectiva-

mente.


Demonstração: Sejam T1 = T |W1e T2 = T |W2

sendo m1(x)

e m2(x) seus polinômios minimais, respectivamente.

Como W1 = Nuc(p1(T )) e W2 = Nuc(p2(T )), temos que

p1(T1)(v) =−→0 e p2(T2)(v) =

−→0 , para qualquer v ∈ V . De modo

similiar ao que foi mostrado no Teorema 1.9 segue que m1(x) divide

p1(x) e m2(x) divide p2(x). Assim, existem polinômios q1(x), q2(x) tais

que

p1(x) = m1(x)q1(x) (2.5)

e

p2(x) = m2(x)q2(x). (2.6)

Pela Proposição 2.1, temos que

m(x) = m1(x)m2(x).

De 2.5 e 2.6, resulta

m(x) = p1(x)p2(x) = m1(x)q1(x)m2(x)q2(x)

= m1(x)m2(x)q1(x)q2(x)

= m(x)q1(x)q2(x).

Da última igualdade obtemos,

q1(x)q2(x) = 1.

Como os polinômios p1(x), p2(x), m1(x) e m2(x) são mônicos temos

que

q1(x) = q2(x) = 1.

Assim,

p1(x) = m1(x)

e

p2(x) = m2(x).

2.1. DECOMPOSIÇÃO PRIMÁRIA 51

Com base nas proposições anteriores temos condições de de-

monstrar o Teorema da Decomposição Primária. De acordo com Lips-

chutz e Lipson (2011) e Bueno (2006) enunciaremos da seguinte forma:

Teorema 2.1 (Teorema da Decomposição Primária). Considere o ope-

rador linear T : V −→ V cujo polinômio característico é da forma

p(x) = p1(x)m1p2(x)m2 . . . pr(x)mr

e o seu polinômio minimal é dado por

m(x) = p1(x)n1p2(x)n2 . . . pr(x)nr

com 0 < ni ≤ mi e sendo pi(x) polinômios distintos, mônicos e irredu-

tíveis. Seja Wi o núcleo de pi(T )ni , com i = 1, . . . , r. Então,

V = W1 ⊕W2 ⊕ · · · ⊕Wr

onde Wi é T -invariante e além disso pi(x)ni é o polinômio minimal da

restrição de T a Wi.

Demonstração: Provaremos este teorema usando o princípio

de indução em r.

Se r = 1, temos que m(x) = p1(x)n1 um polinômio mônico e

irredutível como o minimal de T. Assim,

∀v ∈ V ⇒ m(T )(v) =−→0 ⇒ p1(T )n1(v) =

−→0

⇒ v ∈ Nuc(p1(T )n1).

Logo, V ⊂ Nuc(p1(T )n1). Como Nuc(p1(T )n1) ⊂ V ocorre trivial-

mente, temos

V = Nuc(p1(T )n1) = W1.

Além disso, W1 é obviamente T -invariante e p1(T )n1 é o polinômio

minimal de T |W1= T |V = T .

Suponhamos que o teorema seja válido para r = k. Vamos

provar sua validade para r = k +1. Para isso, supomos que o polinômio


minimal de T : V −→ V seja

f(x) = p1(x)n1p2(x)n2 . . . pk(x)nk pk+1(x)nk+1

com pi(x) polinômios mônicos, irredutíveis e distintos entre si.

Como f(x) é o polinômio minimal de T , temos que f(T ) = 0 e

tomando

g(x) = p1(x)n1p2(x)n2 . . . pk(x)nk e h(x) = pk+1(x)nk+1

temos que g e h são primos entre si. Portanto, podemos aplicar a Pro-

posição 2.1 e obter que

V = W ⊕ U (2.7)

onde

W = Nuc(g(T )) = Nuc(p1(T )n1p2(T )n2 . . . pk(T )nk )

e

U = Nuc(h(T )) = Nuc(pk+1(T )nk+1

são ambos T -invariantes.

Ainda, como g e h são mônicos e f é o polinômio minimal de

T , podemos aplicar a Proposição 2.2 e garantir que g e h são, respec-

tivamente, os polinômios minimais das restrições de T a W e U .

Com isso, g é o minimal de T1 = T |W e admite k fatores

mônicos, irredutíveis e distintos. Pela hipótese de indução, temos então

que

W = W1 ⊕W2 ⊕ · · · ⊕Wk

onde

Wi = Nuc(pi(T1)ni), i = 1, 2, . . . , k

e tal que pi(x)ni é o polinômio minimal de T1 restrito a Wi. Portanto,

tomando Wk+1 = U e substituindo em 2.7 temos

V = W ⊕ U = W1 ⊕W2 ⊕ · · · ⊕Wk ⊕Wk+1

2.2. SUBESPAÇOS CÍCLICOS 53

com Wi T -invariante, para i = 1, 2, . . . , k + 1.

Falta mostrar que, para i = 1, 2, . . . , k

Wi = Nuc(pi(T )ni)

e que (pi(x)ni) é o polinômio minimal de T restrito a Wi. Como pi(x)ni

divide p1(x)n1p2(x)n2 . . . pk(x)nk temos que

v ∈ Nuc(pi(T )ni) ⇒ pi(T )ni(v) =−→0

⇒ (p1(T )n1p2(T )n2 . . . pk(T )nk )(v) =−→0

⇒ v ∈ Nuc(p1(T )n1p2(T )n2 . . . pk(T )nk )

⇒ v ∈ W.

Como T1 = T |W , temos que

Nuc(pi(T )ni) = Nuc(pi(T1)ni) = Wi.

E ainda, a restrição de T em Wi é igual a de T1 a Wi e portanto pi(x)ni é

o polinômio minimal de T restrito a Wi, completando a demonstração.

2.2 SUBESPAÇOS CÍCLICOS

Os subespaços cíclicos podem ser definidos como a interseção

de todos os subespaços T -invariantes de V que contém um dado vetor

v ∈ V , com v 6=−→0 . Porém, seguiremos o exposto em Lipschitz e Lipson

(2011) para definirmos estes subespaços. Para isso, sejam T : V −→ V

um operador linear, onde V é um espaço vetorial de dimensão finita

sobre K e v ∈ V um vetor não nulo. Como a dimensão de V é finita,

ao tomarmos os vetores

v, T (v), T 2(v), . . . , T i(v), . . . i ∈ N

temos que existe um menor natural n para o qual T n(v) é uma combi-

nação linear dos vetores que o precedem nesta sequência. Portanto, o


subespaço vetorial gerado por

β = {v, T (v), T 2(v), . . . , T n−1(v)}

será chamado de subespaço T -cíclico e denotado por Z(v, T ), com v ∈

V , v 6=−→0 , dito vetor T -cíclico, de acordo com a seguinte definição:

Definição 2.1. Seja T : V −→ V um operador linear sendo V um

espaço vetorial de dimensão finita sobre K. Dados v ∈ V , v 6=−→0 , o

conjunto Z(v, T ) ⊂ V é um subespaço T -cíclico de V se for gerado pelo

conjunto {v, T (v), T 2(v), . . . , T n−1(v)}.

De acordo com Coelho e Lourenço (2010) e Lipschutz e Lipson

(2011) construiremos o polinômio mv que é o único polinômio de menor

grau tal que mv(T )(v) =−→0 . Este polinômio é dito T-anulador de v e de

Z(v, T ). Assim, considerando o conjunto {v, T (v), T 2(v), . . . , T n−1(v)},

tomemos T n(v) ∈ Z(v, T ), então podemos escrevê-lo como uma combi-

nação linear dos vetores do conjunto {v, T (v), T 2(v), . . . , T n−1(v)}, ou

seja,

T n(v) = −a0v − a1T (v)− · · · − an−1T n−1(v)

com ai ∈ K, 0 ≤ i ≤ n− 1. Com isso,

T n(v) + a0v + a1T (v) + · · ·+ an−1T n−1(v) =−→0 .

Definimos assim o polinômio T -anulador como

mv(x) = xn + an−1xn−1 + · · ·+ a1x + a0.

A seguir, mostraremos um teorema que se refere ao polinômio

que definimos acima. Com base em Lipschutz e Lipson (2011) o enun-

ciaremos da seguinte forma:

Teorema 2.2. Sejam Z(v, T ) um subespaço T − cíclico, Tv a restrição

de T a Z(v, T ) e mv(x) = xn+an−1xn−1+· · ·+a1x+a0 o T−anulador

de v. Valem as seguintes afirmações:

(i) O conjunto β = {v, T (v), T 2(v), . . . , T n−1(v)} é uma base de Z(v, T );


(ii) O polinômio minimal de Tv é mv(x);

(iii) A representação matricial de Tv na base β é chamada matriz com-

panheira de mv(x), dada por

[Tv]β =

0 0 0 . . . 0 −a0

1 0 0 . . . 0 −a1

0 1 0 . . . 0 −a2

......

.... . .

......

0 0 0 . . . 0 −an−2

0 0 0 . . . 1 −an−1

Demonstração: (i) Por definição, Z(v, T ) é gerado por β =

{v, T (v), T 2(v), . . . , T n−1(v)}, onde n é o menor natural para o qual

T n(v) é uma combinação linear dos vetores de β.

Desta forma, para todo i ≤ n−1 temos que T i(v) ∈ β não pode

ser escrito como combinação linear dos demais vetores de β. Portanto,

β é linearmente independente e sendo assim, uma base para Z(v, T ).

(ii) Seja m(x) = xs + bs−1xs−1 + · · · + b1x + b0 o polinômio minimal

de Tv, assim m(Tv) = 0, com bi ∈ K, 1 ≤ i ≤ s− 1. Como v ∈ Z(v, T ),

temos

−→0 = m(Tv)(v) = m(T )(v)

= T s(v) + bs−1T s−1(v) + · · ·+ b1T (v) + b0v

sendo n ≤ s. Como mv(x) é T -anulador, temos

−→0 = mv(T )(v) = T n(v) + an−1T n−1(v) + · · ·+ a1T (v) + a0v

= mv(Tv)(v).

Assim, mv(Tv) = 0. Temos que m(x) divide mv(x)(argumento seme-

lhante ao mostrado no Teorema 1.9), assim s ≤ n. Logo, n = s. Como

o polinômio mv(x) é o único de menor grau tal que mv(T )(v), então

mv(x) = m(x). Portanto, o polinômio mv(x) é o minimal de Tv.


(iii) Seja β = {v, T (v), T 2(v), · · · , T n−1(v)}. Para calcularmos [Tv]β ,

aplicamos Tv nos vetores de β, obtendo

Tv(v) = T (v) = 0 · v + 1 · T (v) + 0 · T 2(v) + . . . + 0 · T n−1(v).

Da mesma forma, para obter a segunda coluna de [Tv]β , fazemos

Tv(T (v)) = T (T (v)) = T 2(v)

= 0 · v + 0 · T (v) + 1 · T 2(v) + . . . + 0 · T n−1(v).

Para a penúltima coluna, tomamos

Tv(T n−2(v)) = T (T n−2(v))

= T n−1(v)

= 0 · v + 0 · T (v) + · · ·+ 1 · T n−1(v).

Para a última coluna da matriz, vamos utilizar o polinômio mv(x) =

xn + an−1xn−1 + · · ·+ a1x + a0, assim obtemos

−→0 = mv(Tv(v)) = mv(T (v))

= T n(v) + an−1T n−1(v) + · · ·+ a1T (v) + a0v.

Portanto,

T n(v) = −an−1T n−1(v)− · · · − a1T (v)− a0v.

Assim,

Tv(T n−1(v)) = T (T n−1(v)) = T n(v)

= −a0v − a1T (v)− · · · − an−1T n−1(v).

Logo, obtemos a matriz

[Tv]β =

0 0 0 . . . 0 −a0

1 0 0 . . . 0 −a1

0 1 0 . . . 0 −a2

......

.... . .

......

0 0 0 . . . 0 −an−2

0 0 0 . . . 1 −an−1


que é chamada de matriz companheira do polinômio mv(x).

Quando se trata de subespaços cíclicos observamos que estes possuem

uma peculiaridade. Se V = Z(v, T ) então o polinômio característico do

operador linear T sempre coincidirá com o polinômio minimal. Para

mostrar esta afirmação são necessários alguns resultados que mostrare-

mos a seguir, baseados em Coelho e Lourenço (2010).

Lema 2.1. Se T : V −→ V é um operador linear onde V é um espaço

vetorial sobre um corpo K de dimensão finita, então existe um vetor

v ∈ V tal que o polinômio T -anulador é igual ao polinômio minimal de

T .

Demonstração: Sejam m(x) e mv(x) polinômios minimal e

anulador de T , respectivamente. Mostraremos apenas um caso particu-

lar, no qual m(x) = f(x)m, sendo f um polinômio irredutível em P (K),

porém o resultado também é válido quando m(x) = f1(x)m1 · · · fr(x))mr .

Sabemos que o polinômio minimal m(x) é o polinômio de menor

grau tal que m(T )(u) =−→0 , para qualquer u ∈ V . Assim, existe v ∈ V

de tal forma que f(T )m−1v 6= 0. Como mv(x) divide m(x) (argumento

semelhante ao mostrado no Teorema 1.9) e f(x) é irredutível, segue que

mv(x) = f(x)l para algum l ≤ m.

Como mv(T ) = 0 e usando o fato que f(T )m−1v 6= 0, concluí-

mos que

f(T )m(v) = f(T )l(v).

Desta forma,

m(x) = mv(x)

.

Corolário 2.1. Se T : V −→ V é um operador linear onde V é um

espaço vetorial sobre um corpo K de dimensão finita, então existe um

subespaço T-cíclico de V com dimensão igual ao grau do polinômio

minimal de T .


Demonstração: Conforme o Lema 2.1, sabemos que existe

v ∈ V tal que m(x) = mv(x). Seja ϕv : P (K) −→ f(T ) uma transfor-

mação onde ϕv(f) = f(T )(v).

Note que Im(ϕv) = [v, T (v), T 2(v) . . . T m−1(v)] para algum m.

Desta forma, Im(ϕv) é um subespaço T-cíclico de V, com dimensão

igual a m.

Como temos que v ∈ V é tal que m(x) = mv(x), então o grau

de m(x) também é m.

A seguir enunciaremos o Teorema que caracteriza os subespa-

ços T-cíclicos, relacionando os polinômios característico e minimal do

operador T . Através do Lema 2.1 e o Corolário 2.1 conseguiremos rea-

lizar sua demonstração.

Teorema 2.3. Seja T : V −→ V um operador linear onde V é um

espaço vetorial sobre K de dimensão n. As seguintes afirmações são

equivalentes:

(i) V = Z(v, T );

(ii)o grau de m(x) é n;

(iii) m(x) = p(x).

Demonstração: (i)⇒(ii) Como V = Z(v, T ) então existe

v ∈ V tal que V = [v, T (v), T 2(v) . . . T n−1(v)].

Com isso, o grau de mv(x) é n. Como dimV = n, então o grau

de m(x) deve ser no máximo n. Segue que mv(x) divide m(x). Mas a

única maneira disto ocorrer é quando o grau de m(x) é igual a n.

(ii)⇒(iii) Se dimV = n, então seu polinômio característico possui

grau n. Pelo Teorema de Cayley-Hamilton, m(x) divide p(x), logo

m(x) = p(x), pois ambos são polinômios mônicos e por hipótese, tem

o mesmo grau.

(iii)⇒(i) Pelo Corolário 2.1, existe um subespaço T -cíclico Z(v, T ) de

2.3. FORMA CANÔNICA RACIONAL 59

V com dimensão igual a de m(x). Como o grau de m(x) é n temos que

Z(v, T ) = V.

Exemplo 2.1. Seja T : R2 → R

2 o operador dado por T (x, y) =

(2x− 4y, 2x− 2y) tal que

[T ] =

(

2 −4

2 −2

)

.

Calculando o polinômio característico de T , obtemos

p(x) = det

(

x− 2 4

−2 x + 2

)

= (x− 2)(x + 2) = x2 + 4.

Observe que o polinômio característico é igual ao polinômio minimal.

Assim pelo Teorema 2.3, existe v = (a, b) ∈ R2, com v 6=

−→0 , tal que

β = {(a, b), T (a, b)}

é uma base para R2. Como para qualquer v = (a, b) ∈ R

2 o conjunto β

é linearmente independente, temos que

[T ]β =

(

0 −4

1 0

)

é a matriz companheira do polinômio x2 + 4. Logo, R2 = Z(v, T ).

2.3 FORMA CANÔNICA RACIONAL

Com base no que foi visto na seção anterior, enunciaremos dois

resultados essenciais para a construção da Forma Canônica Racional. O

primeiro diz que o espaço vetorial V pode ser decomposto por somas de

subespaços T-cíclicos. E o segundo resultado diz que o operador T pode

ser representado de maneira única por uma matriz cuja diagonal é for-

mada por matrizes companheiras. Conforme Lipschutz e Lipson (2011),

enunciaremos o seguinte Lema que nos fornece esta decomposição de

V.


Lema 2.2 (Decomposição Racional). Se T : V −→ V é um operador

linear cujo polinômio minimal é p(x)n, em que p(x) é um polinômio

mônico irredutível, então V é a soma direta

V = Z(v1, T )⊕ · · · ⊕ Z(vr, T )

dos subespaços T-cíclicos Z(vi, T ) com T-anuladores correspondentes

p(x)n1 , p(x)n2 , . . . , p(x)nr , n = n1 ≥ n2 ≥ . . . ≥ nr.

Além disso, qualquer outra decomposição de V em subespa-

ços T -cíclicos tem o mesmo número de componentes e mesmos T -

anuladores.

De acordo com o Teorema da Decomposição Primária, pode-

mos escrever V = W1 ⊕ · · · ⊕ Wr quando o polinômio minimal é da

forma m(x) = p1(x)n1p2(x)n2 · · · ps(x)ns , sendo Wi = Nuc(pni

i ). E jun-

tamente com o Lema 2.2, conseguimos representar o operador T como

uma matriz cuja diagonal é composta por matrizes companheiras. É o

que nos diz o seguinte teorema:

Teorema 2.4. Se T : V −→ V é um operador com polinômio minimal

m(x) = p1(x)n1p2(x)n2 · · · ps(x)ns

em que os pi(x) são polinômios mônicos irredutíveis distintos, então T

tem uma única representação matricial diagonal em blocos, da forma

[T ]α =

C11 0 . . . 0 . . . 0 0 . . . 0

0 C12 . . . 0 . . . 0 0 . . . 0...

.... . .

......

......

......

0 0 . . . C1r1. . . 0 0 . . . 0

......

......

. . ....

......

...

0 0 0 0 . . . Cs1 0 . . . 0

0 0 0 0 . . . 0 Cs2 . . . 0...

......

......

......

. . ....

0 0 0 0 . . . 0 0 . . . Csrs

2.3. FORMA CANÔNICA RACIONAL 61

onde Cirisão matrizes companheiras dos polinômios pi(x)niri , com

ni = mi1 ≥ mi2 ≥ · · · ≥ miri, 1 ≤ i ≤ s.

O Teorema 2.4 mostra uma representação matricial de T que

é denominada forma canônica racional. Para entendermos melhor, ve-

jamos o exemplo a seguir.

Exemplo 2.2. Sejam V um espaço vetorial sobre R , com dim(V ) = 7

e T : V −→ V um operador linear cujo polinômio minimal é

m(x) = (x2 − 2x + 5)(x− 3)3.

Vamos obter todas as possíveis formas canônicas racionais de

T. Como dimV = 7, temos duas possibilidades para o polinômio carac-

terístico:

p1(x) = (x2 − 2x + 5)2(x− 3)3 ou p2(x) = (x2 − 2x + 5)(x− 3)5.

Como m(x) = (x2 − 2x + 5)(x − 3)3, então obrigatoriamente devemos

ter os blocos C1(x2− 2x + 5) e C2((x− 3)3) = C2(x3− 9x2 + 27x− 27).

Se o polinômio característico for p1, então temos uma possibilidade

para a representação matricial de T na forma racional:

[T ]α =

(

0 −5

1 2

)

(

0 −5

1 2

)

0 0 27

1 0 −27

0 1 9

.

Se o polinômio característico for p2, então temos duas possibi-

lidades, pois podemos escrever o polinômio p2 de duas formas:

p2 = (x2−2x+5)(x−3)3(x−3)2 e p2 = (x2−2x+5)(x−3)3(x−3)(x−3).


Considerando a primeira opção, obtemos os seguintes blocos:

C1(x2 − 2x + 5), C2((x− 3)3) e C3((x− 3)2).

Assim, a representação matricial do operador T é dada por:

[T ]α =

(

0 −5

1 2

)

0 0 27

1 0 −27

0 1 9

(

0 −9

1 6

)

.

Considerando a segunda opção, obtemos os seguintes blocos:

C1(x2 − 2x + 5), C2((x− 3)3), C3(x− 3) e C4(x− 3).

Desta forma, a representação matricial do operador T é dada

por:

[T ]α =

(

0 −5

1 2

)

0 0 27

1 0 −27

0 1 9

(

3)

(

3)

.

Portanto, a forma canônica racional de T é uma das matrizes

[T ]α exibidas, nos quais os elementos que não estão indicados são todos

nulos.

63

3 A FORMA CANÔNICA DE JOR-

DAN

No capítulo 1 deste trabalho revisamos alguns conceitos de Ál-

gebra Linear e juntamente com a Decomposição Primária apresentada

no capítulo 2 temos condições de construir a Forma Canônica de Jor-

dan. Esta forma existe sempre que os polinômios característico e mini-

mal são escritos como um produto de fatores lineares. Observe que isto

sempre acontece quando estamos trabalhando no corpo dos complexos,

com isso qualquer operador T : V −→ V pode ser representado na

Forma Canônica de Jordan.

Veremos que, através da Forma Canônica de Jordan, é possível

exibir a matriz de um operador linear não diagonalizável por meio de

uma matriz que possui uma forma “quase diagonal”, isto é, constituída

por blocos de matrizes triangulares inferiores, cujos elementos das dia-

gonais principais são todos iguais a um mesmo número (os autovalores

do operador), cujos elementos imediatamente abaixo destas diagonais

são todos iguais a 1 e os elementos restantes são todos nulos.

A fim de definir e estudar tudo o que se refere a essa forma, ire-

mos nos basear essencialmente nos livros de Coelho e Lourenço (2010),

Hoffman e Kunze (1971), Lima (2009), Lipschutz e Lipson (2011) e

Pellegrini (2013).

3.1 OPERADORES NILPOTENTES

Neste momento serão estudados os operadores nilpotentes, que

são de grande importância para o entendimento da construção da Forma

Canônica de Jordan. Assim, segue sua definição baseado nos autores

Coelho e Lourenço (2010) e Lima (2009).

64 Capítulo 3. A FORMA CANÔNICA DE JORDAN

Definição 3.1. Um operador linear T : V −→ V é dito nilpotente

quando existe k ∈ N tal que T k = 0. É chamado de índice de nilpotência

o menor número k ∈ N tal que T k = 0, ou seja, T i 6= 0, para todo i < k.

Exemplo 3.1. Seja Pm(R) o espaço vetorial dos polinômios de grau

m com entradas reais. Considere o operador T : Pm(R) → Pm(R) que

é dado por T (p(x)) = p(x)′.

Observe que T é o operador derivação e que T m(p(x)) = c,

onde c ∈ R. Aplicando novamente o operador temos

T (T m(p(x))) = T m+1(p(x)) = 0.

Desta forma, T é nilpotente de índice m + 1.

Exemplo 3.2. Considere o operador T : R3 → R

3 definido como

T (x, y, z) = (0, x, y). Este operador é nilpotente de índice k = 3. De

fato,

T (x, y, z) = (0, x, y),

T 2(x, y, z) = T (0, x, y) = (0, 0, x),

T 3(x, y, z) = T (0, 0, x) = (0, 0, 0).

Assim, T 3 = 0.

Uma característica dos operadores nilpotentes é possuírem ape-

nas o zero como autovalor. Esta afirmação é facilmente mostrada a

seguir:

Proposição 3.1. Se T : V −→ V é um operador linear nilpotente de

índice k, então zero é o seu único autovalor.

Demonstração: Por hipótese temos que para qualquer v ∈

V tem-se T k(v) =−→0 , assim seja v um autovetor de T associado ao

autovalor λ. Então−→0 = T k(v) = λkv

3.1. OPERADORES NILPOTENTES 65

isto é,

λkv =−→0 .

Como v 6=−→0 , concluímos que λ = 0.

Quando trabalhamos com um espaço vetorial de dimensão fi-

nita podemos obter uma decomposição em subespaços T -invariantes,

sendo que quando restringirmos o operador em um desses subespaços

teremos um operador nilpotente e no outro subespaço teremos um ope-

rador inversível.

Teorema 3.1. Se V é um espaço vetorial de dimensão finita (real ou

complexo) onde T : V −→ V é um operador linear, então existe uma

decomposição V = U ⊕W , sendo U,W subespaços T -invariantes, onde

T é inversível em U e nilpotente em W. E ainda, tal decomposição é

única.

Demonstração: Considerando os operadores T l, l > 1, pode-

mos obter uma sequência de subespaços T -invariantes de V, tomando

V ⊃ Im(T ) ⊃ Im(T 2) ⊃ · · · ⊃ Im(T l) · · · .

Como a dimensão de V é finita, então esta sequência não po-

derá ser estritamente decrescente para sempre. Assim, seja k > 0 o

menor número natural que satisfaz a igualdade Im(T k) = Im(T k+1).

Afirmamos que Im(T k+1) = Im(T k+2), de fato:

Im(T k+2) = T (Im(T k+1)) = T (Im(T k)) = Im(T k+1).

Da mesma maneira, Im(T k+2) = Im(T k+3) = Im(T k+4) · · · . Igual-

mente obtemos,

Nuc(T ) ⊆ Nuc(T 2) ⊆ · · · ⊆ Nuc(T k) = Nuc(T k+1) = · · ·

pois pelo Teorema do Núcleo e da Imagem, concluímos que

dimNuc(T k+1) = dim(V )− dimIm(T k+1)

= dim(V )− dimIm(T k)

= dimNuc(T k).


Sejam U = Im(T k) e W = Nuc(T k). Queremos mostrar que

V = U + W.

Tomando v ∈ V temos que existe x ∈ V tal que T k(v) =

T 2k(x), pois Im(T k) = Im(T 2k). Então, escrevendo

v = v + (T k(x)− T k(x))

= v + (−T k(x) + T k(x))

= (v − T k(x)) + T k(x)

temos que T k(v − T k(x)) = T k(v) − T 2k(x) =−→0 . Logo, o vetor v −

T k(x) ∈ W e obrigatoriamente T k(x) ∈ U . Assim, mostramos que

V = U + W .

Para que esta soma seja direta, falta mostrar que U∩W = {−→0 }.

Sabendo que dim(U +W ) = dim(U)+dim(W )−dim(U ∩W ) e usando

o Teorema do Núcleo e da Imagem, obtemos

dim(V ) = dim(U + W )

= dim(Im(T k)) + dim(Nuc(T k))− dim(U ∩W )

= dim(V )− dim(U ∩W )

e então

dim(U ∩W ) = 0.

Logo, U ∩W = {−→0 }.

Considere as restrições H1 = T |U e H2 = T |W . É evidente que

H1 é nilpotente, pois Hk1 (v) = T k(v) =

−→0 . E H2 é sobrejetor pois,

H2(U) = T (U) = T (Im(T k)) = Im(T k+1) = Im(T k) = U.

Desta forma, H2 é inversível, por ser um operador linear sobre-

jetor.

Ainda falta provar que essa decomposição é única, para isso

suponhamos que existam E1 e E2 subespaços T-invariantes onde

V = E1 ⊕ E2.


Sejam T1 e T2 operadores tais que T1 = T |E1é nilpotente de

índice k′ e T2 = T |E2é inversível. Definimos agora m = max{k, k′} e

tomando w1 ∈ W ⊂ V , como V = E1⊕E2 então conseguimos escrever

este vetor w1 como a soma dos vetores e1 e e2, onde e1 ∈ E1, e2 ∈ E2.

Então, a igualdade T m(w1) =−→0 é válida, pois se m = k,

temos T m(w1) = T k(w1) =−→0 devido a T ser operador nilpotente

de índice k. Se m = k′, temos T m(w1) = T k′(w1) =−→0 devido a

w1 ∈ W = Nuc(T k) ⊂ Nuc(T k′), como visto anteriormente. Assim,

−→0 = T m(w1) = T m(e1 + e2)

= T m(e1) + T m(e2)

= T m1 (e1) + T m

2 (e2).

Concluímos que T m(e1) =−→0 , pois se m = k, temos T m(e1) =

T k(e1) =−→0 , devido a T ser operador nilpotente de índice k. Se m = k′,

temos T m(e1) = T k′

1 (e1) =−→0 , pois e1 ∈ U1 e T1 é nilpotente de índice

k′.

Com isso, temos T m2 (e2) =

−→0 . Como T2 é inversível, segue que

e2 = 0, fazendo com que w1 = e1. Assim, W ⊆ E1.

Analogamente, mostramos que E1 ⊆ W , portanto E1 = W =

Nuc(T k).

Seja agora u1 ∈ U . Como U = Im(T k), existe v ∈ V tal que

T k(v) = u1. Escrevendo v = b1 + b2, onde b1 ∈ E1, b2 ∈ E2, obtemos:

u1 = T k(v) = T k(b1 + b2) = T k(b1) + T k(b2).

Segue que T k(b1) = 0, pois b1 ∈ E1 = Nuc(T k) e assim

u1 = T k(b2).

Como E2 é T-invariante, segue que u1 ∈ E2, portanto U ⊆ E2.

Seja agora b2 ∈ E2 ⊂ V , como V = U ⊕ W então podemos

escrever b2 = u2 + w2, com u2 ∈ U e w2 ∈ W . Assim, w2 = b2 − u2 ∈


E1 ∩E2 = {−→0 }, pois W = E1 e U ⊆ E2. Dessa forma, b2 = u2 e segue

que E2 ⊆ U , fazendo com que U = E2. Logo, a decomposição é única.

A Proposição a seguir nos auxiliará na obtenção de uma base

em relação a qual a matriz que representa o operador T é composta

por blocos da forma

0 0 · · · 0 0

1 0 · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

em sua diagonal.

Proposição 3.2. Considere o operador linear T : V −→ V nilpotente

de índice k ≥ 1, se v ∈ V é um vetor tal que T k−1(v) 6=−→0 e T k(v) =

−→0 , então:

(i) O conjunto {v, T (v), T 2(v), . . . , T k−1(v)} é l.i.

(ii) Existe um subespaço T-invariante W de V tal que V = U ⊕ W ,

onde U = [v, T (v), T 2(v), . . . , T k−1(v)].

Demonstração: (i) Para mostrar que o conjunto

{v, T (v), T 2(v), . . . , T k−1(v)}

é linearmente independente, precisamos primeiramente tomar uma com-

binação linear nula com os elementos do conjunto. Assim, consideremos

a0v + a1T (v) + a2T 2(v) + . . . + ak−1T k−1(v) =−→0 .

Aplicando o operador T k−1 em ambos os lados, obtemos

a0T k−1(v) + a1T k(v) + a2T k+1(v) + . . . + ak−1T 2k−2(v) =−→0 .

Por hipótese temos T k(v) = T k+1(v) = . . . = T 2k−2(v) =−→0 . Logo,

a0T k−1(v) =−→0 .


No entanto, T k−1(v) 6=−→0 , portanto a0 = 0.

Da mesma forma, aplicando o operador T k−2 temos que a1 = 0.

Prosseguindo analogamente, temos a0 = a1 = a2 = . . . = ak−1 = 0.

Sendo assim o conjunto {v, T (v), T 2(v), . . . , T k−1(v)} é linearmente in-

dependente.

(ii) Primeiramente, note que U é T -invariante, pois tomando u ∈ U

podemos escrevê-lo da seguinte forma:

u = a0v + a1T (v) + a2T 2(v) + · · ·+ ak−1T k−1(v)

onde ai ∈ K, 0 ≤ i ≤ k − 1. Assim,

T (u) = T (a0v + a1T (v) + a2T 2(v) + · · ·+ ak−1T k−1(v))

= T (a0v) + T (a1T (v)) + T (a2T 2(v)) + · · ·+ T (ak−1T k−1(v))

= a0T (v) + a1T 2(v) + a2T 3(v) + · · ·+ ak−1T k(v).

Por hipótese segue que ak−1T k(v) =−→0 . Consequentemente,

T (u) = a0T (v) + a1T 2(v) + a2T 3(v) + · · ·+ ak−2T k−1(v) ∈ U.

Logo, U é T -invariante.

Para mostrarmos o resultado desejado, usaremos o princípio de

indução sobre k.

Quando k = 1, teríamos U = [v] = Nuc(T ), pois v 6=−→0 e

T (v) =−→0 e obviamente W = Im(T ) é T -invariante e V = U ⊕W .

Suponhamos que a decomposição é válida para todos os opera-

dores nilpotentes com índices menores que k, com k > 1.

Podemos observar que Im(T ) é um subespaço T -invariante e

que a restrição de T em Im(T ) gera um operador tal que

T k−1(T (v)) = T k(v) =−→0

e

T k−2(T (v)) = T k−1(v) 6=−→0 .


Assim, T |Im(T ) é um operador nilpotente de índice k − 1.

Vamos escrever um subespaço U1 como U1 = U∩Im(T ), devido

a interseção de U e Im(T ) podemos concluir que

U1 = [T (v), T 2(v), . . . , T k−1(v)].

Utilizando a hipótese de indução temos que Im(T ) = U1⊕W1,

onde W1 é um subespaço T -invariante de V.

Considere o subespaço W2 = {w ∈ V | T (w) ∈ W1}. Precisa-

mos primeiramente mostrar duas afirmações:

V = U + W2 e U ∩W1 = {−→0 }.

Se u ∈ V , teremos T (u) ∈ Im(T ) e assim, representamos T (u) como

a soma de um vetor de U1 e outro de W1, ou seja, T (u) = u1 + w1,

u1 ∈ U1 e w1 ∈ W1.

Como U1 = [T (v), T 2(v), . . . , T k−1(v)], existem a1, a2, . . . , ak−1 ∈

K tais que,

u1 =k−1∑

i=1

aiTi(v) = T

(

k−1∑

i=1

aiTi−1(v)

)

= T (u2),

onde denotamos u2 =k−1∑

i=1

aiTi−1(v) e temos que u2 ∈ U . Assim,

T (u) = T (u2) + w1

ou seja,

T (u)− T (u2) = w1

isto é,

T (u− u2) = w1 ∈ W1.

Pela forma que W2 foi definido, concluímos que u − u2 ∈ W2.

Logo,

u = u2 + (u− u2) ∈ U + W2


de modo que provamos a primeira afirmação.

Considere agora u ∈ U ∩W1. Por U e W1 serem T -invariantes

temos que T (u) ∈ U ∩ Im(T ) e T (u) ∈ W1. Com isso,

T (u) ∈ U ∩ Im(T ) ∩W1 = U1 ∩W1.

Como

Im(T ) = U1 ⊕W1

então

T (u) ∈ U1 ∩W1 = {−→0 }.

Logo T (u) =−→0 .

Como u ∈ U , existem escalares a0, a1, · · · , ak−1 ∈ K, tais que

u =k−1∑

i=0

aiTi(v),

Portanto,

−→0 = T (u) = T

(

k−1∑

i=0

aiTi(v)

)

=

k−1∑

i=0

aiTi+1(v)

= a0T (v) + a1T 2(v) + · · ·+ ak−2T k−1(v) + ak−1T k(v).

Visto que T k(v) =−→0 , nos resta

a0T (v) + a1T 2(v) + · · ·+ ak−2T k−1(v) =−→0 .

Dado que o conjunto {T (v), T 2(v), . . . , T k−1} é linearmente in-

dependente, então a0 = a1 = · · · = ak−2 = 0 e u = ak−1T k−1(v) ∈

Im(T ). Assim, u ∈ U ∩ Im(T ) = U1. Logo, u ∈ U1 ∩ W1 = {−→0 },

portanto

U ∩W1 = {−→0 }.


Conforme a igualdade U ∩W1 = {−→0 }, temos que

U ∩W2 ∩W1 = {−→0 }

e como U ∩ W2 e W1 estão contidos em W2, pois W1 é T -invariante,

segue que existe um subespaço W , tal que

W2 = W ⊕W1 ⊕ (U ∩W2). (3.1)

Afirmamos que W = W ⊕W1 é o subespaço que estamos procurando.

De fato, W ⊆ W2 e W ∩ (U ∩ W2) = {−→0 }, assim U ∩ W = {

−→0 }.

Utilizando a primeira afirmação, V = U + W2 e o Teorema 1.2, temos

dim(V ) = dim(U + W2) = dim(U) + dim(W2)− dim(U ∩W2). (3.2)

Por 3.1, temos

dim(W2)− dim(U) ∩W2 = dim(W ⊕W1) = dim(W ). (3.3)

Subtraindo as equações 3.2 e 3.3, temos

dim(V )− dim(W ) = dim(U)

e assim,

dim(V ) = dim(U) + dim(W ).

Logo, V = W + U como queríamos. Basta apenas mostrar que

W é um subespaço T -invariante. De fato, como W ⊆ W2, teremos

T (W ) ⊆ W1 ⊆ W , finalizando a demonstração.

Considere um operador linear T : V → V , onde V possui

dimensão n ≥ 1. Suponhamos que o polinômio característico de T seja

da forma p(x) = (x − λ)n e que o índice de nilpotência do operador

(T − λ) seja n. Pela Proposição 3.2, existe um conjunto

β = {v, (T − λI)(v), (T − λI)2(v), . . . , (T − λI)(v)n−1}


que é linearmente independente. Como β possui n vetores e dim(V ) =

n, temos que β é base de V . Em relação a base β, a representação

matricial de (T − λI) é dada por

[T − λI ]β =

0 0 · · · 0 0

1 0 · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

.

Assim,

[T − λI ]β = [T ]β −

λ 0 · · · 0 0

0 λ · · · 0 0

0 0 · · · 0 0...

.... . .

......

0 0 · · · 0 λ

=

0 0 · · · 0 0

1 0 · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

.

Isto é,

[T ]β =

λ 0 · · · 0 0

0 λ · · · 0 0

0 0 · · · 0 0...

.... . .

......

0 0 · · · 0 λ

+

0 0 · · · 0 0

1 0 · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

.

Logo,

[T ]β =

λ 0 · · · 0 0

1 λ · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 λ

.

Desta forma, quando o operador T : V −→ V possui polinômio

característico da forma p(x) = (x − λ)n, conseguimos representar este

operador através de uma matriz cuja diagonal principal é formada pelo


autovalor λ e os elementos imediatamente abaixo da diagonal principal

são iguais a 1 e os demais elementos são todos nulos. Baseado nisto,

definiremos um bloco de Jordan.

Definição 3.2. Um bloco de Jordan n × n é uma matriz triangular

inferior dada por:

J(λ, n) =

λ 0 · · · 0 0

1 λ · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 λ

.

Neste momento, nosso objetivo é encontrar uma base onde

qualquer operador linear T é representado através de uma matriz for-

mada por blocos de Jordan em sua diagonal. Tal matriz será chamada

de Forma Canônica de Jordan.

Teorema 3.2. Se T : V −→ V é um operador linear nilpotente com

índice de nilpotência k ≥ 1, onde V é um espaço vetorial sobre o corpo

K de dimensão finita, então existem números positivos t, k1, . . . , kt e

vetores v1, . . . , vt ∈ V tais que:

(a) k = k1 ≥ k2 ≥ k3 ≥ · · · ≥ kt.

(b)O conjunto γ = {v1, T (v1), . . . , T k1−1(v1), . . . , vt, T (vt), . . . , T kt−1(vt)}

é uma base de V.

(c)T ki(vi) =−→0 para cada i = 1, . . . , t.

Demonstração: Como T é nilpotente de índice k, existe

v1 ∈ V tal que T k−1(v1) 6=−→0 . Utilizando a Proposição 3.2 temos

um conjunto β1 = {v1, T (v1), T 2(v1), . . . , T k−1(v1)} linearmente inde-

pendente, onde v1 ∈ V e ainda, podemos escrever

V = U1 ⊕W1

onde U1 é gerado por β1 e W1 é subespaço T -invariante.

3.2. AUTOVETORES GENERALIZADOS 75

Seja k = k1. Fazendo T1 = T |W1, temos que T1 será nilpo-

tente com o índice que denotaremos k2, sendo que k2 ≤ k1. Da mesma

maneira, existe v2 ∈ W1 tal que T k2−11 (v2) = T k2−1(v2) 6=

−→0 e pela

Proposição 3.2 temos

W1 = U2 ⊕W2

onde U2 é gerado por β2 = {v2, T (v2), T 2(v2), . . . , T k2−1(v2)} , que é um

conjunto linearmente independente, e W2 é um subespaço T -invariante.

Fazendo T2 = T |W2teremos um operador nilpotente de índice

k3, com k3 ≤ k2. Como a dimensão de V é finita, se repetirmos este

processo, chegaremos que k1 ≥ k2 ≥ k3 ≥ · · · ≥ kt.

Além disso,vemos que γ = β1 ∪ β2 ∪ · · · ∪ βt é uma base de V ,

pois de acordo com a Proposição 3.2 temos V = U1 ⊕ U2 ⊕ · · · ⊕ Ut.

Por fim, T ki(vi) =−→0 para cada i = 1, · · · , t, pois T |Wi

é

sempre nilpotente de índice ki.

O Teorema 3.2 nos garante que existe uma base em que a repre-

sentação matricial de um operador nilpotente será formada por blocos

de Jordan, porém não especifica quem são os elementos desta base.

Na próxima seção, teremos como objetivo reescrever o Teorema 3.2 em

termos de autovetores generalizados, que nos permitirá explicitar esta

base.

3.2 AUTOVETORES GENERALIZADOS

Sempre que temos um operador linear T : V −→ V diagonalizá-

vel, podemos afirmar que existe uma base de V formada por autovetores

de T . Porém, quando T não é diagonalizável, não haverá autovetores

suficientes para compor uma base de V . Neste caso, veremos que existe

uma base constituída pelo que chamaremos de cadeia de Jordan.

Definição 3.3 (Autovetores generalizados). Seja T : V −→ V um

operador linear. Se existirem escalares λ e p, com p positivo, tais que:

(T − λI)p(v) =−→0


e

(T − λI)p−1(v) 6=−→0

então v é chamado de autovetor generalizado de T .

Observe que se p = 1 então v é um autovetor de T .

Exemplo 3.3. Seja T : R3 → R3 o operador linear dado por

[T ] =

0 0 1

1 1 0

1 0 0

.

O vetor v = (1, 0, 1) é um autovetor generalizado de T associ-

ado ao autovalor 1, com p = 2. De fato,

(T − I)2(v) =

2 0 −2

−1 0 1

−2 0 2

1

0

1

=

0

0

0

porém,

(T − I)(v) =

−1 0 1

1 0 0

1 0 −1

1

0

1

=

0

1

0

.

Definição 3.4. Seja λ um autovalor do operador linear T : V → V.

Uma cadeia de Jordan é uma sequência de vetores da forma:

v, (T − λI)(v), (T − λI)2(v), . . . , (T − λI)p−1(v)

sendo v um autovetor generalizado de T .

Exemplo 3.4. Retomando o exemplo 3.3, temos que a sequência

v = (1, 0, 1), (T − I)(v) = (0, 1, 0)

é uma cadeia de Jordan associado ao autovalor 1.

Teorema 3.3. Uma cadeia de Jordan é formada por vetores linear-

mente independentes.

3.2. AUTOVETORES GENERALIZADOS 77

Demonstração: Seja T um operador linear tal que a sequên-

cia

v, (T − λI)(v), . . . , (T − λI)p−1(v)

é uma cadeia de Jordan, com (T −λI)p(v) =−→0 e (T −λI)p−1(v) 6=

−→0 .

Suponhamos que

a0v + a1(T − λI)(v) + . . . + ap−1(T − λI)p−1(v) =−→0 . (3.4)

Aplicando o operador (T − λI)p−1 em ambos os lados, obtemos

a0(T − λI)p−1(v) + a1(T − λI)p(v) + . . . + ap−1(T − λI)2p−2(v) =−→0 .

Como (T − λI)i(v) =−→0 , para todo i ≥ p, então a igualdade anterior

se reduz a

a0(T − λI)p−1(v) =−→0 .

Como (T−λI)p−1(v) 6=−→0 , temos que a0 = 0. Reescrevendo a igualdade

3.4, temos

a1(T − λI)(v) + . . . + ap−1(T − λI)p−1(v) =−→0 . (3.5)

Aplicando (T − λI)p−2 em ambos os lados, temos

a1(T − λI)p−1(v) + a2(T − λI)p(v) + . . . + ap−1(T − λI)2p−3(v) =−→0

que se reduz a

a1(T − λI)p−1 =−→0

e portanto a1 = 0, visto que (T − λI)p−1 6=−→0 . De modo análogo,

concluímos que a2 = · · · = ap−1 = 0. Logo, a cadeia de Jordan é

linearmente independente.

Podemos generalizar o resultado do Teorema 3.3 para uma

quantidade finita de cadeias de Jordan. Ou seja, a união de cadeias

associadas a autovalores distintos é linearmente independente.

Seja T : V −→ V um operador linear cujo polinômio caracte-

rístico é dado por p(x) = (x − λ)n, considere as seguintes cadeias de


Jordan associadas ao autovalor λ:

v1, (T − λI)(v1), . . . , (T − λI)k1−1(v1),

v2, (T − λI)(v2), . . . , (T − λI)k2−1(v2),

...

vt, (T − λI)(vt), . . . , (T − λI)kt−1(vt).

Observe que (T − λI)ki(vi) =−→0 , para cada i = 1, . . . , t, e que o

operador (T − λI) é nilpotente de índice menor ou igual a n, pois

p(T ) = (T − λI)n = 0. Assim, conforme o Teorema 3.2 estas cadeias

formam uma base para V . Logo, existe uma base formada por cadeias

de Jordan tal que a representação de T nesta base está na forma de

Jordan.

3.3 A FORMA CANÔNICA DE JORDAN

Nesta seção, temos como finalidade utilizar os resultados vistos

para construir a chamada forma canônica de Jordan, ou simplesmente,

forma de Jordan de um operador linear qualquer. A existência da forma

de Jordan para um operador qualquer decorre da sua existência para

operadores nilpotentes. Mostraremos isto através do próximo Teorema

que Coelho e Lourenço (2010) enuncia da seguinte forma:

Teorema 3.4. Seja V um espaço vetorial de dimensão finita sobre K.

Se T : V −→ V é um operador linear cujo polinômio característico é

da forma

p(x) = (x− λ1)m1 · · · (x− λr)mr

com mi > 1 e λi 6= λj, se i 6= j, então

V = W1 ⊕W2 ⊕ · · · ⊕Wr

onde, para cada 1 ≤ i ≤ r, tem-se que:

(i) a restrição do operador T − λiI a Wi é nilpotente;

(ii) Wi é T -invariante;

(iii) dim(Wi) = mi.

3.3. A FORMA CANÔNICA DE JORDAN 79

Demonstração: Considere a transformação (T − λiI) : V →

V . Vamos denotar esta transformação por Ti = (T −λiI), para 1 ≤ i ≤

r.

Pelo Teorema 3.1 existe uma decomposição V = Wi⊕Ui, sendo

Wi e Ui subespaços Ti-invariantes e as restrições de Ti a Wi e a Ui nilpo-

tente e inversível, respectivamente. Desta forma, provamos o primeiro

item.

Como Wi é T -invariante e Ti = (T − λiI), pela Proposição

1.1, podemos afirmar que Wi e Ui são T -invariantes, provando assim o

segundo item.

Sejam agora T ′ = T |Wie T ′′ = T |Ui

, como V = Wi ⊕Ui então

pela Proposição 1.2 temos que o polinômio característico de T é escrito

como

p(x) = p′(x) p′′(x)

sendo p′(x) e p′′(x) os polinômios característico de T ′ e T ′′, respectiva-

mente.

Conforme a Proposição 3.1, temos que o operador T ′ − λiI

possui apenas o zero como autovalor. Desta forma, para algum w ∈ Wi,

com w 6=−→0 , temos

(T ′ − λiI)(w) = 0 · w

isto é,

(T ′ − λiI)(w) =−→0

assim,

T ′(w)− λiw =−→0 ⇒ T ′(w) = λiw.

Portanto, λi é o único autovalor de T ′. Como

(T ′′ − λiI) = (T |Ui− λiI) = (T − λiI)|Ui

= Ti|Ui

é inversível, temos que λi não é autovalor de T ′′, em outras palavras

det(T ′′ − λiI) 6= 0.


Assim concluímos que p′(x) = (x − λi)mi . Como p′(x) é o polinômio

característico de T ′ : Wi → Wi, então concluímos que dim(Wi) = mi,

provando o terceiro item.

Como p(x) = (x− λ1)m1 · · · (x− λr)mr , temos que

dim(V ) = m1 + m2 + · · ·+ mr

Pelo item (iii), obtemos

dim(V ) = dim(W1) + dim(W2) + · · ·+ dim(Wr).

E como Wi ∩ (W1 + · · ·+ Wi−1 + Wi+1 + · · ·+ Wr) = {−→0 }, então

dim(V ) = dim(W1 + W2 + · · ·+ Wr).

Logo,

V = W1 ⊕W2 ⊕ · · · ⊕Wr.

Observe que para um operador T : V −→ V cujo polinômio

característico é da forma p(x) = (x−λ1)m1 · · · (x−λr)mr , tem-se que o

polinômio minimal de T será dado por m(x) = (x−λ1)n1 · · · (x−λr)nr ,

com ni ≤ mi. Assim, pelo Teorema da Decomposição Primária temos

que os subespaços Wi do Teorema 3.4 são os núcleos de (T − λiI)ni .

De acordo com o Teorema 3.4 o espaço vetorial V pode ser

decomposto como uma soma direta de subespaços Wi que satisfazem

os itens (i),(ii) e (iii).

Tomando o operador Ti sendo a restrição de T a Wi, para cada

i = 1, 2, . . . , r, temos que (Ti − λiI) é nilpotente. Observe que os po-

linômios característico e minimal do operador Ti são, respectivamente

p(x) = (x− λi)mi e m(x) = (x− λi)

ni


Segundo o Teorema 3.2, existe uma base γi de Wi tal que

[Ti − λiI]γi=

0 0 · · · 0 0

1 0 · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

isto é,

[Ti ]γi=

λi 0 · · · 0 0

1 λi · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 λi

mi×mi

Podemos reescrever a matriz acima de tal forma que, para ni =

ni1 ≥ ni2 ≥ · · · ≥ nij , sua diagonal é formada por blocos de Jordan,

desta forma

[Ti ]γi=

J(λi, ni1) 0 · · · 0

0 J(λi, ni2) · · · 0...

.... . .

...

0 0 · · · J(λi, nij)

mi×mi

sendo cada bloco dado por

J (λi , nij) =

λi 0 · · · 0 0

1 λi · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 λi

nij×nij

para cada i = 1, . . . , r e j = 1, . . . , ti. Segundo o Teorema 1.3, existe

uma base de V que é a união das bases γi de Wi, ou seja,

γ = γ1 ∪ γ2 ∪ · · · ∪ γr.


E finalmente, obtemos

[T ]γ =

[T1]γ10 · · · 0

0 [T2]γ2· · · 0

......

. . ....

0 0 · · · [Tr]γr

que é dita a forma de Jordan de T .

Pode-se demonstrar que a Forma Canônica de Jordan de um

operador linear é única, a menos da posição dos blocos de Jordan ao

longo da diagonal principal, conforme demonstrado por Lima (2009).

Note que o polinômio minimal de T é dado por

m(x) = (x− λ1)n1 · · · (x− λr)nr

e assim, para cada J(λi, nij) há ao menos um bloco com ordem ni,

sendo que os outros são de ordem menor ou igual a ni. Isto decorre do

fato que o operador (Ti − λiI)ni = 0. E ainda, a soma das ordens dos

J(λi, nij) é mi.

Para identificar quantos blocos J(λi, nij) a matriz do operador

possui, basta observar a multiplicidade geométrica de λi.

Com base nas informações obtidas, temos condições de encon-

trar a Forma de Jordan para qualquer operador T : V → V , sendo

V de dimensão finita. Vale salientar que T pode ser posto na Forma

de Jordan quando seus polinômios característico e minimal são escritos

como um produto de fatores lineares, e isto sempre acontece no corpo

dos complexos.


T (x, y, z) = (2x + 6y − 15z, x + y − 5z, x + 2y − 6z).

O operador T possui a representação matricial na base canônica


da forma

[T ] =

2 6 −15

1 1 −5

1 2 −6

portanto, p(x) = (x + 1)3. As possibilidades para o polinômio minimal

são

m(x) = (x + 1), m(x)(x + 1)2 ou m(x) = (x + 1)3.

Como (T + I) 6= 0 e (T + I)2 = 0, então o polinômio minimal

de T é dado por m(x) = (x + 1)2.

Pelo Teorema da Decomposição Primária temos

R3 = Nuc(T + I)2.

Através do sistema (T + I)(v) =−→0 é possível encontrar dois

autovetores associados a λ = −1, assim a multiplicidade geométrica de

λ = −1 é igual a 2, de modo que haverá dois blocos referentes a este

autovalor. Resolvendo o sistema

3 6 −15

1 2 −5

1 2 −5

x

y

z

=

0

0

0

obtemos os autovetores (−2, 1, 0) e (5, 0, 1).

Precisamos encontrar uma base γ tal que a matriz [T ] esteja

na forma de Jordan. Com isso, conforme o Teorema 3.2, resolvendo o

sistema (T +I)2(v) =−→0 para obter a cadeia de Jordan, encontramos os

autovetores generalizados (1, 0, 0), (0, 1, 0) e (0, 0, 1). Escolhendo v1 =

(1, 0, 0), temos que o vetor (T + I)(v1) = (3, 1, 1) compõe a base γ.

Tomando v2 = (−2, 1, 0), obtemos γ = {(1, 0, 0), (3, 1, 1), (−2, 1, 0)}.

Logo, a matriz [T ]γ é representada por

[T ]γ =

(

−1 0

1 −1

)

(

−1)


nos quais os elementos que não estão indicados são todos nulos.


T (x, y, z, t) = (2x− y + t, 3y − z, y + z,−y + 3t).

O operador T possui representação matricial na base canônica

da forma

[T ] =

2 −1 0 1

0 3 −1 0

0 1 1 0

0 −1 0 3

.

Conforme o exemplo 1.5, temos que os polinômios característico

e minimal de T são dados por

p(x) = (x− 2)3(x− 3) e m(x) = (x− 2)2(x− 3).

Pelo Teorema da Decomposição Primária, o espaço vetorial R4

pode ser escrito como R4 = Nuc(T − 2I)2 ⊕Nuc(T − 3I).

Para λ = 2, encontraremos os vetores que satisfazem a igual-

dade (T − 2I)(v) =−→0 . Resolvendo o sistema

0 −1 0 1

0 1 −1 0

0 1 −1 0

0 −1 0 1

x

y

z

t

=

0

0

0

0

encontramos os autovetores (0, 1, 1, 1) e (1, 0, 0, 0).

Como a multiplicidade algébrica de λ = 2 é igual a 3, diferen-

temente da sua multiplicidade geométrica que é 2, então precisamos

resolver outro sistema para obter um autovetor generalizado, ou seja,

encontrar os vetores que satisfazem a igualdade (T − 2I)2(v) =−→0 .


Resolvendo o sistema

0 −2 1 1

0 0 0 0

0 0 0 0

0 −2 1 1

x

y

z

t

=

0

0

0

0

encontramos os autovetores generalizados (0, 1, 0, 2), (0, 0, 1,−1) e (1, 0, 0, 0).

Escolhendo o vetor v1 = (0, 0, 1,−1), temos pelo Teorema 3.2

que o vetor (T − 2I)(v1) = (−1,−1,−1,−1) compõe a base γ.

Note que teremos dois blocos associados ao autovalor λ = 2,

com isso escolhemos o autovetor v2 = (0, 1, 1, 1).

Para λ = 3, encontraremos um vetor v tal que (T−3I)(v) =−→0 .

Resolvendo o sistema

−1 −1 0 1

0 0 −1 0

0 1 −2 0

0 −1 0 0

x

y

z

t

=

0

0

0

0

encontramos o autovetor v3 = (1, 0, 0, 1). Como a multiplicidade geo-

métrica do autovalor λ = 3 é igual a 1, então há somente um bloco

referente a este autovalor.

Logo, encontramos uma base

γ = {(0, 0, 1,−1), (−1,−1,−1,−1), (0, 1, 1, 1), (1, 0, 0, 1)}

tal que a representação de T nesta base é dada por

[T ]γ =

(

2 0

1 2

)

(

2)

(

3)

que é a forma de Jordan de T .



T (x, y, z, t, w, p) = (2x, x + 2y,−x + 2z, y + 2t, x + y + z + t + 2w, w−p)

cuja representação na base canônica é

[T ] =

2 0 0 0 0 0

1 2 0 0 0 0

−1 0 2 0 0 0

0 1 0 2 0 0

1 1 1 1 2 0

0 0 0 0 1 −1

.

Os polinômios característico e minimal de T são

p(x) = (x− 2)5(x + 1) e m(x) = (x− 2)4(x + 1)

e segue que R6 = Nuc(T − 2I)4 ⊕Nuc(T + I).

Para λ = 2, temos o sistema

0 0 0 0 0 0

1 0 0 0 0 0

−1 0 0 0 0 0

0 1 0 0 0 0

1 1 1 1 0 0

0 0 0 0 1 −3

x

y

z

t

w

p

=

0

0

0

0

0

0

,

que fornece os autovetores (0, 0,−1, 1, 0, 0) e (0, 0, 0, 0, 3, 1).

Através do sistema (T − 2I)4(v) =−→0 , obtemos os autoveto-

res generalizados (−6, 10, 0, 0, 0, 0), (−9, 0, 10, 0, 0, 0), (−9, 0, 0, 10, 0, 0),

(27, 0, 0, 0, 10, 0), (−81, 0, 0, 0, 0, 10). Escolhendo v1 = (−6, 10, 0, 0, 0, 0),

temos que os vetores

v1 = (−6, 10, 0, 0, 0, 0)

(T − 2I)(v1) = (0,−6, 6, 10, 4, 0),

(T − 2I)2(v1) = (0, 0, 0,−6, 10, 4),

(T − 2I)3(v1) = (0, 0, 0, 0,−6,−2)


formam uma cadeia de Jordan para λ = 2.

Como a multiplicidade geométrica é igual a 2, haverá dois blo-

cos associados a λ = 2. Assim, seja v2 = (0, 0,−1, 1, 0, 0).

Para λ = −1, temos o sistema

3 0 0 0 0 0

1 3 0 0 0 0

−1 0 3 0 0 0

0 1 0 3 0 0

1 1 1 1 3 0

0 0 0 0 1 0

x

y

z

t

w

p

=

0

0

0

0

0

0

que fornece o autovetor v3 = (0, 0, 0, 0, 0, 1).

Logo, γ = {(−6, 10, 0, 0, 0, 0), (0,−6, 6, 10, 4, 0), (0, 0, 0,−6, 10, 4),

(0, 0, 0, 0,−6,−2), (0, 0,−1, 1, 0, 0), (0, 0, 0, 0, 0, 1)} e assim a forma de

Jordan de T é

[T ]γ =

2 0 0 0

1 2 0 0

0 1 2 0

0 0 1 2

(

2)

(

1)

.

Exemplo 3.8. Seja T um operador linear cujos polinômios caracterís-

tico e minimal são, respectivamente

p(x) = (x− 5)4(x− 1)3 e m(x) = (x− 5)2(x− 1)2.

Podemos encontrar as possíveis formas de Jordan com as in-

formações dadas.

Se o operador T possui dois autovetores independentes associ-


ados a λ = 5, então sua forma de Jordan é dada por

(

5 0

1 5

)

(

5 0

1 5

)

(

1 0

1 1

)

(

1)

.

No entanto, se possuir três autovetores independentes associa-

dos a λ = 5 sua forma de Jordan será

(

5 0

1 5

)

(

5)

(

5)

(

1 0

1 1

)

(

1)

.

Uma das aplicações da Foma Canônica de Jordan se encontra

na resolução de sistemas de equações diferenciais lineares. Ao estudar o

caso geral da equação diferencial linear x′ = Ax, onde A é uma matriz

de ordem n×n, temos que a solução geral do problema de valor inicial

(PVI) linear{

x′ = Ax

x(0) = x0

é dada por x(t) = eAtx0. Assim, para obtermos a solução do sistema

é necessário calcular a matriz eAt, cuja obtenção é simplificada com o

uso da Forma Canônica de Jordan, como veremos no exemplo abaixo.

Exemplo 3.9. Seja o PVI da forma{

x′(t) = Ax(t)

x(0) = x0


sendo

A =

3 0 0

1 4 1

2 3 6

e x0 =

1

2

−1

Primeiramente, verificamos que a forma de Jordan de A, que

denotaremos por J e com os polinômios característico e minimal da

forma pA(x) = mA(x) = (x− 3)2(x− 7), é dada por

J =

(

3 0

1 3

)

(

7)

associada a base γ = {(4, 0,−3), (0, 1,−1), (0, 1, 3)}. Assim, a matriz P

de mudança de base, tal que J = P−1AP , é igual a

P =

4 0 0

0 1 1

−3 −1 3

.

Para determinar a solução x(t) = eAtx0, precisamos calcular

a matriz eAt. Para isso, conforme Figueiredo e Neves (2008), algumas

propriedades são necessárias:

1) Se P é uma matriz inversível então,

eP−1AP = P−1eAP.

2) AB = BA se, e somente se e(A+B)t = eAteBt, para todo t.

3) Usando a propriedade 2 e a expansão em série de MacLaurin

eA =

∞∑

i=0

Ai

i!,


temos

eJ(λi,ni)t = e(λiI+Ni)t = eλiteNit

= eλit

(

I + Nit +N2

i

2!t2 + · · ·+

Nni−1i

(ni − 1)!tni−1

)

= eλit

1 0 0 0 0

t 1 0 0 0t2

2! t 1 0 0...

.... . .

. . ....

tni−1

(ni−1)!tni−2

(ni−2)! · · · t 1

ni×ni

(3.6)

onde Ni é uma matriz nilpotente do tipo

Ni =

0 0 · · · 0 0

1 0 · · · 0 0

0 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

ni×ni

Note que a série∞∑

i=0

Ai

i!é a soma de infinitos termos, porém se a matriz

A for nilpotente esta soma se torna finita, pois a partir de uma certa

potência a matriz se anula. Portanto, a exponencial eP−1AP é formada

por blocos do tipo 3.6.

Observe que os blocos de Jordan de A são

J(3, 2) =

(

3 0

1 3

)

e J(7, 1) = (7) .

Conforme as propriedades acima, temos

eJ(3,2)t = e(3I+N1)t = e3It+N1t = e3teN1t

= e3t

(

1 0

t 1

)

=

(

e3t 0

te3t e3t

)


e

eJ(7,1)t = e(7I+N2)t = e7It+N2t = e7teN2t

= e7t(1)

= (e7t).

Logo,

eJt =

e3t 0 0

te3t e3t 0

0 0 e7t

.

Com as informações obtidas, temos condições de encontrar a

matriz eAt. Assim,

eAt = PeJtP−1

=

4 0 0

0 1 1

−3 −1 3

e3t 0 0

te3t e3t 0

0 0 e7t

14 0 0

− 316

34 −1

43

1614

14

=

e3t 0 0te3t

4 − 3e3t

16 + 3e7t

163e3t

4 + e7t

4 − e3t

4 + e7t

4

− 3e3t

4 − te3t

4 + 3e3t

16 + 9e7t

16 −3e3t

4 + 3e7t

4e3t

4 + 3e7t

4

Logo, a solução geral do sistema de equações diferenciais é dada

por

x(t) =

e3t 0 0te3t

4 − 3e3t

16 + 3e7t

163e3t

4 + e7t

4 − e3t

4 + e7t

4

−3e3t

4 − te3t

4 + 3e3t

16 + 9e7t

16 − 3e3t

4 + 3e7t

4e3t

4 + 3e7t

4

1

2

−1

=

e3t

te3t

4 + 25e3t

16 + 7e7t

16

−13e3t

16 − te3t

4 + 21e7t

16

.

93

CONCLUSÃO

O curso de Licenciatura em Matemática permite ao acadêmico

uma visão de várias áreas da matemática. E este trabalho teve como

um dos seus objetivos ampliar os conhecimentos referentes à Álgebra

Linear. A construção da Forma Canônica de Jordan requer o estudo

destes conhecimentos, para atingir tal objetivo se explorou alguns con-

ceitos não abordados na graduação. Dentre eles, o estudo relativo aos

operadores não diagonalizáveis.

A Forma Canônica de Jordan possibilita uma representação

matricial de um operador linear não diagonalizável de maneira mais

simples possível, visto que este operador não possui uma base cons-

tituída por autovetores, assim não podendo ser representado por uma

matriz diagonal. No entanto, através de uma base constituída por auto-

vetores generalizados, este operador possui uma representação matricial

formada por blocos de Jordan.

Os operadores nilpotentes são de suma importância para a

forma de Jordan, pois por meio deles a existência da forma de Jor-

dan pode ser estendida para qualquer operador linear, quando este

possui polinômios característico e minimal escritos como um produto

de fatores lineares.

Com isso, a forma de Jordan tem aplicabilidade na resolução

de sistemas de equações diferenciais de primeira ordem. A resolução

se torna simples quando a matriz dos coeficientes deste sistema for

diagonalizável. Porém, quando esta matriz não é diagonalizável, pode-

se reduzir o sistema a outro equivalente, cuja nova matriz esta na Forma

de Jordan.

As pesquisas realizadas neste trabalho despertaram o interesse

em aprofundar ainda mais o conhecimento a respeito da Forma de Jor-

94 Conclusão

dan, de outras formas canônicas existentes e suas aplicações.

95

Referências

BUENO, H. P. Álgebra linear: Um segundo curso. Rio de Janeiro:

IMPA, 2006.

COELHO, F. U.; LOURENÇO, M. L. Um curso de álgebra linear. 2.ed.

São Paulo; EDUSP, 2010.

FIGUEIREDO, D. G.; NEVES, A. F. Equações Diferenciais Aplicadas.

3. Ed. Rio de Janeiro: IMPA, 2009.

HOFFMAN, K; KUNZE, R. Linear Algebra. 2. ed. Rio de Janeiro:

Prentice Hall, 1971.

LANG, S.; JUTUCA, L. P. S. G. Álgebra linear. Rio de Janeiro: Ciência

Moderna, 2003.

LIMA, E. L. Álgebra Linear. 7. ed. Coleção Matemática Universitária.

Rio de Janeiro: IMPA, 2009.

LIPSCHUTZ, S; LIPSON, M. Álgebra Linear. 4.ed. Coleção Schaum.

Porto Alegre: Bookman, 2011.

PELLEGRINI J. C.. Álgebra Linear - notas de aula - versão 114. Dispo-

nível em <http://aleph0.info/cursos/al/notas/al.pdf>. Data de acesso:

12 de junho de 2015.

Apêndices

99

APÊNDICE A – PROPRIEDADES

Para a resolução do sistema de equações diferenciais do exem-

plo 3.9, foram utilizadas algumas propriedades, sendo duas delas de-

monstradas a seguir.

Propriedade A.1. Se P é uma matriz inversível então,


Demonstração: Utilizado a expansão em série de MacLaurin

eA =∞∑

i=0

Ai

i!,

temos que

eP−1AP =

∞∑

i=0

(P−1AP )i

i!

Como (P−1AP )i = P−1AiP , segue que

eP−1AP =∞∑

i=0

(P−1AP )i

i!

=∞∑

i=0

P−1AiP

i!

= P−1

(

∞∑

i=0

Ai

i!

)

P

= P−1eAP.

Logo,


100 APÊNDICE A. PROPRIEDADES

Propriedade A.2. AB = BA se, e somente se e(A+B)t = eAteBt, para

todo t.

Demonstração: (⇒) Precisamos mostrar que x1(t) = eAteBt

e x2(t) = e(A+B)t satisfazem o PVI dado por x′(t) = (A+B)x2(t), com

x(0) = I. Pela regra do produto, segue que

x′1(t) = AeAteBt + eAtBeBt. (A.1)

Observe que eAtB = BeAt, pois

eAtB =

∞∑

i=0

(At)i

i!B

= I ·B + At ·B +A2t2

2·B + · · ·+

Antn

n·B.

Como as matrizes A e B comutam, segue que

eAtB = B · I + B ·At + B ·A2t2

2+ · · ·+ B ·

Antn

n

= B∞∑

i=0

(At)i

i!

= BeAt.

Retornando para a equação A.1, obtemos

x′1(t) = AeAteBt + BeAteBt

= (A + B)eAteBt.

Pela unicidade de solução de equações diferenciais, temos que

e(A+B)t = eAteBt.

(⇐) Derivando ambos os lados da igualdade e(A+B)t = eAteBt, obtemos

(A + B)e(A+B)t = AeAteBt + eAtBeBt.

Derivando novamente, obtemos

(A + B)2e(A+B)t = A2eAteBt + AeAtBeBt + AeAtBeBt + eAtB2eBt.

101

Fazendo t = 0, temos

(A + B)2 = A2 + AB + AB + B2

(A + B)(A + B) = A2 + 2AB + B2

A2 + AB + BA + B2 = A2 + 2AB + B2

AB + BA = 2AB

BA = AB.

Logo, as matrizes A e B comutam.

jéssica neckel cavalheiro a forma canônica de jordan

Documents

Transcript of jéssica neckel cavalheiro a forma canônica de jordan