5 Supressão de ruído por decomposição wavelet
Transcript of 5 Supressão de ruído por decomposição wavelet
5 Supressão de ruído por decomposição wavelet
A decomposição a partir de funções de base especialmente selecionadas é
uma poderosa ferramenta de análise e síntese de sinais. A teoria mais
representativa desse tipo de abordagem é a decomposição de Fourier, que tem
como funções de base funções harmônicas. Entretanto, a teoria de Fourier não é a
mais apropriada para o tratamento de sinais cuja resposta ao impulso seja variante
no tempo. Essa limitação motivou diversos pesquisadores ao longo do século
passado, a buscarem conjuntos de funções de base alternativas às de Fourier.
Na teoria de Fourier, as funções de base têm um escopo “global”, ou seja,
estendem-se ao longo de todo o domínio de análise original (temporal). É essa
característica que torna a análise de Fourier inadequada ao tratamento de sinais
com resposta ao impulso variante no tempo. As teorias desenvolvidas para
caracterizar esses sinais propõem o uso de funções de base com escopo
“localizado” em ambos os domínios. A análise de Fourier em intervalos curtos de
tempo (STFA – “Short Time Fourier Analysis”), a análise por distribuições de
Wigner Ville e a análise por wavelets são teorias que permitem a análise conjunta
temporal-frequencial [31]. Cada teoria apresenta um diferencial com relação às
demais, e a escolha da teoria mais adequada depende de certas condições
associadas ao sinal analisado, bem como do tipo de informação que se deseje
extrair. Entretanto, apesar de ser relativamente nova, é fácil constatar na literatura
que a teoria de wavelets em particular tem sido aplicada a um número cada vez
maior de problemas ligados direta ou indiretamente à área de processamento de
sinais.
A crescente popularidade da teoria de wavelets e a quase ausência de
publicações associando essa teoria a problemas de estimação do canal de
propagação rádio-móvel motivaram uma das propostas desta tese. De fato, apenas
algumas poucas referências foram encontradas associando os dois campos de
interesse, estimação espectral espacial-temporal e teoria de wavelets. Mais ainda,
até o momento as possibilidades de aplicação direta da teoria de wavelets não se
5 Supressão de ruído por decomposição wavelet 102
mostraram atraentes o suficiente para compensar o maior esforço computacional
resultante, entre outras contrapartidas. Por outro lado, houve motivação para uma
aplicação “indireta” da teoria de wavelets. A supressão de ruído baseada em
decomposição por wavelets foi concebida como alternativa a um procedimento de
pós-processamento de PDPs. O capítulo seguinte apresenta os resultados dessa
aplicação em dois conjuntos distintos de PDPs gerados a partir de sondagens de
canal faixa-larga disponíveis [8-10].
Do exposto, este capítulo tem por objetivo apresentar inicialmente conceitos
fundamentais sobre wavelets. Em seguida, um breve resumo sobre algumas
aplicações diretas da teoria de wavelets ao problema da estimação espectral
espacial-temporal é apresentado, ainda que não tenham se mostrado tão
promissoras quanto o esperado. Por fim, a aplicação específica da teoria de
wavelets de maior interesse nesta tese é detalhada: a supressão de ruído.
5.1. Fundamentos da teoria de wavelets
Sob um ponto de vista histórico, a análise por wavelets é um novo método,
apesar de sua fundamentação matemática ter sido derivada do trabalho de Joseph
Fourier no século XIX. Fourier estabeleceu aquela base com suas teorias sobre
análise frequencial, comprovadamente de grande importância e influência.
A atenção de pesquisadores foi gradualmente migrando da análise baseada
em freqüência para a análise baseada em “escala”, que é a abordagem da análise
por wavelets, quando começou a ficar claro que uma abordagem medindo
flutuações médias em escalas diferentes levava a uma menor sensibilidade ao
ruído.
A primeira menção ao que hoje é chamado de wavelet parece ter sido de
1909, em uma tese de Alfred Haar. O conceito de wavelets na sua forma teórica
atual foi proposto pela primeira vez por Jean Morlet e pela equipe de
pesquisadores de Alex Grossman trabalhando no Centro de Física Teórica de
Marseille na França.
Os métodos de análise por wavelets foram desenvolvidos principalmente por
Y. Meyer e seus colegas, que asseguraram a disseminação dos métodos. O
algoritmo principal é da época do trabalho de Stephane Mallat em 1988. Desde
então, a pesquisa em wavelets se tornou internacional. Tal pesquisa é
5 Supressão de ruído por decomposição wavelet 103
particularmente ativa nos EUA, graças ao trabalho de cientistas como Ingrid
Daubechies, Ronald Coifman e Victor Wickerhauser [32].
O domínio wavelet tem crescido rapidamente. Diversos artigos matemáticos
e tentativas de aplicações práticas são publicadas todos os meses [33]. No que diz
respeito ao campo do processamento de sinais propriamente dito, as aplicações
incluem: detecção de descontinuidades e pontos de quebra; análises específicas
dos comportamentos de curto e longo prazo; identificação frequencial (ainda que
não tão direta e facilmente como a teoria de Fourier, mas com a vantagem de
poder acompanhar variações com o tempo); supressão de sinais; supressão de
ruído; e compactação. Em particular, estas duas últimas parecem ser as aplicações
mais comuns da teoria de wavelets atualmente. Entretanto, é fácil constatar que à
medida que a teoria vem sendo difundida e compreendida, novas aplicações vêm
surgindo nas mais diversas áreas.
Um dos grandes atrativos da teoria de wavelets é a capacidade de analisar
sinais com espectro variante no tempo. Tradicionalmente, os sinais são estudados
ou como função do tempo, ou como função da freqüência. Entretanto, a maioria
dos sinais encontrados na prática apresentam espectros variantes no tempo, como
por exemplo tons de música. Na Natureza, poucos sinais possuem conteúdo
frequencial que não mude ao longo do tempo. Em várias aplicações práticas,
caracterizar o sinal simultaneamente nos domínios temporal e frequencial é de
grande utilidade, como no processamento de sinais de voz [31].
Para compreender melhor o conceito fundamental da teoria de wavelets, é
interessante inicialmente relembrar resumidamente os fundamentos da análise de
Fourier, que decompõe um sinal em componentes senoidais de diferentes
freqüências. Tal decomposição é o que permite a análise do espectro de
freqüências do sinal, como ilustrado na Figura 26.
Figura 26 Transformada de Fourier de um sinal.
5 Supressão de ruído por decomposição wavelet 104
Embora para muitos sinais a análise de Fourier seja extremamente útil, ela
apresenta uma séria contrapartida, conforme previamente mencionado. A
transformação espectral acarreta perda total da informação temporal do sinal, e
vice-versa com a transformação inversa. Se as propriedades do sinal não se
modificam substancialmente ao longo do tempo – mais especificamente, se o sinal
for estacionário – esta contrapartida não é muito relevante. Entretanto, a maioria
dos sinais de interesse contém diversas características transitórias ou não-
estacionárias: desvios; tendências; mudanças bruscas; e começos e términos de
eventos. Estas características são eventualmente as mais importantes do sinal, mas
nesses casos, a análise de Fourier não é adequada para detectá-las.
Num esforço para sobrepor a limitação previamente citada, em 1946 Dennis
Gabor propôs uma adaptação à transformada de Fourier, em que apenas uma
pequena seção do sinal em um dado instante era analisada – uma técnica chamada
de “janelamento” do sinal. A adaptação de Gabor, chamada Transformada de
Fourier em Intervalos Curtos (Short-Time Fourier Transform – STFT) mapeia um
sinal em uma função bi-dimensional do tempo e da freqüência, conforme ilustrado
na Figura 27. O janelamento temporal traz consigo uma incerteza associada à
precisão da análise, que não havia na transformada Fourier convencional. Essa
imprecisão se manifesta em uma relação de compromisso entre a resolução
frequencial e a capacidade de acompanhar as variações espectrais ao longo do
tempo. Além disso, quanto menor a largura da janela, maior o esforço
computacional necessário para realizar a análise espectral do sinal. Na STFT, a
largura da janela temporal é fixa para um dado sinal analisado. Com isso, o grau
de incerteza associado ao janelamento é o mesmo para todo o espectro conjunto
frequencial-temporal.
Figura 27 Transformada de Fourier em intervalos curtos (STFT) de um sinal.
5 Supressão de ruído por decomposição wavelet 105
Há muitos casos em que a análise de um determinado sinal prioriza faixas
específicas do espectro, dando menor importância para o restante do conteúdo
frequencial. Para explorar melhor essa situação, seria interessante uma
transformação que flexibilizasse a largura da janela temporal, aplicando janelas
mais estreitas às áreas espectrais desejadas, e aumentando a largura para o
espectro de menor interesse. Uma das técnicas que permite essa abordagem
diferenciada é a análise por wavelets.
Uma das estratégias de janelamento temporal mais utilizadas na análise por
wavelets é a que aplica as menores larguras ao conteúdo de alta freqüência
(intimamente associado às variações rápidas), e as maiores larguras ao conteúdo
espectral baixo (variações lentas). A Figura 28 ilustra o conceito em questão, onde
a “escala” é interpretada como uma grandeza inversamente proporcional à
freqüência.
Figura 28 Transformada de wavelet de um sinal.
Mas o que seria afinal uma wavelet? Uma wavelet é uma forma de onda de
duração limitada e que possui um valor médio igual a zero. A comparação inicial
inevitável é a de uma wavelet com uma senóide, que é a base da análise de
Fourier. Senóides são ilimitadas no tempo – elas se estendem de –∞ a +∞. Mais
ainda, enquanto senóides são suaves e previsíveis, wavelets tendem a ser
irregulares e assimétricas. A Figura 29 ilustra essas diferenças.
5 Supressão de ruído por decomposição wavelet 106
Figura 29 Comparação entre uma senóide e uma wavelet (db10).
A análise de Fourier consiste em decompor um sinal em ondas senoidais de
várias freqüências. De forma análoga, a análise por wavelets é a decomposição de
um sinal em versões “deslocadas” e “escalonadas” da wavelet original (ou
“wavelet mãe”). Ao observar ilustrações de wavelets e ondas senoidais, como as
da Figura 29, deduz-se intuitivamente que sinais com mudanças abruptas são
potencialmente melhor analisados com uma típica e irregular wavelet que com
uma suave senóide, assim como certos alimentos são melhor manuseados com um
garfo que com uma colher. Formalmente falando, a maioria das wavelets de
interesse são funções ditas “localizadas”6 tanto no tempo quanto em escala
(freqüência). É essa característica das wavelets que viabiliza aplicações como a
compactação do sinal, a focalização da análise para uma região específica de
interesse do espectro variante no tempo, ou ainda a localização das áreas de maior
concentração de energia, entre outras.
O tratamento analítico para a análise por wavelets inclui a transformada
contínua de wavelet, assim como a discreta, além de suas respectivas
transformadas inversas. A transformada contínua traz consigo uma grande
redundância de informações sobre o sinal analisado, o que a torna
computacionalmente desinteressante. Via de regra, a transformada discreta é
utilizada, seja em sua versão mais simples na chamada “análise de multi-
resolução”, seja na versão que permite um detalhamento personalizado do
espectro, que é a “análise por pacotes”.
6 Um sinal é dito “localizado” em torno de um ponto se sua energia está concentrada nas
proximidades do referido ponto.
5 Supressão de ruído por decomposição wavelet 107
5.1.1. Transformada contínua de wavelet
O tratamento analítico da transformada contínua de wavelet guarda
semelhanças com o da análise de Fourier, cuja transformada é representada por:
(5.1) ( ) ( )∫∞
∞−
−= dtetfF tjωω
que é a soma sobre todo o domínio temporal do sinal f(t) multiplicado por uma
exponencial complexa (que pode ser decomposta em componentes senoidais reais
e imaginárias).
Os resultados da transformada são os coeficientes de Fourier F(ω), que
quando multiplicados por uma senóide de freqüência ω, compreendem as
componentes constituintes do sinal original. A Figura 30 ilustra o referido
processo de decomposição.
Figura 30 Decomposição de um sinal em suas componentes senoidais constituintes por
transformada de Fourier.
Analogamente, a transformada contínua de wavelet (CWT – Continuous
Wavelet Transform) é definida como a soma sobre todo o domínio temporal do
sinal multiplicado por versões escalonadas e deslocadas da função wavelet ψ:
(5.2) ( ) ( ) ( )∫∞
∞−
= dttbatfbaC ,,, ψ
onde os parâmetros a e b correspondem aos fatores de escala e de deslocamento
(posição), respectivamente.
5 Supressão de ruído por decomposição wavelet 108
O resultado da CWT são diversos coeficientes wavelet C, que são função da
escala e da posição. Multiplicando-se cada coeficiente pela wavelet
correspondente apropriadamente escalonada e deslocada, obtém-se as wavelets
constituintes do sinal original, conforme ilustrado na Figura 31.
Figura 31 Decomposição de um sinal em suas componentes wavelets constituintes por
CWT.
A análise por wavelets produz uma visão tempo-escala de um sinal.
Conforme previamente mencionado, as escalas tem associação inversa com as
freqüências de um sinal. Basicamente, escalonar uma wavelet significa alongá-la
ou comprimí-la. A ilustração da Figura 32 exemplifica o escalonamento de uma
wavelet, onde a é o fator de escala.
Figura 32 Ilustração do escalonamento de uma wavelet.
Se a função wavelet for definida como uma senóide de freqüência ω por
exemplo, verifica-se facilmente que o fator de escala a é exatamente o inverso de
ω. De modo geral portanto, a escala está relacionada ao conteúdo frequencial do
sinal na análise por wavelets.
5 Supressão de ruído por decomposição wavelet 109
Deslocar uma wavelet significa simplesmente acrescentar um retardo, como
no exemplo da Figura 33.
Figura 33 Ilustração do deslocamento de uma wavelet.
Portanto, a CWT é a soma sobre todo o domínio temporal da multiplicação
do sinal por versões escalonadas e deslocadas de uma wavelet apropriadamente
escolhida. Este processo produz coeficientes wavelet C que são função de escala e
posição (tempo). Quanto maior C, maior a similaridade entre a wavelet e a seção
do sinal que está sendo tomada para o cálculo do coeficiente. Mais precisamente,
se a energia do sinal e a energia da wavelet forem unitárias, C pode ser
interpretado como um coeficiente de correlação. Obviamente os resultados
dependem da forma da wavelet escolhida.
Os coeficientes calculados para as diferentes escalas em diferentes seções do
sinal devem ser agrupados de maneira ordenada, particularmente quando se deseja
visualizar esses resultados em um gráfico. A Figura 34 por exemplo, ilustra um
gráfico típico, onde o eixo horizontal representa os deslocamentos de tempo, o
eixo vertical a escala, e a magnitude do coeficiente wavelet é representada por
uma escala de cores. Alternativamente, pode-se optar por um gráfico 3D como o
da Figura 35.
Figura 34 Gráfico típico de uma CWT de um sinal, usando escala de cores para
representar a magnitude dos coeficientes wavelet.
5 Supressão de ruído por decomposição wavelet 110
Figura 35 Gráfico típico de uma CWT de um sinal, usando um terceiro eixo ortogonal
para representar a magnitude dos coeficientes wavelet.
5.1.2. Transformada discreta de wavelet – análise de multi-resolução
Na CWT, o conjunto de escalas e posições (deslocamentos) nas quais ela é
operada é contínuo. A CWT pode operar em qualquer escala, desde a
correspondente ao tamanho do sinal original até uma escala pequena o suficiente
para ponderar variações dentro de um limite de resolução associado à medição do
sinal original, por exemplo. Da mesma forma, a CWT é contínua em termos de
deslocamento durante o cálculo dos coeficientes, pois a wavelet analisadora é
deslocada suavemente sobre todo o domínio temporal do sinal analisado.
Via de regra, qualquer processamento de sinal realizado em um computador
utilizando dados coletados experimentalmente deve ser executado em um sinal
discreto na prática. Além disso, calcular coeficientes wavelet para um número
muito grande de escalas é uma tarefa que gera um volume enorme de dados. Uma
estratégia computacionalmente mais eficiente e atraente seria a escolha de apenas
um sub-conjunto de escalas e posições específicas para as quais os coeficientes
devem ser calculados. Adotando-se essa estratégia genérica, a transformada de
wavelet deixa de ser contínua para ser discreta.
Um dos esquemas de transformação discreta mais utilizados dentre os
disponíveis na literatura opera com escalas e posições baseadas em potências de 2
(dois) – as chamadas escalas e posições “diádicas”. Tal esquema foi organizado na
maneira como se conhece atualmente por Mallat em 1988, que enxergou uma
5 Supressão de ruído por decomposição wavelet 111
analogia bastante apropriada entre o algoritmo de decomposição diádico (análise
de multi-resolução) e o uso de um banco de filtros, conceito este oriundo da teoria
geral de processamento de sinais. Por ser provavelmente o esquema de
decomposição mais conhecido e empregado, o termo “transformada discreta de
wavelet” (DWT – Discrete Wavelet Transform) se refere especificamente ao
algoritmo de Mallat, embora outros esquemas de transformação discreta existam.
Embora historicamente a análise de multi-resolução preceda a DWT, para o
escopo deste texto o entendimento da última é mais conveniente num primeiro
estágio. Compreendido o conceito da DWT a partir do conceito do banco de
filtros, a associação com os principais conceitos e equações da análise de multi-
resolução será apresentada em seguida.
A DWT divide o sinal analisado em componentes de alta escala e baixa
escala. As primeiras são chamadas de “aproximações”, já que correspondem ao
conteúdo de baixa freqüência do sinal. As variações rápidas do sinal são chamadas
de “detalhes”. No seu nível mais básico, o processo de filtragem que gera a
divisão mencionada pode ser entendido através da ilustração da Figura 36. O sinal
original (S) é decomposto por dois filtros complementares. O filtro passa-baixas
gera a componente de aproximações (A), enquanto o passa-altas gera a
componente de detalhes (D).
Figura 36 Filtragem de um estágio para geração de aproximações (A) e detalhes (D) de
um sinal (S).
O resultado de uma DWT apresentaria portanto duas vezes mais dados que o
sinal original, o que seria um retrocesso em termos de eficiência computacional.
Supondo, por exemplo, que o sinal original S consista de 1000 amostras, então os
5 Supressão de ruído por decomposição wavelet 112
sinais resultantes da filtragem terão cada um também 1000 amostras, ou seja, a
decomposição resultaria num total de 2000 amostras. Para compensar o esforço
extra indesejável, a decomposição é realizada reduzindo-se a taxa de amostragem
(downsampling) na mesma proporção que o número de decomposições, ou seja,
dois no caso em questão, como na ilustração da Figura 37.
Figura 37 Decomposição por filtragem de um estágio: sem e com downsampling.
Para exemplificar o processo, seja um sinal senoidal puro com ruído
adicionado. A DWT deste sinal (S) produz as componentes cD (detalhes) e cA
(aproximações), conforme ilustrado na Figura 38. Observa-se que os coeficientes
da componente cD são pequenos e consistem essencialmente de ruído, enquanto
que os coeficientes da componente aproximações cA contém muito menos ruído
que o sinal original.
Figura 38 DWT de um estágio para um sinal senoidal com ruído.
O processo de decomposição da DWT pode ser repetido, sempre atuando
sobre as componentes de aproximações. Sucessivas decomposições geram a
5 Supressão de ruído por decomposição wavelet 113
chamada “árvore de decomposição wavelet”, como ilustrado na Figura 39. O
limite máximo de decomposições corresponde ao nível em que a componente de
detalhes consista de apenas uma amostra. O limite prático entretanto costuma ser
selecionado com base na natureza do sinal, ou em um critério mais específico tal
como o da entropia.
Figura 39 Árvore de decomposição wavelet – um exemplo.
A DWT implementa na forma de um banco de filtros a chamada “análise de
multi-resolução” (MRA – Multi-Resolution Analysis). A MRA permite analisar
um sinal em vários níveis de resolução, e é formalmente representada por uma
seqüência crescente de subespaços fechados Vn (n inteiro) de funções
quadraticamente integráveis definidas no corpo dos números reais, onde cada
subespaço Vj-1 ⊂ Vj. Para o equacionamento da MRA, define-se inicialmente a
chamada “função de escalonamento” (scaling function) ϕ(x) ∈ V0, cujas
translações inteiras geram este subespaço. Considerando-se as relações entre os
subespaços funcionais, verifica-se que as funções de base de um subespaço Vj
podem ser expressas como combinação linear das funções de base do espaço Vj+i,
para i > 0. Em particular, para j = 0 e i = 1,existem coeficientes {he(k)} tais que:
( ) ( ) ( kxkhxk
e −= ∑ 22ϕϕ ) (5.3)
5 Supressão de ruído por decomposição wavelet 114
A raiz quadrada na expressão acima decorre da relação diádica entre os
subespaços sucessivos, mas também do interesse em se obter bases ortonormais
para todos subespaços funcionais.
A eq. (5.3) é fundamental para a MRA e é normalmente referida como
“equação de refinamento” ou “equação de escalonamento”. O conjunto de
coeficientes {he(k)} pode ser encarado como os pesos de um filtro, comumente
chamado de “filtro de escalonamento”.
Generalizando a equação mediante a combinação dos operadores de
translação e escalonamento, pode-se obter as funções do subespaço Vj a partir das
funções de base de V0, ou seja:
( ) ( )kxx jjkj −= 22 2/
, ϕϕ (5.4)
Voltando ao conceito dos subespaços funcionais hierarquizados em escala
crescente, um subespaço Vj+1 pode ser gerado pelo subespaço de nível inferior Vj
somado a seu complemento ortogonal Wj. Em outras palavras, este subespaço terá
funções de base ψj,k ortogonais às funções de base ϕj,k do subespaço
complementar. Com isso, analogamente à definição da equação de escalonamento,
chamando ψ de “função wavelet”, com ψ ∈ W0, como W0 ⊂ V1, existem
coeficientes {hw(k)} tais que:
( ) ( ) ( kxkhxk
w −= ∑ 22ϕψ ) (5.5)
Assim como considerado para a função de escalonamento, os coeficientes {hw(k)}
são convenientemente associados aos pesos de um filtro denominado “filtro
wavelet”. Sob a mesma analogia, a partir da função wavelet pode-se gerar uma
classe de funções com operações de translação e escalonamento dadas por:
( ) ( )kxx jjkj −= 22 2/
, ψψ (5.6)
Resumindo, o problema genérico de decomposição discreta de um sinal
S(x), dado por:
5 Supressão de ruído por decomposição wavelet 115
(5.7) ( ) ( )∑∑=k j
kjkj xaxS ,, ψ
pode ser resolvido segundo a abordagem da DWT, que se baseia na análise de
multi-resolução, como em:
(5.8) ( ) ( ) ( )∑∑∑∞
=
+=k jj
kjkjk
kjkj xdxcxS0
,,,0,0 ψϕ
onde os coeficientes cj,k e dj,k de decomposição do sinal são calculados como o
resultado da filtragem do sinal por um banco de filtros, cujos pesos devem ser
computados a partir de uma função de escalonamento adequadamente escolhida (e
de sua ortogonal wavelet). Na eq. (5.8), o termo associado à função escalonadora
corresponde à componente de aproximações, enquanto que o termo restante está
associado aos detalhes. A decomposição no primeiro nível divide o sinal em duas
componentes independentes – aproximações (A1) e detalhes (D1), de modo que
S(x) = A1 + D1. Usando o conceito dos subespaços complementares sobre cada
componente de aproximações Ai calculada sucessivamente para cada nível i, a
árvore de decomposição wavelet exemplificada na Figura 39 vai se expandindo,
permitindo uma análise cada vez mais detalhada do sinal. Para i decomposições, o
sinal pode ser representado mais compactamente por:
(5.9) ( ) ∑=
+=i
jji DAxS
1
5.1.3. Análise por pacotes wavelet
O método por pacotes wavelet é uma generalização da DWT que oferece
uma gama mais rica de possibilidades para a análise de sinais. Na DWT, um sinal
é decomposto em uma componente de aproximações e uma de detalhes. A
primeira por si só é então decomposta em aproximações e detalhes de segundo
nível, e o processo se repete, como ilustrado na Figura 40. Para n níveis, a DWT
oferece n + 1 possibilidades de decomposição do sinal.
5 Supressão de ruído por decomposição wavelet 116
Figura 40 DWT de 3 níveis de um sinal.
Na análise por pacotes wavelet, os detalhes também podem ser
decompostos. Isto compreende mais de maneiras diferentes para decompor o
sinal. Tem-se então a chamada “árvore de decomposição por pacotes wavelet”,
como ilustrado na Figura 41. A árvore de decomposição wavelet da DWT (Figura
39) corresponde a apenas um ramo da árvore binária completa.
122−n
Figura 41 Árvore de decomposição por pacotes wavelet – diagrama de níveis.
Por exemplo, a análise por pacotes wavelet permite que o sinal S seja
representado como a soma das componentes A1 + AAD3 + DAD3 + DD2 (Figura
41). Este é um exemplo de representação que não é possível com a DWT.
Escolher uma dentre todas as possíveis codificações corresponde por si só a
um problema adicional a ser resolvido. Um dos critérios existentes baseia-se no
conceito de entropia para selecionar a decomposição mais adequada de um sinal
dado. Neste método, cada nó da decomposição é observado e quantifica-se o
ganho de informação associado.
Existem algoritmos simples e eficientes tanto para decomposição por
pacotes wavelet quanto para seleção ótima do ramo de decomposição. Coifman e
5 Supressão de ruído por decomposição wavelet 117
Wickerhauser propuseram um algoritmo de filtragem adaptativa, com
aplicabilidade direta em codificação ótima de sinais e compressão de dados. Tais
algoritmos permitem otimizar a decomposição tanto globalmente quanto
localmente com respeito a cada nó.
5.1.4. Algumas funções wavelet especiais e suas propriedades
Dentre os diversos fatores que impulsionaram a difusão da teoria de
wavelets nos últimos anos, destacam-se os estudos que introduzem funções ou
famílias de funções apropriadas para serem utilizadas como wavelets. A Figura 42
apresenta alguns exemplos de funções wavelet e suas funções escalonadoras
associadas. As famílias de funções são comumente representadas pela abreviação
do pesquisador que as desenvolveram (“coif” para Coifman ou “db” para
Daubechies) ou de alguma denominação dada (“sym” para Symlets), seguido por
um número que costuma representar uma característica da função. Como
característica geral, observa-se que todas as funções decaem rapidamente para
zero. As wavelets Morlet e “chapéu mexicano” não possuem escalonadoras e são
simétricas. A wavelet Haar é a única função descontínua, com três pontos de
descontinuidade. As funções wavelet oscilam mais que suas escalonadoras
associadas. A wavelet coif2 exibe alguns pontos angulares. As wavelets db6 e
sym6 são bastante suaves.
5 Supressão de ruído por decomposição wavelet 118
Figura 42 Algumas funções wavelet e suas escalonadoras associadas.
Há diferentes tipos de famílias de funções wavelet, cujas qualidades variam
de acordo com diversos critérios. Um dos aspectos relevantes é o comprimento
(também chamado de “suporte”) das funções wavelet e escalonadora, bem como
de suas respectivas transformadas de Fourier. Mais especificamente, a velocidade
de convergência para zero dessas funções à medida que o tempo (ou a freqüência
no caso das transformadas) tende para infinito, quantifica a capacidade de
localização da função (no tempo ou na freqüência). Outro aspecto importante é a
simetria, especialmente em aplicações como processamento de imagens, para as
quais é desejável evitar a perda de fase do sinal analisado.
O número que costuma acompanhar a designação compacta de uma wavelet
(como em “db6” por exemplo) corresponde ao número de momentos nulos
(vanishing moments) da função. Esta propriedade é especialmente importante para
aplicações de compressão de sinais, bem como de supressão de sinais.
Outra propriedade importante é a regularidade, que pode ser inclusive
quantificada. Para um sinal f diferenciável continuamente no tempo até a ordem s
5 Supressão de ruído por decomposição wavelet 119
em um ponto x0, sendo s um inteiro ≥ 0, a sua regularidade é definida por s. Se a
derivada de ordem m da função f se assemelha a rxx 0− localmente ao redor de
x0, então a regularidade s é dada por s = m + r, com 0 < r < 1. A regularidade de f
em um domínio é aquela que corresponda ao ponto menos regular do domínio, ou
seja, a menor calculada. Quanto maior s, mais regular o sinal. A regularidade é
útil para se extrair características como a suavidade de um sinal reconstruído, ou
ainda em problemas de estimação de funções em análises por regressões não-
lineares.
5.2. Algumas aplicações da teoria de wavelets a problemas de estimação do espectro espacial-temporal
Uma idéia geral para a aplicação de wavelets em processamento de sinais
em arranjos é apresentada em [34]. Um esquema de estimação de DOA baseado
em decomposição wavelet é proposto. Em linhas gerais, o sinal é amostrado no
arranjo segundo um escalonamento diádico (em potências de 2) wavelet, de modo
que além da amostragem à taxa de Nyquist (λ/2), sub-amostragens a taxas maiores
também são tomadas (λ, 2λ, 4λ, ...). Se por um lado o processo permite melhorar
a resolução em certas situações especiais, na maioria dos casos, como não se sabe
a priori as DOAs, a contrapartida da ambigüidade angular resultante da sub-
amostragem tende a ser o efeito predominante. Deve-se destacar que a teoria de
wavelets é usada apenas com o intuito previamente destacado, e não para a
estimação propriamente dita, para a qual os autores utilizaram o método MUSIC
em suas simulações. Segundo os autores, suas simulações indicaram que a nova
abordagem melhorava o desempenho de estimação, particularmente para fontes
próximas à direção de broadside.
Apesar de interessante e aparentemente promissora, a abordagem proposta
em [34] não parece ser de grande interesse para aplicações de sondagens de canal
na prática. Inicialmente, o exemplo tomado para se obter a vantagem apregoada
pelo uso da técnica foi convenientemente escolhido para evitar o problema da
ambigüidade angular de um arranjo ULA sub-amostrado no domínio espacial,
como parte da técnica impõe. As DOAs do problema original pertenciam ao cone
angular não-ambíguo ao redor da direção de broadside – para uma amostragem a
2λ, ângulos no intervalo [-14,5o, +14,5o] podem ser distinguidos. Mais ainda, a
5 Supressão de ruído por decomposição wavelet 120
vantagem tende a ser reduzida para arranjos “práticos” com um número menor de
elementos, como 8 ou 4, pois o número máximo de níveis de decomposição
wavelet é conseqüentemente menor. Por exemplo, um arranjo ULA de 8
elementos permitiria uma decomposição em no máximo 3 níveis, contra os 5 da
simulação (ULA-32).
Há um número crescente, embora ainda reduzido, de aplicações da teoria de
wavelets em problemas de estimação de TDOA, que compreende uma das
técnicas conhecidas para localização de posição. A maioria das referências aplica
a supressão de ruído por decomposição wavelet para melhorar o desempenho dos
métodos de estimação [35-40]. Uma outra linha de ação é encontrada em [41],
onde um arranjo de antenas é empregado para agregar alguma redundância
espacial ao processo de estimação de TDOA. Para aproveitar a redundância em
benefício de uma maior resolução do processo de estimação de TDOA, os autores
propõem um método que inclui decomposição por pacotes wavelet dos sinais em
cada elemento do arranjo. A comparação por correlação dos sinais reconstruídos
nível-a-nível pode indicar variações de alta freqüência, que correspondem a
TDOAs muito próximas, com separação menor que a resolução de métodos
convencionais de estimação (periodograma). Os autores realizaram algumas
medidas, e compararam seu método inclusive com o MUSIC, com vantagem para
o método que eles propuseram. Entretanto, o esforço computacional do método
parece ser grande demais para a vantagem conquistada, e a própria diversidade
espacial que o arranjo proporciona parece ser sub-aproveitada.
5.3. Supressão de ruído usando transformada de wavelet
O resultado de qualquer decomposição wavelet é um conjunto de
coeficientes que apresenta boa correlação entre o sinal e as funções-base da
transformação. Uma das possibilidades óbvias de processamento derivadas dessa
propriedade é a reconstituição de sinais desprezando parte dos coeficientes de
menor correlação, já que a forma geral do sinal seria preservada. De fato, esse é o
princípio básico de duas das aplicações mais significativas da análise por
wavelets: a compressão de sinais, muito utilizada com imagens; e a supressão de
ruído (de-noising).
5 Supressão de ruído por decomposição wavelet 121
A idéia básica por trás da supressão de ruído é escolher quais coeficientes a
serem mantidos para preservar a informação do sinal, removendo
conseqüentemente os coeficientes associados à contribuição do ruído. A análise
por wavelets apresenta duas propriedades que viabilizam a idéia citada [42]. A
primeira é que apenas alguns poucos coeficientes de decomposição serão não-
nulos se as funções-base forem selecionadas adequadamente de acordo com as
características do sinal analisado, tais como regularidade e número de momentos
nulos por exemplo. A outra propriedade é que, se o sinal apresentar distribuição
gaussiana, os coeficientes wavelet também apresentarão tal distribuição. Neste
sentido, decomposições wavelet ortogonais são operações lineares que
transformam ruído branco em ruído branco. Portanto, a adição de ruído a um sinal
leva a coeficientes de decomposição ruidosos, com o ruído contribuindo em todos
os coeficientes, mas o sinal contribuindo apenas em alguns poucos. Uma
abordagem genérica para resolver o problema da supressão de ruído foi proposta
originalmente por Donoho e Johnstone [43], de cortar os coeficientes menores que
um certo limiar (thresholding), estabelecido de acordo com algum critério.
A supressão de ruído pode ser formalmente definida da seguinte forma. Seja
x(t) o sinal de dados corrompido por ruído:
x(t) = s(t) + n(t) (5.10)
onde s(t) é o sinal original, e n(t) o ruído aditivo, ambos funções do tempo a
serrem amostrados. Sejam W(⋅) o operador direto e W-1(⋅) o inverso que
representam a transformada de wavelet, escolhidos apropriadamente. Seja ainda
D(⋅,α) o operador que representa a supressão de ruído para um limiar α. Como o
objetivo é suprimir o ruído de x(t) para obter uma estimativa de s(t), então o
procedimento completo pode ser resumido nas três equações a seguir:
)(ˆ ts
C = W(x) (5.11)
Cd = D(C, α) (5.12)
) (5.13) ()(ˆ 1dCWts −=
5 Supressão de ruído por decomposição wavelet 122
Ou seja, inicialmente os coeficientes de decomposição wavelet C são calculados.
Em seguida, o operador de supressão de ruído é aplicado a C, cortando tudo o que
for menor que um limiar α apropriadamente estabelecido. Por fim, a estimativa
do sinal original é obtida a partir da transformada inversa dos coeficientes
com ruído suprimido C
)(ˆ ts
d.
Como pode ser observado no procedimento supracitado, a supressão de
ruído por decomposição wavelet não deve ser confundida com “suavização”
(smoothing) do sinal. A suavização é uma filtragem passa-baixas do sinal, ou seja,
apenas o conteúdo de alta freqüência é suprimido. A supressão de ruído por sua
vez, procura remover qualquer ruído presente, retendo qualquer conteúdo de
informação do sinal, independentemente do conteúdo frequencial do mesmo [44].
Mais ainda, a suavização é um procedimento linear, enquanto que a supressão de
ruído é não-linear – mais especificamente o operador D(C, α) da eq. (5.12). É
interessante salientar ainda que a supressão de ruído é considerada uma técnica
não-paramétrica.
O exemplo a seguir ajuda a ilustrar a diferença entre supressão de ruído e
suavização. A Figura 43 apresenta a decomposição wavelet (por DWT) em cinco
níveis de um sinal ruidoso com conteúdo frequencial variante no tempo (por isso
mesmo chamado convenientemente de “Doppler”). Cada componente de
aproximações corresponde a uma versão filtrada com seletividade crescente com o
nível. Como o ruído está presente em toda o espectro de freqüências, é de se
esperar que à medida que a seletividade do filtro passa-baixas aumente (nível de
decomposição), o ruído diminua. De fato, esse comportamento fica claro ao
observar as componentes a1 a a5. Da mesma forma, a suavização crescente do
sinal também fica clara, a tal ponto que, na componente a5, observa-se que o
conteúdo frequencial mais alto do sinal, que ocorre no primeiro quinto da escala
de tempo, está totalmente suprimido.
5 Supressão de ruído por decomposição wavelet 123
Figura 43 Decomposição wavelet de um sinal com DWT em cinco níveis (wavelet Sym4).
A supressão de ruído atua de forma bem mais seletiva, sem o prejuízo ao
conteúdo frequencial da suavização. A Figura 44 ilustra o estabelecimento de
limiares de corte às componentes de detalhes d1 a d5 do sinal. Observa-se que,
segundo o critério utilizado, a componente d1, que representa o conteúdo
frequencial mais alto do sinal, é tomada como ruído puro, sendo completamente
descartada. O resultado final da reconstituição do sinal após a supressão de ruído é
ilustrado na própria Figura 44. Embora o procedimento procure preservar o
conteúdo frequencial, percebe-se que a supressão de ruído não é “milagrosa”,
sendo ineficiente para relações sinal/ruído muito baixas.
O detalhamento do procedimento genérico de supressão de ruído definido
previamente envolve principalmente a definição do limiar. Algumas técnicas de
definição bastante difundidas na literatura são descritas a seguir, assim como as
principais maneiras de se efetuar a conformação do corte.
5 Supressão de ruído por decomposição wavelet 124
Figura 44 Supressão de ruído de um sinal tipo “Doppler”, decomposto por DWT em cinco
níveis, e o estabelecimento de limiares de corte para as componentes de detalhes.
5.3.1. Conformação do limiar de supressão: limiar abrupto ou suave
A conformação do limiar de supressão de ruído aos coeficientes é realizada
normalmente de duas maneiras distintas. O modo mais simples é a aplicação do
chamado limiar “abrupto” (hard), que simplesmente substitui os coeficientes
menores que o limiar por zero. A equação abaixo representa esta conformação:
≤
>=− α
α
C
CCC Hd ,0
, (5.14)
A conformação de limiar suave (soft), definida na eq. (5.15), apresenta
propriedades matemáticas mais interessantes, pois “encolhe” os coeficientes para
evitar a descontinuidade que a conformação abrupta impõe. Em função desse
encolhimento no domínio da transformada, o procedimento de supressão é
comumente referido na literatura como “supressão de ruído por decomposição
wavelet com encolhimento” (wavelet shrinkage de-noising), quando a
conformação suave é escolhida [44]. A Figura 45 ilustra a diferença entre as duas
abordagens para a conformação de limiar.
5 Supressão de ruído por decomposição wavelet 125
( )( )
≤
>−=− α
αα
C
CCCsignC Sd ,0
, (5.15)
Figura 45 Diferenças entre as conformações de limiar abrupto e suave.
5.3.2. Regras para seleção de limiar
Embora pesquisadores especialistas em wavelets como Mallat,
Wickerhauser e Coifman tenham sido os primeiros a abordar a aplicação da
supressão de ruído, o trabalho de Donoho parece ser o mais divulgado, muito
provavelmente por ter sido o primeiro a interpretar formalmente o assunto [45].
Particularmente, em seu trabalho algumas regras para seleção de limiar foram
desenvolvidas, entre elas a mais simples e utilizada de todas, a chamada “regra
universal” ou “VisuShrink”. O termo “shrink” se refere ao efeito de encolhimento
previamente mencionado que a conformação de limiar suave provoca, uma vez
que esta foi a escolha de Donoho no desenvolvimento analítico de sua regra.
O esquema VisuShrink foi desenvolvido como a solução de um problema de
otimização, no qual um critério minimax submetido a restrições foi adotado. O
5 Supressão de ruído por decomposição wavelet 126
critério minimax é comumente utilizado em Estatística para projetar estimadores.
Para o problema da supressão de ruído, a função de regressão desconhecida a ser
estimada é o sinal sem ruído. O estimador minimax provê um resultado que
corresponde ao menor erro médio quadrático máximo de um dado conjunto de
funções [33]. Este conjunto de funções é submetido à restrição que condiciona a
estimativa para ser tão “suave” quanto o sinal original [45]. A motivação para essa
restrição foi a necessidade de uma melhor relação de compromisso entre variância
e polarização (bias). O princípio minimax otimiza apenas o erro médio quadrático,
resultando em uma relação de compromisso entre a polarização e a variância que
mantém ambos com ordem de grandeza de mesma magnitude. Em conseqüência,
as estimativas exibem consideravelmente algumas estruturas indesejáveis
induzidas por ruído, tais como ondulações (ripples), “manchas” (blips) e
oscilações [45].
A regra de seleção Visu é muito simples de aplicar, pois é uma função
simplesmente da largura amostral n do sinal original, que é também o número de
coeficientes computado para uma transformada de wavelet ortogonal. Para um
sinal x(t) corrompido por ruído gaussiano de média nula, o limiar Visu é dado por:
( )nlog2σα = (5.16)
onde σ é o nível de ruído, e o logaritmo está na base natural.
O esquema Visu é eventualmente acusado de “super-suavizar” as
estimativas [46]. Para evitar essa possibilidade, uma outra classe de regras, que
computa o limiar de uma forma adaptativa aos dados, pode ser usada no lugar da
Visu. Uma dessas regras utiliza o estimador de risco não-polarizado de Stein
(SURE ou SUREShrink – Stein’s Unbiased Risk Estimator), que minimiza uma
função de risco para um valor de limiar particular. Para um dado conjunto de
coeficientes, o limiar é aquele que apresenta o menor risco. Outro esquema
adaptativo aos dados anti-super-suavização é a regra RiskShrink, que pode ser
compreendida como o esquema Visu não submetido à restrição da suavidade.
Exatamente por isso, esse esquema é conhecido também como Minimax, já que o
limiar é selecionado de acordo com o critério minimax.
5 Supressão de ruído por decomposição wavelet 127
Uma alternativa interessante às regras de seleção anteriores pode ser uma
mistura delas. A chamada solução “heurística” aplica o esquema SURE, a menos
que a relação sinal/ruído seja baixa. Neste caso, o limiar Visu é selecionado em
seu lugar, uma vez que a regra SURE tende a ser mais conservativa, ou seja, sua
estimativa ainda seria muito “ruidosa” [33].
A adaptabilidade aos dados das regras de seleção Risk e SURE permite outra
caracterização para o limiar. Com relação aos diferentes níveis de decomposição
wavelet, o limiar universal é o mesmo para todos, motivo pelo qual o limiar é
classificado como “global”. Por outro lado, o limiar é dito “local” para os
esquemas SURE e Risk, já que é estimado localmente para cada nível de
decomposição.
Quando uma regra adaptativa aos dados é escolhida, um procedimento de
quatro etapas é mais representativo do procedimento geral de supressão de ruído,
que o de três estágios representados pelas eqs. (5.11) a (5.13). Naquela seqüência,
antes de se aplicar o operador de supressão de ruído da eq. (5.12), um operador de
determinação de limiar deve ser aplicado, como na eq. (5.17) abaixo.
) (5.17) (Cd=α