5 Supressão de ruído por decomposição wavelet

5 Supressão de ruído por decomposição wavelet

A decomposição a partir de funções de base especialmente selecionadas é

uma poderosa ferramenta de análise e síntese de sinais. A teoria mais

representativa desse tipo de abordagem é a decomposição de Fourier, que tem

como funções de base funções harmônicas. Entretanto, a teoria de Fourier não é a

mais apropriada para o tratamento de sinais cuja resposta ao impulso seja variante

no tempo. Essa limitação motivou diversos pesquisadores ao longo do século

passado, a buscarem conjuntos de funções de base alternativas às de Fourier.

Na teoria de Fourier, as funções de base têm um escopo “global”, ou seja,

estendem-se ao longo de todo o domínio de análise original (temporal). É essa

característica que torna a análise de Fourier inadequada ao tratamento de sinais

com resposta ao impulso variante no tempo. As teorias desenvolvidas para

caracterizar esses sinais propõem o uso de funções de base com escopo

“localizado” em ambos os domínios. A análise de Fourier em intervalos curtos de

tempo (STFA – “Short Time Fourier Analysis”), a análise por distribuições de

Wigner Ville e a análise por wavelets são teorias que permitem a análise conjunta

temporal-frequencial [31]. Cada teoria apresenta um diferencial com relação às

demais, e a escolha da teoria mais adequada depende de certas condições

associadas ao sinal analisado, bem como do tipo de informação que se deseje

extrair. Entretanto, apesar de ser relativamente nova, é fácil constatar na literatura

que a teoria de wavelets em particular tem sido aplicada a um número cada vez

maior de problemas ligados direta ou indiretamente à área de processamento de

sinais.

A crescente popularidade da teoria de wavelets e a quase ausência de

publicações associando essa teoria a problemas de estimação do canal de

propagação rádio-móvel motivaram uma das propostas desta tese. De fato, apenas

algumas poucas referências foram encontradas associando os dois campos de

interesse, estimação espectral espacial-temporal e teoria de wavelets. Mais ainda,

até o momento as possibilidades de aplicação direta da teoria de wavelets não se

DBD

PUC-Rio - Certificação Digital Nº 0016247/CA

5 Supressão de ruído por decomposição wavelet 102

mostraram atraentes o suficiente para compensar o maior esforço computacional

resultante, entre outras contrapartidas. Por outro lado, houve motivação para uma

aplicação “indireta” da teoria de wavelets. A supressão de ruído baseada em

decomposição por wavelets foi concebida como alternativa a um procedimento de

pós-processamento de PDPs. O capítulo seguinte apresenta os resultados dessa

aplicação em dois conjuntos distintos de PDPs gerados a partir de sondagens de

canal faixa-larga disponíveis [8-10].

Do exposto, este capítulo tem por objetivo apresentar inicialmente conceitos

fundamentais sobre wavelets. Em seguida, um breve resumo sobre algumas

aplicações diretas da teoria de wavelets ao problema da estimação espectral

espacial-temporal é apresentado, ainda que não tenham se mostrado tão

promissoras quanto o esperado. Por fim, a aplicação específica da teoria de

wavelets de maior interesse nesta tese é detalhada: a supressão de ruído.

5.1. Fundamentos da teoria de wavelets

Sob um ponto de vista histórico, a análise por wavelets é um novo método,

apesar de sua fundamentação matemática ter sido derivada do trabalho de Joseph

Fourier no século XIX. Fourier estabeleceu aquela base com suas teorias sobre

análise frequencial, comprovadamente de grande importância e influência.

A atenção de pesquisadores foi gradualmente migrando da análise baseada

em freqüência para a análise baseada em “escala”, que é a abordagem da análise

por wavelets, quando começou a ficar claro que uma abordagem medindo

flutuações médias em escalas diferentes levava a uma menor sensibilidade ao

ruído.

A primeira menção ao que hoje é chamado de wavelet parece ter sido de

1909, em uma tese de Alfred Haar. O conceito de wavelets na sua forma teórica

atual foi proposto pela primeira vez por Jean Morlet e pela equipe de

pesquisadores de Alex Grossman trabalhando no Centro de Física Teórica de

Marseille na França.

Os métodos de análise por wavelets foram desenvolvidos principalmente por

Y. Meyer e seus colegas, que asseguraram a disseminação dos métodos. O

algoritmo principal é da época do trabalho de Stephane Mallat em 1988. Desde

então, a pesquisa em wavelets se tornou internacional. Tal pesquisa é

DBD



particularmente ativa nos EUA, graças ao trabalho de cientistas como Ingrid

Daubechies, Ronald Coifman e Victor Wickerhauser [32].

O domínio wavelet tem crescido rapidamente. Diversos artigos matemáticos

e tentativas de aplicações práticas são publicadas todos os meses [33]. No que diz

respeito ao campo do processamento de sinais propriamente dito, as aplicações

incluem: detecção de descontinuidades e pontos de quebra; análises específicas

dos comportamentos de curto e longo prazo; identificação frequencial (ainda que

não tão direta e facilmente como a teoria de Fourier, mas com a vantagem de

poder acompanhar variações com o tempo); supressão de sinais; supressão de

ruído; e compactação. Em particular, estas duas últimas parecem ser as aplicações

mais comuns da teoria de wavelets atualmente. Entretanto, é fácil constatar que à

medida que a teoria vem sendo difundida e compreendida, novas aplicações vêm

surgindo nas mais diversas áreas.

Um dos grandes atrativos da teoria de wavelets é a capacidade de analisar

sinais com espectro variante no tempo. Tradicionalmente, os sinais são estudados

ou como função do tempo, ou como função da freqüência. Entretanto, a maioria

dos sinais encontrados na prática apresentam espectros variantes no tempo, como

por exemplo tons de música. Na Natureza, poucos sinais possuem conteúdo

frequencial que não mude ao longo do tempo. Em várias aplicações práticas,

caracterizar o sinal simultaneamente nos domínios temporal e frequencial é de

grande utilidade, como no processamento de sinais de voz [31].

Para compreender melhor o conceito fundamental da teoria de wavelets, é

interessante inicialmente relembrar resumidamente os fundamentos da análise de

Fourier, que decompõe um sinal em componentes senoidais de diferentes

freqüências. Tal decomposição é o que permite a análise do espectro de

freqüências do sinal, como ilustrado na Figura 26.

Figura 26 Transformada de Fourier de um sinal.

DBD



Embora para muitos sinais a análise de Fourier seja extremamente útil, ela

apresenta uma séria contrapartida, conforme previamente mencionado. A

transformação espectral acarreta perda total da informação temporal do sinal, e

vice-versa com a transformação inversa. Se as propriedades do sinal não se

modificam substancialmente ao longo do tempo – mais especificamente, se o sinal

for estacionário – esta contrapartida não é muito relevante. Entretanto, a maioria

dos sinais de interesse contém diversas características transitórias ou não-

estacionárias: desvios; tendências; mudanças bruscas; e começos e términos de

eventos. Estas características são eventualmente as mais importantes do sinal, mas

nesses casos, a análise de Fourier não é adequada para detectá-las.

Num esforço para sobrepor a limitação previamente citada, em 1946 Dennis

Gabor propôs uma adaptação à transformada de Fourier, em que apenas uma

pequena seção do sinal em um dado instante era analisada – uma técnica chamada

de “janelamento” do sinal. A adaptação de Gabor, chamada Transformada de

Fourier em Intervalos Curtos (Short-Time Fourier Transform – STFT) mapeia um

sinal em uma função bi-dimensional do tempo e da freqüência, conforme ilustrado

na Figura 27. O janelamento temporal traz consigo uma incerteza associada à

precisão da análise, que não havia na transformada Fourier convencional. Essa

imprecisão se manifesta em uma relação de compromisso entre a resolução

frequencial e a capacidade de acompanhar as variações espectrais ao longo do

tempo. Além disso, quanto menor a largura da janela, maior o esforço

computacional necessário para realizar a análise espectral do sinal. Na STFT, a

largura da janela temporal é fixa para um dado sinal analisado. Com isso, o grau

de incerteza associado ao janelamento é o mesmo para todo o espectro conjunto

frequencial-temporal.

Figura 27 Transformada de Fourier em intervalos curtos (STFT) de um sinal.

DBD



Há muitos casos em que a análise de um determinado sinal prioriza faixas

específicas do espectro, dando menor importância para o restante do conteúdo

frequencial. Para explorar melhor essa situação, seria interessante uma

transformação que flexibilizasse a largura da janela temporal, aplicando janelas

mais estreitas às áreas espectrais desejadas, e aumentando a largura para o

espectro de menor interesse. Uma das técnicas que permite essa abordagem

diferenciada é a análise por wavelets.

Uma das estratégias de janelamento temporal mais utilizadas na análise por

wavelets é a que aplica as menores larguras ao conteúdo de alta freqüência

(intimamente associado às variações rápidas), e as maiores larguras ao conteúdo

espectral baixo (variações lentas). A Figura 28 ilustra o conceito em questão, onde

a “escala” é interpretada como uma grandeza inversamente proporcional à

freqüência.

Figura 28 Transformada de wavelet de um sinal.

Mas o que seria afinal uma wavelet? Uma wavelet é uma forma de onda de

duração limitada e que possui um valor médio igual a zero. A comparação inicial

inevitável é a de uma wavelet com uma senóide, que é a base da análise de

Fourier. Senóides são ilimitadas no tempo – elas se estendem de –∞ a +∞. Mais

ainda, enquanto senóides são suaves e previsíveis, wavelets tendem a ser

irregulares e assimétricas. A Figura 29 ilustra essas diferenças.

DBD



Figura 29 Comparação entre uma senóide e uma wavelet (db10).

A análise de Fourier consiste em decompor um sinal em ondas senoidais de

várias freqüências. De forma análoga, a análise por wavelets é a decomposição de

um sinal em versões “deslocadas” e “escalonadas” da wavelet original (ou

“wavelet mãe”). Ao observar ilustrações de wavelets e ondas senoidais, como as

da Figura 29, deduz-se intuitivamente que sinais com mudanças abruptas são

potencialmente melhor analisados com uma típica e irregular wavelet que com

uma suave senóide, assim como certos alimentos são melhor manuseados com um

garfo que com uma colher. Formalmente falando, a maioria das wavelets de

interesse são funções ditas “localizadas”6 tanto no tempo quanto em escala

(freqüência). É essa característica das wavelets que viabiliza aplicações como a

compactação do sinal, a focalização da análise para uma região específica de

interesse do espectro variante no tempo, ou ainda a localização das áreas de maior

concentração de energia, entre outras.

O tratamento analítico para a análise por wavelets inclui a transformada

contínua de wavelet, assim como a discreta, além de suas respectivas

transformadas inversas. A transformada contínua traz consigo uma grande

redundância de informações sobre o sinal analisado, o que a torna

computacionalmente desinteressante. Via de regra, a transformada discreta é

utilizada, seja em sua versão mais simples na chamada “análise de multi-

resolução”, seja na versão que permite um detalhamento personalizado do

espectro, que é a “análise por pacotes”.

6 Um sinal é dito “localizado” em torno de um ponto se sua energia está concentrada nas

proximidades do referido ponto.

DBD



5.1.1. Transformada contínua de wavelet

O tratamento analítico da transformada contínua de wavelet guarda

semelhanças com o da análise de Fourier, cuja transformada é representada por:

(5.1) ( ) ( )∫∞

∞−

−= dtetfF tjωω

que é a soma sobre todo o domínio temporal do sinal f(t) multiplicado por uma

exponencial complexa (que pode ser decomposta em componentes senoidais reais

e imaginárias).

Os resultados da transformada são os coeficientes de Fourier F(ω), que

quando multiplicados por uma senóide de freqüência ω, compreendem as

componentes constituintes do sinal original. A Figura 30 ilustra o referido

processo de decomposição.

Figura 30 Decomposição de um sinal em suas componentes senoidais constituintes por

transformada de Fourier.

Analogamente, a transformada contínua de wavelet (CWT – Continuous

Wavelet Transform) é definida como a soma sobre todo o domínio temporal do

sinal multiplicado por versões escalonadas e deslocadas da função wavelet ψ:

(5.2) ( ) ( ) ( )∫∞

∞−

= dttbatfbaC ,,, ψ

onde os parâmetros a e b correspondem aos fatores de escala e de deslocamento

(posição), respectivamente.

DBD



O resultado da CWT são diversos coeficientes wavelet C, que são função da

escala e da posição. Multiplicando-se cada coeficiente pela wavelet

correspondente apropriadamente escalonada e deslocada, obtém-se as wavelets

constituintes do sinal original, conforme ilustrado na Figura 31.

Figura 31 Decomposição de um sinal em suas componentes wavelets constituintes por

CWT.

A análise por wavelets produz uma visão tempo-escala de um sinal.

Conforme previamente mencionado, as escalas tem associação inversa com as

freqüências de um sinal. Basicamente, escalonar uma wavelet significa alongá-la

ou comprimí-la. A ilustração da Figura 32 exemplifica o escalonamento de uma

wavelet, onde a é o fator de escala.

Figura 32 Ilustração do escalonamento de uma wavelet.

Se a função wavelet for definida como uma senóide de freqüência ω por

exemplo, verifica-se facilmente que o fator de escala a é exatamente o inverso de

ω. De modo geral portanto, a escala está relacionada ao conteúdo frequencial do

sinal na análise por wavelets.

DBD



Deslocar uma wavelet significa simplesmente acrescentar um retardo, como

no exemplo da Figura 33.

Figura 33 Ilustração do deslocamento de uma wavelet.

Portanto, a CWT é a soma sobre todo o domínio temporal da multiplicação

do sinal por versões escalonadas e deslocadas de uma wavelet apropriadamente

escolhida. Este processo produz coeficientes wavelet C que são função de escala e

posição (tempo). Quanto maior C, maior a similaridade entre a wavelet e a seção

do sinal que está sendo tomada para o cálculo do coeficiente. Mais precisamente,

se a energia do sinal e a energia da wavelet forem unitárias, C pode ser

interpretado como um coeficiente de correlação. Obviamente os resultados

dependem da forma da wavelet escolhida.

Os coeficientes calculados para as diferentes escalas em diferentes seções do

sinal devem ser agrupados de maneira ordenada, particularmente quando se deseja

visualizar esses resultados em um gráfico. A Figura 34 por exemplo, ilustra um

gráfico típico, onde o eixo horizontal representa os deslocamentos de tempo, o

eixo vertical a escala, e a magnitude do coeficiente wavelet é representada por

uma escala de cores. Alternativamente, pode-se optar por um gráfico 3D como o

da Figura 35.

Figura 34 Gráfico típico de uma CWT de um sinal, usando escala de cores para

representar a magnitude dos coeficientes wavelet.

DBD



Figura 35 Gráfico típico de uma CWT de um sinal, usando um terceiro eixo ortogonal

para representar a magnitude dos coeficientes wavelet.

5.1.2. Transformada discreta de wavelet – análise de multi-resolução

Na CWT, o conjunto de escalas e posições (deslocamentos) nas quais ela é

operada é contínuo. A CWT pode operar em qualquer escala, desde a

correspondente ao tamanho do sinal original até uma escala pequena o suficiente

para ponderar variações dentro de um limite de resolução associado à medição do

sinal original, por exemplo. Da mesma forma, a CWT é contínua em termos de

deslocamento durante o cálculo dos coeficientes, pois a wavelet analisadora é

deslocada suavemente sobre todo o domínio temporal do sinal analisado.

Via de regra, qualquer processamento de sinal realizado em um computador

utilizando dados coletados experimentalmente deve ser executado em um sinal

discreto na prática. Além disso, calcular coeficientes wavelet para um número

muito grande de escalas é uma tarefa que gera um volume enorme de dados. Uma

estratégia computacionalmente mais eficiente e atraente seria a escolha de apenas

um sub-conjunto de escalas e posições específicas para as quais os coeficientes

devem ser calculados. Adotando-se essa estratégia genérica, a transformada de

wavelet deixa de ser contínua para ser discreta.

Um dos esquemas de transformação discreta mais utilizados dentre os

disponíveis na literatura opera com escalas e posições baseadas em potências de 2

(dois) – as chamadas escalas e posições “diádicas”. Tal esquema foi organizado na

maneira como se conhece atualmente por Mallat em 1988, que enxergou uma

DBD



analogia bastante apropriada entre o algoritmo de decomposição diádico (análise

de multi-resolução) e o uso de um banco de filtros, conceito este oriundo da teoria

geral de processamento de sinais. Por ser provavelmente o esquema de

decomposição mais conhecido e empregado, o termo “transformada discreta de

wavelet” (DWT – Discrete Wavelet Transform) se refere especificamente ao

algoritmo de Mallat, embora outros esquemas de transformação discreta existam.

Embora historicamente a análise de multi-resolução preceda a DWT, para o

escopo deste texto o entendimento da última é mais conveniente num primeiro

estágio. Compreendido o conceito da DWT a partir do conceito do banco de

filtros, a associação com os principais conceitos e equações da análise de multi-

resolução será apresentada em seguida.

A DWT divide o sinal analisado em componentes de alta escala e baixa

escala. As primeiras são chamadas de “aproximações”, já que correspondem ao

conteúdo de baixa freqüência do sinal. As variações rápidas do sinal são chamadas

de “detalhes”. No seu nível mais básico, o processo de filtragem que gera a

divisão mencionada pode ser entendido através da ilustração da Figura 36. O sinal

original (S) é decomposto por dois filtros complementares. O filtro passa-baixas

gera a componente de aproximações (A), enquanto o passa-altas gera a

componente de detalhes (D).

Figura 36 Filtragem de um estágio para geração de aproximações (A) e detalhes (D) de

um sinal (S).

O resultado de uma DWT apresentaria portanto duas vezes mais dados que o

sinal original, o que seria um retrocesso em termos de eficiência computacional.

Supondo, por exemplo, que o sinal original S consista de 1000 amostras, então os

DBD



sinais resultantes da filtragem terão cada um também 1000 amostras, ou seja, a

decomposição resultaria num total de 2000 amostras. Para compensar o esforço

extra indesejável, a decomposição é realizada reduzindo-se a taxa de amostragem

(downsampling) na mesma proporção que o número de decomposições, ou seja,

dois no caso em questão, como na ilustração da Figura 37.

Figura 37 Decomposição por filtragem de um estágio: sem e com downsampling.

Para exemplificar o processo, seja um sinal senoidal puro com ruído

adicionado. A DWT deste sinal (S) produz as componentes cD (detalhes) e cA

(aproximações), conforme ilustrado na Figura 38. Observa-se que os coeficientes

da componente cD são pequenos e consistem essencialmente de ruído, enquanto

que os coeficientes da componente aproximações cA contém muito menos ruído

que o sinal original.

Figura 38 DWT de um estágio para um sinal senoidal com ruído.

O processo de decomposição da DWT pode ser repetido, sempre atuando

sobre as componentes de aproximações. Sucessivas decomposições geram a

DBD



chamada “árvore de decomposição wavelet”, como ilustrado na Figura 39. O

limite máximo de decomposições corresponde ao nível em que a componente de

detalhes consista de apenas uma amostra. O limite prático entretanto costuma ser

selecionado com base na natureza do sinal, ou em um critério mais específico tal

como o da entropia.

Figura 39 Árvore de decomposição wavelet – um exemplo.

A DWT implementa na forma de um banco de filtros a chamada “análise de

multi-resolução” (MRA – Multi-Resolution Analysis). A MRA permite analisar

um sinal em vários níveis de resolução, e é formalmente representada por uma

seqüência crescente de subespaços fechados Vn (n inteiro) de funções

quadraticamente integráveis definidas no corpo dos números reais, onde cada

subespaço Vj-1 ⊂ Vj. Para o equacionamento da MRA, define-se inicialmente a

chamada “função de escalonamento” (scaling function) ϕ(x) ∈ V0, cujas

translações inteiras geram este subespaço. Considerando-se as relações entre os

subespaços funcionais, verifica-se que as funções de base de um subespaço Vj

podem ser expressas como combinação linear das funções de base do espaço Vj+i,

para i > 0. Em particular, para j = 0 e i = 1,existem coeficientes {he(k)} tais que:

( ) ( ) ( kxkhxk

e −= ∑ 22ϕϕ ) (5.3)

DBD



A raiz quadrada na expressão acima decorre da relação diádica entre os

subespaços sucessivos, mas também do interesse em se obter bases ortonormais

para todos subespaços funcionais.

A eq. (5.3) é fundamental para a MRA e é normalmente referida como

“equação de refinamento” ou “equação de escalonamento”. O conjunto de

coeficientes {he(k)} pode ser encarado como os pesos de um filtro, comumente

chamado de “filtro de escalonamento”.

Generalizando a equação mediante a combinação dos operadores de

translação e escalonamento, pode-se obter as funções do subespaço Vj a partir das

funções de base de V0, ou seja:

( ) ( )kxx jjkj −= 22 2/

, ϕϕ (5.4)

Voltando ao conceito dos subespaços funcionais hierarquizados em escala

crescente, um subespaço Vj+1 pode ser gerado pelo subespaço de nível inferior Vj

somado a seu complemento ortogonal Wj. Em outras palavras, este subespaço terá

funções de base ψj,k ortogonais às funções de base ϕj,k do subespaço

complementar. Com isso, analogamente à definição da equação de escalonamento,

chamando ψ de “função wavelet”, com ψ ∈ W0, como W0 ⊂ V1, existem

coeficientes {hw(k)} tais que:

( ) ( ) ( kxkhxk

w −= ∑ 22ϕψ ) (5.5)

Assim como considerado para a função de escalonamento, os coeficientes {hw(k)}

são convenientemente associados aos pesos de um filtro denominado “filtro

wavelet”. Sob a mesma analogia, a partir da função wavelet pode-se gerar uma

classe de funções com operações de translação e escalonamento dadas por:

( ) ( )kxx jjkj −= 22 2/

, ψψ (5.6)

Resumindo, o problema genérico de decomposição discreta de um sinal

S(x), dado por:

DBD



(5.7) ( ) ( )∑∑=k j

kjkj xaxS ,, ψ

pode ser resolvido segundo a abordagem da DWT, que se baseia na análise de

multi-resolução, como em:

(5.8) ( ) ( ) ( )∑∑∑∞

=

+=k jj

kjkjk

kjkj xdxcxS0

,,,0,0 ψϕ

onde os coeficientes cj,k e dj,k de decomposição do sinal são calculados como o

resultado da filtragem do sinal por um banco de filtros, cujos pesos devem ser

computados a partir de uma função de escalonamento adequadamente escolhida (e

de sua ortogonal wavelet). Na eq. (5.8), o termo associado à função escalonadora

corresponde à componente de aproximações, enquanto que o termo restante está

associado aos detalhes. A decomposição no primeiro nível divide o sinal em duas

componentes independentes – aproximações (A1) e detalhes (D1), de modo que

S(x) = A1 + D1. Usando o conceito dos subespaços complementares sobre cada

componente de aproximações Ai calculada sucessivamente para cada nível i, a

árvore de decomposição wavelet exemplificada na Figura 39 vai se expandindo,

permitindo uma análise cada vez mais detalhada do sinal. Para i decomposições, o

sinal pode ser representado mais compactamente por:

(5.9) ( ) ∑=

+=i

jji DAxS

1

5.1.3. Análise por pacotes wavelet

O método por pacotes wavelet é uma generalização da DWT que oferece

uma gama mais rica de possibilidades para a análise de sinais. Na DWT, um sinal

é decomposto em uma componente de aproximações e uma de detalhes. A

primeira por si só é então decomposta em aproximações e detalhes de segundo

nível, e o processo se repete, como ilustrado na Figura 40. Para n níveis, a DWT

oferece n + 1 possibilidades de decomposição do sinal.

DBD



Figura 40 DWT de 3 níveis de um sinal.

Na análise por pacotes wavelet, os detalhes também podem ser

decompostos. Isto compreende mais de maneiras diferentes para decompor o

sinal. Tem-se então a chamada “árvore de decomposição por pacotes wavelet”,

como ilustrado na Figura 41. A árvore de decomposição wavelet da DWT (Figura

39) corresponde a apenas um ramo da árvore binária completa.

122−n

Figura 41 Árvore de decomposição por pacotes wavelet – diagrama de níveis.

Por exemplo, a análise por pacotes wavelet permite que o sinal S seja

representado como a soma das componentes A1 + AAD3 + DAD3 + DD2 (Figura

41). Este é um exemplo de representação que não é possível com a DWT.

Escolher uma dentre todas as possíveis codificações corresponde por si só a

um problema adicional a ser resolvido. Um dos critérios existentes baseia-se no

conceito de entropia para selecionar a decomposição mais adequada de um sinal

dado. Neste método, cada nó da decomposição é observado e quantifica-se o

ganho de informação associado.

Existem algoritmos simples e eficientes tanto para decomposição por

pacotes wavelet quanto para seleção ótima do ramo de decomposição. Coifman e

DBD



Wickerhauser propuseram um algoritmo de filtragem adaptativa, com

aplicabilidade direta em codificação ótima de sinais e compressão de dados. Tais

algoritmos permitem otimizar a decomposição tanto globalmente quanto

localmente com respeito a cada nó.

5.1.4. Algumas funções wavelet especiais e suas propriedades

Dentre os diversos fatores que impulsionaram a difusão da teoria de

wavelets nos últimos anos, destacam-se os estudos que introduzem funções ou

famílias de funções apropriadas para serem utilizadas como wavelets. A Figura 42

apresenta alguns exemplos de funções wavelet e suas funções escalonadoras

associadas. As famílias de funções são comumente representadas pela abreviação

do pesquisador que as desenvolveram (“coif” para Coifman ou “db” para

Daubechies) ou de alguma denominação dada (“sym” para Symlets), seguido por

um número que costuma representar uma característica da função. Como

característica geral, observa-se que todas as funções decaem rapidamente para

zero. As wavelets Morlet e “chapéu mexicano” não possuem escalonadoras e são

simétricas. A wavelet Haar é a única função descontínua, com três pontos de

descontinuidade. As funções wavelet oscilam mais que suas escalonadoras

associadas. A wavelet coif2 exibe alguns pontos angulares. As wavelets db6 e

sym6 são bastante suaves.

DBD



Figura 42 Algumas funções wavelet e suas escalonadoras associadas.

Há diferentes tipos de famílias de funções wavelet, cujas qualidades variam

de acordo com diversos critérios. Um dos aspectos relevantes é o comprimento

(também chamado de “suporte”) das funções wavelet e escalonadora, bem como

de suas respectivas transformadas de Fourier. Mais especificamente, a velocidade

de convergência para zero dessas funções à medida que o tempo (ou a freqüência

no caso das transformadas) tende para infinito, quantifica a capacidade de

localização da função (no tempo ou na freqüência). Outro aspecto importante é a

simetria, especialmente em aplicações como processamento de imagens, para as

quais é desejável evitar a perda de fase do sinal analisado.

O número que costuma acompanhar a designação compacta de uma wavelet

(como em “db6” por exemplo) corresponde ao número de momentos nulos

(vanishing moments) da função. Esta propriedade é especialmente importante para

aplicações de compressão de sinais, bem como de supressão de sinais.

Outra propriedade importante é a regularidade, que pode ser inclusive

quantificada. Para um sinal f diferenciável continuamente no tempo até a ordem s

DBD



em um ponto x0, sendo s um inteiro ≥ 0, a sua regularidade é definida por s. Se a

derivada de ordem m da função f se assemelha a rxx 0− localmente ao redor de

x0, então a regularidade s é dada por s = m + r, com 0 < r < 1. A regularidade de f

em um domínio é aquela que corresponda ao ponto menos regular do domínio, ou

seja, a menor calculada. Quanto maior s, mais regular o sinal. A regularidade é

útil para se extrair características como a suavidade de um sinal reconstruído, ou

ainda em problemas de estimação de funções em análises por regressões não-

lineares.

5.2. Algumas aplicações da teoria de wavelets a problemas de estimação do espectro espacial-temporal

Uma idéia geral para a aplicação de wavelets em processamento de sinais

em arranjos é apresentada em [34]. Um esquema de estimação de DOA baseado

em decomposição wavelet é proposto. Em linhas gerais, o sinal é amostrado no

arranjo segundo um escalonamento diádico (em potências de 2) wavelet, de modo

que além da amostragem à taxa de Nyquist (λ/2), sub-amostragens a taxas maiores

também são tomadas (λ, 2λ, 4λ, ...). Se por um lado o processo permite melhorar

a resolução em certas situações especiais, na maioria dos casos, como não se sabe

a priori as DOAs, a contrapartida da ambigüidade angular resultante da sub-

amostragem tende a ser o efeito predominante. Deve-se destacar que a teoria de

wavelets é usada apenas com o intuito previamente destacado, e não para a

estimação propriamente dita, para a qual os autores utilizaram o método MUSIC

em suas simulações. Segundo os autores, suas simulações indicaram que a nova

abordagem melhorava o desempenho de estimação, particularmente para fontes

próximas à direção de broadside.

Apesar de interessante e aparentemente promissora, a abordagem proposta

em [34] não parece ser de grande interesse para aplicações de sondagens de canal

na prática. Inicialmente, o exemplo tomado para se obter a vantagem apregoada

pelo uso da técnica foi convenientemente escolhido para evitar o problema da

ambigüidade angular de um arranjo ULA sub-amostrado no domínio espacial,

como parte da técnica impõe. As DOAs do problema original pertenciam ao cone

angular não-ambíguo ao redor da direção de broadside – para uma amostragem a

2λ, ângulos no intervalo [-14,5o, +14,5o] podem ser distinguidos. Mais ainda, a

DBD



vantagem tende a ser reduzida para arranjos “práticos” com um número menor de

elementos, como 8 ou 4, pois o número máximo de níveis de decomposição

wavelet é conseqüentemente menor. Por exemplo, um arranjo ULA de 8

elementos permitiria uma decomposição em no máximo 3 níveis, contra os 5 da

simulação (ULA-32).

Há um número crescente, embora ainda reduzido, de aplicações da teoria de

wavelets em problemas de estimação de TDOA, que compreende uma das

técnicas conhecidas para localização de posição. A maioria das referências aplica

a supressão de ruído por decomposição wavelet para melhorar o desempenho dos

métodos de estimação [35-40]. Uma outra linha de ação é encontrada em [41],

onde um arranjo de antenas é empregado para agregar alguma redundância

espacial ao processo de estimação de TDOA. Para aproveitar a redundância em

benefício de uma maior resolução do processo de estimação de TDOA, os autores

propõem um método que inclui decomposição por pacotes wavelet dos sinais em

cada elemento do arranjo. A comparação por correlação dos sinais reconstruídos

nível-a-nível pode indicar variações de alta freqüência, que correspondem a

TDOAs muito próximas, com separação menor que a resolução de métodos

convencionais de estimação (periodograma). Os autores realizaram algumas

medidas, e compararam seu método inclusive com o MUSIC, com vantagem para

o método que eles propuseram. Entretanto, o esforço computacional do método

parece ser grande demais para a vantagem conquistada, e a própria diversidade

espacial que o arranjo proporciona parece ser sub-aproveitada.

5.3. Supressão de ruído usando transformada de wavelet

O resultado de qualquer decomposição wavelet é um conjunto de

coeficientes que apresenta boa correlação entre o sinal e as funções-base da

transformação. Uma das possibilidades óbvias de processamento derivadas dessa

propriedade é a reconstituição de sinais desprezando parte dos coeficientes de

menor correlação, já que a forma geral do sinal seria preservada. De fato, esse é o

princípio básico de duas das aplicações mais significativas da análise por

wavelets: a compressão de sinais, muito utilizada com imagens; e a supressão de

ruído (de-noising).

DBD



A idéia básica por trás da supressão de ruído é escolher quais coeficientes a

serem mantidos para preservar a informação do sinal, removendo

conseqüentemente os coeficientes associados à contribuição do ruído. A análise

por wavelets apresenta duas propriedades que viabilizam a idéia citada [42]. A

primeira é que apenas alguns poucos coeficientes de decomposição serão não-

nulos se as funções-base forem selecionadas adequadamente de acordo com as

características do sinal analisado, tais como regularidade e número de momentos

nulos por exemplo. A outra propriedade é que, se o sinal apresentar distribuição

gaussiana, os coeficientes wavelet também apresentarão tal distribuição. Neste

sentido, decomposições wavelet ortogonais são operações lineares que

transformam ruído branco em ruído branco. Portanto, a adição de ruído a um sinal

leva a coeficientes de decomposição ruidosos, com o ruído contribuindo em todos

os coeficientes, mas o sinal contribuindo apenas em alguns poucos. Uma

abordagem genérica para resolver o problema da supressão de ruído foi proposta

originalmente por Donoho e Johnstone [43], de cortar os coeficientes menores que

um certo limiar (thresholding), estabelecido de acordo com algum critério.

A supressão de ruído pode ser formalmente definida da seguinte forma. Seja

x(t) o sinal de dados corrompido por ruído:

x(t) = s(t) + n(t) (5.10)

onde s(t) é o sinal original, e n(t) o ruído aditivo, ambos funções do tempo a

serrem amostrados. Sejam W(⋅) o operador direto e W-1(⋅) o inverso que

representam a transformada de wavelet, escolhidos apropriadamente. Seja ainda

D(⋅,α) o operador que representa a supressão de ruído para um limiar α. Como o

objetivo é suprimir o ruído de x(t) para obter uma estimativa de s(t), então o

procedimento completo pode ser resumido nas três equações a seguir:

)(ˆ ts

C = W(x) (5.11)

Cd = D(C, α) (5.12)

) (5.13) ()(ˆ 1dCWts −=

DBD



Ou seja, inicialmente os coeficientes de decomposição wavelet C são calculados.

Em seguida, o operador de supressão de ruído é aplicado a C, cortando tudo o que

for menor que um limiar α apropriadamente estabelecido. Por fim, a estimativa

do sinal original é obtida a partir da transformada inversa dos coeficientes

com ruído suprimido C

)(ˆ ts

d.

Como pode ser observado no procedimento supracitado, a supressão de

ruído por decomposição wavelet não deve ser confundida com “suavização”

(smoothing) do sinal. A suavização é uma filtragem passa-baixas do sinal, ou seja,

apenas o conteúdo de alta freqüência é suprimido. A supressão de ruído por sua

vez, procura remover qualquer ruído presente, retendo qualquer conteúdo de

informação do sinal, independentemente do conteúdo frequencial do mesmo [44].

Mais ainda, a suavização é um procedimento linear, enquanto que a supressão de

ruído é não-linear – mais especificamente o operador D(C, α) da eq. (5.12). É

interessante salientar ainda que a supressão de ruído é considerada uma técnica

não-paramétrica.

O exemplo a seguir ajuda a ilustrar a diferença entre supressão de ruído e

suavização. A Figura 43 apresenta a decomposição wavelet (por DWT) em cinco

níveis de um sinal ruidoso com conteúdo frequencial variante no tempo (por isso

mesmo chamado convenientemente de “Doppler”). Cada componente de

aproximações corresponde a uma versão filtrada com seletividade crescente com o

nível. Como o ruído está presente em toda o espectro de freqüências, é de se

esperar que à medida que a seletividade do filtro passa-baixas aumente (nível de

decomposição), o ruído diminua. De fato, esse comportamento fica claro ao

observar as componentes a1 a a5. Da mesma forma, a suavização crescente do

sinal também fica clara, a tal ponto que, na componente a5, observa-se que o

conteúdo frequencial mais alto do sinal, que ocorre no primeiro quinto da escala

de tempo, está totalmente suprimido.

DBD



Figura 43 Decomposição wavelet de um sinal com DWT em cinco níveis (wavelet Sym4).

A supressão de ruído atua de forma bem mais seletiva, sem o prejuízo ao

conteúdo frequencial da suavização. A Figura 44 ilustra o estabelecimento de

limiares de corte às componentes de detalhes d1 a d5 do sinal. Observa-se que,

segundo o critério utilizado, a componente d1, que representa o conteúdo

frequencial mais alto do sinal, é tomada como ruído puro, sendo completamente

descartada. O resultado final da reconstituição do sinal após a supressão de ruído é

ilustrado na própria Figura 44. Embora o procedimento procure preservar o

conteúdo frequencial, percebe-se que a supressão de ruído não é “milagrosa”,

sendo ineficiente para relações sinal/ruído muito baixas.

O detalhamento do procedimento genérico de supressão de ruído definido

previamente envolve principalmente a definição do limiar. Algumas técnicas de

definição bastante difundidas na literatura são descritas a seguir, assim como as

principais maneiras de se efetuar a conformação do corte.

DBD



Figura 44 Supressão de ruído de um sinal tipo “Doppler”, decomposto por DWT em cinco

níveis, e o estabelecimento de limiares de corte para as componentes de detalhes.

5.3.1. Conformação do limiar de supressão: limiar abrupto ou suave

A conformação do limiar de supressão de ruído aos coeficientes é realizada

normalmente de duas maneiras distintas. O modo mais simples é a aplicação do

chamado limiar “abrupto” (hard), que simplesmente substitui os coeficientes

menores que o limiar por zero. A equação abaixo representa esta conformação:

≤

>=− α

α

C

CCC Hd ,0

, (5.14)

A conformação de limiar suave (soft), definida na eq. (5.15), apresenta

propriedades matemáticas mais interessantes, pois “encolhe” os coeficientes para

evitar a descontinuidade que a conformação abrupta impõe. Em função desse

encolhimento no domínio da transformada, o procedimento de supressão é

comumente referido na literatura como “supressão de ruído por decomposição

wavelet com encolhimento” (wavelet shrinkage de-noising), quando a

conformação suave é escolhida [44]. A Figura 45 ilustra a diferença entre as duas

abordagens para a conformação de limiar.

DBD



( )( )

≤

>−=− α

αα

C

CCCsignC Sd ,0

, (5.15)

Figura 45 Diferenças entre as conformações de limiar abrupto e suave.

5.3.2. Regras para seleção de limiar

Embora pesquisadores especialistas em wavelets como Mallat,

Wickerhauser e Coifman tenham sido os primeiros a abordar a aplicação da

supressão de ruído, o trabalho de Donoho parece ser o mais divulgado, muito

provavelmente por ter sido o primeiro a interpretar formalmente o assunto [45].

Particularmente, em seu trabalho algumas regras para seleção de limiar foram

desenvolvidas, entre elas a mais simples e utilizada de todas, a chamada “regra

universal” ou “VisuShrink”. O termo “shrink” se refere ao efeito de encolhimento

previamente mencionado que a conformação de limiar suave provoca, uma vez

que esta foi a escolha de Donoho no desenvolvimento analítico de sua regra.

O esquema VisuShrink foi desenvolvido como a solução de um problema de

otimização, no qual um critério minimax submetido a restrições foi adotado. O

DBD



critério minimax é comumente utilizado em Estatística para projetar estimadores.

Para o problema da supressão de ruído, a função de regressão desconhecida a ser

estimada é o sinal sem ruído. O estimador minimax provê um resultado que

corresponde ao menor erro médio quadrático máximo de um dado conjunto de

funções [33]. Este conjunto de funções é submetido à restrição que condiciona a

estimativa para ser tão “suave” quanto o sinal original [45]. A motivação para essa

restrição foi a necessidade de uma melhor relação de compromisso entre variância

e polarização (bias). O princípio minimax otimiza apenas o erro médio quadrático,

resultando em uma relação de compromisso entre a polarização e a variância que

mantém ambos com ordem de grandeza de mesma magnitude. Em conseqüência,

as estimativas exibem consideravelmente algumas estruturas indesejáveis

induzidas por ruído, tais como ondulações (ripples), “manchas” (blips) e

oscilações [45].

A regra de seleção Visu é muito simples de aplicar, pois é uma função

simplesmente da largura amostral n do sinal original, que é também o número de

coeficientes computado para uma transformada de wavelet ortogonal. Para um

sinal x(t) corrompido por ruído gaussiano de média nula, o limiar Visu é dado por:

( )nlog2σα = (5.16)

onde σ é o nível de ruído, e o logaritmo está na base natural.

O esquema Visu é eventualmente acusado de “super-suavizar” as

estimativas [46]. Para evitar essa possibilidade, uma outra classe de regras, que

computa o limiar de uma forma adaptativa aos dados, pode ser usada no lugar da

Visu. Uma dessas regras utiliza o estimador de risco não-polarizado de Stein

(SURE ou SUREShrink – Stein’s Unbiased Risk Estimator), que minimiza uma

função de risco para um valor de limiar particular. Para um dado conjunto de

coeficientes, o limiar é aquele que apresenta o menor risco. Outro esquema

adaptativo aos dados anti-super-suavização é a regra RiskShrink, que pode ser

compreendida como o esquema Visu não submetido à restrição da suavidade.

Exatamente por isso, esse esquema é conhecido também como Minimax, já que o

limiar é selecionado de acordo com o critério minimax.

DBD



Uma alternativa interessante às regras de seleção anteriores pode ser uma

mistura delas. A chamada solução “heurística” aplica o esquema SURE, a menos

que a relação sinal/ruído seja baixa. Neste caso, o limiar Visu é selecionado em

seu lugar, uma vez que a regra SURE tende a ser mais conservativa, ou seja, sua

estimativa ainda seria muito “ruidosa” [33].

A adaptabilidade aos dados das regras de seleção Risk e SURE permite outra

caracterização para o limiar. Com relação aos diferentes níveis de decomposição

wavelet, o limiar universal é o mesmo para todos, motivo pelo qual o limiar é

classificado como “global”. Por outro lado, o limiar é dito “local” para os

esquemas SURE e Risk, já que é estimado localmente para cada nível de

decomposição.

Quando uma regra adaptativa aos dados é escolhida, um procedimento de

quatro etapas é mais representativo do procedimento geral de supressão de ruído,

que o de três estágios representados pelas eqs. (5.11) a (5.13). Naquela seqüência,

antes de se aplicar o operador de supressão de ruído da eq. (5.12), um operador de

determinação de limiar deve ser aplicado, como na eq. (5.17) abaixo.

) (5.17) (Cd=α

DBD


5 Supressão de ruído por decomposição wavelet

Documents

Transcript of 5 Supressão de ruído por decomposição wavelet