EOG Man-Machine Interface

IAS 2010 – Instrumentação e Aquisição de Sinais

Projecto final Lisboa, Portugal, 12 Dezembro 2010

Interface Homem-Máquina utilizando EOG

Ana Cláudia Carriço, Ana Ruela, Cecília Nunes, Joana Pinto, Joana Rodrigues e João Semedo

Resumo – O electro-oculograma é um método de monitorização

do movimento ocular, baseado na variação de tensão gerada pela

alteração da orientação espacial do dipolo ocular. Este sinal

electrofisiológico pode ser utilizado para controlar dispositivos

externos, o que poderá ser extremamente útil em aplicações para

pessoas com mobilidade reduzida. Com este trabalho pretendeu-

se implementar um telefone controlado pelos movimentos

oculares (eyePhone). Tendo em conta as limitações da

implementação, considera-se que os resultados obtidos foram

satisfatórios.

Indexação – biopotenciais, electro-oculograma, Interface

Homem-Máquina, MATLAB,

I. MONOGRAFIA

A interface Homem-Máquina (IHM) é a interacção entre

o homem e a máquina por meio de troca de sinais,

nomeadamente eléctricos, de modo a desempenhar uma

determinada tarefa.

A IHM pode ter duplo sentido. Por um lado, pode ser

entendida pelo controlo de máquinas por sinais gerados

pelo corpo humano. Por outro, pode consistir no estímulo

do corpo humano por potenciais gerados por máquinas, por

exemplo em próteses de apoio à locomoção desenvolvidas

no âmbito da Biomecatrónica. O presente trabalho refere-se

à primeira abordagem.

Embora a interface comum com dispositivos

electrónicos, como computadores ou telemóveis, envolva a

utilização de um teclado ou de um rato, em pessoas com

deficiências motoras graves, como lesões da medula

espinal, mielopatia, mãos amputadas ou mesmo a síndrome

do locked-in, torna-se complicada a relação com estes

aparelhos electrónicos.

Desde o início do século XX, com o crescimento da

utilização das máquinas, têm surgido correntes científicas

interessadas na possibilidade de uma relação mais estreita

entre o Homem e as máquinas.

Assim, com o desenvolvimento da tecnologia, têm

surgido, com maior frequência, sistemas auxiliares a

pessoas de mobilidade reduzida, em particular a

tetraplégicos. Devido à sua incapacidade de movimento, é

de extrema importância o desenvolvimento destes sistemas,

que devem ser cada vez mais robustos e funcionais, para

proporcionar uma maior autonomia e consequentemente

uma melhor qualidade de vida a estas pessoas.

Com a ajuda da IHM, indivíduos com deficiências

podem retomar algumas das suas capacidades, melhorando

assim a sua qualidade de vida.

Para tal, pode-se recorrer a vários métodos de

interacção, como toque, visão, audição, transferência de

calor ou qualquer outra função física ou cognitiva. Este

processo pode ser representado pela Figura 1.

Para além da já referida aplicação, os biopotenciais

abrem um leque de inúmeras possibilidades: quer a nível de

simplificação de tarefas, métodos de diagnóstico ou mesmo

a utilização de equipamentos mãos-livres em cirurgia.

Esclarecendo o último ponto, seria em tudo vantajoso que

um médico, durante uma cirurgia, pudesse manipular um

telefone ou um computador, evitando riscos de

contaminação.

Neste sentido, a IHM pode tirar partido dos

biopotenciais humanos gerados pela actividade eléctrica de

algumas células do organismo. Esta actividade deve-se à

existência de um gradiente iónico entre o interior e o

exterior da célula, que em repouso é negativa, considerando

o interior em relação ao exterior. Quando a membrana da

célula recebe algum estímulo que a despolarize além do seu

limiar, surge o potencial de acção, ou seja, uma alteração

rápida na polaridade da tensão.

Estes potenciais podem ser medidos com recurso ao

electrocardiograma (ECG) no caso do potencial cardíaco,

Fig. 1. Interface Homem-Máquina (IHM)

Mestrado Integrado em Engenharia Biomédica, Instituto Superior Técnico, Lisboa, Portugal

63947, [email protected], [email protected]

Mestrado Integrado em Engenharia Biomédica, Instituto Superior

Técnico, Lisboa, Portugal 62821, [email protected], [email protected]


62835, [email protected]


Técnico, Lisboa, Portugal

63772, [email protected]


Técnico, Lisboa, Portugal 62757, [email protected], [email protected]


62839, [email protected], [email protected]

2

electromiograma (EMG) no caso do potencial do músculo

esquelético, electroencefalograma (EEG) no caso dos

neurónios e electro-oculograma (EOG) no caso do

movimento ocular.

Neste trabalho, desenvolveu-se um destes dispositivos,

tendo-se escolhido como sinal fisiológico o último referido:

o EOG, cujas variações podem ser facilmente controladas

voluntariamente. Além disso, o movimento ocular é um

movimento feito sistematicamente, quer para ler, escrever,

adquirir informação sobre o ambiente, etc. Assim, esta

capacidade de controlar a direcção do olhar pode ser

utilizada como meio de comunicação com as máquinas.

A. O electro-oculograma

O electro-oculograma é um método de medição dos

potenciais eléctricos associados ao movimento ocular, com

eléctrodos colocados em posições estratégicas na cara. O

olho possui uma diferença de potencial de repouso entre o

as partes frontal e interior do globo ocular (pólo positivo e

negativo, respectivamente).

O potencial de repouso é gerado maioritariamente pela

polarização do epitélio pigmentar da retina, variando entre

os 10 μV e os 100 μV, conforme a luminosidade. Em

resposta à iluminação, a retina sofre uma queda rápida de

potencial de repouso (60 a 75 s) chamada de oscilação

rápida, seguida por uma lenta subida (7 a 14 min) chamada

de oscilação lenta. A técnica pode ser usada de inúmeras

formas, sendo das mais frequentes na prática clínica a

medição da amplitude do potencial de repouso e a resposta

à iluminação.

O movimento ocular provoca movimentação do dipolo

(Figura 2), resultando em fluxos de corrente em torno das

órbitas proporcionais à magnitude do potencial de repouso.

Consequentemente, obtêm-se diferentes leituras de tensão,

nos eléctrodos de superfície, cuja interpretação permite

saber a orientação espacial dos olhos do sujeito avaliado.

Esta tensão varia sensivelmente entre os 0.1 e 4 mV. Este

fenómeno possui grande utilidade, por exemplo no

desenvolvimento de dispositivos de interface homem-

máquina para indivíduos com locomoção debilitada,

assunto abordado no presente trabalho.

B. Estado actual da tecnologia

O princípio da electro-oculografia surge em 1848,

quando Emil du Bois-Reymond verificou que a córnea tem

um potencial positivo em relação à parte posterior do olho.

Mais tarde, por volta dos anos 50, Elwin Marg referiu-se

a esta técnica como electro-oculograma e em 1962 é

desenvolvida a primeira aplicação clínica.

Nos últimos anos verificou-se um elevado

desenvolvimento tecnológico para pessoas com

dificuldades motoras. Assim, existe, actualmente, uma

grande quantidade de estudos de IHM baseados em EOG

na literatura. Em [8] e [9] foram desenvolvidas interfaces

com capacidade para introdução de texto totalmente

controlada por EOG. Em [7], pretendeu-se construir um

robot controlado pelos movimentos horizontais e verticais e

pelo piscar dos olhos. Além disso, em [4], foi desenvolvido

um protótipo de uma cadeira de rodas controlada com os

movimentos oculares.

C. Anatomia do olho humano

A visão é um dos sistemas sensoriais mais úteis e

importantes do ponto de vista funcional, sendo por isso

considerado como instrumento primordial da relação do

indivíduo com o meio ambiente. A organização das

estruturas nervosas implicadas na função visual humana é,

pela sua complexidade e pela sofisticação dos seus

mecanismos, a prova indubitável desta proeminência. A

anatomia do olho humano encontra-se representada na

Figura 3.

O primeiro intermediário entre o mundo visual e o

cérebro é a retina, o órgão receptor da visão. A retina, a

terceira camada e a mais interior do globo ocular, é assim

responsável pela formação de imagem, dando início às vias

visuais. Este órgão contém dois tipos de receptores

denominados de cones e bastonetes. Apesar de serem

ambos fotoreceptores, uma vez que captam energia

luminosa, estes dois tipos de células tem características e

funções muito próprias. Enquanto os cones detectam as

formas e as cores, sendo responsáveis pela visão diurna, os

bastonetes só entram em actividade quando a intensidade

luminosa é muito fraca ou à noite.

A córnea é a estrutura mais anterior do olho, sendo

caracterizada pela sua rigidez e transparência. Permite a

entrada de luz no olho, assim como a sua focagem. Atrás

Fig. 3. Anatomia do olho humano

Fig. 2. Movimento do dipolo ocular

3

da córnea localiza-se o humor aquoso, um líquido que

preenche a cavidade anterior do olho, e que ajuda a manter

a sua forma esférica, ao mesmo tempo que nutre estruturas

como o cristalino e a córnea. O humor aquoso é

responsável pela tensão ocular.

Por outro lado, a cavidade posterior do globo ocular,

também designada por câmara vítrea, encontra-se

preenchida por uma substância gelatinosa, o corpo vítreo,

cuja finalidade é prevenir o colapso do globo ocular e

manter a retina em contacto com a coróideia.

Por fim, a íris, que corresponde à parte colorida do olho

é uma estrutura contráctil, formada por músculo liso e que

separa os compartimentos aquosos em anterior e posterior.

Tem como finalidade o controlo da entrada de luz através

da abertura ou fecho da pupila, respectivamente pelo

relaxamento ou contracção dos seus músculos.

Os músculos responsáveis pelos movimentos oculares

(Figura 4) são os rectos medial, lateral, superior, inferior e

os músculos oblíquos.

Os rectos medial e lateral contraem-se para executar os

movimentos dos olhos na horizontal. Os rectos superiores e

inferiores contraem-se para movimentar os olhos na

vertical.

Os músculos oblíquos, por sua vez, são responsáveis

pela rotação dos glóbulos oculares e manutenção dos

campos visuais na posição central.

D. Movimentos oculares

O EOG detecta essencialmente três tipos de movimentos

oculares: fixação visual, sacadas e piscar de olhos.

A fixação (Figura 5) corresponde à fase estacionária do

movimentos ocular, nesta fase é estabelecido um contacto

visual prolongado com um único ponto. A fixação

geralmente ocorre entre duas sacadas e apresenta um

intervalo de duração entre os 100 ms e os 200 ms. A

fixação nunca é perfeitamente estática, ocorre sempre

algum movimento ocular involuntário.

As sacadas (Figura 6) são movimentos rápidos e

simultâneos de ambos os olhos na mesma direcção. A

duração de uma sacada depende da distância angular que os

olhos percorrem num movimento, ou seja, depende da

amplitude da sacada. Geralmente, uma sacada tem uma

amplitude de 20 graus e uma duração que varia entre os 10

ms e os 100 ms.

O piscar dos olhos (Figura 7) ocorre devido à

necessidade fisiológica do olho espalhar a lágrima,

produzida pelas glândulas lacrimais, com o objectivo de

lavar e lubrificar o olho. Em média, o ser humano pisca os

olhos entre 12 e 19 vezes por minuto, sendo que cada

piscar tem uma duração que varia entre os 100 ms e os 400

ms.

E. Montagem dos eléctrodos

Por norma, são utilizados um a dois canais de EOG. Um

dos eléctrodos é colocado 1 cm para fora e para cima do

canto externo de um olho, e o outro eléctrodo 1 cm para

fora e para baixo do outro olho, utilizando as orelha como

referência ou usando uma montagem diferencial entre os

dois eléctrodos. Esta montagem encontra-se esquematizada

na Figura 8.

No entanto, para distinguir os movimentos verticais dos

horizontais devem ser usadas montagens adicionais. Assim,

o que se faz é utilizar uma montagem de quatro eléctrodos,

três deles à volta do olho direito - em cima, em baixo e no

canto externo do olho direito - e um no canto externo do

olho esquerdo. Deve-se ainda acrescentar um eléctrodo no

meio da teste, correspondente à comum.

Esta montagem encontra-se esquematizada na Figura 9,

onde o eléctrodo a verde corresponde à terra, os eléctrodos

a vermelho ao canal horizontal e os eléctrodos a preto ao

Fig. 8. Esquema habitual da colocação dos eléctrodos num EOG

Fig. 7. Piscar de olhos

Fig. 6. Sacada superior

Fig. 5. Fixação ocular

Fig. 4. Músculos responsáveis pelos movimentos oculares

4

canal vertical. Assim, tanto o canal horizontal como o

vertical serão diferenciais.

F. Variação do potencial com os movimentos oculares

Como referido, o potencial de repouso sofre pequenas

variações com a luminosidade. Com os olhos em repouso e

dada a montagem adoptada dos eléctrodos, a tensão

captada deverá ser nula.

Quando o olho se vira para a direita, a parte positiva do

dipolo fica mais próxima do eléctrodo localizado do lado

direito relativamente ao eléctrodo do lado esquerdo que

fica mais próximo do pólo negativo. Assim, no canal de

movimento horizontal é registada uma tensão positiva, e no

caso oposto é registada tensão negativa.

Idealmente, a amplitude da onda quadrada segue uma

função sinusoidal do ângulo do olhar (Figura 10). A

rotação máxima é de ±70°, mas a relação entre o ângulo e a

tensão torna-se pouco fiável a partir dos ±30°. O mesmo

ocorre para a direcção vertical, sendo positivo a sacada

superior e negativa a inferior.

G. Vantagens e Problemas do EOG

Uma das principais desvantagens do EOG é o facto do

potencial da retina de cada indivíduo sofrer variações ao

longo do dia, entre outros factores, como fadiga ou

luminosidade, causando um elevado baseline drift e

exigindo frequente calibração do dispositivo.

Se por um lado, o corte da componente DC elimina este

problema, também reduz a qualidade do resultado

pretendido. Outras dificuldades residem na existência de

artefactos, por exemplo, oscilações dos eléctrodos na pele,

e não linearidade da amplitude dos potenciais com o ângulo

dos olhos.

As vantagens incluem a possibilidade de fazer o teste no

escuro ou com olhos fechados, que neste trabalho não tem

utilidade, bem como o referido controlo dos sinais de saída

pelo indivíduo sujeito ao teste.

É ainda de destacar a sua facilidade de utilização em

pessoas acamadas e de detecção do piscar de olhos,

constituindo o EOG o sistema de monitorização de

movimentos dos olhos mais barato.

II. DESENVOLVIMENTO DO PROTÓTIPO

Com o objectivo de criar um dispositivo que permitisse

a realização de uma actividade específica sem utilização

dos membros, a primeira fase foi a escolha do biopotencial

a utilizar e a utilização do mesmo.

Numa primeira fase, pensou-se em desenvolver um

dispositivo de levitação, com o qual seria possível deslocar

uma bola dentro de um tubo, através dos níveis de

concentração do utilizador. Para tal, tentou-se adquirir e

identificar alterações em certas ondas cerebrais com a

concentração, nomeadamente as ondas beta e delta, a partir

da construção de um dispositivo de electroencefalograma.

A aquisição foi bem sucedida. No entanto,

possivelmente devido a uma razão sinal-ruído elevada e/ou

baixa amplitude das ondas na zona beta, apenas se

conseguiu identificar diminuição na amplitude da onda

alfa, aquando da realização de um cálculo com os olhos

fechados. Não obstante, a tentativa de levitação de um

objecto com os olhos fechados foi considerada de reduzida

utilidade.

Assim, optou-se por uma segunda abordagem: o

desenvolvimento de um telefone controlado por EOG, uma

vez que a aquisição dos potenciais oculares já tinha sido

previamente conseguida. Esta opção é menos exigente a

nível da qualidade do sinal, mas mais complexa a nível de

implementação computacional.

A. Alguns requisitos relativamente ao design e prática do

EOG

Quanto à iluminação, deve ser fornecida por uma ou

várias lampas de luz branca, colocadas de forma a iluminar

uniformemente o campo de visão do indivíduo sujeito ao

teste. Devem ser evitadas sombras ou locais de grande

intensidade focal directa. A luz deve ser ajustável para

efeitos de calibração, dependendo da análise pretendida.

Fig. 10. Relação entre o ângulo horizontal e amplitude das formas de

onda quadradas obtidas no EOG

Fig. 9. Esquema utilizado no trabalho para colocação dos eléctrodos

5

Em relação aos eléctrodos, estes devem ser feitos de

material não polarizável como prata/ cloreto de prata ou

ouro. Os eléctrodos devem permitir uma ligação de

impedância menor que 10 kΩ com a pele, numa banda de

frequência que se estende dos 30 aos 200 Hz. A aplicação

dos eléctrodos de superfície deve ser feita com gel

condutor e em pele limpa com álcool ou outro material de

preparação, dada a fraca condutividade das camadas

superiores da pele.

No que diz respeito à corrente, a corrente directa

reproduz com fidelidade as variações tensão com forma de

onda quadrada produzidas no movimento ocular. Contudo,

a utilização e a amplificação desta componente podem

levar a problemas de baseline drif ou instabilidade, devido

à referida variação do potencial de repouso da retina.

Assim, é recomendada a utilização de corrente alternada,

limitada a uma banda dos 0.3 aos 30 Hz, sensivelmente.

Além de cortar a componente contínua, esta banda

proporciona a eliminação dos 50 Hz da frequência da rede.

A variação do potencial da retina é também divergente

entre indivíduos e outros factores sendo essencial efectuar

calibração no início de cada teste. Na nossa abordagem,

além de se efectuar a calibração inicial, optou-se por não

cortar a componente contínua para contornar o baseline

drift, já que a qualidade dos resultados estaria

comprometida.

Quanto à visualização das formas de onda, é importante

que os dados estejam visíveis, de forma transitória ou não,

para permitir identificação artefactos ou necessárias

alterações na colocação dos eléctrodos. É de extrema

importância o isolamento galvânico, assegurando a

segurança do indivíduo sujeito ao impedir a imposição de

corrente ao corpo, bem como um pequena redução de

ruído.

Esta foram recomendações da International Society for

Clinical Electrophysiology of Vision[1]

B. Circuito

A configuração clássica de um sistema de registo de

biopotenciais é a indicada na Figura 11. O sinal é captado

pelos eléctrodos e passa pelo amplificador diferencial (ou

de instrumentação). De referir que o comum electrónico

corresponde ao eléctrodo colocado na testa.

Contudo este pode ser colocado noutro local do corpo

para de redução de ruído, nomeadamente no lóbulo da

orelha.

De seguida, o sinal passa por um amplificador de

isolamento e pelo filtro necessário. Finalmente, é possível a

visualização do sinal e o tratamento do mesmo.

Quanto à parte inicial da aquisição, como explicado, o

sinal do EOG é capturado por cinco eléctrodos, colocados

de acordo com a Figura 9.

Os eléctrodos utilizados são os indicados na Figura 12.

Foi ainda utilizado um gel condutor abrasivo para

preencher os eléctrodos, o Ten20.

O circuito de aquisição requer uma elevada impedância

de entrada e elevada rejeição de modo comum, asseguradas

por dois INA116, um por cada canal de aquisição. Estes

amplificadores de instrumentação possuem impedância de

entrada de e rejeição de modo comum de 86 dB

(para um ganho de 100). O ganho proporcionado por este

modelo é calculado a partir de:

(1)

onde G é o ganho e a resistência que controla o

ganho. A impedância de entrada deve ser elevada de forma

a garantir que a divisão de tensão entre a pele e o circuito

forneça a maior fracção de sinal ao circuito. Uma vez que

não se realiza a supressão da componente DC dos sinais

adquiridos e a alimentação dos amplificadores de

instrumentação é realizada através de pilhas, que fornecem

tensões mais reduzidas, há que ter especial atenção à

saturação dos amplificadores. Tal é garantido através da

escolha do ganho, que foi efectuada pesando ainda o ganho

necessário para a correcta visualização dos sinais e uma

amplificação demasiado elevada de ruído. Optou-se por um

ganho de 100 (mais precisamente 101).

Por sua vez, uma elevada rejeição de modo comum

permite obter sinais variáveis de pequena amplitude, como

os que caracterizam o EOG, sobrepostos a uma

componente comum elevada, que é assim eliminada.

Fig. 12. Eléctrodos utilizados na aquisição do EOG

Fig. 11. Configuração clássica de um sistema de registo de biopotenciais

6

Uma elevada rejeição de modo comum é também indicada

para sinais diferenciais, que é o caso. Assim, a exigência

para rejeição de modo comum é elevada, idealmente maior

que 80 dB [10].

Depois, para assegurar o isolamento galvânico, utilizou-

se dois amplificadores de isolamento, o ISO122 e o

ISO124, um para cada canal. O isolamento galvânico é

garantido pela transmissão digital do sinal através de uma

barreira capacitiva, sendo produzido ruído a cerca de 500

kHz na ordem dos 20 mV.

Conhecendo a gama de frequências de interesse, o sinal

foi filtrado para remover frequências indesejadas, como as

do ruído inerente à rede. Deste modo, foi desenvolvido um

filtro passa-baixo, com frequência de corte projectada para

30 Hz. Este filtro é de grande importância atenuando não

só a frequência de rede como o ruído adicionado pelo

amplificador de isolamento, servindo ainda como filtro

anti-alising. A construção de filtros analógicos passa-alto e

passa-banda, para a atenuação do Baseline Drift não foi

bem sucedida, devido à exigência de uma banda de rejeição

estreita, próxima dos 0 Hz.

Alternativamente, procurou-se uma solução

computacional com base na permanente dos thresholds,

para identificar o movimento, como será explicado na

secção C.

O sinal à saída de cada um dos dois filtros passa-baixo é

por fim digitalizado e fornecido ao computador através da

placa de aquisição.

O circuito implementado encontra-se representado nas

Figuras 12 e 13.

Fig. 12. Esquema do circuito utilizado na aquisição do EOG

Fig. 13. Circuito utilizado na aquisição do EOG

7

C. Tratamento do sinal e Implementação em MATLAB

A aquisição do sinal foi realizada com recurso a uma

placa de aquisição da National Instruments, conectada a

um computador, permitindo o posterior processamento do

sinal no MATLAB.

Os sinais são obtidos com uma Sample Rate de 5000

amostras p/segundo (Aps), valor bastante superior ao

teoricamente necessário para o intervalo de frequências dos

potenciais de interesse, 0 a 30 Hz.

Uma frequência de amostragem de 60 Aps é

teoricamente suficiente. Embora se tenha utilizado um

valor bastante superior, este é um dos argumentos de

entrada do programa desenvolvido, o que facilita a sua

alteração, podendo assim ser reduzido para a

implementação de um Analog to Digital Converter (ADC)

móvel de baixo custo.

De facto, ainda que a placa de aquisição permita utilizar

intervalos de tensão relativamente grandes na sua entrada,

tal é feito à custa de uma redução da sua resolução. Uma

vez que a amplificação de sinal no circuito construído se

realiza nos amplificadores de instrumentação (antes do

sinal ser filtrado), esta não deve ser demasiado elevada.

Como se optou pela implementação de um ganho de

100, os potenciais adquiridos passam a apresentar tensões

entre 10 e 100 mV. A Units Range utilizada foi assim de -1

a 1 V para garantir que a Baseline Drift não satura a

entrada do ADC da placa ao mesmo tempo que se

maximiza a resolução do mesmo.

O objectivo da aquisição foi conseguir, a partir dos dois

canais adquiridos, discriminar a tecla focada pelo

utilizador, exigindo apenas uma calibração inicial e sem

qualquer restrição nos movimentos efectuados.

Uma vez que se pretende que o processamento do sinal

seja efectuado em tempo real, são adquiridas pequenas

janelas de sinal sendo estas imediatamente processadas.

Porque na maior parte das janelas adquiridas a

componente de interesse será DC, tal impede a utilização

de filtros digitais, que se revelam muito instáveis na

presença de janelas curtas. Permitindo componentes com

frequências próximas dos 0 Hz, os sinais obtidos vão ser

afectados pela Baseline Drift, tendo sido necessário

implementar um algoritmo que lidasse da melhor forma

com este tipo de ruído. Tal foi conseguido utilizando

Thresholds dinâmicos.

É efectuada uma calibração inicial onde se definem as

amplitudes das sacadas que se pretendem detectar em

ambos os eixos utilizados. Depois, apenas se exige que o

utilizador foque o seu olhar no centro do ecrã (tecla central)

durante a primeira janela adquirida. O programa define

neste momento a origem do referencial.

Se na janela seguinte o utilizador mantiver o olhar na

tecla central, a origem de ambos os eixos será actualizada

para as médias dos sinais obtidos. Se o utilizador desviar o

olhar, por exemplo, para a tecla directamente à direita, será

identificada uma alteração no eixo horizontal. A origem do

eixo vertical será, mais uma vez, actualizada para a média

do sinal correspondente, sendo que a origem do eixo

horizontal será agora actualizada para a média do sinal

subtraída da amplitude correspondente ao movimento

detectado. Assim, quanto menor a janela, melhor o

algoritmo lida com transições rápidas na componente DC.

O Threshold para detecção utilizado é de 60% da

amplituda da sacada, sendo que se exige que 65% dos

pontos de uma janela excedam o Threshold para que seja

considerado o movimento. Estes valores foram

determinados empiricamente, representando um

compromisso entre a sensibilidade ao ruído (especialmente

a Baseline Drift) e a detecção das sacadas. Ambos os

valores são argumentos do algoritmo, permitindo uma

melhor afinação da detecção para diferentes montagens.

A escolha do comprimento das janelas adquiridas é, no

entanto, o parâmetro mais crítico no que toca à anulação do

efeito da Baseline Drift. Quanto menor a janela de

aquisição, melhor o algoritmo lida com a Baseline Drift,

conforme explicado acima.

No entanto, ao diminuir a janela de aquisição, aumenta a

probabilidade da actualização ser corrompida por ruído. O

artefacto resultante do piscar de olhos é aquele que mais

prejudica o processo de actualização dos Thresholds.

Uma vez que o algoritmo implementado não utiliza as

variações no sinal, para realizar a detecção utilizou-se a

derivada para detectar mudanças rápidas. Qualquer janela

em que é detectada uma variação súbita no sinal (negativa

ou positiva) é ignorada, o que exclui a contribuição do

artefacto referido.

O comprimento utilizado para cada janela foi assim de

250 ms, valor que garante a rápida adaptação do algoritmo

à Baseline Drift, ao mesmo tempo que permite a detecção

de variações rápidas, não sendo os resultados afectados ao

ignorar algumas janelas.

Outro aspecto importante que prejudica a qualidade do

sinal é o facto de as transições não serem totalmente

independentes entre os eixos, ou seja, ou transição

realizada na horizontal provocará alterações no sinal

vertical, o que dificulta bastante a correcta detecção desta

componente. Este problema é atenuado através de um

aumento da exigência na detecção, provocando mais um

trade-off difícil de solucionar entre manter o algoritmo

estável ao longo destas alterações e não falhar transições

que de facto ocorrem em potenciais já ligeiramente alterado

por este artefacto.

D. Interface Gráfica

A determinação da posição do foco do utilizador é

utilizada para controlar um telefone. O mapa utilizado tem

dimensões 3x4, ou seja, existem duas sacadas a detectar no

canal vertical e três a detectar no canal horizontal.

O telefone foi criado através de uma interface gráfica no

MATLAB, Figura 14.

A tecla central é o "5" e é esta tecla que é utilizada na

primeira janela de aquisição para definir a origem do

referencial. Na calibração horizontal o utilizador deverá

focar sucessivamente as teclas "5", "4", "6" e "0". Na

calibração vertical a sequência de teclas utilizada é "5", "8"

e "2". As calibrações são verificadas pelo programa e

podem ser repetidas tantas vezes quanto necessário. Para

iniciar a utilização basta premir a tecla "START", podendo

8

esta ser parada a qualquer momento através da tecla

"STOP".

Sempre que se inicie a aquisição deve focar-se a tecla

central. Para confirmar a selecção de uma das teclas, ou

seja, marcar um número, basta manter o foco na tecla por

mais de 3 segundos. A sequência marcada vai sendo

apresentada numa caixa lateral. Existe ainda uma tecla para

apagar números introduzidos, tecla "C" e uma tecla para

efectuar a chamada, tecla "CALL".

A tecla determinada pelo foco é automaticamente

destacada a vermelho. Esta funcionalidade é de extrema

importância, permitindo um feedback constante com o

utilizador.

A utilização de uma quarta coluna ao invés de uma

quarta linha deve-se a uma melhor performance do detector

no eixo horizontal. Tal deve-se principalmente à existência

do artefacto do piscar de olhos no canal vertical.

E. Resultados

De seguida apresenta-se uma aquisição de 30 segundos

de EOG, em que a sequência de teclas utilizada foi: “5”,

“2”, “1”, “4”, “5”, “6”, “5”, “4” e “1”. O detector foi

utilizado com os parâmetros indicados acima: janela de

aquisição de 250 ms, percentagem da amplitude da sacada

utilizada como Threshold de 60% e fracção mínima de

pontos sobre o Threshold de 65%. A figura 14 representa a

aquisição do sinal do canal horizontal do EOG e a figura 15

corresponde à aquisição do sinal do canal vertical.

De referir, a existência de sobre-elevações somente na

figura 16 correspondentes a artefactos resultantes do piscar

de olhos involuntário do utilizador. Outro factor a ter em

conta é a baseline drift, caracterizada por oscilações de

frequência reduzida observadas na maior parte do sinal.

Para uma análise espectral dos sinais obtidos procedeu-

se ao cálculo das transformadas de Fourier de cada um dos

sinais subtraído da própria média (Figuras 17 e 18).

Procedendo à análise das transformadas, verifica-se que

o efeito dos filtros passa-baixo é pouco visível próximo da

frequência de corte teórica. Em particular, é de notar que o

ruído da rede é pouco atenuado como se pode observar nas

Figuras 17 e 18. Destaque ainda para os picos junto à

componente DC, muito importantes neste tipo de sinal. A

amplitude dos picos observados nos 50 Hz difere de um

canal para o outro, a amplitude do canal horizontal é

inferior à do canal vertical. Esta diferença era esperada uma

vez que a amplitude do sinal do canal vertical é superior à

do sinal do canal horizontal para todas as frequências.

Fig. 16. Sinal do EOG adquirido no Canal Vertical

Fig. 15. Sinal do EOG adquirido no Canal Horizontal

Fig. 14. Interface gráfica do eyePhone

9

As rápidas transições de amplitude correspondem a

sacadas. Nestes instantes o utilizador desloca os olhos de

um botão para outro, Tabela 1.

A detecção foi correctamente efectuada para toda a

sequência utilizada, com excepção da posição final. A

explicação para a falha na detecção é simples: Esta

transição ocorre muito próximo do final da aquisição. Se

recordarmos que o algoritmo ignora janelas em que

ocorrem variações bruscas no sinal não é surpreendente que

não tenha havido detecção uma vez que seria necessária

mais uma janela já com o patamar da sacada definido.

Outro visível aspecto muito importante é o facto de

transições horizontais afectarem o sinal vertical e vice-

versa. Se a estes artefactos acrescentarmos o artefacto do

piscar de olhos e a Baseline Drift é até assinalável a

robustez apresentada pelo algoritmo de detecção neste

exemplo.

F. Ideias para o futuro e conclusões

Este trabalho teve como objectivo o desenvolvimento de

uma IHM com vista a contribuir para a autonomia e

capacidade de comunicação de indivíduos com deficiências

motoras. Deste modo, foi bem sucedida a construção de um

dispositivo de EOG, que permite ao indivíduo a marcação

de um número de telefone num teclado, para posterior

ligação a um programa como o Skype.

Após a realização do trabalho, constatou-se que o

sistema pode ser utilizado como IHM de modo eficiente.

De um ponto de vista técnico, há que destacar:

(a) Tanto o sinal horizontal como o vertical do EOG

foram medidos com sucesso, com um CMRR de 86 dB e

uma sampling rate de 5000 Hz.

(b) Poder-se-ia ter utilizado um filtro passa-baixo de

uma ordem superior, dada a não total eliminação do ruído

com frequência superior a 30 Hz. Contudo, o grau de

eliminação deste tipo de ruído foi suficiente para cumprir

os objectivos. De facto, o ruído que realmente afecta os

resultados é o Baseline drift e a interferência num canal

devido a movimentos no eixo teoricamente ortogonal, que

podem dar origem a erros, mesmo após o tratamento

computacional referido.

(c) Os threshold poderiam estar definidos com uma

margem de tolerância dentro da qual o sinal poderia variar

sem alterar a classificação do estímulo, dando histerese ao

classificador de eventos e tornando a sua acção mais

robusta.

(d) A possibilidade de utilizar o telefone com sucesso de

modo a possibilitar uma comunicação eficiente.

O sistema de EOG revelou-se mais simples que o de

EEG, quer a nível de aquisição de sinal, quer a nível de

eficiência do processo em geral. Além disso, o EOG é um

método relativamente barato e que funciona bem em tempo

real.

Poder-se-á ainda utilizar outros métodos de detecção dos

movimentos oculares como o vídeo-oculograma (VOG),

sclera coil e oculograma de infravermelhos.

Seria também interessante o desenvolvimento de um

dispositivo híbrido, ou seja, simultaneamente de EOG e

EEG, a nível de comunicação ou de controlo de objectos

exteriores, como seria o caso da levitação da bola.

Outra ideia seria a implantação cirúrgica dos eléctrodos

com tecnologia de comunicação sem fios, como o

TABELA I

BOTÃO SELECCIONADO EM FUNÇÃO DO SINAL ADQUIRIDO

Tempo/s Botão Direcção

4.8 5-2 Cima

8.3 2-1 Esquerda

11.2 1-4 Baixo

14.7 4-5 Direita

17.7 5-6 Direita

23.9 6-5 Esquerda

26.8 5-4 Esquerda

29.5 4-1 Cima

Fig. 18. Transformada de Fourier do sinal do EOG adquirido no canal

vertical

Fig. 17. Transformada de Fourier do sinal do EOG adquirido no canal

horizontal

10

bluetooth, de modo a serem utilizados sem alteração

estética do indivíduo.

Há assim todo um conjunto de possibilidades para o

desenvolvimento e melhoramento de IHM que podem

facilitar o dia-a-dia de indivíduos com dificuldades motoras

ou para a realização de tarefas específicas, como por

exemplo o controlo de vários dispositivos em simultâneo

durante uma cirurgia.

III. REFERÊNCIAS

[1] M. F. Marmor and E. Zrenner, “Standard for Clinical Electro-

oculography,” for the International Society for Clinical

Electrophysiology of Vision 1993 [2] T. Paiva, “Característica e Registo de algumas actividades

fisiológicas,” Dezembro de 2006 [3] T. Paiva, “Variáveis Fisiológicas,” 2010

[4] R. Barea, L.Boquete, M.Mazo and L.López, “Wheelchair

Guidance Strategies Using EOG,”,Journal of Intelligent and Robotic Systems 34: 279-299, 2002

[5] A. Bulling, J. A. Ward, H. Gellersen and G.Tröster, “Eye

Movement Analysis for Activity Recognition Using Electrooculography,” IEEE Transactions, Março 2010

[6] D. Kumar and E. Poole, “Classification of EOG for Human

Interface,” Proceedings of the Second Joint EMBS/BMES Conference Houston, TX, USA, Outubro 23-26, 2002

[7] Y. Kim, N. L. Doh, Y. Youm and W. K. Chung, “Robust

discrimination method of the electrooculogram signals for human.computer interaction controlling mobile robot,” Intelligent

Automation and Soft Computing, vol 13, no. 3, pp. 319-336, 2007

[8] B. D. Shaviv, “The design and improvement of an eye controlled interface,”

http://www.cs.sunysb.edu/~vislab/projects/eye/Reports/report/report.

pdf [9] A. K. Amit, Amit B and B. D. Shaviv, “An Eye Tracking

Computer User Interface,” Research Frontiers in Virtual Reality

Workshop Proc., IEEE Computer. 1993, pp.120-121 [10] A. B.Usakli and S. Gurkan, “Design of a Novel Efficient

Human-Computer Interface: An Electrooculogram Based Virtual

Keyboard,” IEEE Transactions, Agosto 2010. [11] H.S. Dhillon, R. Singla, N. S. Rekhi, R. Jha, “EOG and EMG

Based Virtual Keyboard: A Brain-Computer Interface,”, IEEE 2009

EOG Man-Machine Interface

Documents

Transcript of EOG Man-Machine Interface