EOG Man-Machine Interface
-
Upload
joana-paulo -
Category
Documents
-
view
729 -
download
16
Transcript of EOG Man-Machine Interface
IAS 2010 – Instrumentação e Aquisição de Sinais
Projecto final Lisboa, Portugal, 12 Dezembro 2010
Interface Homem-Máquina utilizando EOG
Ana Cláudia Carriço, Ana Ruela, Cecília Nunes, Joana Pinto, Joana Rodrigues e João Semedo
Resumo – O electro-oculograma é um método de monitorização
do movimento ocular, baseado na variação de tensão gerada pela
alteração da orientação espacial do dipolo ocular. Este sinal
electrofisiológico pode ser utilizado para controlar dispositivos
externos, o que poderá ser extremamente útil em aplicações para
pessoas com mobilidade reduzida. Com este trabalho pretendeu-
se implementar um telefone controlado pelos movimentos
oculares (eyePhone). Tendo em conta as limitações da
implementação, considera-se que os resultados obtidos foram
satisfatórios.
Indexação – biopotenciais, electro-oculograma, Interface
Homem-Máquina, MATLAB,
I. MONOGRAFIA
A interface Homem-Máquina (IHM) é a interacção entre
o homem e a máquina por meio de troca de sinais,
nomeadamente eléctricos, de modo a desempenhar uma
determinada tarefa.
A IHM pode ter duplo sentido. Por um lado, pode ser
entendida pelo controlo de máquinas por sinais gerados
pelo corpo humano. Por outro, pode consistir no estímulo
do corpo humano por potenciais gerados por máquinas, por
exemplo em próteses de apoio à locomoção desenvolvidas
no âmbito da Biomecatrónica. O presente trabalho refere-se
à primeira abordagem.
Embora a interface comum com dispositivos
electrónicos, como computadores ou telemóveis, envolva a
utilização de um teclado ou de um rato, em pessoas com
deficiências motoras graves, como lesões da medula
espinal, mielopatia, mãos amputadas ou mesmo a síndrome
do locked-in, torna-se complicada a relação com estes
aparelhos electrónicos.
Desde o início do século XX, com o crescimento da
utilização das máquinas, têm surgido correntes científicas
interessadas na possibilidade de uma relação mais estreita
entre o Homem e as máquinas.
Assim, com o desenvolvimento da tecnologia, têm
surgido, com maior frequência, sistemas auxiliares a
pessoas de mobilidade reduzida, em particular a
tetraplégicos. Devido à sua incapacidade de movimento, é
de extrema importância o desenvolvimento destes sistemas,
que devem ser cada vez mais robustos e funcionais, para
proporcionar uma maior autonomia e consequentemente
uma melhor qualidade de vida a estas pessoas.
Com a ajuda da IHM, indivíduos com deficiências
podem retomar algumas das suas capacidades, melhorando
assim a sua qualidade de vida.
Para tal, pode-se recorrer a vários métodos de
interacção, como toque, visão, audição, transferência de
calor ou qualquer outra função física ou cognitiva. Este
processo pode ser representado pela Figura 1.
Para além da já referida aplicação, os biopotenciais
abrem um leque de inúmeras possibilidades: quer a nível de
simplificação de tarefas, métodos de diagnóstico ou mesmo
a utilização de equipamentos mãos-livres em cirurgia.
Esclarecendo o último ponto, seria em tudo vantajoso que
um médico, durante uma cirurgia, pudesse manipular um
telefone ou um computador, evitando riscos de
contaminação.
Neste sentido, a IHM pode tirar partido dos
biopotenciais humanos gerados pela actividade eléctrica de
algumas células do organismo. Esta actividade deve-se à
existência de um gradiente iónico entre o interior e o
exterior da célula, que em repouso é negativa, considerando
o interior em relação ao exterior. Quando a membrana da
célula recebe algum estímulo que a despolarize além do seu
limiar, surge o potencial de acção, ou seja, uma alteração
rápida na polaridade da tensão.
Estes potenciais podem ser medidos com recurso ao
electrocardiograma (ECG) no caso do potencial cardíaco,
Fig. 1. Interface Homem-Máquina (IHM)
Mestrado Integrado em Engenharia Biomédica, Instituto Superior Técnico, Lisboa, Portugal
63947, [email protected], [email protected]
Mestrado Integrado em Engenharia Biomédica, Instituto Superior
Técnico, Lisboa, Portugal 62821, [email protected], [email protected]
Mestrado Integrado em Engenharia Biomédica, Instituto Superior Técnico, Lisboa, Portugal
62835, [email protected]
Mestrado Integrado em Engenharia Biomédica, Instituto Superior
Técnico, Lisboa, Portugal
63772, [email protected]
Mestrado Integrado em Engenharia Biomédica, Instituto Superior
Técnico, Lisboa, Portugal 62757, [email protected], [email protected]
Mestrado Integrado em Engenharia Biomédica, Instituto Superior Técnico, Lisboa, Portugal
62839, [email protected], [email protected]
2
electromiograma (EMG) no caso do potencial do músculo
esquelético, electroencefalograma (EEG) no caso dos
neurónios e electro-oculograma (EOG) no caso do
movimento ocular.
Neste trabalho, desenvolveu-se um destes dispositivos,
tendo-se escolhido como sinal fisiológico o último referido:
o EOG, cujas variações podem ser facilmente controladas
voluntariamente. Além disso, o movimento ocular é um
movimento feito sistematicamente, quer para ler, escrever,
adquirir informação sobre o ambiente, etc. Assim, esta
capacidade de controlar a direcção do olhar pode ser
utilizada como meio de comunicação com as máquinas.
A. O electro-oculograma
O electro-oculograma é um método de medição dos
potenciais eléctricos associados ao movimento ocular, com
eléctrodos colocados em posições estratégicas na cara. O
olho possui uma diferença de potencial de repouso entre o
as partes frontal e interior do globo ocular (pólo positivo e
negativo, respectivamente).
O potencial de repouso é gerado maioritariamente pela
polarização do epitélio pigmentar da retina, variando entre
os 10 μV e os 100 μV, conforme a luminosidade. Em
resposta à iluminação, a retina sofre uma queda rápida de
potencial de repouso (60 a 75 s) chamada de oscilação
rápida, seguida por uma lenta subida (7 a 14 min) chamada
de oscilação lenta. A técnica pode ser usada de inúmeras
formas, sendo das mais frequentes na prática clínica a
medição da amplitude do potencial de repouso e a resposta
à iluminação.
O movimento ocular provoca movimentação do dipolo
(Figura 2), resultando em fluxos de corrente em torno das
órbitas proporcionais à magnitude do potencial de repouso.
Consequentemente, obtêm-se diferentes leituras de tensão,
nos eléctrodos de superfície, cuja interpretação permite
saber a orientação espacial dos olhos do sujeito avaliado.
Esta tensão varia sensivelmente entre os 0.1 e 4 mV. Este
fenómeno possui grande utilidade, por exemplo no
desenvolvimento de dispositivos de interface homem-
máquina para indivíduos com locomoção debilitada,
assunto abordado no presente trabalho.
B. Estado actual da tecnologia
O princípio da electro-oculografia surge em 1848,
quando Emil du Bois-Reymond verificou que a córnea tem
um potencial positivo em relação à parte posterior do olho.
Mais tarde, por volta dos anos 50, Elwin Marg referiu-se
a esta técnica como electro-oculograma e em 1962 é
desenvolvida a primeira aplicação clínica.
Nos últimos anos verificou-se um elevado
desenvolvimento tecnológico para pessoas com
dificuldades motoras. Assim, existe, actualmente, uma
grande quantidade de estudos de IHM baseados em EOG
na literatura. Em [8] e [9] foram desenvolvidas interfaces
com capacidade para introdução de texto totalmente
controlada por EOG. Em [7], pretendeu-se construir um
robot controlado pelos movimentos horizontais e verticais e
pelo piscar dos olhos. Além disso, em [4], foi desenvolvido
um protótipo de uma cadeira de rodas controlada com os
movimentos oculares.
C. Anatomia do olho humano
A visão é um dos sistemas sensoriais mais úteis e
importantes do ponto de vista funcional, sendo por isso
considerado como instrumento primordial da relação do
indivíduo com o meio ambiente. A organização das
estruturas nervosas implicadas na função visual humana é,
pela sua complexidade e pela sofisticação dos seus
mecanismos, a prova indubitável desta proeminência. A
anatomia do olho humano encontra-se representada na
Figura 3.
O primeiro intermediário entre o mundo visual e o
cérebro é a retina, o órgão receptor da visão. A retina, a
terceira camada e a mais interior do globo ocular, é assim
responsável pela formação de imagem, dando início às vias
visuais. Este órgão contém dois tipos de receptores
denominados de cones e bastonetes. Apesar de serem
ambos fotoreceptores, uma vez que captam energia
luminosa, estes dois tipos de células tem características e
funções muito próprias. Enquanto os cones detectam as
formas e as cores, sendo responsáveis pela visão diurna, os
bastonetes só entram em actividade quando a intensidade
luminosa é muito fraca ou à noite.
A córnea é a estrutura mais anterior do olho, sendo
caracterizada pela sua rigidez e transparência. Permite a
entrada de luz no olho, assim como a sua focagem. Atrás
Fig. 3. Anatomia do olho humano
Fig. 2. Movimento do dipolo ocular
3
da córnea localiza-se o humor aquoso, um líquido que
preenche a cavidade anterior do olho, e que ajuda a manter
a sua forma esférica, ao mesmo tempo que nutre estruturas
como o cristalino e a córnea. O humor aquoso é
responsável pela tensão ocular.
Por outro lado, a cavidade posterior do globo ocular,
também designada por câmara vítrea, encontra-se
preenchida por uma substância gelatinosa, o corpo vítreo,
cuja finalidade é prevenir o colapso do globo ocular e
manter a retina em contacto com a coróideia.
Por fim, a íris, que corresponde à parte colorida do olho
é uma estrutura contráctil, formada por músculo liso e que
separa os compartimentos aquosos em anterior e posterior.
Tem como finalidade o controlo da entrada de luz através
da abertura ou fecho da pupila, respectivamente pelo
relaxamento ou contracção dos seus músculos.
Os músculos responsáveis pelos movimentos oculares
(Figura 4) são os rectos medial, lateral, superior, inferior e
os músculos oblíquos.
Os rectos medial e lateral contraem-se para executar os
movimentos dos olhos na horizontal. Os rectos superiores e
inferiores contraem-se para movimentar os olhos na
vertical.
Os músculos oblíquos, por sua vez, são responsáveis
pela rotação dos glóbulos oculares e manutenção dos
campos visuais na posição central.
D. Movimentos oculares
O EOG detecta essencialmente três tipos de movimentos
oculares: fixação visual, sacadas e piscar de olhos.
A fixação (Figura 5) corresponde à fase estacionária do
movimentos ocular, nesta fase é estabelecido um contacto
visual prolongado com um único ponto. A fixação
geralmente ocorre entre duas sacadas e apresenta um
intervalo de duração entre os 100 ms e os 200 ms. A
fixação nunca é perfeitamente estática, ocorre sempre
algum movimento ocular involuntário.
As sacadas (Figura 6) são movimentos rápidos e
simultâneos de ambos os olhos na mesma direcção. A
duração de uma sacada depende da distância angular que os
olhos percorrem num movimento, ou seja, depende da
amplitude da sacada. Geralmente, uma sacada tem uma
amplitude de 20 graus e uma duração que varia entre os 10
ms e os 100 ms.
O piscar dos olhos (Figura 7) ocorre devido à
necessidade fisiológica do olho espalhar a lágrima,
produzida pelas glândulas lacrimais, com o objectivo de
lavar e lubrificar o olho. Em média, o ser humano pisca os
olhos entre 12 e 19 vezes por minuto, sendo que cada
piscar tem uma duração que varia entre os 100 ms e os 400
ms.
E. Montagem dos eléctrodos
Por norma, são utilizados um a dois canais de EOG. Um
dos eléctrodos é colocado 1 cm para fora e para cima do
canto externo de um olho, e o outro eléctrodo 1 cm para
fora e para baixo do outro olho, utilizando as orelha como
referência ou usando uma montagem diferencial entre os
dois eléctrodos. Esta montagem encontra-se esquematizada
na Figura 8.
No entanto, para distinguir os movimentos verticais dos
horizontais devem ser usadas montagens adicionais. Assim,
o que se faz é utilizar uma montagem de quatro eléctrodos,
três deles à volta do olho direito - em cima, em baixo e no
canto externo do olho direito - e um no canto externo do
olho esquerdo. Deve-se ainda acrescentar um eléctrodo no
meio da teste, correspondente à comum.
Esta montagem encontra-se esquematizada na Figura 9,
onde o eléctrodo a verde corresponde à terra, os eléctrodos
a vermelho ao canal horizontal e os eléctrodos a preto ao
Fig. 8. Esquema habitual da colocação dos eléctrodos num EOG
Fig. 7. Piscar de olhos
Fig. 6. Sacada superior
Fig. 5. Fixação ocular
Fig. 4. Músculos responsáveis pelos movimentos oculares
4
canal vertical. Assim, tanto o canal horizontal como o
vertical serão diferenciais.
F. Variação do potencial com os movimentos oculares
Como referido, o potencial de repouso sofre pequenas
variações com a luminosidade. Com os olhos em repouso e
dada a montagem adoptada dos eléctrodos, a tensão
captada deverá ser nula.
Quando o olho se vira para a direita, a parte positiva do
dipolo fica mais próxima do eléctrodo localizado do lado
direito relativamente ao eléctrodo do lado esquerdo que
fica mais próximo do pólo negativo. Assim, no canal de
movimento horizontal é registada uma tensão positiva, e no
caso oposto é registada tensão negativa.
Idealmente, a amplitude da onda quadrada segue uma
função sinusoidal do ângulo do olhar (Figura 10). A
rotação máxima é de ±70°, mas a relação entre o ângulo e a
tensão torna-se pouco fiável a partir dos ±30°. O mesmo
ocorre para a direcção vertical, sendo positivo a sacada
superior e negativa a inferior.
G. Vantagens e Problemas do EOG
Uma das principais desvantagens do EOG é o facto do
potencial da retina de cada indivíduo sofrer variações ao
longo do dia, entre outros factores, como fadiga ou
luminosidade, causando um elevado baseline drift e
exigindo frequente calibração do dispositivo.
Se por um lado, o corte da componente DC elimina este
problema, também reduz a qualidade do resultado
pretendido. Outras dificuldades residem na existência de
artefactos, por exemplo, oscilações dos eléctrodos na pele,
e não linearidade da amplitude dos potenciais com o ângulo
dos olhos.
As vantagens incluem a possibilidade de fazer o teste no
escuro ou com olhos fechados, que neste trabalho não tem
utilidade, bem como o referido controlo dos sinais de saída
pelo indivíduo sujeito ao teste.
É ainda de destacar a sua facilidade de utilização em
pessoas acamadas e de detecção do piscar de olhos,
constituindo o EOG o sistema de monitorização de
movimentos dos olhos mais barato.
II. DESENVOLVIMENTO DO PROTÓTIPO
Com o objectivo de criar um dispositivo que permitisse
a realização de uma actividade específica sem utilização
dos membros, a primeira fase foi a escolha do biopotencial
a utilizar e a utilização do mesmo.
Numa primeira fase, pensou-se em desenvolver um
dispositivo de levitação, com o qual seria possível deslocar
uma bola dentro de um tubo, através dos níveis de
concentração do utilizador. Para tal, tentou-se adquirir e
identificar alterações em certas ondas cerebrais com a
concentração, nomeadamente as ondas beta e delta, a partir
da construção de um dispositivo de electroencefalograma.
A aquisição foi bem sucedida. No entanto,
possivelmente devido a uma razão sinal-ruído elevada e/ou
baixa amplitude das ondas na zona beta, apenas se
conseguiu identificar diminuição na amplitude da onda
alfa, aquando da realização de um cálculo com os olhos
fechados. Não obstante, a tentativa de levitação de um
objecto com os olhos fechados foi considerada de reduzida
utilidade.
Assim, optou-se por uma segunda abordagem: o
desenvolvimento de um telefone controlado por EOG, uma
vez que a aquisição dos potenciais oculares já tinha sido
previamente conseguida. Esta opção é menos exigente a
nível da qualidade do sinal, mas mais complexa a nível de
implementação computacional.
A. Alguns requisitos relativamente ao design e prática do
EOG
Quanto à iluminação, deve ser fornecida por uma ou
várias lampas de luz branca, colocadas de forma a iluminar
uniformemente o campo de visão do indivíduo sujeito ao
teste. Devem ser evitadas sombras ou locais de grande
intensidade focal directa. A luz deve ser ajustável para
efeitos de calibração, dependendo da análise pretendida.
Fig. 10. Relação entre o ângulo horizontal e amplitude das formas de
onda quadradas obtidas no EOG
Fig. 9. Esquema utilizado no trabalho para colocação dos eléctrodos
5
Em relação aos eléctrodos, estes devem ser feitos de
material não polarizável como prata/ cloreto de prata ou
ouro. Os eléctrodos devem permitir uma ligação de
impedância menor que 10 kΩ com a pele, numa banda de
frequência que se estende dos 30 aos 200 Hz. A aplicação
dos eléctrodos de superfície deve ser feita com gel
condutor e em pele limpa com álcool ou outro material de
preparação, dada a fraca condutividade das camadas
superiores da pele.
No que diz respeito à corrente, a corrente directa
reproduz com fidelidade as variações tensão com forma de
onda quadrada produzidas no movimento ocular. Contudo,
a utilização e a amplificação desta componente podem
levar a problemas de baseline drif ou instabilidade, devido
à referida variação do potencial de repouso da retina.
Assim, é recomendada a utilização de corrente alternada,
limitada a uma banda dos 0.3 aos 30 Hz, sensivelmente.
Além de cortar a componente contínua, esta banda
proporciona a eliminação dos 50 Hz da frequência da rede.
A variação do potencial da retina é também divergente
entre indivíduos e outros factores sendo essencial efectuar
calibração no início de cada teste. Na nossa abordagem,
além de se efectuar a calibração inicial, optou-se por não
cortar a componente contínua para contornar o baseline
drift, já que a qualidade dos resultados estaria
comprometida.
Quanto à visualização das formas de onda, é importante
que os dados estejam visíveis, de forma transitória ou não,
para permitir identificação artefactos ou necessárias
alterações na colocação dos eléctrodos. É de extrema
importância o isolamento galvânico, assegurando a
segurança do indivíduo sujeito ao impedir a imposição de
corrente ao corpo, bem como um pequena redução de
ruído.
Esta foram recomendações da International Society for
Clinical Electrophysiology of Vision[1]
B. Circuito
A configuração clássica de um sistema de registo de
biopotenciais é a indicada na Figura 11. O sinal é captado
pelos eléctrodos e passa pelo amplificador diferencial (ou
de instrumentação). De referir que o comum electrónico
corresponde ao eléctrodo colocado na testa.
Contudo este pode ser colocado noutro local do corpo
para de redução de ruído, nomeadamente no lóbulo da
orelha.
De seguida, o sinal passa por um amplificador de
isolamento e pelo filtro necessário. Finalmente, é possível a
visualização do sinal e o tratamento do mesmo.
Quanto à parte inicial da aquisição, como explicado, o
sinal do EOG é capturado por cinco eléctrodos, colocados
de acordo com a Figura 9.
Os eléctrodos utilizados são os indicados na Figura 12.
Foi ainda utilizado um gel condutor abrasivo para
preencher os eléctrodos, o Ten20.
O circuito de aquisição requer uma elevada impedância
de entrada e elevada rejeição de modo comum, asseguradas
por dois INA116, um por cada canal de aquisição. Estes
amplificadores de instrumentação possuem impedância de
entrada de e rejeição de modo comum de 86 dB
(para um ganho de 100). O ganho proporcionado por este
modelo é calculado a partir de:
(1)
onde G é o ganho e a resistência que controla o
ganho. A impedância de entrada deve ser elevada de forma
a garantir que a divisão de tensão entre a pele e o circuito
forneça a maior fracção de sinal ao circuito. Uma vez que
não se realiza a supressão da componente DC dos sinais
adquiridos e a alimentação dos amplificadores de
instrumentação é realizada através de pilhas, que fornecem
tensões mais reduzidas, há que ter especial atenção à
saturação dos amplificadores. Tal é garantido através da
escolha do ganho, que foi efectuada pesando ainda o ganho
necessário para a correcta visualização dos sinais e uma
amplificação demasiado elevada de ruído. Optou-se por um
ganho de 100 (mais precisamente 101).
Por sua vez, uma elevada rejeição de modo comum
permite obter sinais variáveis de pequena amplitude, como
os que caracterizam o EOG, sobrepostos a uma
componente comum elevada, que é assim eliminada.
Fig. 12. Eléctrodos utilizados na aquisição do EOG
Fig. 11. Configuração clássica de um sistema de registo de biopotenciais
6
Uma elevada rejeição de modo comum é também indicada
para sinais diferenciais, que é o caso. Assim, a exigência
para rejeição de modo comum é elevada, idealmente maior
que 80 dB [10].
Depois, para assegurar o isolamento galvânico, utilizou-
se dois amplificadores de isolamento, o ISO122 e o
ISO124, um para cada canal. O isolamento galvânico é
garantido pela transmissão digital do sinal através de uma
barreira capacitiva, sendo produzido ruído a cerca de 500
kHz na ordem dos 20 mV.
Conhecendo a gama de frequências de interesse, o sinal
foi filtrado para remover frequências indesejadas, como as
do ruído inerente à rede. Deste modo, foi desenvolvido um
filtro passa-baixo, com frequência de corte projectada para
30 Hz. Este filtro é de grande importância atenuando não
só a frequência de rede como o ruído adicionado pelo
amplificador de isolamento, servindo ainda como filtro
anti-alising. A construção de filtros analógicos passa-alto e
passa-banda, para a atenuação do Baseline Drift não foi
bem sucedida, devido à exigência de uma banda de rejeição
estreita, próxima dos 0 Hz.
Alternativamente, procurou-se uma solução
computacional com base na permanente dos thresholds,
para identificar o movimento, como será explicado na
secção C.
O sinal à saída de cada um dos dois filtros passa-baixo é
por fim digitalizado e fornecido ao computador através da
placa de aquisição.
O circuito implementado encontra-se representado nas
Figuras 12 e 13.
Fig. 12. Esquema do circuito utilizado na aquisição do EOG
Fig. 13. Circuito utilizado na aquisição do EOG
7
C. Tratamento do sinal e Implementação em MATLAB
A aquisição do sinal foi realizada com recurso a uma
placa de aquisição da National Instruments, conectada a
um computador, permitindo o posterior processamento do
sinal no MATLAB.
Os sinais são obtidos com uma Sample Rate de 5000
amostras p/segundo (Aps), valor bastante superior ao
teoricamente necessário para o intervalo de frequências dos
potenciais de interesse, 0 a 30 Hz.
Uma frequência de amostragem de 60 Aps é
teoricamente suficiente. Embora se tenha utilizado um
valor bastante superior, este é um dos argumentos de
entrada do programa desenvolvido, o que facilita a sua
alteração, podendo assim ser reduzido para a
implementação de um Analog to Digital Converter (ADC)
móvel de baixo custo.
De facto, ainda que a placa de aquisição permita utilizar
intervalos de tensão relativamente grandes na sua entrada,
tal é feito à custa de uma redução da sua resolução. Uma
vez que a amplificação de sinal no circuito construído se
realiza nos amplificadores de instrumentação (antes do
sinal ser filtrado), esta não deve ser demasiado elevada.
Como se optou pela implementação de um ganho de
100, os potenciais adquiridos passam a apresentar tensões
entre 10 e 100 mV. A Units Range utilizada foi assim de -1
a 1 V para garantir que a Baseline Drift não satura a
entrada do ADC da placa ao mesmo tempo que se
maximiza a resolução do mesmo.
O objectivo da aquisição foi conseguir, a partir dos dois
canais adquiridos, discriminar a tecla focada pelo
utilizador, exigindo apenas uma calibração inicial e sem
qualquer restrição nos movimentos efectuados.
Uma vez que se pretende que o processamento do sinal
seja efectuado em tempo real, são adquiridas pequenas
janelas de sinal sendo estas imediatamente processadas.
Porque na maior parte das janelas adquiridas a
componente de interesse será DC, tal impede a utilização
de filtros digitais, que se revelam muito instáveis na
presença de janelas curtas. Permitindo componentes com
frequências próximas dos 0 Hz, os sinais obtidos vão ser
afectados pela Baseline Drift, tendo sido necessário
implementar um algoritmo que lidasse da melhor forma
com este tipo de ruído. Tal foi conseguido utilizando
Thresholds dinâmicos.
É efectuada uma calibração inicial onde se definem as
amplitudes das sacadas que se pretendem detectar em
ambos os eixos utilizados. Depois, apenas se exige que o
utilizador foque o seu olhar no centro do ecrã (tecla central)
durante a primeira janela adquirida. O programa define
neste momento a origem do referencial.
Se na janela seguinte o utilizador mantiver o olhar na
tecla central, a origem de ambos os eixos será actualizada
para as médias dos sinais obtidos. Se o utilizador desviar o
olhar, por exemplo, para a tecla directamente à direita, será
identificada uma alteração no eixo horizontal. A origem do
eixo vertical será, mais uma vez, actualizada para a média
do sinal correspondente, sendo que a origem do eixo
horizontal será agora actualizada para a média do sinal
subtraída da amplitude correspondente ao movimento
detectado. Assim, quanto menor a janela, melhor o
algoritmo lida com transições rápidas na componente DC.
O Threshold para detecção utilizado é de 60% da
amplituda da sacada, sendo que se exige que 65% dos
pontos de uma janela excedam o Threshold para que seja
considerado o movimento. Estes valores foram
determinados empiricamente, representando um
compromisso entre a sensibilidade ao ruído (especialmente
a Baseline Drift) e a detecção das sacadas. Ambos os
valores são argumentos do algoritmo, permitindo uma
melhor afinação da detecção para diferentes montagens.
A escolha do comprimento das janelas adquiridas é, no
entanto, o parâmetro mais crítico no que toca à anulação do
efeito da Baseline Drift. Quanto menor a janela de
aquisição, melhor o algoritmo lida com a Baseline Drift,
conforme explicado acima.
No entanto, ao diminuir a janela de aquisição, aumenta a
probabilidade da actualização ser corrompida por ruído. O
artefacto resultante do piscar de olhos é aquele que mais
prejudica o processo de actualização dos Thresholds.
Uma vez que o algoritmo implementado não utiliza as
variações no sinal, para realizar a detecção utilizou-se a
derivada para detectar mudanças rápidas. Qualquer janela
em que é detectada uma variação súbita no sinal (negativa
ou positiva) é ignorada, o que exclui a contribuição do
artefacto referido.
O comprimento utilizado para cada janela foi assim de
250 ms, valor que garante a rápida adaptação do algoritmo
à Baseline Drift, ao mesmo tempo que permite a detecção
de variações rápidas, não sendo os resultados afectados ao
ignorar algumas janelas.
Outro aspecto importante que prejudica a qualidade do
sinal é o facto de as transições não serem totalmente
independentes entre os eixos, ou seja, ou transição
realizada na horizontal provocará alterações no sinal
vertical, o que dificulta bastante a correcta detecção desta
componente. Este problema é atenuado através de um
aumento da exigência na detecção, provocando mais um
trade-off difícil de solucionar entre manter o algoritmo
estável ao longo destas alterações e não falhar transições
que de facto ocorrem em potenciais já ligeiramente alterado
por este artefacto.
D. Interface Gráfica
A determinação da posição do foco do utilizador é
utilizada para controlar um telefone. O mapa utilizado tem
dimensões 3x4, ou seja, existem duas sacadas a detectar no
canal vertical e três a detectar no canal horizontal.
O telefone foi criado através de uma interface gráfica no
MATLAB, Figura 14.
A tecla central é o "5" e é esta tecla que é utilizada na
primeira janela de aquisição para definir a origem do
referencial. Na calibração horizontal o utilizador deverá
focar sucessivamente as teclas "5", "4", "6" e "0". Na
calibração vertical a sequência de teclas utilizada é "5", "8"
e "2". As calibrações são verificadas pelo programa e
podem ser repetidas tantas vezes quanto necessário. Para
iniciar a utilização basta premir a tecla "START", podendo
8
esta ser parada a qualquer momento através da tecla
"STOP".
Sempre que se inicie a aquisição deve focar-se a tecla
central. Para confirmar a selecção de uma das teclas, ou
seja, marcar um número, basta manter o foco na tecla por
mais de 3 segundos. A sequência marcada vai sendo
apresentada numa caixa lateral. Existe ainda uma tecla para
apagar números introduzidos, tecla "C" e uma tecla para
efectuar a chamada, tecla "CALL".
A tecla determinada pelo foco é automaticamente
destacada a vermelho. Esta funcionalidade é de extrema
importância, permitindo um feedback constante com o
utilizador.
A utilização de uma quarta coluna ao invés de uma
quarta linha deve-se a uma melhor performance do detector
no eixo horizontal. Tal deve-se principalmente à existência
do artefacto do piscar de olhos no canal vertical.
E. Resultados
De seguida apresenta-se uma aquisição de 30 segundos
de EOG, em que a sequência de teclas utilizada foi: “5”,
“2”, “1”, “4”, “5”, “6”, “5”, “4” e “1”. O detector foi
utilizado com os parâmetros indicados acima: janela de
aquisição de 250 ms, percentagem da amplitude da sacada
utilizada como Threshold de 60% e fracção mínima de
pontos sobre o Threshold de 65%. A figura 14 representa a
aquisição do sinal do canal horizontal do EOG e a figura 15
corresponde à aquisição do sinal do canal vertical.
De referir, a existência de sobre-elevações somente na
figura 16 correspondentes a artefactos resultantes do piscar
de olhos involuntário do utilizador. Outro factor a ter em
conta é a baseline drift, caracterizada por oscilações de
frequência reduzida observadas na maior parte do sinal.
Para uma análise espectral dos sinais obtidos procedeu-
se ao cálculo das transformadas de Fourier de cada um dos
sinais subtraído da própria média (Figuras 17 e 18).
Procedendo à análise das transformadas, verifica-se que
o efeito dos filtros passa-baixo é pouco visível próximo da
frequência de corte teórica. Em particular, é de notar que o
ruído da rede é pouco atenuado como se pode observar nas
Figuras 17 e 18. Destaque ainda para os picos junto à
componente DC, muito importantes neste tipo de sinal. A
amplitude dos picos observados nos 50 Hz difere de um
canal para o outro, a amplitude do canal horizontal é
inferior à do canal vertical. Esta diferença era esperada uma
vez que a amplitude do sinal do canal vertical é superior à
do sinal do canal horizontal para todas as frequências.
Fig. 16. Sinal do EOG adquirido no Canal Vertical
Fig. 15. Sinal do EOG adquirido no Canal Horizontal
Fig. 14. Interface gráfica do eyePhone
9
As rápidas transições de amplitude correspondem a
sacadas. Nestes instantes o utilizador desloca os olhos de
um botão para outro, Tabela 1.
A detecção foi correctamente efectuada para toda a
sequência utilizada, com excepção da posição final. A
explicação para a falha na detecção é simples: Esta
transição ocorre muito próximo do final da aquisição. Se
recordarmos que o algoritmo ignora janelas em que
ocorrem variações bruscas no sinal não é surpreendente que
não tenha havido detecção uma vez que seria necessária
mais uma janela já com o patamar da sacada definido.
Outro visível aspecto muito importante é o facto de
transições horizontais afectarem o sinal vertical e vice-
versa. Se a estes artefactos acrescentarmos o artefacto do
piscar de olhos e a Baseline Drift é até assinalável a
robustez apresentada pelo algoritmo de detecção neste
exemplo.
F. Ideias para o futuro e conclusões
Este trabalho teve como objectivo o desenvolvimento de
uma IHM com vista a contribuir para a autonomia e
capacidade de comunicação de indivíduos com deficiências
motoras. Deste modo, foi bem sucedida a construção de um
dispositivo de EOG, que permite ao indivíduo a marcação
de um número de telefone num teclado, para posterior
ligação a um programa como o Skype.
Após a realização do trabalho, constatou-se que o
sistema pode ser utilizado como IHM de modo eficiente.
De um ponto de vista técnico, há que destacar:
(a) Tanto o sinal horizontal como o vertical do EOG
foram medidos com sucesso, com um CMRR de 86 dB e
uma sampling rate de 5000 Hz.
(b) Poder-se-ia ter utilizado um filtro passa-baixo de
uma ordem superior, dada a não total eliminação do ruído
com frequência superior a 30 Hz. Contudo, o grau de
eliminação deste tipo de ruído foi suficiente para cumprir
os objectivos. De facto, o ruído que realmente afecta os
resultados é o Baseline drift e a interferência num canal
devido a movimentos no eixo teoricamente ortogonal, que
podem dar origem a erros, mesmo após o tratamento
computacional referido.
(c) Os threshold poderiam estar definidos com uma
margem de tolerância dentro da qual o sinal poderia variar
sem alterar a classificação do estímulo, dando histerese ao
classificador de eventos e tornando a sua acção mais
robusta.
(d) A possibilidade de utilizar o telefone com sucesso de
modo a possibilitar uma comunicação eficiente.
O sistema de EOG revelou-se mais simples que o de
EEG, quer a nível de aquisição de sinal, quer a nível de
eficiência do processo em geral. Além disso, o EOG é um
método relativamente barato e que funciona bem em tempo
real.
Poder-se-á ainda utilizar outros métodos de detecção dos
movimentos oculares como o vídeo-oculograma (VOG),
sclera coil e oculograma de infravermelhos.
Seria também interessante o desenvolvimento de um
dispositivo híbrido, ou seja, simultaneamente de EOG e
EEG, a nível de comunicação ou de controlo de objectos
exteriores, como seria o caso da levitação da bola.
Outra ideia seria a implantação cirúrgica dos eléctrodos
com tecnologia de comunicação sem fios, como o
TABELA I
BOTÃO SELECCIONADO EM FUNÇÃO DO SINAL ADQUIRIDO
Tempo/s Botão Direcção
4.8 5-2 Cima
8.3 2-1 Esquerda
11.2 1-4 Baixo
14.7 4-5 Direita
17.7 5-6 Direita
23.9 6-5 Esquerda
26.8 5-4 Esquerda
29.5 4-1 Cima
Fig. 18. Transformada de Fourier do sinal do EOG adquirido no canal
vertical
Fig. 17. Transformada de Fourier do sinal do EOG adquirido no canal
horizontal
10
bluetooth, de modo a serem utilizados sem alteração
estética do indivíduo.
Há assim todo um conjunto de possibilidades para o
desenvolvimento e melhoramento de IHM que podem
facilitar o dia-a-dia de indivíduos com dificuldades motoras
ou para a realização de tarefas específicas, como por
exemplo o controlo de vários dispositivos em simultâneo
durante uma cirurgia.
III. REFERÊNCIAS
[1] M. F. Marmor and E. Zrenner, “Standard for Clinical Electro-
oculography,” for the International Society for Clinical
Electrophysiology of Vision 1993 [2] T. Paiva, “Característica e Registo de algumas actividades
fisiológicas,” Dezembro de 2006 [3] T. Paiva, “Variáveis Fisiológicas,” 2010
[4] R. Barea, L.Boquete, M.Mazo and L.López, “Wheelchair
Guidance Strategies Using EOG,”,Journal of Intelligent and Robotic Systems 34: 279-299, 2002
[5] A. Bulling, J. A. Ward, H. Gellersen and G.Tröster, “Eye
Movement Analysis for Activity Recognition Using Electrooculography,” IEEE Transactions, Março 2010
[6] D. Kumar and E. Poole, “Classification of EOG for Human
Interface,” Proceedings of the Second Joint EMBS/BMES Conference Houston, TX, USA, Outubro 23-26, 2002
[7] Y. Kim, N. L. Doh, Y. Youm and W. K. Chung, “Robust
discrimination method of the electrooculogram signals for human.computer interaction controlling mobile robot,” Intelligent
Automation and Soft Computing, vol 13, no. 3, pp. 319-336, 2007
[8] B. D. Shaviv, “The design and improvement of an eye controlled interface,”
http://www.cs.sunysb.edu/~vislab/projects/eye/Reports/report/report.
pdf [9] A. K. Amit, Amit B and B. D. Shaviv, “An Eye Tracking
Computer User Interface,” Research Frontiers in Virtual Reality
Workshop Proc., IEEE Computer. 1993, pp.120-121 [10] A. B.Usakli and S. Gurkan, “Design of a Novel Efficient
Human-Computer Interface: An Electrooculogram Based Virtual
Keyboard,” IEEE Transactions, Agosto 2010. [11] H.S. Dhillon, R. Singla, N. S. Rekhi, R. Jha, “EOG and EMG
Based Virtual Keyboard: A Brain-Computer Interface,”, IEEE 2009