000624194
-
Upload
marcelogarabini -
Category
Documents
-
view
220 -
download
0
Transcript of 000624194
-
7/25/2019 000624194
1/106
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMTICA
PROGRAMA DE PS-GRADUAO EM COMPUTAO
RAQUEL MAINARDI PILLAT
Coordenao Dinmica de Visualizaes deDados Multidimensionais
Dissertao apresentada como requisito parcialpara a obteno do grau de Mestre em Cinciada Computao
Prof. Dr. Carla Maria Dal Sasso Freitas
Orientadora
Porto Alegre, julho de 2006.
-
7/25/2019 000624194
2/106
CIP CATALOGAO NA PUBLICAO
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SULReitor: Prof. Jos Carlos Ferraz HennemannVice-Reitor: Prof. Pedro Cezar Dutra FonsecaPr-Reitora de Ps-Graduao: Profa. Valquria Linck BassaniDiretor do Instituto de Informtica: Prof. Philippe Olivier Alexandre Navaux
Coordenador do PPGC: Prof. Flvio Rech WagnerBibliotecria-Chefe do Instituto de Informtica: Beatriz Regina Bastos Haro
Pillat, Raquel Mainardi
Coordenao Dinmica de Visualizaes de DadosMultidimensionais / Raquel Mainardi Pillat Porto Alegre:Programa de Ps-Graduao em Computao, 2006.
106 f.:il.
Dissertao (mestrado) Universidade Federal do Rio Grandedo Sul. Programa de Ps-Graduao em Computao. PortoAlegre, BR RS, 2006. Orientadora: Carla Maria Dal SassoFreitas.
1. Visualizao de informaes. 2. Visualizaes coordenadas.3. Interface de usurio. I. Freitas, Carla Maria Dal Sasso. II. Ttulo.
-
7/25/2019 000624194
3/106
AGRADECIMENTOS
Agradeo minha orientadora, Carla Dal Sasso Freitas, pelo auxlio e estmulorecebido durante a realizao desse trabalho e a todos os integrantes do grupo decomputao grfica da UFRGS (um GRUPO de verdade, do qual eu tenho muitoorgulho em fazer parte). No posso deixar de agradecer tambm a pacincia e boa
vontade daqueles que participaram uma ou vrias vezes dos meus experimentos deavaliao.
Por fim, agradecimentos muito especiais minha famlia: minha me Lcia, meu paiLuiz Clvis, minha irm Micheli e meu namorado Fbio.
-
7/25/2019 000624194
4/106
SUMRIO
LISTA DE FIGURAS.......................................................................................... 7
LISTA DE TABELAS ....................................................................................... 10
RESUMO.......................................................................................................... 11
ABSTRACT...................................................................................................... 12
1 INTRODUO ........................................................................................... 13
1.1 Motivao ............................................................................................................. 141.2 Objetivos e Contribuies................................................................................... 151.3 Organizao do Trabalho................................................................................... 15
2 INTERAO COM VISUALIZAES MULTIDIMENSIONAIS ................. 16
2.1 Visualizaes Multidimensionais ....................................................................... 162.1.1 Tcnicas de projeo geomtrica........................................................................ 172.1.2 Tcnicas Iconogrficas ....................................................................................... 232.1.3 Tcnicas Orientadas a Pixel................................................................................ 242.2 Tcnicas de Interao.......................................................................................... 262.2.1 Mapeamento de Dados para Propriedades Visuais............................................. 262.2.2 Projees............................................................................................................. 272.2.3 Filtragem............................................................................................................. 282.2.4 Zoom................................................................................................................... 292.2.5 Detalhes por Demanda........................................................................................ 30
3 VISUALIZAES COORDENADAS: CONCEITOS E REVISO
BIBLIOGRFICA............................................................................................. 313.1 Tipos de Coordenaes........................................................................................ 313.1.1 Brushing-and-Linking......................................................................................... 323.1.2 Reordenao de Dimenses Sincronizada.......................................................... 333.1.3 Filtragem Sincronizada....................................................................................... 333.1.4 Mapeamento de Dados para Propriedades Visuais............................................. 343.1.5 ScrollingSincronizado ....................................................................................... 343.1.6 Zoom Sincronizado ............................................................................................ 353.1.7 Rotao Sincronizada ......................................................................................... 363.1.8 Overviewe Detalhe............................................................................................. 36
3.1.9 Drill Down.......................................................................................................... 373.2 Sistemas de Mltiplas Visualizaes Coordenadas .......................................... 38
-
7/25/2019 000624194
5/106
3.2.1 XmdvTool........................................................................................................... 393.2.2 Snap-Together .................................................................................................... 403.2.3 GeoVista Studio.................................................................................................. 43
4 O TOOLKIT INFOVIS................................................................................. 45
4.1 FrameworkGeral ................................................................................................. 464.1.1 Entrada e Sada ................................................................................................... 464.1.2 Tabelas e Colunas............................................................................................... 464.1.3 Visualizaes...................................................................................................... 474.1.4 Componentes ...................................................................................................... 484.2 Exibindo Visualizaes........................................................................................ 484.3 Extenso do Toolkit: Criando Novas Visualizaes ......................................... 494.4 Mecanismos de Interao.................................................................................... 524.4.1 Mecanismos Adicionados................................................................................... 55
5 COORDENAO DINMICA DE VISUALIZAESMULTIDIMENSIONAIS .................................................................................... 57
5.1 Coordenaes para Sistemas de Visualizao de Dados Multidimensionais . 575.1.1 Mapeamento de Dados para Propriedades Visuais............................................. 575.1.2 Reordenao de Dimenses................................................................................ 585.1.3 Filtragem............................................................................................................. 585.1.4 Brushing-and-Linking......................................................................................... 595.2 Aplicao de Visualizaes Coordenadas para Dados Multidimensionais .... 595.2.1 Visualizaes...................................................................................................... 605.2.2 Coordenaes ..................................................................................................... 685.2.3 Arquitetura.......................................................................................................... 71
5.2.4 Grafo de Coordenao........................................................................................ 735.2.5 Especificando Coordenaes Dinamicamente.................................................... 745.2.6 Gerenciamento de Coordenaes ....................................................................... 765.2.7 Tornando uma Visualizao Coordenvel: A Interface Visualization ............... 805.3 Comentrios Finais.............................................................................................. 81
6 AVALIAO PRELIMINAR ....................................................................... 82
6.1 Primeira Avaliao.............................................................................................. 826.1.1 Conjunto de Dados ............................................................................................. 826.1.2 Tarefas Experimentais........................................................................................ 836.1.3 Procedimento...................................................................................................... 83
6.1.4 Resultados........................................................................................................... 846.2 Segunda Avaliao............................................................................................... 87
7 ESTUDO DE CASO ................................................................................... 88
7.1 Descrio e Objetivos do Domnio: Morfometria Craniana............................ 887.2 Conjunto de Dados .............................................................................................. 897.3 Procedimento ....................................................................................................... 897.4 Resultados ............................................................................................................ 907.4.1 Identificao de Crnios com Medidas Fora do Padro..................................... 907.4.2 Identificao de Variaes nos Padres de Medidas de Diferentes Localidades917.4.3 Identificao de Variaes nas Medidas de Animais com Nmero de
Cromossomos Diferente ..................................................................................... 927.4.4 Verificao de Variaes nas Medidas de Animais de Sexo Diferente ............. 93
-
7/25/2019 000624194
6/106
7.5 Comparao: Aplicao Desenvolvida x Aplicao do Domnio .................... 957.6 Concluses............................................................................................................ 96
8 CONCLUSES .......................................................................................... 98
8.1 Avaliao Final .................................................................................................... 988.2 Trabalhos Futuros ............................................................................................. 101
REFERNCIAS.............................................................................................. 102
-
7/25/2019 000624194
7/106
LISTA DE FIGURAS
Figura 2.1: Representao visual da tcnica Coordenadas Paralelas ............................. 18
Figura 2.2: Tcnica Coordenadas Paralelas com sobreposio de linhas (15.000 itensde dados representados)............................................................................... 18
Figura 2.3: Representao visual da tcnica Matriz de Scatter Plots............................. 19Figura 2.4: Representao visual da tcnica Radviz ...................................................... 20
Figura 2.5: Representao visual da tcnica Coordenadas Paralelas Circulares............ 21
Figura 2.6: Representao visual da tcnica Polyviz ..................................................... 22
Figura 2.7: Representao visual da tcnica Survey Plots.............................................. 22
Figura 2.8: Tcnicas iconogrficas: a) Faces de Chernoff e b) Glifos em Estrela ......... 23
Figura 2.9: Mapeamento de Stick Figures(esquerda) e grfico iconogrfico de dadosdo censo da Inglaterra (direita).................................................................... 24
Figura 2.10: Visualizaes orientadas a pixel de um conjunto de dados com novedimenses, utilizando duas formas de distribuio espacial: espiral(esquerda) e por eixos (direita).................................................................. 25
Figura 2.11: Tcnicas independentes de consulta: a) curvas de Peano-Hilbert,b) curvas de Morton e c) padres recursivos............................................. 25
Figura 2.12: Tcnica Segmentos de Crculo................................................................... 26
Figura 2.13: Usando consultas dinmicas para verificar a concentrao espacial deitens de dados em uma regio de interesse ............................................... 28
Figura 2.14:Magic lenses: Lente de viso aramada 3D e lente de aumento 2D............ 29
Figura 2.15: Usando a tcnica detalhes por demanda para obter informaesadicionais sobre um item de dado. ............................................................ 30
Figura 3.1: Visualizaes coordenadas pela tcnica brushing-and-linking ................... 33
Figura 3.2: Visualizaes coordenadas com valores do atributo Originmapeadospara cor ........................................................................................................ 35
Figura 3.3: Mltiplas visualizaes 3D em grid............................................................. 36
Figura 3.4: Coordenao de overview e detalhe no sistema PDQ Tree-browser ........... 37
Figura 3.5: Usando a coordenao drill downpara visualizar o contedo de
agregaes no Snap-Together...................................................................... 38
-
7/25/2019 000624194
8/106
Figura 3.6:Brushing-and-linking n-dimensional no sistema XmdvTool. Os dadosselecionados so exibidos nas imagens (a) e (b) em vermelho e a regiode brushing,que indica os dados de interesse, mostrada nas imagens(c) e (d) no espao de um glifo em estrela e no espao de coordenadas
paralelas, respectivamente. .......................................................................... 41Figura 3.7: Cenrio construdo em Snap-Together para a explorao de duas tabelas
relacionadas de dados multidimensionais.................................................... 42
Figura 3.8: Cenrio construdo em GeoVista Studio com todas as suas tcnicas devisualizao multidimensionais ................................................................... 44
Figura 4.1: Estrutura interna do toolkit InfoVis. Retngulos representam estruturas dedados e elipses representam funes. .......................................................... 46
Figura 4.2: Programa para a visualizao de Coordenadas Paralelas. O cdigo doretngulo azul gera uma visualizao no-interativa, mas quando
substitudo pelo cdigo do retngulo vermelho a visualizao recebe umpainel de controle padro............................................................................. 49
Figura 4.3: Hierarquia das classes de visualizao do toolkit InfoVis........................... 50
Figura 4.4: Cdigo padro executado para o desenho de itens de dados ....................... 51
Figura 4.5: Cdigo padro executado para o desenho de um item de dado ................... 51
Figura 4.6: As quatro abas do painel de controle: (a) Filters; (b) Visual; (c) Excentric;e (d) Fisheyes............................................................................................... 52
Figura 4.7: Visualizaes geradas pela aplicao dos mecanismos de interao Colorby ( esquerda) e Size by( direita) sobre as tcnicas Radviz (acima) e
Coordenadas Paralelas (abaixo)................................................................... 53
Figura 4.8:Labelsdinmicos na tcnica Coordenadas Paralelas ................................... 54
Figura 4.9: Lente Fisheye aplicada na tcnica Radviz ................................................... 54
Figura 4.10: Visualizao dos valores que o 142item de dado do conjunto sobrecarros possui para cada atributo ................................................................ 55
Figura 4.11: Componentes grficos que compem o mecanismo de interaoAttributes Manipulation ............................................................................ 56
Figura 5.1: Tcnica Coordenadas Paralelas implementada no toolkit InfoVis .............. 61
Figura 5.2: Criao e desenho das linhas que representam atributos na tcnicaCoordenadas Paralelas................................................................................. 61
Figura 5.3: Criao dos objetos que representam itens de dados na tcnicaCoordenadas Paralelas................................................................................. 62
Figura 5.4: Tcnica Radviz implementada no toolkit InfoVis ....................................... 63
Figura 5.5: Criao e desenho das linhas que representam atributos na tcnica Radviz 64
Figura 5.6: Criao dos objetos que representam itens de dados na tcnica Radviz...... 65
Figura 5.7: Tcnica Matriz de Scatter Plotsimplementada no toolkit InfoVis.............. 66
Figura 5.8: Procedimento para a criao da matriz de visualizaes Scatter Plots 2D.. 67
-
7/25/2019 000624194
9/106
Figura 5.9: Procedimento utilizado para garantir que aes realizadas em umavisualizao 2D da matriz de Scatter Plotsejam executadas tambm nassuas demais visualizaes............................................................................ 68
Figura 5.10: Cenrio de explorao construdo na aplicao prottipo ......................... 71
Figura 5.11: Arquitetura do prottipo desenvolvido ...................................................... 72
Figura 5.12: Estrutura do grafo de coordenao e seus relacionamentos com outrosmdulos da aplicao ................................................................................ 73
Figura 5.13: Processo de criao e viabilizao de uma nova coordenao .................. 74
Figura 5.14: Representao grfica de um grafo de coordenao.................................. 75
Figura 5.15: Conectando os nodos da nova coordenao............................................... 75
Figura 5.16: Seleo de interaes a serem coordenadas............................................... 76
Figura 5.17: Nodos conectados pela ao de seleo..................................................... 76Figura 5.18: Removendo uma coordenao ................................................................... 76
Figura 5.19: Processo de gerenciamento de coordenaes ............................................ 77
Figura 5.20: Atividades realizadas pelo usurio e aplicao no processo depropagao de uma interao.................................................................... 78
Figura 5.21: Seqncia de operaes realizadas pelos objetos envolvidos napropagao de interaes .......................................................................... 79
Figura 5.22: Mtodos da interface Visualizationrelacionados ao processo decoordenao............................................................................................... 81
Figura 7.1: Indicao das dezesseis medidas extradas do crnio de um tuco-tuco paraa anlise morfomtrica tradicional. (a) Vista dorsal, (b) vista ventral e (c)vista lateral................................................................................................... 89
Figura 7.2: Identificao de um animal com medidas fora do padro (item destacado) 91
Figura 7.3: Representao do conjunto inteiro de dados morfomtricos com locaisde coleta mapeados para cor........................................................................ 92
Figura 7.4: Representao em Coordenadas Paralelas das amostras morfomtricascoletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha).. 93
Figura 7.5: Representao em Matriz de Scatter Plotdas amostras morfomtricascoletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha).. 94
Figura 7.6: Representao do conjunto inteiro de dados morfomtricos com machosmapeados para a cor rosa e fmeas mapeadas para a cor preta ................... 94
Figura 7.7: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot(direita), utilizados na anlise do dimorfismo sexual. ................................. 96
Figura 7.8: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot(direita), utilizados na anlise de variaes por local de coleta................... 96
-
7/25/2019 000624194
10/106
LISTA DE TABELAS
Tabela 2.1: Representao de uma tabela de dados.........................................................16
Tabela 2.2: Propriedades visuais que podem ser usadas para mapear atributos dedados e exemplos de mapeamentos tpicos..................................................27
Tabela 5.1: Interaes coordenadas e as propriedades que notificam sua ocorrncia.....80Tabela 8.1: Comparao das tcnicas Coordenadas Paralelas, Radviz e Matriz de
Scatter Plots segundo critrios encontrados na literatura.............................99
-
7/25/2019 000624194
11/106
RESUMO
Tcnicas de visualizao de informaes representam graficamente dados de umdeterminado domnio de aplicao e disponibilizam mecanismos para a interao com arepresentao gerada, a fim de que o usurio consiga interpretar e compreender asinformaes apresentadas. As tcnicas de visualizao multidimensionais, em
particular, referem-se visualizao de informaes onde cada elemento no conjunto dedados descrito, ou caracterizado, por mltiplas variveis (atributos), as quais devemser codificadas em uma nica estrutura visual.
Embora existam diversas tcnicas de visualizao para representar dadosmultidimensionais, nenhuma delas apresenta o melhor desempenho para todos os tiposde tarefas. Uma estratgia interessante analisar vrias representaes simultaneamentemantendo uma ligao semntica entre elas, de forma que aes realizadas sobre umatcnica se reflitam automaticamente nas demais. No existe, atualmente, um sistema demltiplas visualizaes coordenadas especfico para a representao de dadosmultidimensionais, que disponha de um amplo e variado conjunto de coordenaes. Os
sistemas que suportam a representao coordenada deste tipo de dados so de propsitogeral e, devido a isto, oferecem poucas possibilidades de coordenao.
O presente trabalho apresenta um estudo de tcnicas de coordenao para sistemasde mltiplas visualizaes, focando coordenao de representaes visuais de dadosmultidimensionais. A partir do estudo dos diversos sistemas de visualizao existentes,foi identificado um conjunto de coordenaes que podem ser aplicadas entrevisualizaes multidimensionais. Esse trabalho apresenta estas coordenaes e umanova aplicao de mltiplas visualizaes coordenadas (construda a partir do toolkitInfoVis), especfica para a representao de dados multidimensionais, que implementa oconjunto de coordenaes. A aplicao desenvolvida conta com um variado conjunto decoordenaes e altamente flexvel, permitindo tanto a escolha das visualizaes querepresentaro o conjunto de dados, bem como das coordenaes ativas entre elas.
Foram realizados alguns estudos de avaliao como ensaios de interao comusurios. Primeiramente, as implementaes das tcnicas de visualizao suportadas
pela aplicao desenvolvida foram avaliadas, com o objetivo de encontrar possveisproblemas de usabilidade. Grande parte dos problemas identificados nesta avaliao,principalmente os mais graves, foram solucionados logo aps sua realizao. Naseqncia, outro experimento, conduzido de maneira mais informal, avaliou algumasquestes a respeito do uso das coordenaes implementadas. Por fim, com um estudo decaso, verificou-se a aplicabilidade das visualizaes multidimensionais suportadas pelaaplicao para a explorao de dados de um domnio especfico.
Palavras-Chave: Visualizao de informaes, mltiplas visualizaes coordenadas,interface de usurio.
-
7/25/2019 000624194
12/106
-
7/25/2019 000624194
13/106
1 INTRODUO
O desenvolvimento tecnolgico, incorporando avanos em produtos e servios,gerou condies para medies mais precisas, simulaes mais velozes e registro deuma gama variada de tipos de dados, produzindo conjuntos de dados cada vez maisvolumosos e complexos. A explorao e a anlise desses volumes de dados tornou-se
uma tarefa difcil que s pode ser realizada com a utilizao de ferramentascomputacionais apropriadas, muitas vezes dependentes do domnio dos dados. Isto especialmente complexo quando os dados tm alta dimensionalidade, ou seja,correspondem a conjuntos de vrios atributos.
A rea de visualizao de informaes tem por objetivo facilitar a compreenso e amanipulao desta vasta quantidade de dados diversificados (CARD, 1999; SPENCE,2001), atravs do emprego de tcnicas que buscam tanto representar visualmente osdados quanto permitir ao usurio a interao com estas representaes. As tcnicas devisualizao multidimensionais so especialmente projetadas para a representao dedados que tm alta dimensionalidade (descritos por mltiplos atributos). Conjuntos de
dados multidimensionais geralmente so representados como tabelas, onde cada linhacorresponde a um elemento de dado, com as colunas representando atributos.
As representaes visuais de tcnicas de visualizao de informaes, quandomanipuladas dinamicamente, facilitam a interpretao dos dados pelo usurio,
possibilitando a percepo de padres, tendncias, relacionamentos e exceesembutidos nos mesmos. Uma das grandes questes em relao a essas tcnicas o quoefetiva uma determinada tcnica, em um determinado domnio, ou para umdeterminado objetivo.
Embora existam diversas tcnicas para mostrar tabelas e conjuntos de dadosmultidimensionais, dependendo da categoria dos dados e das tarefas especficas que
deveriam ser suportadas, uma nica tcnica pode no ser suficiente: usurios podemprecisar visualizar os dados mostrados com diferentes tcnicas para encontrarrelacionamentos e modelos.
Assim, dadas as necessidades mencionadas acima, alguns autores (BALDONADOet al., 2000; NORTH, 2000) passaram a trabalhar com uma estratgia denominadaMltiplas Visualizaes Coordenadas (CMV - Coordinated Multiple Views). Nestaestratgia, diferentes visualizaes podem ser integradas em um ambiente e usadas deforma coordenada, isto , estabelecendo-se uma ligao semntica entre asvisualizaes, de maneira que aes sobre uma se reflitam nas demais. Desta forma,aproveita-se os pontos fortes de cada uma, e conjuntos de dados complexos e de altadimensionalidade podem ser visualizados atravs de tcnicas apropriadamenteselecionadas (SHIMABUKURO, 2004).
-
7/25/2019 000624194
14/106
14
North e Shneiderman (1997) observaram que a coordenao de mltiplasvisualizaes oferece as seguintes vantagens:
Melhora na performance do usurio: O tempo de acesso informao reduzido, principalmente com a manipulao de informaes hierrquicas, comomostrado por Chimera et al. (1994), bem como o nmero de aes requeridas dousurio para manter um estado sincronizado, como mostrado por Kandogan eShneiderman (1997);
Descoberta de relacionamentos inesperados: Seria difcil encontrar taisrelacionamentos sem coordenao;
Unificao do desktop: mais sensato apresentar informaes complexas noem uma nica visualizao complexa e integrada, mas em mltiplasvisualizaes mais simples, usando coordenao para navegar, manterrelacionamentos, etc.
1.1 Motivao
Mltiplas visualizaes de um mesmo conjunto de dados permitem observ-lo sobvrias perspectivas, bem como explorar os pontos fortes e minimizar os efeitos dos
pontos fracos das tcnicas envolvidas (KEIM, 1996; EICK; KARR, 2000). Diversasferramentas genricas de visualizao de informaes oferecem vrias tcnicas e
permitem o seu uso coordenado para visualizar um mesmo conjunto de dados. Noentanto, em geral, o conjunto de tcnicas e as formas de coordenao disponveis sofixos, pr-estabelecidos durante o projeto da ferramenta, o que limita a potencialidadedo uso das tcnicas em contextos de aplicaes diversos e a liberdade do usurio no
processo de explorao das mesmas. Ambientes que permitem flexibilidade naconfigurao da coordenao entre mltiplas visualizaes, possibilitando a criao decenrios personalizados para as necessidades do usurio, tm sido tema de estudos e jexistem algumas iniciativas, como Snap-Together (NORTH, 2000) e GeoVISTA Studio(GAHEGAN et al., 2000), que sero abordadas com maior detalhamento no Captulo 3.A primeira destas ferramentas genrica, podendo ser aplicada para a anlise devariados tipos de dados e domnios de aplicao; a ltima, entretanto, enfatiza otratamento de dados espaciais (geo-referenciados).
Assim como a ferramenta GeoVISTA Studio, a maioria das aplicaes existentesque suportam mltiplas visualizaes coordenadas so projetadas para atender, com
maior nfase, dados relativos a um domnio especfico. Assim, a tarefa de determinaodas aes de interao coordenadas em uma ferramenta facilitada e a mesma adquirecondies para atender melhor as necessidades dos usurios no processo decompreenso e anlise dos dados.
Um problema encontrado atualmente em ferramentas de mltiplas visualizaescoordenadas genricas a baixa variedade de interaes coordenadas que as mesmassuportam. Os usurios de Snap-Together, por exemplo, tm suas aes de interaolimitadas seleo e navegao, mas ...muito mais interaes deveriam ser suportadas,tendo em vista que o objetivo da ferramenta a visualizao exploratria(BOUKHELIFA et al., 2003).
A delimitao das coordenaes suportadas por uma ferramenta de visualizaogenrica uma tarefa difcil. Devido natureza multiforma das diversas visualizaes,
-
7/25/2019 000624194
15/106
15
aes executadas sobre uma delas nem sempre podem ser diretamente aplicadas paraoutras. Alm disso, algumas coordenaes possveis de serem alcanadas, podem no
possuir utilidade; e ainda, outras podem ser impossveis de realizar (BOUKHELIFA etal., 2003). Na rea de visualizao de informaes multidimensionais, ainda no existe
uma ferramenta genrica, capaz de atender os diversos domnios de aplicao em quedados multidimensionais podem ser gerados, flexvel na escolha das visualizaes e dasaes coordenadas e com um conjunto rico e variado destas ltimas. Esta observao foia principal motivadora para a realizao desse trabalho.
1.2 Objetivos e Contribuies
O objetivo principal desse trabalho investigar tcnicas de coordenao que podemser aplicadas entre visualizaes multidimensionais em geral. Como objetivo secundrioest a implementao de tais tcnicas em uma aplicao prottipo altamente flexvel,
com a finalidade de validar as coordenaes definidas.Assim, as contribuies desse trabalho so:
A definio de um conjunto variado de coordenaes que podem ser aplicadasentre visualizaes multidimensionais em geral, reunindo coordenaesutilizadas por diferentes ferramentas;
A construo de uma aplicao prottipo de mltiplas visualizaescoordenadas que:
especfica para visualizao de informaes multidimensionais, nosendo, no entanto, voltada para um domnio de aplicao especfico;
altamente flexvel, pois permite que usurios possam definir quais,dentre as visualizaes suportadas, iro compor um cenrio de mltiplasvisualizaes e quais aes interativas sero coordenadas entre as mesmas.
1.3 Organizao do Trabalho
Os demais captulos dessa dissertao esto organizados como segue. O Captulo 2descreve as principais tcnicas de visualizao e de interao utilizadas para conjuntosde dados multidimensionais, organizadas em categorias. O Captulo 3 aborda os
principais tipos de coordenaes utilizadas por sistemas de mltiplas visualizaes
coordenadas, alm de descrever alguns destes sistemas relacionados com o presentetrabalho. O Captulo 4 apresenta caractersticas e a estrutura bsica do toolkit devisualizao InfoVis, sobre o qual foi construda a aplicao prottipo para validao decoordenaes. O Captulo 5 tem como objetivo apresentar e descrever apenas umconjunto especfico de coordenaes: aquelas que podem ser aplicadas em sistemas demltiplas visualizaes coordenadas, especficos para a visualizao de dadosmultidimensionais. Alm disso, este ltimo captulo aborda tambm a descrio de umaaplicao de visualizaes multidimensionais coordenadas, que implementa o conjuntode coordenaes apresentado no mesmo. O Captulo 6 descreve dois estudos deavaliao preliminar da aplicao prottipo apresentada nesse trabalho e o Captulo 7descreve um estudo de caso em que a aplicao desenvolvida foi utilizada por
especialistas de um domnio especfico para a explorao de seus dadosmultidimensionais. Finalmente, o Captulo 8 apresenta concluses e trabalhos futuros.
-
7/25/2019 000624194
16/106
2 INTERAO COM VISUALIZAESMULTIDIMENSIONAIS
O termo dimensionalidade usado para referir tanto o nmero de dimenses doespao-domnio onde determinado objeto est definido - podendo ser um espaounidimensional (1D), bidimensional (2D) ou tridimensional (3D) -, quanto o nmero deatributos de um registro de dado - geralmente, referenciado como n-dimensional (nD),multidimensional ou multivariado. Assim, dados multidimensionais so aqueles que
podem ser representados como uma tabela de dados multivariados, ou seja, que possuimuitas variveis (ou atributos) que devem ser codificadas em uma nica estrutura visual1D, 2D ou 3D (CARD, 1999). A representao de uma tabela de dados multivariados mostrada na tabela 2.1.
Tabela 2.1: Representao de uma tabela de dados
Variveli Varivelj Varivelk
Casox Val or ix Val or jx Val or kx . . .
Casoy Val or iy Val or jy Val or ky . . .
... . . . . . . . . . . . .
As colunas da tabela em questo representam variveis (ou atributos), conjuntos querepresentam a gama de valores nas colunas. As linhas representam casos (ou itens dedados, tuplas), que so conjuntos de valores para cada varivel. Nesse trabalho, adotou-se o termo item de dado para denotar uma tupla descrevendo um relacionamento entremltiplas variveis (por exemplo, um caso ou registro de dado) e o termo atributo
para denotar as variveis (dimenses) do conjunto de dados.
2.1 Visualizaes Multidimensionais
As visualizaes que so especificamente projetadas para codificar dados quepodem ser representados como tabelas multivarivel so denominadas visualizaesmultidimensionais.
As tcnicas de visualizao multidimensionais podem ser categorizadas de acordocom diferentes critrios. Keim (1996) sugere uma categorizao baseada em trscritrios: a natureza do dado a ser visualizado, a abordagem de mapeamento adotado
pela tcnica e os mtodos de interao e distoro disponibilizados para permitir amanipulao da representao visual.
-
7/25/2019 000624194
17/106
17
Existem vrias tcnicas para a visualizao de dados multidimensionais. Nessa seosero apresentadas algumas tcnicas clssicas, direcionadas visualizao de tabelas dedados, dando-se nfase s tcnicas mais representativas e citadas na literatura. Asmesmas sero descritas seguindo o critrio de classificao proposto por Keim (1996),
que difere tcnicas de acordo com a forma de mapeamento adotada para transformardados em formas visuais. Este critrio divide as tcnicas de visualizaomultidimensionais em tcnicas de projeo geomtrica, iconogrficas e orientadas a
pixel.
2.1.1Tcnicas de projeo geomtrica
Nessa classe esto includas todas as tcnicas de visualizao que empregam algumtipo de projeo geomtrica para mapear dados para formas visuais. Entre as tcnicasdesta categoria esto: Coordenadas Paralelas, Matriz de Scatter Plots, grficos de linhas,grfico de barras e histogramas, Survey Plots, Curvas de Andrews, Radviz e
Coordenadas Paralelas Circulares.As principais tcnicas representantes dessa categoria so descritas com maior
detalhamento a seguir. Para demonstrar a representao visual gerada por cada umadestas tcnicas, foi utilizado o conjunto de dados sobre carros (descrito na seo 6.1.1desse trabalho).
2.1.1.1 Coordenadas Paralelas
A tcnica Coordenadas Paralelas foi introduzida por Inselberg (1985) (1990) pararepresentar mltiplas dimenses sem utilizar eixos cartesianos ortogonais. Nessatcnica, dados multidimensionais so representados utilizando linhas verticais e
horizontais. Cada linha vertical indica um atributo (ou varivel) e os valores dosatributos so mapeados para pontos nessas linhas verticais, de forma que cada item dedado seja representado como uma linha poligonal que intercepta cada linha vertical emseu ponto correspondente ao valor de cada atributo, formando um aglomerado de linhashorizontais. Os valores mximo e mnimo de um atributo so usualmente mapeados
para as extremidades superior e inferior de uma linha vertical, respectivamente. A figura2.1 mostra um exemplo da representao visual gerada pela tcnica CoordenadasParalelas (para representar os dados de carros). As diferentes intensidades de cor, daslinhas horizontais da figura, foram usadas para diferenciar itens de dados com valoresdiferentes para o atributo Origin.
A representao visual gerada pela tcnica Coordenadas Paralelas facilitaprincipalmente a identificao de algumas caractersticas, como diferenas nadistribuio dos dados e correlaes entre atributos. Porm, visto que as linhas
poligonais podem se sobrepor, o nmero de itens de dados que podem ser visualizadosao mesmo tempo limitado a aproximadamente 1.000 itens (KEIM, 1996). Assim, avisualizao de grandes volumes de dados requer que a tcnica seja utilizadadisponibilizando-se operaes adequadas de interao. A figura 2.2 exibe um exemploda visualizao Coordenadas Paralelas, onde h uma acentuada sobreposio de linhas.
2.1.1.2 Matriz de Scatter Plots
Scatter Plot uma tcnica classificada como geomtrica, onde pontos oumarcadores visuais (representando itens de dados) so plotados em coordenadas (x, y)
-
7/25/2019 000624194
18/106
18
de forma semelhante a outros grficos bidimensionais. Matriz de Scatter Plots umaextenso desta tcnica, utilizada para a representao de dados multidimensionais. Namesma, so exibidas simultaneamente mltiplas projees bidimensionais (scatter
plots) dos diferentes pares de atributos do conjunto de dados. Por exemplo, para um
conjunto de dados com 6 dimenses, uma matriz 6 x 6 (6 linhas e 6 colunas) usadapara prover a visualizao de cada dimenso versus todas as outras. A figura 2.3 mostraum exemplo de visualizao gerada com a tcnica Matriz de Scatter Plots.
Figura 2.1: Representao visual da tcnica Coordenadas Paralelas
Figura 2.2: Tcnica Coordenadas Paralelas com sobreposio de linhas (15.000 itens dedados representados) (KEIM, 1997)
-
7/25/2019 000624194
19/106
19
Figura 2.3: Representao visual da tcnica Matriz de Scatter Plots
A Matriz de Scatter Plots considerada de fcil interpretao, por permitir avisualizao de todas as possveis correlaes entre os pares de dimenses. Contudo, aquantidade de dimenses que podem ser apresentadas simultaneamente uma limitao,
devido ao pouco espao disponvel para a projeo de cada grfico. medida que onmero de dimenses aumenta, torna-se necessrio o uso de operaes de interao(como zoomingou panning) para uma efetiva interpretao dos resultados. Hyperslice(VAN, 1993) e HyperBox (ALPERN; CARTER, 1991) so exemplos de variaes daMatriz de Scatter Plots, que fazem uso de uma matriz de painis.
2.1.1.3 Radviz
Radviz (HOFFMAN et al., 1997) visualizao de coordenadas radiais umatcnica que segue um princpio semelhante a Coordenadas Paralelas. Nessa tcnica, nlinhas, correspondentes ndimenses, emanam radialmente do centro de um crculo e
terminam no seu permetro, em pontos igualmente espaados, denominados dimensionalanchors(DAs). Cada item de dado projetado est ligado por meio de molas imaginriass DAs e a posio onde so projetados aquela onde existe equilbrio das foras dasmolas associadas a cada dimenso (HOFFMAN, 1999). Cada ponto de dado , ento,exibido onde a soma das foras das molas igual a zero. Todos os valores dos itens dedados so, geralmente, normalizados para valores entre 0 e 1 (FAYYAD; GRINSTEIN;WIERSE, 2002). A figura 2.4 mostra um exemplo da representao visual da tcnicaRadviz.
A tcnica Radviz pode mapear vrios itens de dados na mesma posio, dependendoda ordem em que os atributos esto distribudos no crculo. Alm disso, outras
caractersticas desta tcnica de visualizao so (HOFFMAN, 1999) (FAYYAD;GRINSTEIN; WIERSE, 2002):
-
7/25/2019 000624194
20/106
20
Itens de dados com valores de atributos aproximadamente iguais (depois denormalizados) so posicionados prximos ao centro do crculo;
Itens de dados com valores similares associados a dimenses em eixosopostos ficam, tambm, prximos ao centro;
Valores maiores dos atributos (ou dimenses) atraem o ponto projetado pararegies prximas aos eixos associados a estes atributos.
A posio de um item de dado depende da representao das dimenses ao redor docrculo, sendo que, se a ordem das dimenses for alterada, a representao grficatambm o ser.
Figura 2.4: Representao visual da tcnica Radviz(imagem extrada de VALIATI, 2004)
2.1.1.4 Coordenadas Paralelas Circulares
Coordenadas Paralelas Circulares (denominada, tambm, como Grfico de EstrelasSobrepostas) correspondem a uma outra verso circular da tcnica CoordenadasParalelas, consideravelmente, mais prxima idia original desta ltima (FAYYAD;GRINSTEIN; WIERSE, 2002). Basicamente, a forma de mapear e projetar os dados
permanece a mesma, apenas as dimenses so dispostas de outra forma (em um formatocircular), formando um grfico em estrela (conforme mostra a figura 2.5).
Seguindo esta forma de projeo geomtrica, os segmentos de linha so mais longosna parte externa do crculo, onde os valores maiores so tipicamente mapeados,enquanto os valores menores so projetados para o centro do crculo. Devido assimetria formada na representao dos valores maiores e menores, certos padres
podem ser facilmente detectados com esta tcnica (FAYYAD; GRINSTEIN; WIERSE,2002).
-
7/25/2019 000624194
21/106
21
Figura 2.5: Representao visual da tcnica Coordenadas Paralelas Circulares (imagemextrada de VALIATI, 2004)
2.1.1.5 Polyviz
Polyviz uma tcnica que busca combinar caractersticas de Coordenadas Paralelase de Radviz. Um dos problemas apresentados pela tcnica Radviz que pontos n-dimensionais com valores bastante diferentes podem ser mapeados para a mesma
posio na tela. Esta sobreposio pode ser contornada se os pontos fixados para asmolas, em cada dimenso, forem expandidos ao longo dos eixos (FAYYAD;GRINSTEIN; WIERSE, 2002).
Na tcnica Polyviz, alm de ser empregada esta nova forma de mapeamento dospontos, a distribuio para cada dimenso mostrada por linhas emanando dos eixos edispostas em uma configurao poligonal (ver figura 2.6). Deste modo, procura-seaproveitar a capacidade de exibio de agrupamentos, demonstrada pela tcnica Radviz,
e a habilidade de visualizar a distribuio de dados em cada dimenso, caracterstica deCoordenadas Paralelas.
2.1.1.6 Survey Plots
Survey Plots(LOHNINGER; INSPECT, 1994) outra tcnica na qual os dados decada dimenso so mapeados para linhas estendidas a partir de um ponto central. Ocomprimento de cada linha corresponde ao valor do item de dado sendo representado.Como em grfico de barras, esta tcnica utiliza a idia de representar os dadosestendendo cada ponto sendo mapeado para um determinado eixo. Um princpiosemelhante a este empregado tambm pelas tcnicas Table Lens(RAO; CARD, 1994)
e Matriz de Permutao (BERTIN, 1983).
-
7/25/2019 000624194
22/106
22
A visualizao de Survey Plots permite que correlaes entre quaisquer duasdimenses possam ser percebidas, especialmente, quando os dados so classificados deacordo com uma dimenso particular (FAYYAD; GRINSTEIN; WIERSE, 2002). Afigura 2.7 mostra um exemplo de visualizao Survey Plots (representando os dados
sobre carros), na qual os dados esto classificados por nmero de cilindros (valores doatributo Cylinders).
Figura 2.6: Representao visual da tcnica Polyviz (HOFFMAN et al., 2000)
Figura 2.7: Representao visual da tcnica Survey Plots (imagem extrada deVALIATI, 2004)
-
7/25/2019 000624194
23/106
23
2.1.2Tcnicas Iconogrficas
H dois tipos de visualizaes do tipo iconogrficas: glifos e cones. Em cada umadestas, as dimenses de um conjunto de dados so mapeadas para certas caractersticasdos glifos ou cones. Assim, cada glifo ou cone representa um item de dado com suasn-dimenses.
2.1.2.1 Faces de Chernoff
Uma das mais conhecidas visualizaes iconogrficas Faces de Chernoff(CHERNOFF, 1973). Nesta ltima, as dimenses dos dados so mapeadas paracaractersticas de uma face, como formato do nariz, boca, olhos e da face como um todo(ver figura 2.8(a)), resultando em diferentes formatos de faces (definidas segundo osvalores sendo mapeados). Contudo, a efetividade desta tcnica amplamente discutida,devido dificuldade de percepo de diferenas muito pequenas nas imagens e pelamesma ser inadequada para a identificao de agrupamentos.
Figura 2.8: Tcnicas iconogrficas: a) Faces de Chernoff e b) Glifos em Estrela(KEIM, 1997)
2.1.2.2 Glifo em Estrela
Na tcnica Glifo em Estrela (ver figura 2.8 (b)), cada item de dado representado
por um glifo em forma de estrela. Em cada um destes, as dimenses dos dados sorepresentadas como raios de ngulos iguais, partindo do centro de um crculo. Ocomprimento de um raio indica o valor de um atributo. Raios mais extensos representamvalores altos e o centro do crculo indica o valor mnimo da dimenso.
2.1.2.3 Stick Figure
A tcnica Stick Figure caracteriza-se pelo uso de cones bsicos. As vriasdimenses dos dados so mapeadas para parmetros dos cones, tais como ocomprimento e o ngulo de rotao de uma aresta (ou galho). Variaes decomprimento, espessura e cor das arestas fornecem outras possibilidades de
representao, explorando a capacidade humana de percepo de texturas einterpretao de padres (FAYYAD; GRINSTEIN; WIERSE, 2002). A imagem daesquerda da figura 2.9 apresenta uma tabela de cones, que representam diversos
-
7/25/2019 000624194
24/106
24
parmetros do censo da Inglaterra, e a imagem da direita da mesma figura mostra estescones plotados em coordenadas x e y, indicando renda e idade.
Figura 2.9: Mapeamento de Stick Figures(esquerda) e grfico iconogrfico de dados docenso da Inglaterra (direita) (FAYYAD et al., 2002)
2.1.3Tcnicas Orientadas a Pixel
Tcnicas dessa categoria caracterizam-se por mapear o conjunto de valores de cadaatributo (ou dimenso) dos dados em pixels na tela. O conjunto de valores de cadaatributo exibido em janelas individuais, ou seja, para um conjunto de dados que possuin atributos, a tela dividida em n janelas. Em cada uma das janelas, cada valor doatributo representado por umpixel,colorido conforme o valor sendo representado. Adistribuio espacial dos pixelsna janela pode ser determinada de diferentes maneiras(ver figura 2.10), de modo que relaes ou significados nos dados possam ser
percebidos pela anlise das regies correspondentes nas janelas (KEIM, 1996).
As formas utilizadas para a distribuio dos pixelsnas janelas podem ser divididasem tcnicas dependentes e independentes do resultado de uma consulta. Nas tcnicasindependentes de consulta, os valores dos atributos so mapeados diretamente para os
pixelse exibidos nas janelas, utilizando-se curvas de preenchimento de espao (curvasde Peano-Hilbert ou Morton) ou padres recursivos (ver figura 2.11), que proporcionam
um melhor agrupamento de itens de dados relacionados e uma distribuiosemanticamente significativa.
Por outro lado, nas tcnicas dependentes de consulta, ao invs dos valores dosatributos serem mapeados diretamente para pixels, as distncias destes valores a umadeterminada consulta que so mapeadas. Desta forma, alm dos itens de dados quesatisfazem a consulta, tambm podem ser exibidos aqueles valores que se aproximam daresposta, atravs da exibio da distncia de cada valor a um respectivo valorestabelecido na consulta. O clculo da distncia depende da aplicao e do tipo de dado.Os atributos referentes a um item de dado ocupam a mesma posio relativa nas suasrespectivas janelas, sendo que a ordem de exibio dos itens na janela determinada por
uma distncia global. Essa distncia calculada pela combinao das distncias de cadaatributo, ponderadas por um peso correspondente, que determina a relevncia dada aoatributo.
-
7/25/2019 000624194
25/106
25
Visto que o foco est na relevncia dos dados com respeito a uma consulta,diferentes formas de distribuio dospixelspodem ser apropriadas: em espiral, onde asrespostas corretas so apresentadas no centro da janela e os valores prximos ao redordesta regio, ou por eixos, indicando distncias positivas e negativas (ver figura 2.10).
Figura 2.10: Visualizaes orientadas a pixel de um conjunto de dados com novedimenses, utilizando duas formas de distribuio espacial: espiral (esquerda) e por
eixos (direita) (KEIM, 1997).
Figura 2.11: Tcnicas independentes de consulta: a) curvas de Peano-Hilbert , b) curvasde Morton e c) padres recursivos (KEIM, 1996) (KEIM, 1997)
Embora o formato retangular para as janelas permita um uso racional do espao natela, a percepo de relacionamentos entre os atributos pode ser dificultada quantomaior for o nmero de dimenses a serem visualizadas. Uma alternativa de soluo aeste problema a utilizao de um formato circular, adotado, por exemplo, na tcnicaSegmentos de Crculo (ver figura 2.12).
-
7/25/2019 000624194
26/106
26
Figura 2.12: Tcnica Segmentos de Crculo (KEIM, 1997).
2.2 Tcnicas de Interao
Alm das tcnicas de visualizao, para uma explorao de dados efetiva, necessrio tambm o uso de algumas tcnicas de interao. Estas ltimas permitem queum usurio possa interagir diretamente com visualizaes e alter-las dinamicamente deacordo com seus objetivos de explorao. A possibilidade de interagir comrepresentaes visuais pode reduzir consideravelmente as desvantagens e pontos fracos
de algumas tcnicas de visualizao (principalmente, daquelas que apresentamdesordem visual e sobreposio de objetos), fornecendo ao usurio mecanismos paramanipular a complexidade de conjuntos de dados (OLIVEIRA; LEVKOWITZ, 2003).
Keim (1997) identificou as tcnicas de interao que so utilizadas para aexplorao de conjuntos de dados multidimensionais e organizou-as em seis classes:mapeamento de dados para propriedades visuais, projees, filtragem (seleo econsulta), brushing and linking, zoom e detalhes por demanda. A seguir, as tcnicas deinterao aplicadas para a visualizao de dados multidimensionais sero descritas,utilizando a categorizao proposta por Keim.
2.2.1Mapeamento de Dados para Propriedades VisuaisEsta categoria inclui as tcnicas de interao que realizam mapeamentos de atributos
(dimenses) dos dados para parmetros de uma visualizao. Estes parmetros soatributos visuais de objetos representando itens de dados (como cor, tamanho,transparncia, orientao, etc.). A tabela 2.2 mostra exemplos tpicos de mapeamentos
para algumas propriedades visuais.
A codificao de atributos de dados para propriedades visuais de uma visualizaoaumenta a densidade dos dados e a variedade de representaes que podem ser geradas(STOLTE; HANRAHAN, 2001). Alm disso, este tipo de mapeamento aumenta onmero de dimenses que podem ser visualizadas simultaneamente. Por exemplo, um
scatter plot 2D representa apenas dois atributos (dispostos nos eixos x e y), mas outros
-
7/25/2019 000624194
27/106
27
atributos podem ser representados simultaneamente se estes forem mapeados paraatributos visuais de objetos.
A fim de manter uma especificao breve, no deve ser requerida do usurio aconstruo de mapeamentos. O usurio deve apenas especificar qual atributo de dadosdeve ser mapeado para uma determinada propriedade visual. O sistema que deve serresponsvel por gerar um mapeamento efetivo dos valores do atributo para variaes da
propriedade visual.
Diferentes smbolos (ver tabela 2.2) podem ser utilizados para o mapeamento deatributos nominais, desde que o nmero de valores do atributo seja pequeno. O tamanhode objetos pode ser usado para mapear tanto atributos nominais como quantitativos.Quando mapeando atributos quantitativos, um mapa linear a partir dos valores deatributo para o tamanho dos objetos criado. Por outro lado, se um atributo nominal mapeado, o nmero de valores precisa ser pequeno (no mximo quatro ou cinco), deforma que o usurio consiga distinguir entre diferentes categorias (BERTIN, 1983).
Quando a cor utilizada para mapear atributos nominais, os valores de atributodevem ser associados a cores bem distintas entre si (ver tabela 2.2). Quando os atributosmapeados so quantitativos, geralmente, apenas a nuance de cor variada.
Um princpio chave na gerao de mapeamentos de atributos nominais para apropriedade orientao que a orientao precisa variar pelo menos 30 graus entre ascategorias (KOSSLYN, 1994), o que restringe o nmero de categorias para no mximoseis. Para atributos quantitativos, a orientao varia linearmente com os valores deatributo.
Tabela 2.2: Propriedades visuais que podem ser usadas para mapear atributos de dados e
exemplos de mapeamentos tpicospropriedadevisual
objetos mapeamento nominal mapeamento quantitativo
figura glifo
tamanho retngulo,crculo, linha,glifo, texto
cor retngulo,crculo, linha,glifo, texto
orientao retngulo,linha, texto
Fonte: STOLDE; HANRAHAN, 2001
2.2.2Projees
A idia das tcnicas interativas de projeo mudar, dinamicamente, os atributos dedados (dimenses) que so projetados em eixos de uma visualizao. O objetivo explorar um conjunto de dados multidimensional, permitindo correlaes entrediferentes atributos de dados. Um exemplo clssico de sistema que emprega projees o Grand-Tour (ASIMOV, 1985). Ele tenta mostrar todas as projees bi-dimensionaisinteressantes de um conjunto de dados multidimensional como uma srie de scatter
plots. O nmero de projees possveis exponencial no nmero de dimenses e,
-
7/25/2019 000624194
28/106
28
devido a isto, esta organizao invivel para conjuntos de dados de altadimensionalidade. A seqncia de projees mostrada pode ser randmica, manual ou
pr-computada (KEIM, 2002).
2.2.3FiltragemAo explorar grandes conjuntos de dados, importante particionar, interativamente,
estes dados em diferentes segmentos e, ento, focar no subconjunto de interesse (KEIM,2002). Isto pode ser feito atravs da seleo direta do subconjunto desejado (browsing)ou pela especificao de propriedades do subconjunto alvo (consulta). Ambas as
possibilidades so formas de filtragem.
A seleo realizada diretamente sobre uma representao visual, com o auxlio deum dispositivo de apontamento. Sua nfase na filtragem rpida, destacando umsubconjunto dos dados. No entanto, o uso desta tcnica muito difcil para a filtragemde grandes conjuntos de dados, quando ocorre desordem visual e sobreposio deobjetos.
As tcnicas de consulta dinmica permitem ao usurio manipular widgetsgrficos(sliders, botes, etc.) para controlar a quantidade de dados visualizados (AHLBERG;WILLIAMSON; SHNEIDERMAN, 1992). Cada widgetcorresponde a um atributo doconjunto de dados. Esta tcnica funciona melhor para dados quantitativos, mas podetambm ser usada na manipulao de dados nominais (GOLDSTEIN; ROTH, 1994).
Neste ltimo caso, o usurio deve selecionar elementos a partir de uma lista de valores.A figura 2.13 mostra uma interface de consultas dinmicas, usada para selecionardinamicamente itens de dados, com base nos seus valores para os atributos Latitude,
Longitudee Interval(intervalo de anos). O mapa maior mostra todos os itens de dados
da regio de interesse (delimitada pelos valores de Latitude e Longitude) e o mapamenor (acima direita) mostra apenas os itens dentro do intervalo de 30 a 50 anos.
Figura 2.13: Usando consultas dinmicas para verificar a concentrao espacial de itensde dados em uma regio de interesse (SHIMABUKURO, 2004)
-
7/25/2019 000624194
29/106
29
As vantagens da consulta dinmica so que widgets grficos so fceis de manipulare os efeitos da interao so vistos imediatamente na visualizao. Ao utilizar sliders,
por exemplo, o usurio pode acompanhar a mudana progressiva na quantidade dedados visualizados, medida que a barra do slider vai sendo movida. Alm disso,
consultas dinmicas permitem que o usurio possa descobrir rapidamente quaissegmentos do espao de pesquisa multidimensional esto muito ou pouco populados,onde h agrupamentos, lacunas ou outliers, e quais tendncias existem em dadosnominais (SHNEIDERMAN, 1994). Por outro lado, a principal desvantagem dessatcnica interativa a dificuldade de representar consultas mais elaboradas, como porexemplo, disjunes. Um exemplo de disjuno seria a combinao de dois intervalosdistintos de valores em um nico slider.
Como as tcnicas de filtragem mencionadas acima (seleo e consultas dinmicas)apresentam limitaes claras, vrias outras tcnicas tm sido desenvolvidas paramelhorar a filtragem interativa na explorao de dados. Um exemplo de ferramenta
interativa que pode ser usada para filtragem magic lenses (BIER et al., 1993)(FISHKIN; STONE, 1995). A idia bsica desta ltima usar uma ferramenta comouma lente, para filtrar dados diretamente na visualizao. Os dados debaixo da lente so
processados por um filtro e exibidos diferentemente do restante dos dados (vrias lentescom diferentes filtros podem ser usadas). A tcnica mostra uma visualizao modificadada regio selecionada, enquanto o resto da visualizao permanece igual. Como alente pode ser movimentada por toda a rea de uma visualizao (utilizando o mouse),as magic lensesso tambm chamadas de filtros mveis. A figura 2.14 mostra o uso dedois filtros de magic lenses, um deles mostra uma viso aramada de blocos 3D e o outrouma viso aumentada 2D.
As principais vantagens do uso dessa tcnica so a possiblidade de visualizar
detalhes e contexto simultaneamente e modificar a apresentao de objetos para revelarinformaes escondidas, aumentar os dados de interesse ou eliminar informaesdesnecessrias do foco (BIER et al., 1993).
Figura 2.14:Magic lenses: Uma lente de viso aramada 3D e uma lente de aumento 2D(BIER et al., 1993).
2.2.4Zoom
Zoom uma tcnica interativa muito conhecida e amplamente utilizada por diversasaplicaes. Ao representar graficamente conjuntos de dados com um grande nmero de
itens de dados, importante que estes ltimos sejam exibidos de forma comprimida,com o objetivo de fornecer uma viso de overviewdo conjunto inteiro. Mas, ao mesmo
-
7/25/2019 000624194
30/106
30
tempo, interessante fornecer tambm uma visualizao diferenciada dos dados, emdiferentes resolues.
A tcnica de zoom no significa apenas mostrar objetos de dados maiores, massignifica tambm que a representao dos dados muda automaticamente para apresentarmais detalhes, em nveis de zoom mais altos (KEIM, 2002). Os objetos podem, porexemplo, ser representados em um nico pixel, em nveis de zoom baixos; como cones,em um nvel de zoom intermedirio; e como objetos nomeados, em resolues altas.Uma viso overview permite ao usurio detectar modelos, correlaes e outliers noconjunto de dados, j uma viso com nvel de zoom mais alto permite melhorexplorao de uma rea de interesse, pois os itens de dados so exibidos com maiordetalhe.
2.2.5Detalhes por Demanda
Essa tcnica representa a possibilidade de obter, interativamente, mais detalhessobre os dados visualizados. Estes detalhes podem ser, por exemplo, valores de atributode um item de dado ou cone (ou glifo) ou informaes adicionais destes.
Detalhes por demanda uma tcnica oferecida como alternativa mais rpida aconsultas dinmicas. Em vez de compor consultas e interpretar seus resultados, ousurio pode, em qualquer momento que sentir necessidade, solicitar rapidamente aexibio de detalhes acerca de um item de dado. Esta solicitao, geralmente, realizada por meio da seleo direta do item na visualizao, e os dados de detalhesolicitados, usualmente, so exibidos em um frame pop-up (como na figura 2.15, quemostra informaes adicionais sobre um filme selecionado) ou no painel de controle davisualizao.
Figura 2.15: Usando a tcnica detalhes por demanda para obter informaes adicionaissobre um item de dado (extrado de AHLBERG; SHNEIDERMAN, 1994).
-
7/25/2019 000624194
31/106
3 VISUALIZAES COORDENADAS: CONCEITOS EREVISO BIBLIOGRFICA
Conectar e relacionar informaes em uma visualizao com informaes em outraauxilia o usurio no processo de explorao de um conjunto de dados e pode fornecercompreenses adicionais acerca do mesmo (ROBERTS, 2004). North e Shneiderman(1997), em seus experimentos com usurios, descobriram que a coordenao demltiplas visualizaes oferece como vantagens a melhora na performance do usurio, adescoberta de relacionamentos inesperados e a unificao do desktop.
Muitas formas diferentes de interaes podem ser coordenadas, como operaes demanipulao, consultas, selees e mapeamentos visuais. Alm disso, uma ao emdeterminada visualizao pode ser conectada mesma ao em outra visualizao ou auma ao diferente (a possibilidade de cada combinao deve ser verificada, pois nemtodas so possveis). Ainda, tambm h formas diferentes para especificar umrelacionamento de coordenao, que pode ser unidirecional ou bidirecional.Considerando um par de visualizaes interligadas, apenas uma delas pode afetar a
outra, com uma ligao unidirecional (nico sentido). J se a ligao estabelecida forbidirecional (duplo sentido), ambas as visualizaes so mutuamente afetadas.
Duas visualizaes interligadas, geralmente, representam dados de um mesmoconjunto, cada uma utilizando uma tcnica de representao visual diferente. Outra
possibilidade, no entanto, permitir que visualizaes interligadas representemconjuntos de dados diferentes. Neste caso, os conjuntos de dados considerados devem
possuir uma relao entre si, de forma que seja possvel para uma aplicao estabelerum mapeamento de informaes em uma visualizao para informaes em outra.
A seo abaixo apresenta as principais formas de coordenaes utilizadas porsistemas de mltiplas visualizaes coordenadas e as vantagens que o uso das mesmas
oferece, e a seo seguinte a esta descreve alguns dos principais sistemas devisualizaes coordenadas relacionados a esse trabalho.
3.1 Tipos de Coordenaes
North e Shneiderman (1997) determinaram que as aes realizadas por usurios noprocesso de explorao de dados so limitadas seleo de itens e navegao emjanelas (zoom, scroll, pan, rotao, etc.). Com base nisto, eles desenvolveram umataxonomia de coordenaes que abrange trs possibilidades de combinao destas aes(uma ao em uma visualizao ligada outra ao numa segunda visualizao):
seleoseleo, navegaonavegao e seleonavegao. O smbolo indica bidirecionalidade, o que significa que estas ligaes so vlidas nos dois
-
7/25/2019 000624194
32/106
32
sentidos. Os mesmos autores tambm determinaram que as trs possibilidades decoordenao podem ser aplicadas para visualizaes que representam o mesmo conjuntode dados, bem como para visualizaes que representam conjuntos relacionados.
No entanto, Pattison e Phillips (2001) discordaram das determinaes acima,indicando outras formas de coordenao alm da seleo e navegao, como porexemplo, a ordenao de itens e agrupamentos. Da mesma forma, Boukhelifa et al.(2003) acredita em um uso mais amplo de coordenaes, exemplificado por um modeloem camadas, onde o usurio pode ligar qualquer aspecto do dataflow e processo deexplorao.
Muitas so as coordenaes citadas na literatura (muitas vezes a mesma tcnica tratada por diferentes nomenclaturas), mas no h uma nica categorizao amplamenteaceita que organize as mesmas. Por esta razo, a seguir sero descritas algumascoordenaes, que foram identificadas como as mais utilizadas em sistemas de mltiplasvisualizaes coordenadas para explorao de dados. As sete primeiras coordenaes
descritas (brushing-and-linking, reordenao de dimenses sincronizada, filtragemsincronizada, mapeamento de dados para propriedades visuais, scrollingsincronizado,zoom sincronizado e rotao sincronizada) conectam a mesma ao em todas asvisualizaes, ao contrrio das duas ltimas coordenaes (overview e detalhe e drilldown), que conectam aes diferentes em cada visualizao. Entre todas as tcnicasdescritas abaixo, apenas drill down no costuma ser implementada de forma
bidirecional.
3.1.1Brushing-and-Linking
Brushing um processo no qual um usurio pode destacar, selecionar ou apagar um
subconjunto de elementos representados graficamente, apontando-os com o mouse(MARTIN; WARD, 1995). Quando mltiplas visualizaes dos dados esto sendoexibidas simultaneamente, o brushing associado com outro processo, conhecido comolinking. Neste caso, elementos selecionados em uma visualizao so automaticamentedestacados em todas as demais, tornando possvel a deteco de dependncias ecorrelaes. Por exemplo, na figura 3.1, a seleo dos estados com mais alto nvel deeducao nos EUA, na visualizao scatter plot, revela que estes estados estolocalizados na regio nordeste do pas. Atravs da coordenao brushing-and-linking,os itens selecionados na scatter plot (em amarelo) so automaticamente selecionadostambm na representao de mapa.
Brushing-and-linking o tipo de coordenao mais utilizada pelos sistemas devisualizaes coordenadas e empregada para a anlise de dados h muitos anos.Recentemente, esta tcnica tem sido usada tambm para ajudar usurios a obtereminformaes adicionais sobre pontos de dados selecionados. Alguns sistemas queimplementam esse tipo de coordenao so Spotfire (AHLBERG; WISTRAND, 1995),Visage (ROTH et al., 1996) e Snap-Together (NORTH, 2000), sistema no qual foigerado o cenrio da figura 3.1.
A coordenao brushing-and-linking utilizada com maior freqncia paravisualizar equivalncias entre diferentes representaes do mesmo conjunto de dados,mas a mesma tambm utilizada, por alguns sistemas, para visualizar relaesarbitrrias entre diferentes conjuntos de dados. Por exemplo, registros de dadosrelacionados, mas em diferentes tabelas, podem ser destacados consultando uma base dedados relacional durante o processo de brushing-and-linking.
-
7/25/2019 000624194
33/106
33
Figura 3.1: Visualizaes coordenadas pela tcnica brushing-and-linking
(NORTH, 2000)
3.1.2Reordenao de Dimenses Sincronizada
Esse tipo de coordenao permite que um usurio possa mudar a disposio em queatributos de dados (dimenses) aparecem em diferentes visualizaesmultidimensionais, simultaneamente. Na maioria das tcnicas de visualizaomultidimensionais, os atributos do conjunto de dados so posicionados na tela em umarranjo uni ou bi-dimensional (YANG et al., 2003). Devido a isto, deve ser escolhidaalguma ordem para as dimenses. Esta ordem geralmente interfere na expressividade davisualizao, pois diferentes arranjos de dimenses podem revelar aspectos diferentes
dos dados e afetar a clareza e estrutura da representao visual (PENG; WARD;RUNDENSTEINER, 2004). Assim, caractersticas bem diferentes podem ser percebidasdo conjunto de dados, dependendo do arranjo das dimenses na visualizao.
Apenas alguns sistemas de visualizaes multidimensionais permitem a reordenaode dimenses e esta realizada manualmente pelo usurio. XmdvTool (WARD, 1994) um exemplo de sistema que permite coordenar a reordenao de dimenses. Quando ousurio solicita manualmente uma alterao na ordem das mesmas, essa alterao realizada em todas as visualizaes multidimensionais disponveis, simultaneamente.
3.1.3Filtragem Sincronizada
O processo de filtragem consiste em particionar um conjunto de dados,dinamicamente, com o objetivo de focar em um determinado subconjunto de interesse(KEIM, 2002). No contexto de visualizaes coordenadas, a filtragem , geralmente,utilizada como consultas dinmicas (AHLBERG; SHNEIDERMAN, 1994). O usuriohabilita a eliminao de pontos de dados das visualizaes, especificando intervalos devalores para atributos em consultas. Cada widget grfico (geralmente, um slider) deconsulta dinmica representa um atributo de dados. Conforme o usurio muda ointervalo de um filtro de consulta dinmica, todas as visualizaes coordenadas so
progressivamente alteradas, para exibir o novo montante de pontos de dados.
CityOScope (BRODBECK; GIRARDIN, 2003) um exemplo de sistema que
coordena o processo de filtragem da forma descrita acima. Outra forma de coordenarfiltragem implementada por sistemas de filter-flow, como Linkwinds (JACOBSON;BERKIN; ORTON, 1994). Neste tipo de sistema, o usurio conecta controles de filtro
-
7/25/2019 000624194
34/106
34
de consulta dinmica e visualizaes em uma rede pipeline. Selecionando intervalospara dimenses em um controle ou filtros da visualizao, os dados mostrados seguemnopipeline. Em todos os sistemas pesquisados na literatura, a filtragem sincronizada utilizada apenas em visualizaes que representam o mesmo conjunto de dados.
A filtragem uma tcnica muito til para analisar a distribuio dos dados(agrupamentos e lacunas) e tendncias, assim como reduzir a desordem visual dasrepresentaes. Quando empregada de forma coordenada, esta tcnica evita que ousurio tenha que, repetidas vezes, focar uma visualizao em um determinadosubconjunto de dados, para visualiz-lo em todas as representaes visuais.
3.1.4Mapeamento de Dados para Propriedades Visuais
Esse tipo de coordenao mapeia valores de atributos (dimenses) para parmetrosvisuais de objetos de dados de visualizaes, como cor, tamanho, transparncia,orientao, entre outros (ver tabela 2.2 para exemplos de mapeamentos tpicos). Ousurio deve indicar qual atributo de dados deve ser mapeado para uma determinada
propriedade visual, selecionando o nome do atributo no componente de interface grficaque representa a propriedade em questo. Logo aps a seleo, todas as visualizaescoordenadas exibiro seus objetos de dados com os valores do atributo selecionado pelousurio, mapeados para a propriedade visual por ele tambm escolhida. O mesmo tipode mapeamento visual aplicado em todas as visualizaes.
A coordenao de mapeamentos de dados para propriedades visuais auxilia ousurio a identificar o posicionamento de determinados objetos de dados nas diferentesvisualizaes e perceber tendncias gerais do conjunto de dados. O sistema XmdvTool(WARD, 1994) permite a coordenao de mapeamentos de dados para diferentes mapas
de cores. A figura 3.2 mostra as tcnicas Coordenadas Paralelas e Glifos em Estrelautilizando o mesmo mapa de cores, que representa os valores do atributo Origin. Pretorepresenta o valor mais baixo do atributo e verde claro o valor mais alto.
3.1.5ScrollingSincronizado
Esse tipo de coordenao conecta as scroll barsde duas ou mais janelas, mantendo-as sincronizadas. Uma scroll bar um mecanismo tpico de navegao em janela(panning), sendo assim, as tcnicas scrolling e panning sincronizado so anlogas.Quando o usurio movimenta a scroll bar de uma janela, as demais so deslocadasautomaticamente para a posio correspondente primeira. Esta navegao
sincronizada evita a perda do relacionamento entre as visualizaes e a repetio tediosada ao de navegao em cada uma das janelas, pelo usurio (NORTH;SHNEIDERMAN, 1997). Com isto, as tarefas do usurio, como fazer comparaes eexaminar diferentes pontos de vista, so agilizadas.
-
7/25/2019 000624194
35/106
35
Figura 3.2: Visualizaes coordenadas com valores do atributo Originmapeadospara cor
O scrolling sincronizado pode ser usado para navegar atravs do mesmo conjunto dedados em todas as janelas ou atravs de mltiplos conjuntos correspondentes (NORTH;SHNEIDERMAN, 1997). No primeiro caso, por exemplo, quando editando umdocumento HTML (representao de texto) em uma janela, til simultaneamentevisualizar a sada desse documento (representao do layout) como uma pgina web, emoutra janela. No caso de conjuntos de dados diferentes, o Microsoft Word fornece
scrolling sincronizado entre as janelas de documento, notas de rodap e anotaes. Odeslocamento atravs do documento provoca o deslocamento das listas de notas derodap e anotaes, para mostrar os itens que so referenciados dentro da atual partevisvel do documento.
Os exemplos de scrolling sincronizado citados acima so uni-dimensionais. Noentanto, este tipo de coordenao pode tambm ser aplicado para representaes visuaisde dimensionalidade maior. O sistema DEVise (LIVNY et al., 1997), por exemplo,implementapanning sincronizado em 2D, permitindo que o usurio conecte o eixo x ouy de mltiplos grficos, para que estes mostrem sempre os mesmos domnios eintervalos.
3.1.6Zoom Sincronizado
O zoom sincronizado permite que duas ou mais visualizaes apresentem o mesmonvel de detalhamento. Se o usurio executa uma operao de zoom em umavisualizao, as visualizaes coordenadas a esta sero automaticamente atualizadas
para refletir a mesma operao.
O sistema DEVise (LIVNY et al., 1997), por exemplo, permite ao usuriosincronizadamente realizar zoom em mltiplos grficos 2D, que possuam eixos x ou yem comum. Da mesma forma, Chi et al. (1997) arranjou vrias visualizaes 3D
pequenas em um grid e sincronizou suas operaes de zoom (ver figura 3.3). O zoom
sincronizado pode ser aplicado com visualizaes que representam o mesmo conjuntode dados ou conjuntos diferentes (como DEVise).
-
7/25/2019 000624194
36/106
36
Figura 3.3: Mltiplas visualizaes 3D em grid (CHI et al., 1997)
3.1.7Rotao Sincronizada
Esse tipo de coordenao consiste apenas em sincronizar rotaes executadas noespao visual de diferentes visualizaes, de forma que a orientao rotacional seja a
mesma em todas elas. Esta tcnica utilizada apenas em representaes 3D.O sistema de visualizaes em grid proposto por Chi et al. (1997) utiliza rotaes
sincronizadas para permitir a visualizao de pontos oclusos dos objetos em cada clulado grid. Na figura 3.3, possvel observar que todas as visualizaes 3D do gridrepresentado possuem a mesma orientao rotacional.
3.1.8Overviewe Detalhe
Ao contrrio de todas as coordenaes descritas acima, o overview e detalhe nocorresponde ao mesmo tipo de interao nas visualizaes interligadas. Este tipo decoordenao envolve, geralmente, apenas duas visualizaes e estas so conectadas por
interaes diferentes.A idia fornecer uma visualizao de overviewpara orientao e uma visualizao
de detalhe para tarefas adicionais. Selecionando um item na viso overviewfaz com quea viso de detalhe seja automaticamente atualizada para exibir este item (e vice-versa).
Note que a ao de seleo na vista overview corresponde a uma ao de navegao(panning ou zoom) na vista de detalhe, pois o conjunto inteiro de dados no pode serexibido simultaneamente nesta ltima vista. O overview fornece uma viso do conjuntode dados inteiro e, por isto, os itens so exibidos de forma bastante reduzida. O detalhe,ao contrrio, fornece informaes detalhadas de uma pequena parte do conjunto,exibindo-a em propores bem maiores que o overview.
A figura 3.4 mostra a coordenao overview e detalhe na representao de rvores.A visualizao da esquerda mostra a representao reduzida da rvore (overview) e a
-
7/25/2019 000624194
37/106
37
visualizao da direita mostra em detalhe apenas a sub-rvore selecionada no overview.Nessa figura, a visualizao de detalhe apenas uma verso ampliada do overview.No entanto, a aparncia, ou at mesmo o contedo, pode mudar entre as visualizaesde overview e de detalhe (CARD, 1999). Por exemplo, no sistema SeeSoft (BALL;
EICK, 1996), o texto do cdigo de um programa mostrado com a largura de um nicopixel na viso de overview, j na viso de detalhe, ele mostrado com letras. A grandemaioria dos sistemas que implementam a coordenao overview e detalhe representam omesmo conjunto de dados em ambas as visualizaes.
Ter uma visualizao de overview dos dados apresenta muitas vantagens. Ooverview reduz o tempo de busca, permite a deteco de modelos gerais e ajuda ousurio a escolher o prximo movimento (NORTH; SHNEIDERMAN, 1997). Suacoordenao com a visualizao de detalhe permite ainda um acesso muito mais rpidoa informaes detalhadas.
Figura 3.4: Coordenao de overview e detalhe no sistema PDQ Tree-browser(KUMAR; PLAISANT; SHNEIDERMAN, 1997)
3.1.9Drill Down
A coordenao drill downpermite ao usurio navegar atravs de sucessivas camadasde uma base de dados hierrquica, com visualizaes separadas para cada camada.Selecionando um item pai em uma visualizao, os itens filhos deste so carregados emuma outra visualizao, como ocorre no Windows Explorer. Este tipo de coordenaono costuma ser implementado de forma bidirecional, ou seja, a coordenao ocorresomente em um sentido (da visualizao que exibe itens pais para aquela que exibe itensfilhos).
Esta coordenao torna possvel a explorao de dados hierrquicos com um grande
nmero de camadas e ainda de conjuntos de dados com um grande nmero de itens, quesuportam agregaes. Agregaes so mostradas em uma visualizao e o contedo de
-
7/25/2019 000624194
38/106
38
uma agregao selecionada exibido em outra visualizao (FREDRIKSON et al.,1999). Por exemplo, a figura 3.5 mostra agregaes de itens pelo nmero de automveisenvolvidos em incidentes, no grfico superior da figura, e os incidentes com 2 carrosenvolvidos (agregao selecionada) so exibidos no grfico inferior da figura. Uma
forma diferente de implementao da tcnica drill down utilizada no sistema Visage(ROTH et al., 1996). Neste ltimo, o usurio precisa arrastar uma agregao de itens deuma visualizao e solt-la em outra para ver seu contedo detalhado.
Figura 3.5: Usando a coordenao drill downpara visualizar o contedo de agregaesno Snap-Together (FREDRIKSON et al., 1999)
3.2 Sistemas de Mltiplas Visualizaes Coordenadas
Sistemas de visualizaes coordenadas podem ser classificados por seus nveis deflexibilidade em manipulaes de dados, visualizaes e coordenaes (NORTH;SHNEIDERMAN, 2000). Sistemas flexveis em dados (nvel 1) permitem que osusurios carreguem conjuntos de dados diferentes nas visualizaes. Sistemas flexveisem visualizaes (nvel 2) permitem a escolha de diferentes conjuntos de visualizaes,conforme mais apropriado para os dados. J os sistemas flexveis em coordenaes
permitem que usurios escolham diferentes tipos de coordenaes entre pares devisualizaes.
A maioria dos sistemas de visualizaes coordenadas de nvel 1, ou seja, flexveispara dados, mas no para visualizaes ou coordenaes. Usurios podem carregar seusprprios dados, mas estes so sempre apresentados com a mesma interface.
Sistemas de nvel 2 incluem flexibilidade na escolha de visualizaes. Ferramentascomo EDV (EICK; WILLS, 1995), Spotfire (AHLBERG; WISTRAND, 1995) e Visage(ROTH et al., 1996) podem representar conjuntos de dados atravs de muitas tcnicas
-
7/25/2019 000624194
39/106
39
de visualizao diferentes, escolhidas pelo usurio. Todas as visualizaes socoordenadas atravs da tcnica brushing-and-linking, o que permite o estabelecimentode relaes entre itens de dados em diferentes visualizaes.
Finalmente, sistemas de nvel 3 incluem flexibilidade nas coordenaes entrevisualizaes. Alguns deles fornecem apenas um tipo de coordenao, mas deixam ousurio escolher quais visualizaes coordenar. Como em sistemas desse nvel ascoordenaes so dinmicas, importante que os mesmos disponham de algum mtodo
para representar visualmente as coordenaes ativas entre pares de visualizaes. Oobjetivo disto evitar a desorientao do usurio, que pode esquecer facilmente quaisconexes estabeleceu. Ferramentas como Snap-Together (NORTH, 2000), GeoVISTAStudio (GAHEGAN et al., 2000), DEVise (LIVNY et al., 1997) e Improvise(WEAVER, 2004) apresentam flexibilidade nas coordenaes.
Os sistemas DEVise e Improvise podem ser utilizados para a representao de dadosmultidimensionais, porm ambos no disponibilizam visualizaes que mostram todas
as dimenses destes dados em uma nica representao visual. DEVise tem como nicavisualizao um plot 2D e Improvise oferece tambm plots 3D e algumas tabelas.Assim, a forma utilizada para representar simultaneamente n-dimenses de dados nestasferramentas a criao de mltiplos plots2D. Embora este tipo de representao nofaa parte do foco desse trabalho, importante mencionar que o mesmo permite autilizao de coordenaes interessantes (como panning e zoom sincronizado de plotscom eixos comuns), que so disponibilizadas por DEVise e Improvise. Um pontonegativo destas ferramentas que elas no oferecem um recurso visual de rpido acesso
para o usurio verificar as coordenaes ativas.
A aplicao apresentada nesse trabalho classificada como um sistema flexvel em
dados, visualizaes e coordenaes, pois suporta a escolha dos dados a seremrepresentados, das visualizaes que formaro um cenrio, bem como tambm dascoordenaes que conectaro estas ltimas.
A seguir, sero abordadas com maior detalhamento as ferramentas de visualizaescoordenadas que possuem uma relao mais forte com o presente trabalho. So elas:XmdvTool, Snap-Together e GeoVista Studio.
Snap-Together e GeoVista Studio so flexveis em dados, visualizaes ecoordenaes, enquanto XmdvTool flexvel somente em dados e visualizaes. Estaltima ser abordada aqui por ser especfica para a visualizao de dadosmultidimensionais e apresentar tcnicas de coordenao relevantes para o trabalho.
3.2.1XmdvTool
A aplicao XmdvTool (WARD, 1994) (RUNDENSTEINER et al., 2002) tem comofoco a visualizao exploratria de conjuntos de dados multidimensionais. Pararepresentar estes dados, ela disponibiliza quatro tcnicas tradicionais: CoordenadasParalelas, Matriz de Scatter Plots, Glifos em Estrela e Pilha Dimensional. No entanto,como estas tcnicas geram grande confuso visual e sobreposio de objetos quandorepresentando conjuntos com grande nmero de itens de dados, XmdvTool forneceainda uma verso hierrquica para cada uma das tcnicas mencionadas. O usurio pode,ento, escolher qual verso de uma tcnica utilizar. A nica diferena entre uma tcnica
hierrquica e sua verso tradicional est no fato de que a primeira possibilita ao usuriofiltrar hierarquicamente objetos de dados separados em clusters, por meio da interao
-
7/25/2019 000624194
40/106
40
com uma rvore de mnimos e mximos, onde intervalos de consultas so especificados(RUNDENSTEINER et al., 2002).
As visualizaes geradas por essa ferramenta so todas interligadas por um conjuntofixo e pr-determinado de coordenaes e apenas duas visualizaes podem ser exibidassimultaneamente (uma visualizao principal e outra auxiliar). Alm disso, todas asvisualizaes representam o mesmo conjunto de dados. As caractersticas maisinteressantes dessa ferramenta, no entanto, so suas possibilidades de coordenao, queabrangem brushing-and-linkingn-dimensional, reordenao e filtragem sincronizada dedimenses, filtragem hierrquica de objetos de dados e mapeamento de dados para cor(ver figura 3.2 para um exemplo).
Brushing-and-linking n-dimensional permite ao usurio selecionar, atravs demanipulao direta, regies diferentes para cada dimenso do conjunto de dados, asquais sero consideradas tambm em outras visualizaes devido coordenao. Logo,apenas os objetos de dados contidos inteiramente dentro da regio de brushing n-
dimensional sero destacados em todas as visualizaes. Na figura 3.6, as imagens (c) e(d) mostram em roxo as regies de brushing n-dimensional definidas por um usuriointeragindo diretamente nestas representaes e as imagens (a) e (b) mostramdestacados (em vermelho) os dados contidos inteiramente dentro da regio de brushingdefinida. As tcnicas de visualizao da figura esto interligadas, devido a isto asregies de brushing de ambas so anlogas.
A reordenao e filtragem sincronizada de dimenses so realizadas pelo usuriomodificando componentes grficos em uma janela independente das visualizaes. Afiltragem faz com que um eixo vertical seja retirado da visualizao CoordenadasParalelas, uma aresta (ou raio) da visualizao Glifos em Estrela e uma linha e uma
coluna da Matriz de Scatter Plots. A reordenao sincronizada, diferentemente, apenasmuda a posio destes elementos nas visualizaes citadas, conforme determinado pelousurio.
Embora o sistema XmdvTool apresente tcnicas de coordenao interessantes evariadas para visualizaes multidimensionais, ele no flexvel em coordenaes e no
permite a criao de mltiplas visualizaes (apenas duas), restringindo a liberdade deusurios no processo de explorao de dados. Alm disso, ele emprega apenas uma
possibilidade de mapeamento de dados para propriedades visuais, quando muitas outraspoderiam ser utilizadas.
3.2.2Snap-TogetherSnap-Together (NORTH, 2000) uma ferramenta de propsito geral, que suporta a
visualizao exploratria de conjuntos de dados de diversos tipos. Usurios podem criarcenrios com mltiplas visualizaes e coorden-las da forma que desejarem. Umacoordenao pode corresponder a aes diferentes em cada visualizao (por exemplo,uma seleo de itens correspondendo a uma operao de zoom), mas o conjunto deaes suportadas por cada representao visual limitado seleo de itens enavegao em janela (scroll, pan, zoom, load, etc.). Alm disso, muitas combinaes deaes no so possveis. As principais coordenaes suportadas por Snap-Together so:brushing-and-linking, overview e detalhe, drill downe scrollingsincronizado (NORTH,SHNEIDERMAN, 2000).
-
7/25/2019 000624194
41/106
41
Figura 3.6: Brushing-and-linking n-dimensional no sistema XmdvTool. Os dadosselecionados so exibidos nas imagens (a) e (b) em vermelho, e a regio de brushingque indica os dados de interesse mostrada nas imagens (c) e (d), no espao de um glifoem estrela e no espao de coordenadas paralelas, respectivamente.
Essa ferramenta permite tambm que cada visualizao de um cenrio representegraficamente dados de tabelas diferentes, mas relacionadas. Para isto, Snap-Togetherutiliza um modelo conceitual baseado no modelo relacional. Usurios podem,interativamente, estabelecer relacionamentos entre tabelas de dados relacionadas,conectando um atributo de uma tabela com um atributo de outra. Este relacionamento utilizado pela aplicao para mapear dados de uma visualizao para a outra.
Apesar de Snap-Together prover um conjunto amplo de tcnicas de visualizao,apenas Coordenadas Paralelas e a visualizao Tabela representam tcnicasmultidimensionais. Para estas tcnicas, as aes possveis so ainda mais limitadas:selection, highlight e load, para Coordenadas Paralelas, e selection, load e scrool, para a
visualizao Tabela. A ao highlight(destaque) provoca o mesmo efeito visual que aao selection, mas difere desta ltima porque executada quando o usuriosimplesmente passa o mouse sobre um objeto de dado, destacando-o. A ao load, que
permite apenas o recebimento de dados, utilizada para isolar itens de interesse,exibindo apenas estes ltimos na visualizao. Finalmente, a ao scroll faz com que a
barra de scrollda visualizao Tabela seja deslocada para exibir um determinado itemde dado. Esta ltima ao tambm apenas recebe dados. A figura 3.7 mostra um cenrioconstrudo em Snap-Together, para a explorao de duas tabelas relacionadas de dadosmultidimensionais. A primeira tabela (com dados sobre o censo em estados dos EUA)foi relacionada segunda (com dados sobre o censo em cidades dos EUA) atravs doatributo nome do estado, contido em ambas. Este relacionamento que determina omapeamento de informaes da visualizao Coordenadas Paralelas, que representa a
primeira tabela, para informaes nas visualizaes Scatter Plot e Tabela, que
-
7/25/2019 000624194
42/106
42
representam a segunda tabela de dados. Isto pode ser comprovado observando a figura3.7: a ao selectionda visualizao Coordenadas Paralelas est coordenada com a aoloadda visualizao Tabela, ento a seleo de um item na primeira representao, nocaso o estado California, causa a exibio de informaes acerca de todas as cidades
deste estado, apenas, na segunda visualizao.
Figura 3.7: Cenrio construdo em Snap-Together para a explorao de duas tabelasrelacionadas de dados multidimensionais