000624194

download 000624194

of 106

Transcript of 000624194

  • 7/25/2019 000624194

    1/106

    UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

    INSTITUTO DE INFORMTICA

    PROGRAMA DE PS-GRADUAO EM COMPUTAO

    RAQUEL MAINARDI PILLAT

    Coordenao Dinmica de Visualizaes deDados Multidimensionais

    Dissertao apresentada como requisito parcialpara a obteno do grau de Mestre em Cinciada Computao

    Prof. Dr. Carla Maria Dal Sasso Freitas

    Orientadora

    Porto Alegre, julho de 2006.

  • 7/25/2019 000624194

    2/106

    CIP CATALOGAO NA PUBLICAO

    UNIVERSIDADE FEDERAL DO RIO GRANDE DO SULReitor: Prof. Jos Carlos Ferraz HennemannVice-Reitor: Prof. Pedro Cezar Dutra FonsecaPr-Reitora de Ps-Graduao: Profa. Valquria Linck BassaniDiretor do Instituto de Informtica: Prof. Philippe Olivier Alexandre Navaux

    Coordenador do PPGC: Prof. Flvio Rech WagnerBibliotecria-Chefe do Instituto de Informtica: Beatriz Regina Bastos Haro

    Pillat, Raquel Mainardi

    Coordenao Dinmica de Visualizaes de DadosMultidimensionais / Raquel Mainardi Pillat Porto Alegre:Programa de Ps-Graduao em Computao, 2006.

    106 f.:il.

    Dissertao (mestrado) Universidade Federal do Rio Grandedo Sul. Programa de Ps-Graduao em Computao. PortoAlegre, BR RS, 2006. Orientadora: Carla Maria Dal SassoFreitas.

    1. Visualizao de informaes. 2. Visualizaes coordenadas.3. Interface de usurio. I. Freitas, Carla Maria Dal Sasso. II. Ttulo.

  • 7/25/2019 000624194

    3/106

    AGRADECIMENTOS

    Agradeo minha orientadora, Carla Dal Sasso Freitas, pelo auxlio e estmulorecebido durante a realizao desse trabalho e a todos os integrantes do grupo decomputao grfica da UFRGS (um GRUPO de verdade, do qual eu tenho muitoorgulho em fazer parte). No posso deixar de agradecer tambm a pacincia e boa

    vontade daqueles que participaram uma ou vrias vezes dos meus experimentos deavaliao.

    Por fim, agradecimentos muito especiais minha famlia: minha me Lcia, meu paiLuiz Clvis, minha irm Micheli e meu namorado Fbio.

  • 7/25/2019 000624194

    4/106

    SUMRIO

    LISTA DE FIGURAS.......................................................................................... 7

    LISTA DE TABELAS ....................................................................................... 10

    RESUMO.......................................................................................................... 11

    ABSTRACT...................................................................................................... 12

    1 INTRODUO ........................................................................................... 13

    1.1 Motivao ............................................................................................................. 141.2 Objetivos e Contribuies................................................................................... 151.3 Organizao do Trabalho................................................................................... 15

    2 INTERAO COM VISUALIZAES MULTIDIMENSIONAIS ................. 16

    2.1 Visualizaes Multidimensionais ....................................................................... 162.1.1 Tcnicas de projeo geomtrica........................................................................ 172.1.2 Tcnicas Iconogrficas ....................................................................................... 232.1.3 Tcnicas Orientadas a Pixel................................................................................ 242.2 Tcnicas de Interao.......................................................................................... 262.2.1 Mapeamento de Dados para Propriedades Visuais............................................. 262.2.2 Projees............................................................................................................. 272.2.3 Filtragem............................................................................................................. 282.2.4 Zoom................................................................................................................... 292.2.5 Detalhes por Demanda........................................................................................ 30

    3 VISUALIZAES COORDENADAS: CONCEITOS E REVISO

    BIBLIOGRFICA............................................................................................. 313.1 Tipos de Coordenaes........................................................................................ 313.1.1 Brushing-and-Linking......................................................................................... 323.1.2 Reordenao de Dimenses Sincronizada.......................................................... 333.1.3 Filtragem Sincronizada....................................................................................... 333.1.4 Mapeamento de Dados para Propriedades Visuais............................................. 343.1.5 ScrollingSincronizado ....................................................................................... 343.1.6 Zoom Sincronizado ............................................................................................ 353.1.7 Rotao Sincronizada ......................................................................................... 363.1.8 Overviewe Detalhe............................................................................................. 36

    3.1.9 Drill Down.......................................................................................................... 373.2 Sistemas de Mltiplas Visualizaes Coordenadas .......................................... 38

  • 7/25/2019 000624194

    5/106

    3.2.1 XmdvTool........................................................................................................... 393.2.2 Snap-Together .................................................................................................... 403.2.3 GeoVista Studio.................................................................................................. 43

    4 O TOOLKIT INFOVIS................................................................................. 45

    4.1 FrameworkGeral ................................................................................................. 464.1.1 Entrada e Sada ................................................................................................... 464.1.2 Tabelas e Colunas............................................................................................... 464.1.3 Visualizaes...................................................................................................... 474.1.4 Componentes ...................................................................................................... 484.2 Exibindo Visualizaes........................................................................................ 484.3 Extenso do Toolkit: Criando Novas Visualizaes ......................................... 494.4 Mecanismos de Interao.................................................................................... 524.4.1 Mecanismos Adicionados................................................................................... 55

    5 COORDENAO DINMICA DE VISUALIZAESMULTIDIMENSIONAIS .................................................................................... 57

    5.1 Coordenaes para Sistemas de Visualizao de Dados Multidimensionais . 575.1.1 Mapeamento de Dados para Propriedades Visuais............................................. 575.1.2 Reordenao de Dimenses................................................................................ 585.1.3 Filtragem............................................................................................................. 585.1.4 Brushing-and-Linking......................................................................................... 595.2 Aplicao de Visualizaes Coordenadas para Dados Multidimensionais .... 595.2.1 Visualizaes...................................................................................................... 605.2.2 Coordenaes ..................................................................................................... 685.2.3 Arquitetura.......................................................................................................... 71

    5.2.4 Grafo de Coordenao........................................................................................ 735.2.5 Especificando Coordenaes Dinamicamente.................................................... 745.2.6 Gerenciamento de Coordenaes ....................................................................... 765.2.7 Tornando uma Visualizao Coordenvel: A Interface Visualization ............... 805.3 Comentrios Finais.............................................................................................. 81

    6 AVALIAO PRELIMINAR ....................................................................... 82

    6.1 Primeira Avaliao.............................................................................................. 826.1.1 Conjunto de Dados ............................................................................................. 826.1.2 Tarefas Experimentais........................................................................................ 836.1.3 Procedimento...................................................................................................... 83

    6.1.4 Resultados........................................................................................................... 846.2 Segunda Avaliao............................................................................................... 87

    7 ESTUDO DE CASO ................................................................................... 88

    7.1 Descrio e Objetivos do Domnio: Morfometria Craniana............................ 887.2 Conjunto de Dados .............................................................................................. 897.3 Procedimento ....................................................................................................... 897.4 Resultados ............................................................................................................ 907.4.1 Identificao de Crnios com Medidas Fora do Padro..................................... 907.4.2 Identificao de Variaes nos Padres de Medidas de Diferentes Localidades917.4.3 Identificao de Variaes nas Medidas de Animais com Nmero de

    Cromossomos Diferente ..................................................................................... 927.4.4 Verificao de Variaes nas Medidas de Animais de Sexo Diferente ............. 93

  • 7/25/2019 000624194

    6/106

    7.5 Comparao: Aplicao Desenvolvida x Aplicao do Domnio .................... 957.6 Concluses............................................................................................................ 96

    8 CONCLUSES .......................................................................................... 98

    8.1 Avaliao Final .................................................................................................... 988.2 Trabalhos Futuros ............................................................................................. 101

    REFERNCIAS.............................................................................................. 102

  • 7/25/2019 000624194

    7/106

    LISTA DE FIGURAS

    Figura 2.1: Representao visual da tcnica Coordenadas Paralelas ............................. 18

    Figura 2.2: Tcnica Coordenadas Paralelas com sobreposio de linhas (15.000 itensde dados representados)............................................................................... 18

    Figura 2.3: Representao visual da tcnica Matriz de Scatter Plots............................. 19Figura 2.4: Representao visual da tcnica Radviz ...................................................... 20

    Figura 2.5: Representao visual da tcnica Coordenadas Paralelas Circulares............ 21

    Figura 2.6: Representao visual da tcnica Polyviz ..................................................... 22

    Figura 2.7: Representao visual da tcnica Survey Plots.............................................. 22

    Figura 2.8: Tcnicas iconogrficas: a) Faces de Chernoff e b) Glifos em Estrela ......... 23

    Figura 2.9: Mapeamento de Stick Figures(esquerda) e grfico iconogrfico de dadosdo censo da Inglaterra (direita).................................................................... 24

    Figura 2.10: Visualizaes orientadas a pixel de um conjunto de dados com novedimenses, utilizando duas formas de distribuio espacial: espiral(esquerda) e por eixos (direita).................................................................. 25

    Figura 2.11: Tcnicas independentes de consulta: a) curvas de Peano-Hilbert,b) curvas de Morton e c) padres recursivos............................................. 25

    Figura 2.12: Tcnica Segmentos de Crculo................................................................... 26

    Figura 2.13: Usando consultas dinmicas para verificar a concentrao espacial deitens de dados em uma regio de interesse ............................................... 28

    Figura 2.14:Magic lenses: Lente de viso aramada 3D e lente de aumento 2D............ 29

    Figura 2.15: Usando a tcnica detalhes por demanda para obter informaesadicionais sobre um item de dado. ............................................................ 30

    Figura 3.1: Visualizaes coordenadas pela tcnica brushing-and-linking ................... 33

    Figura 3.2: Visualizaes coordenadas com valores do atributo Originmapeadospara cor ........................................................................................................ 35

    Figura 3.3: Mltiplas visualizaes 3D em grid............................................................. 36

    Figura 3.4: Coordenao de overview e detalhe no sistema PDQ Tree-browser ........... 37

    Figura 3.5: Usando a coordenao drill downpara visualizar o contedo de

    agregaes no Snap-Together...................................................................... 38

  • 7/25/2019 000624194

    8/106

    Figura 3.6:Brushing-and-linking n-dimensional no sistema XmdvTool. Os dadosselecionados so exibidos nas imagens (a) e (b) em vermelho e a regiode brushing,que indica os dados de interesse, mostrada nas imagens(c) e (d) no espao de um glifo em estrela e no espao de coordenadas

    paralelas, respectivamente. .......................................................................... 41Figura 3.7: Cenrio construdo em Snap-Together para a explorao de duas tabelas

    relacionadas de dados multidimensionais.................................................... 42

    Figura 3.8: Cenrio construdo em GeoVista Studio com todas as suas tcnicas devisualizao multidimensionais ................................................................... 44

    Figura 4.1: Estrutura interna do toolkit InfoVis. Retngulos representam estruturas dedados e elipses representam funes. .......................................................... 46

    Figura 4.2: Programa para a visualizao de Coordenadas Paralelas. O cdigo doretngulo azul gera uma visualizao no-interativa, mas quando

    substitudo pelo cdigo do retngulo vermelho a visualizao recebe umpainel de controle padro............................................................................. 49

    Figura 4.3: Hierarquia das classes de visualizao do toolkit InfoVis........................... 50

    Figura 4.4: Cdigo padro executado para o desenho de itens de dados ....................... 51

    Figura 4.5: Cdigo padro executado para o desenho de um item de dado ................... 51

    Figura 4.6: As quatro abas do painel de controle: (a) Filters; (b) Visual; (c) Excentric;e (d) Fisheyes............................................................................................... 52

    Figura 4.7: Visualizaes geradas pela aplicao dos mecanismos de interao Colorby ( esquerda) e Size by( direita) sobre as tcnicas Radviz (acima) e

    Coordenadas Paralelas (abaixo)................................................................... 53

    Figura 4.8:Labelsdinmicos na tcnica Coordenadas Paralelas ................................... 54

    Figura 4.9: Lente Fisheye aplicada na tcnica Radviz ................................................... 54

    Figura 4.10: Visualizao dos valores que o 142item de dado do conjunto sobrecarros possui para cada atributo ................................................................ 55

    Figura 4.11: Componentes grficos que compem o mecanismo de interaoAttributes Manipulation ............................................................................ 56

    Figura 5.1: Tcnica Coordenadas Paralelas implementada no toolkit InfoVis .............. 61

    Figura 5.2: Criao e desenho das linhas que representam atributos na tcnicaCoordenadas Paralelas................................................................................. 61

    Figura 5.3: Criao dos objetos que representam itens de dados na tcnicaCoordenadas Paralelas................................................................................. 62

    Figura 5.4: Tcnica Radviz implementada no toolkit InfoVis ....................................... 63

    Figura 5.5: Criao e desenho das linhas que representam atributos na tcnica Radviz 64

    Figura 5.6: Criao dos objetos que representam itens de dados na tcnica Radviz...... 65

    Figura 5.7: Tcnica Matriz de Scatter Plotsimplementada no toolkit InfoVis.............. 66

    Figura 5.8: Procedimento para a criao da matriz de visualizaes Scatter Plots 2D.. 67

  • 7/25/2019 000624194

    9/106

    Figura 5.9: Procedimento utilizado para garantir que aes realizadas em umavisualizao 2D da matriz de Scatter Plotsejam executadas tambm nassuas demais visualizaes............................................................................ 68

    Figura 5.10: Cenrio de explorao construdo na aplicao prottipo ......................... 71

    Figura 5.11: Arquitetura do prottipo desenvolvido ...................................................... 72

    Figura 5.12: Estrutura do grafo de coordenao e seus relacionamentos com outrosmdulos da aplicao ................................................................................ 73

    Figura 5.13: Processo de criao e viabilizao de uma nova coordenao .................. 74

    Figura 5.14: Representao grfica de um grafo de coordenao.................................. 75

    Figura 5.15: Conectando os nodos da nova coordenao............................................... 75

    Figura 5.16: Seleo de interaes a serem coordenadas............................................... 76

    Figura 5.17: Nodos conectados pela ao de seleo..................................................... 76Figura 5.18: Removendo uma coordenao ................................................................... 76

    Figura 5.19: Processo de gerenciamento de coordenaes ............................................ 77

    Figura 5.20: Atividades realizadas pelo usurio e aplicao no processo depropagao de uma interao.................................................................... 78

    Figura 5.21: Seqncia de operaes realizadas pelos objetos envolvidos napropagao de interaes .......................................................................... 79

    Figura 5.22: Mtodos da interface Visualizationrelacionados ao processo decoordenao............................................................................................... 81

    Figura 7.1: Indicao das dezesseis medidas extradas do crnio de um tuco-tuco paraa anlise morfomtrica tradicional. (a) Vista dorsal, (b) vista ventral e (c)vista lateral................................................................................................... 89

    Figura 7.2: Identificao de um animal com medidas fora do padro (item destacado) 91

    Figura 7.3: Representao do conjunto inteiro de dados morfomtricos com locaisde coleta mapeados para cor........................................................................ 92

    Figura 7.4: Representao em Coordenadas Paralelas das amostras morfomtricascoletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha).. 93

    Figura 7.5: Representao em Matriz de Scatter Plotdas amostras morfomtricascoletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha).. 94

    Figura 7.6: Representao do conjunto inteiro de dados morfomtricos com machosmapeados para a cor rosa e fmeas mapeadas para a cor preta ................... 94

    Figura 7.7: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot(direita), utilizados na anlise do dimorfismo sexual. ................................. 96

    Figura 7.8: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot(direita), utilizados na anlise de variaes por local de coleta................... 96

  • 7/25/2019 000624194

    10/106

    LISTA DE TABELAS

    Tabela 2.1: Representao de uma tabela de dados.........................................................16

    Tabela 2.2: Propriedades visuais que podem ser usadas para mapear atributos dedados e exemplos de mapeamentos tpicos..................................................27

    Tabela 5.1: Interaes coordenadas e as propriedades que notificam sua ocorrncia.....80Tabela 8.1: Comparao das tcnicas Coordenadas Paralelas, Radviz e Matriz de

    Scatter Plots segundo critrios encontrados na literatura.............................99

  • 7/25/2019 000624194

    11/106

    RESUMO

    Tcnicas de visualizao de informaes representam graficamente dados de umdeterminado domnio de aplicao e disponibilizam mecanismos para a interao com arepresentao gerada, a fim de que o usurio consiga interpretar e compreender asinformaes apresentadas. As tcnicas de visualizao multidimensionais, em

    particular, referem-se visualizao de informaes onde cada elemento no conjunto dedados descrito, ou caracterizado, por mltiplas variveis (atributos), as quais devemser codificadas em uma nica estrutura visual.

    Embora existam diversas tcnicas de visualizao para representar dadosmultidimensionais, nenhuma delas apresenta o melhor desempenho para todos os tiposde tarefas. Uma estratgia interessante analisar vrias representaes simultaneamentemantendo uma ligao semntica entre elas, de forma que aes realizadas sobre umatcnica se reflitam automaticamente nas demais. No existe, atualmente, um sistema demltiplas visualizaes coordenadas especfico para a representao de dadosmultidimensionais, que disponha de um amplo e variado conjunto de coordenaes. Os

    sistemas que suportam a representao coordenada deste tipo de dados so de propsitogeral e, devido a isto, oferecem poucas possibilidades de coordenao.

    O presente trabalho apresenta um estudo de tcnicas de coordenao para sistemasde mltiplas visualizaes, focando coordenao de representaes visuais de dadosmultidimensionais. A partir do estudo dos diversos sistemas de visualizao existentes,foi identificado um conjunto de coordenaes que podem ser aplicadas entrevisualizaes multidimensionais. Esse trabalho apresenta estas coordenaes e umanova aplicao de mltiplas visualizaes coordenadas (construda a partir do toolkitInfoVis), especfica para a representao de dados multidimensionais, que implementa oconjunto de coordenaes. A aplicao desenvolvida conta com um variado conjunto decoordenaes e altamente flexvel, permitindo tanto a escolha das visualizaes querepresentaro o conjunto de dados, bem como das coordenaes ativas entre elas.

    Foram realizados alguns estudos de avaliao como ensaios de interao comusurios. Primeiramente, as implementaes das tcnicas de visualizao suportadas

    pela aplicao desenvolvida foram avaliadas, com o objetivo de encontrar possveisproblemas de usabilidade. Grande parte dos problemas identificados nesta avaliao,principalmente os mais graves, foram solucionados logo aps sua realizao. Naseqncia, outro experimento, conduzido de maneira mais informal, avaliou algumasquestes a respeito do uso das coordenaes implementadas. Por fim, com um estudo decaso, verificou-se a aplicabilidade das visualizaes multidimensionais suportadas pelaaplicao para a explorao de dados de um domnio especfico.

    Palavras-Chave: Visualizao de informaes, mltiplas visualizaes coordenadas,interface de usurio.

  • 7/25/2019 000624194

    12/106

  • 7/25/2019 000624194

    13/106

    1 INTRODUO

    O desenvolvimento tecnolgico, incorporando avanos em produtos e servios,gerou condies para medies mais precisas, simulaes mais velozes e registro deuma gama variada de tipos de dados, produzindo conjuntos de dados cada vez maisvolumosos e complexos. A explorao e a anlise desses volumes de dados tornou-se

    uma tarefa difcil que s pode ser realizada com a utilizao de ferramentascomputacionais apropriadas, muitas vezes dependentes do domnio dos dados. Isto especialmente complexo quando os dados tm alta dimensionalidade, ou seja,correspondem a conjuntos de vrios atributos.

    A rea de visualizao de informaes tem por objetivo facilitar a compreenso e amanipulao desta vasta quantidade de dados diversificados (CARD, 1999; SPENCE,2001), atravs do emprego de tcnicas que buscam tanto representar visualmente osdados quanto permitir ao usurio a interao com estas representaes. As tcnicas devisualizao multidimensionais so especialmente projetadas para a representao dedados que tm alta dimensionalidade (descritos por mltiplos atributos). Conjuntos de

    dados multidimensionais geralmente so representados como tabelas, onde cada linhacorresponde a um elemento de dado, com as colunas representando atributos.

    As representaes visuais de tcnicas de visualizao de informaes, quandomanipuladas dinamicamente, facilitam a interpretao dos dados pelo usurio,

    possibilitando a percepo de padres, tendncias, relacionamentos e exceesembutidos nos mesmos. Uma das grandes questes em relao a essas tcnicas o quoefetiva uma determinada tcnica, em um determinado domnio, ou para umdeterminado objetivo.

    Embora existam diversas tcnicas para mostrar tabelas e conjuntos de dadosmultidimensionais, dependendo da categoria dos dados e das tarefas especficas que

    deveriam ser suportadas, uma nica tcnica pode no ser suficiente: usurios podemprecisar visualizar os dados mostrados com diferentes tcnicas para encontrarrelacionamentos e modelos.

    Assim, dadas as necessidades mencionadas acima, alguns autores (BALDONADOet al., 2000; NORTH, 2000) passaram a trabalhar com uma estratgia denominadaMltiplas Visualizaes Coordenadas (CMV - Coordinated Multiple Views). Nestaestratgia, diferentes visualizaes podem ser integradas em um ambiente e usadas deforma coordenada, isto , estabelecendo-se uma ligao semntica entre asvisualizaes, de maneira que aes sobre uma se reflitam nas demais. Desta forma,aproveita-se os pontos fortes de cada uma, e conjuntos de dados complexos e de altadimensionalidade podem ser visualizados atravs de tcnicas apropriadamenteselecionadas (SHIMABUKURO, 2004).

  • 7/25/2019 000624194

    14/106

    14

    North e Shneiderman (1997) observaram que a coordenao de mltiplasvisualizaes oferece as seguintes vantagens:

    Melhora na performance do usurio: O tempo de acesso informao reduzido, principalmente com a manipulao de informaes hierrquicas, comomostrado por Chimera et al. (1994), bem como o nmero de aes requeridas dousurio para manter um estado sincronizado, como mostrado por Kandogan eShneiderman (1997);

    Descoberta de relacionamentos inesperados: Seria difcil encontrar taisrelacionamentos sem coordenao;

    Unificao do desktop: mais sensato apresentar informaes complexas noem uma nica visualizao complexa e integrada, mas em mltiplasvisualizaes mais simples, usando coordenao para navegar, manterrelacionamentos, etc.

    1.1 Motivao

    Mltiplas visualizaes de um mesmo conjunto de dados permitem observ-lo sobvrias perspectivas, bem como explorar os pontos fortes e minimizar os efeitos dos

    pontos fracos das tcnicas envolvidas (KEIM, 1996; EICK; KARR, 2000). Diversasferramentas genricas de visualizao de informaes oferecem vrias tcnicas e

    permitem o seu uso coordenado para visualizar um mesmo conjunto de dados. Noentanto, em geral, o conjunto de tcnicas e as formas de coordenao disponveis sofixos, pr-estabelecidos durante o projeto da ferramenta, o que limita a potencialidadedo uso das tcnicas em contextos de aplicaes diversos e a liberdade do usurio no

    processo de explorao das mesmas. Ambientes que permitem flexibilidade naconfigurao da coordenao entre mltiplas visualizaes, possibilitando a criao decenrios personalizados para as necessidades do usurio, tm sido tema de estudos e jexistem algumas iniciativas, como Snap-Together (NORTH, 2000) e GeoVISTA Studio(GAHEGAN et al., 2000), que sero abordadas com maior detalhamento no Captulo 3.A primeira destas ferramentas genrica, podendo ser aplicada para a anlise devariados tipos de dados e domnios de aplicao; a ltima, entretanto, enfatiza otratamento de dados espaciais (geo-referenciados).

    Assim como a ferramenta GeoVISTA Studio, a maioria das aplicaes existentesque suportam mltiplas visualizaes coordenadas so projetadas para atender, com

    maior nfase, dados relativos a um domnio especfico. Assim, a tarefa de determinaodas aes de interao coordenadas em uma ferramenta facilitada e a mesma adquirecondies para atender melhor as necessidades dos usurios no processo decompreenso e anlise dos dados.

    Um problema encontrado atualmente em ferramentas de mltiplas visualizaescoordenadas genricas a baixa variedade de interaes coordenadas que as mesmassuportam. Os usurios de Snap-Together, por exemplo, tm suas aes de interaolimitadas seleo e navegao, mas ...muito mais interaes deveriam ser suportadas,tendo em vista que o objetivo da ferramenta a visualizao exploratria(BOUKHELIFA et al., 2003).

    A delimitao das coordenaes suportadas por uma ferramenta de visualizaogenrica uma tarefa difcil. Devido natureza multiforma das diversas visualizaes,

  • 7/25/2019 000624194

    15/106

    15

    aes executadas sobre uma delas nem sempre podem ser diretamente aplicadas paraoutras. Alm disso, algumas coordenaes possveis de serem alcanadas, podem no

    possuir utilidade; e ainda, outras podem ser impossveis de realizar (BOUKHELIFA etal., 2003). Na rea de visualizao de informaes multidimensionais, ainda no existe

    uma ferramenta genrica, capaz de atender os diversos domnios de aplicao em quedados multidimensionais podem ser gerados, flexvel na escolha das visualizaes e dasaes coordenadas e com um conjunto rico e variado destas ltimas. Esta observao foia principal motivadora para a realizao desse trabalho.

    1.2 Objetivos e Contribuies

    O objetivo principal desse trabalho investigar tcnicas de coordenao que podemser aplicadas entre visualizaes multidimensionais em geral. Como objetivo secundrioest a implementao de tais tcnicas em uma aplicao prottipo altamente flexvel,

    com a finalidade de validar as coordenaes definidas.Assim, as contribuies desse trabalho so:

    A definio de um conjunto variado de coordenaes que podem ser aplicadasentre visualizaes multidimensionais em geral, reunindo coordenaesutilizadas por diferentes ferramentas;

    A construo de uma aplicao prottipo de mltiplas visualizaescoordenadas que:

    especfica para visualizao de informaes multidimensionais, nosendo, no entanto, voltada para um domnio de aplicao especfico;

    altamente flexvel, pois permite que usurios possam definir quais,dentre as visualizaes suportadas, iro compor um cenrio de mltiplasvisualizaes e quais aes interativas sero coordenadas entre as mesmas.

    1.3 Organizao do Trabalho

    Os demais captulos dessa dissertao esto organizados como segue. O Captulo 2descreve as principais tcnicas de visualizao e de interao utilizadas para conjuntosde dados multidimensionais, organizadas em categorias. O Captulo 3 aborda os

    principais tipos de coordenaes utilizadas por sistemas de mltiplas visualizaes

    coordenadas, alm de descrever alguns destes sistemas relacionados com o presentetrabalho. O Captulo 4 apresenta caractersticas e a estrutura bsica do toolkit devisualizao InfoVis, sobre o qual foi construda a aplicao prottipo para validao decoordenaes. O Captulo 5 tem como objetivo apresentar e descrever apenas umconjunto especfico de coordenaes: aquelas que podem ser aplicadas em sistemas demltiplas visualizaes coordenadas, especficos para a visualizao de dadosmultidimensionais. Alm disso, este ltimo captulo aborda tambm a descrio de umaaplicao de visualizaes multidimensionais coordenadas, que implementa o conjuntode coordenaes apresentado no mesmo. O Captulo 6 descreve dois estudos deavaliao preliminar da aplicao prottipo apresentada nesse trabalho e o Captulo 7descreve um estudo de caso em que a aplicao desenvolvida foi utilizada por

    especialistas de um domnio especfico para a explorao de seus dadosmultidimensionais. Finalmente, o Captulo 8 apresenta concluses e trabalhos futuros.

  • 7/25/2019 000624194

    16/106

    2 INTERAO COM VISUALIZAESMULTIDIMENSIONAIS

    O termo dimensionalidade usado para referir tanto o nmero de dimenses doespao-domnio onde determinado objeto est definido - podendo ser um espaounidimensional (1D), bidimensional (2D) ou tridimensional (3D) -, quanto o nmero deatributos de um registro de dado - geralmente, referenciado como n-dimensional (nD),multidimensional ou multivariado. Assim, dados multidimensionais so aqueles que

    podem ser representados como uma tabela de dados multivariados, ou seja, que possuimuitas variveis (ou atributos) que devem ser codificadas em uma nica estrutura visual1D, 2D ou 3D (CARD, 1999). A representao de uma tabela de dados multivariados mostrada na tabela 2.1.

    Tabela 2.1: Representao de uma tabela de dados

    Variveli Varivelj Varivelk

    Casox Val or ix Val or jx Val or kx . . .

    Casoy Val or iy Val or jy Val or ky . . .

    ... . . . . . . . . . . . .

    As colunas da tabela em questo representam variveis (ou atributos), conjuntos querepresentam a gama de valores nas colunas. As linhas representam casos (ou itens dedados, tuplas), que so conjuntos de valores para cada varivel. Nesse trabalho, adotou-se o termo item de dado para denotar uma tupla descrevendo um relacionamento entremltiplas variveis (por exemplo, um caso ou registro de dado) e o termo atributo

    para denotar as variveis (dimenses) do conjunto de dados.

    2.1 Visualizaes Multidimensionais

    As visualizaes que so especificamente projetadas para codificar dados quepodem ser representados como tabelas multivarivel so denominadas visualizaesmultidimensionais.

    As tcnicas de visualizao multidimensionais podem ser categorizadas de acordocom diferentes critrios. Keim (1996) sugere uma categorizao baseada em trscritrios: a natureza do dado a ser visualizado, a abordagem de mapeamento adotado

    pela tcnica e os mtodos de interao e distoro disponibilizados para permitir amanipulao da representao visual.

  • 7/25/2019 000624194

    17/106

    17

    Existem vrias tcnicas para a visualizao de dados multidimensionais. Nessa seosero apresentadas algumas tcnicas clssicas, direcionadas visualizao de tabelas dedados, dando-se nfase s tcnicas mais representativas e citadas na literatura. Asmesmas sero descritas seguindo o critrio de classificao proposto por Keim (1996),

    que difere tcnicas de acordo com a forma de mapeamento adotada para transformardados em formas visuais. Este critrio divide as tcnicas de visualizaomultidimensionais em tcnicas de projeo geomtrica, iconogrficas e orientadas a

    pixel.

    2.1.1Tcnicas de projeo geomtrica

    Nessa classe esto includas todas as tcnicas de visualizao que empregam algumtipo de projeo geomtrica para mapear dados para formas visuais. Entre as tcnicasdesta categoria esto: Coordenadas Paralelas, Matriz de Scatter Plots, grficos de linhas,grfico de barras e histogramas, Survey Plots, Curvas de Andrews, Radviz e

    Coordenadas Paralelas Circulares.As principais tcnicas representantes dessa categoria so descritas com maior

    detalhamento a seguir. Para demonstrar a representao visual gerada por cada umadestas tcnicas, foi utilizado o conjunto de dados sobre carros (descrito na seo 6.1.1desse trabalho).

    2.1.1.1 Coordenadas Paralelas

    A tcnica Coordenadas Paralelas foi introduzida por Inselberg (1985) (1990) pararepresentar mltiplas dimenses sem utilizar eixos cartesianos ortogonais. Nessatcnica, dados multidimensionais so representados utilizando linhas verticais e

    horizontais. Cada linha vertical indica um atributo (ou varivel) e os valores dosatributos so mapeados para pontos nessas linhas verticais, de forma que cada item dedado seja representado como uma linha poligonal que intercepta cada linha vertical emseu ponto correspondente ao valor de cada atributo, formando um aglomerado de linhashorizontais. Os valores mximo e mnimo de um atributo so usualmente mapeados

    para as extremidades superior e inferior de uma linha vertical, respectivamente. A figura2.1 mostra um exemplo da representao visual gerada pela tcnica CoordenadasParalelas (para representar os dados de carros). As diferentes intensidades de cor, daslinhas horizontais da figura, foram usadas para diferenciar itens de dados com valoresdiferentes para o atributo Origin.

    A representao visual gerada pela tcnica Coordenadas Paralelas facilitaprincipalmente a identificao de algumas caractersticas, como diferenas nadistribuio dos dados e correlaes entre atributos. Porm, visto que as linhas

    poligonais podem se sobrepor, o nmero de itens de dados que podem ser visualizadosao mesmo tempo limitado a aproximadamente 1.000 itens (KEIM, 1996). Assim, avisualizao de grandes volumes de dados requer que a tcnica seja utilizadadisponibilizando-se operaes adequadas de interao. A figura 2.2 exibe um exemploda visualizao Coordenadas Paralelas, onde h uma acentuada sobreposio de linhas.

    2.1.1.2 Matriz de Scatter Plots

    Scatter Plot uma tcnica classificada como geomtrica, onde pontos oumarcadores visuais (representando itens de dados) so plotados em coordenadas (x, y)

  • 7/25/2019 000624194

    18/106

    18

    de forma semelhante a outros grficos bidimensionais. Matriz de Scatter Plots umaextenso desta tcnica, utilizada para a representao de dados multidimensionais. Namesma, so exibidas simultaneamente mltiplas projees bidimensionais (scatter

    plots) dos diferentes pares de atributos do conjunto de dados. Por exemplo, para um

    conjunto de dados com 6 dimenses, uma matriz 6 x 6 (6 linhas e 6 colunas) usadapara prover a visualizao de cada dimenso versus todas as outras. A figura 2.3 mostraum exemplo de visualizao gerada com a tcnica Matriz de Scatter Plots.

    Figura 2.1: Representao visual da tcnica Coordenadas Paralelas

    Figura 2.2: Tcnica Coordenadas Paralelas com sobreposio de linhas (15.000 itens dedados representados) (KEIM, 1997)

  • 7/25/2019 000624194

    19/106

    19

    Figura 2.3: Representao visual da tcnica Matriz de Scatter Plots

    A Matriz de Scatter Plots considerada de fcil interpretao, por permitir avisualizao de todas as possveis correlaes entre os pares de dimenses. Contudo, aquantidade de dimenses que podem ser apresentadas simultaneamente uma limitao,

    devido ao pouco espao disponvel para a projeo de cada grfico. medida que onmero de dimenses aumenta, torna-se necessrio o uso de operaes de interao(como zoomingou panning) para uma efetiva interpretao dos resultados. Hyperslice(VAN, 1993) e HyperBox (ALPERN; CARTER, 1991) so exemplos de variaes daMatriz de Scatter Plots, que fazem uso de uma matriz de painis.

    2.1.1.3 Radviz

    Radviz (HOFFMAN et al., 1997) visualizao de coordenadas radiais umatcnica que segue um princpio semelhante a Coordenadas Paralelas. Nessa tcnica, nlinhas, correspondentes ndimenses, emanam radialmente do centro de um crculo e

    terminam no seu permetro, em pontos igualmente espaados, denominados dimensionalanchors(DAs). Cada item de dado projetado est ligado por meio de molas imaginriass DAs e a posio onde so projetados aquela onde existe equilbrio das foras dasmolas associadas a cada dimenso (HOFFMAN, 1999). Cada ponto de dado , ento,exibido onde a soma das foras das molas igual a zero. Todos os valores dos itens dedados so, geralmente, normalizados para valores entre 0 e 1 (FAYYAD; GRINSTEIN;WIERSE, 2002). A figura 2.4 mostra um exemplo da representao visual da tcnicaRadviz.

    A tcnica Radviz pode mapear vrios itens de dados na mesma posio, dependendoda ordem em que os atributos esto distribudos no crculo. Alm disso, outras

    caractersticas desta tcnica de visualizao so (HOFFMAN, 1999) (FAYYAD;GRINSTEIN; WIERSE, 2002):

  • 7/25/2019 000624194

    20/106

    20

    Itens de dados com valores de atributos aproximadamente iguais (depois denormalizados) so posicionados prximos ao centro do crculo;

    Itens de dados com valores similares associados a dimenses em eixosopostos ficam, tambm, prximos ao centro;

    Valores maiores dos atributos (ou dimenses) atraem o ponto projetado pararegies prximas aos eixos associados a estes atributos.

    A posio de um item de dado depende da representao das dimenses ao redor docrculo, sendo que, se a ordem das dimenses for alterada, a representao grficatambm o ser.

    Figura 2.4: Representao visual da tcnica Radviz(imagem extrada de VALIATI, 2004)

    2.1.1.4 Coordenadas Paralelas Circulares

    Coordenadas Paralelas Circulares (denominada, tambm, como Grfico de EstrelasSobrepostas) correspondem a uma outra verso circular da tcnica CoordenadasParalelas, consideravelmente, mais prxima idia original desta ltima (FAYYAD;GRINSTEIN; WIERSE, 2002). Basicamente, a forma de mapear e projetar os dados

    permanece a mesma, apenas as dimenses so dispostas de outra forma (em um formatocircular), formando um grfico em estrela (conforme mostra a figura 2.5).

    Seguindo esta forma de projeo geomtrica, os segmentos de linha so mais longosna parte externa do crculo, onde os valores maiores so tipicamente mapeados,enquanto os valores menores so projetados para o centro do crculo. Devido assimetria formada na representao dos valores maiores e menores, certos padres

    podem ser facilmente detectados com esta tcnica (FAYYAD; GRINSTEIN; WIERSE,2002).

  • 7/25/2019 000624194

    21/106

    21

    Figura 2.5: Representao visual da tcnica Coordenadas Paralelas Circulares (imagemextrada de VALIATI, 2004)

    2.1.1.5 Polyviz

    Polyviz uma tcnica que busca combinar caractersticas de Coordenadas Paralelase de Radviz. Um dos problemas apresentados pela tcnica Radviz que pontos n-dimensionais com valores bastante diferentes podem ser mapeados para a mesma

    posio na tela. Esta sobreposio pode ser contornada se os pontos fixados para asmolas, em cada dimenso, forem expandidos ao longo dos eixos (FAYYAD;GRINSTEIN; WIERSE, 2002).

    Na tcnica Polyviz, alm de ser empregada esta nova forma de mapeamento dospontos, a distribuio para cada dimenso mostrada por linhas emanando dos eixos edispostas em uma configurao poligonal (ver figura 2.6). Deste modo, procura-seaproveitar a capacidade de exibio de agrupamentos, demonstrada pela tcnica Radviz,

    e a habilidade de visualizar a distribuio de dados em cada dimenso, caracterstica deCoordenadas Paralelas.

    2.1.1.6 Survey Plots

    Survey Plots(LOHNINGER; INSPECT, 1994) outra tcnica na qual os dados decada dimenso so mapeados para linhas estendidas a partir de um ponto central. Ocomprimento de cada linha corresponde ao valor do item de dado sendo representado.Como em grfico de barras, esta tcnica utiliza a idia de representar os dadosestendendo cada ponto sendo mapeado para um determinado eixo. Um princpiosemelhante a este empregado tambm pelas tcnicas Table Lens(RAO; CARD, 1994)

    e Matriz de Permutao (BERTIN, 1983).

  • 7/25/2019 000624194

    22/106

    22

    A visualizao de Survey Plots permite que correlaes entre quaisquer duasdimenses possam ser percebidas, especialmente, quando os dados so classificados deacordo com uma dimenso particular (FAYYAD; GRINSTEIN; WIERSE, 2002). Afigura 2.7 mostra um exemplo de visualizao Survey Plots (representando os dados

    sobre carros), na qual os dados esto classificados por nmero de cilindros (valores doatributo Cylinders).

    Figura 2.6: Representao visual da tcnica Polyviz (HOFFMAN et al., 2000)

    Figura 2.7: Representao visual da tcnica Survey Plots (imagem extrada deVALIATI, 2004)

  • 7/25/2019 000624194

    23/106

    23

    2.1.2Tcnicas Iconogrficas

    H dois tipos de visualizaes do tipo iconogrficas: glifos e cones. Em cada umadestas, as dimenses de um conjunto de dados so mapeadas para certas caractersticasdos glifos ou cones. Assim, cada glifo ou cone representa um item de dado com suasn-dimenses.

    2.1.2.1 Faces de Chernoff

    Uma das mais conhecidas visualizaes iconogrficas Faces de Chernoff(CHERNOFF, 1973). Nesta ltima, as dimenses dos dados so mapeadas paracaractersticas de uma face, como formato do nariz, boca, olhos e da face como um todo(ver figura 2.8(a)), resultando em diferentes formatos de faces (definidas segundo osvalores sendo mapeados). Contudo, a efetividade desta tcnica amplamente discutida,devido dificuldade de percepo de diferenas muito pequenas nas imagens e pelamesma ser inadequada para a identificao de agrupamentos.

    Figura 2.8: Tcnicas iconogrficas: a) Faces de Chernoff e b) Glifos em Estrela(KEIM, 1997)

    2.1.2.2 Glifo em Estrela

    Na tcnica Glifo em Estrela (ver figura 2.8 (b)), cada item de dado representado

    por um glifo em forma de estrela. Em cada um destes, as dimenses dos dados sorepresentadas como raios de ngulos iguais, partindo do centro de um crculo. Ocomprimento de um raio indica o valor de um atributo. Raios mais extensos representamvalores altos e o centro do crculo indica o valor mnimo da dimenso.

    2.1.2.3 Stick Figure

    A tcnica Stick Figure caracteriza-se pelo uso de cones bsicos. As vriasdimenses dos dados so mapeadas para parmetros dos cones, tais como ocomprimento e o ngulo de rotao de uma aresta (ou galho). Variaes decomprimento, espessura e cor das arestas fornecem outras possibilidades de

    representao, explorando a capacidade humana de percepo de texturas einterpretao de padres (FAYYAD; GRINSTEIN; WIERSE, 2002). A imagem daesquerda da figura 2.9 apresenta uma tabela de cones, que representam diversos

  • 7/25/2019 000624194

    24/106

    24

    parmetros do censo da Inglaterra, e a imagem da direita da mesma figura mostra estescones plotados em coordenadas x e y, indicando renda e idade.

    Figura 2.9: Mapeamento de Stick Figures(esquerda) e grfico iconogrfico de dados docenso da Inglaterra (direita) (FAYYAD et al., 2002)

    2.1.3Tcnicas Orientadas a Pixel

    Tcnicas dessa categoria caracterizam-se por mapear o conjunto de valores de cadaatributo (ou dimenso) dos dados em pixels na tela. O conjunto de valores de cadaatributo exibido em janelas individuais, ou seja, para um conjunto de dados que possuin atributos, a tela dividida em n janelas. Em cada uma das janelas, cada valor doatributo representado por umpixel,colorido conforme o valor sendo representado. Adistribuio espacial dos pixelsna janela pode ser determinada de diferentes maneiras(ver figura 2.10), de modo que relaes ou significados nos dados possam ser

    percebidos pela anlise das regies correspondentes nas janelas (KEIM, 1996).

    As formas utilizadas para a distribuio dos pixelsnas janelas podem ser divididasem tcnicas dependentes e independentes do resultado de uma consulta. Nas tcnicasindependentes de consulta, os valores dos atributos so mapeados diretamente para os

    pixelse exibidos nas janelas, utilizando-se curvas de preenchimento de espao (curvasde Peano-Hilbert ou Morton) ou padres recursivos (ver figura 2.11), que proporcionam

    um melhor agrupamento de itens de dados relacionados e uma distribuiosemanticamente significativa.

    Por outro lado, nas tcnicas dependentes de consulta, ao invs dos valores dosatributos serem mapeados diretamente para pixels, as distncias destes valores a umadeterminada consulta que so mapeadas. Desta forma, alm dos itens de dados quesatisfazem a consulta, tambm podem ser exibidos aqueles valores que se aproximam daresposta, atravs da exibio da distncia de cada valor a um respectivo valorestabelecido na consulta. O clculo da distncia depende da aplicao e do tipo de dado.Os atributos referentes a um item de dado ocupam a mesma posio relativa nas suasrespectivas janelas, sendo que a ordem de exibio dos itens na janela determinada por

    uma distncia global. Essa distncia calculada pela combinao das distncias de cadaatributo, ponderadas por um peso correspondente, que determina a relevncia dada aoatributo.

  • 7/25/2019 000624194

    25/106

    25

    Visto que o foco est na relevncia dos dados com respeito a uma consulta,diferentes formas de distribuio dospixelspodem ser apropriadas: em espiral, onde asrespostas corretas so apresentadas no centro da janela e os valores prximos ao redordesta regio, ou por eixos, indicando distncias positivas e negativas (ver figura 2.10).

    Figura 2.10: Visualizaes orientadas a pixel de um conjunto de dados com novedimenses, utilizando duas formas de distribuio espacial: espiral (esquerda) e por

    eixos (direita) (KEIM, 1997).

    Figura 2.11: Tcnicas independentes de consulta: a) curvas de Peano-Hilbert , b) curvasde Morton e c) padres recursivos (KEIM, 1996) (KEIM, 1997)

    Embora o formato retangular para as janelas permita um uso racional do espao natela, a percepo de relacionamentos entre os atributos pode ser dificultada quantomaior for o nmero de dimenses a serem visualizadas. Uma alternativa de soluo aeste problema a utilizao de um formato circular, adotado, por exemplo, na tcnicaSegmentos de Crculo (ver figura 2.12).

  • 7/25/2019 000624194

    26/106

    26

    Figura 2.12: Tcnica Segmentos de Crculo (KEIM, 1997).

    2.2 Tcnicas de Interao

    Alm das tcnicas de visualizao, para uma explorao de dados efetiva, necessrio tambm o uso de algumas tcnicas de interao. Estas ltimas permitem queum usurio possa interagir diretamente com visualizaes e alter-las dinamicamente deacordo com seus objetivos de explorao. A possibilidade de interagir comrepresentaes visuais pode reduzir consideravelmente as desvantagens e pontos fracos

    de algumas tcnicas de visualizao (principalmente, daquelas que apresentamdesordem visual e sobreposio de objetos), fornecendo ao usurio mecanismos paramanipular a complexidade de conjuntos de dados (OLIVEIRA; LEVKOWITZ, 2003).

    Keim (1997) identificou as tcnicas de interao que so utilizadas para aexplorao de conjuntos de dados multidimensionais e organizou-as em seis classes:mapeamento de dados para propriedades visuais, projees, filtragem (seleo econsulta), brushing and linking, zoom e detalhes por demanda. A seguir, as tcnicas deinterao aplicadas para a visualizao de dados multidimensionais sero descritas,utilizando a categorizao proposta por Keim.

    2.2.1Mapeamento de Dados para Propriedades VisuaisEsta categoria inclui as tcnicas de interao que realizam mapeamentos de atributos

    (dimenses) dos dados para parmetros de uma visualizao. Estes parmetros soatributos visuais de objetos representando itens de dados (como cor, tamanho,transparncia, orientao, etc.). A tabela 2.2 mostra exemplos tpicos de mapeamentos

    para algumas propriedades visuais.

    A codificao de atributos de dados para propriedades visuais de uma visualizaoaumenta a densidade dos dados e a variedade de representaes que podem ser geradas(STOLTE; HANRAHAN, 2001). Alm disso, este tipo de mapeamento aumenta onmero de dimenses que podem ser visualizadas simultaneamente. Por exemplo, um

    scatter plot 2D representa apenas dois atributos (dispostos nos eixos x e y), mas outros

  • 7/25/2019 000624194

    27/106

    27

    atributos podem ser representados simultaneamente se estes forem mapeados paraatributos visuais de objetos.

    A fim de manter uma especificao breve, no deve ser requerida do usurio aconstruo de mapeamentos. O usurio deve apenas especificar qual atributo de dadosdeve ser mapeado para uma determinada propriedade visual. O sistema que deve serresponsvel por gerar um mapeamento efetivo dos valores do atributo para variaes da

    propriedade visual.

    Diferentes smbolos (ver tabela 2.2) podem ser utilizados para o mapeamento deatributos nominais, desde que o nmero de valores do atributo seja pequeno. O tamanhode objetos pode ser usado para mapear tanto atributos nominais como quantitativos.Quando mapeando atributos quantitativos, um mapa linear a partir dos valores deatributo para o tamanho dos objetos criado. Por outro lado, se um atributo nominal mapeado, o nmero de valores precisa ser pequeno (no mximo quatro ou cinco), deforma que o usurio consiga distinguir entre diferentes categorias (BERTIN, 1983).

    Quando a cor utilizada para mapear atributos nominais, os valores de atributodevem ser associados a cores bem distintas entre si (ver tabela 2.2). Quando os atributosmapeados so quantitativos, geralmente, apenas a nuance de cor variada.

    Um princpio chave na gerao de mapeamentos de atributos nominais para apropriedade orientao que a orientao precisa variar pelo menos 30 graus entre ascategorias (KOSSLYN, 1994), o que restringe o nmero de categorias para no mximoseis. Para atributos quantitativos, a orientao varia linearmente com os valores deatributo.

    Tabela 2.2: Propriedades visuais que podem ser usadas para mapear atributos de dados e

    exemplos de mapeamentos tpicospropriedadevisual

    objetos mapeamento nominal mapeamento quantitativo

    figura glifo

    tamanho retngulo,crculo, linha,glifo, texto

    cor retngulo,crculo, linha,glifo, texto

    orientao retngulo,linha, texto

    Fonte: STOLDE; HANRAHAN, 2001

    2.2.2Projees

    A idia das tcnicas interativas de projeo mudar, dinamicamente, os atributos dedados (dimenses) que so projetados em eixos de uma visualizao. O objetivo explorar um conjunto de dados multidimensional, permitindo correlaes entrediferentes atributos de dados. Um exemplo clssico de sistema que emprega projees o Grand-Tour (ASIMOV, 1985). Ele tenta mostrar todas as projees bi-dimensionaisinteressantes de um conjunto de dados multidimensional como uma srie de scatter

    plots. O nmero de projees possveis exponencial no nmero de dimenses e,

  • 7/25/2019 000624194

    28/106

    28

    devido a isto, esta organizao invivel para conjuntos de dados de altadimensionalidade. A seqncia de projees mostrada pode ser randmica, manual ou

    pr-computada (KEIM, 2002).

    2.2.3FiltragemAo explorar grandes conjuntos de dados, importante particionar, interativamente,

    estes dados em diferentes segmentos e, ento, focar no subconjunto de interesse (KEIM,2002). Isto pode ser feito atravs da seleo direta do subconjunto desejado (browsing)ou pela especificao de propriedades do subconjunto alvo (consulta). Ambas as

    possibilidades so formas de filtragem.

    A seleo realizada diretamente sobre uma representao visual, com o auxlio deum dispositivo de apontamento. Sua nfase na filtragem rpida, destacando umsubconjunto dos dados. No entanto, o uso desta tcnica muito difcil para a filtragemde grandes conjuntos de dados, quando ocorre desordem visual e sobreposio deobjetos.

    As tcnicas de consulta dinmica permitem ao usurio manipular widgetsgrficos(sliders, botes, etc.) para controlar a quantidade de dados visualizados (AHLBERG;WILLIAMSON; SHNEIDERMAN, 1992). Cada widgetcorresponde a um atributo doconjunto de dados. Esta tcnica funciona melhor para dados quantitativos, mas podetambm ser usada na manipulao de dados nominais (GOLDSTEIN; ROTH, 1994).

    Neste ltimo caso, o usurio deve selecionar elementos a partir de uma lista de valores.A figura 2.13 mostra uma interface de consultas dinmicas, usada para selecionardinamicamente itens de dados, com base nos seus valores para os atributos Latitude,

    Longitudee Interval(intervalo de anos). O mapa maior mostra todos os itens de dados

    da regio de interesse (delimitada pelos valores de Latitude e Longitude) e o mapamenor (acima direita) mostra apenas os itens dentro do intervalo de 30 a 50 anos.

    Figura 2.13: Usando consultas dinmicas para verificar a concentrao espacial de itensde dados em uma regio de interesse (SHIMABUKURO, 2004)

  • 7/25/2019 000624194

    29/106

    29

    As vantagens da consulta dinmica so que widgets grficos so fceis de manipulare os efeitos da interao so vistos imediatamente na visualizao. Ao utilizar sliders,

    por exemplo, o usurio pode acompanhar a mudana progressiva na quantidade dedados visualizados, medida que a barra do slider vai sendo movida. Alm disso,

    consultas dinmicas permitem que o usurio possa descobrir rapidamente quaissegmentos do espao de pesquisa multidimensional esto muito ou pouco populados,onde h agrupamentos, lacunas ou outliers, e quais tendncias existem em dadosnominais (SHNEIDERMAN, 1994). Por outro lado, a principal desvantagem dessatcnica interativa a dificuldade de representar consultas mais elaboradas, como porexemplo, disjunes. Um exemplo de disjuno seria a combinao de dois intervalosdistintos de valores em um nico slider.

    Como as tcnicas de filtragem mencionadas acima (seleo e consultas dinmicas)apresentam limitaes claras, vrias outras tcnicas tm sido desenvolvidas paramelhorar a filtragem interativa na explorao de dados. Um exemplo de ferramenta

    interativa que pode ser usada para filtragem magic lenses (BIER et al., 1993)(FISHKIN; STONE, 1995). A idia bsica desta ltima usar uma ferramenta comouma lente, para filtrar dados diretamente na visualizao. Os dados debaixo da lente so

    processados por um filtro e exibidos diferentemente do restante dos dados (vrias lentescom diferentes filtros podem ser usadas). A tcnica mostra uma visualizao modificadada regio selecionada, enquanto o resto da visualizao permanece igual. Como alente pode ser movimentada por toda a rea de uma visualizao (utilizando o mouse),as magic lensesso tambm chamadas de filtros mveis. A figura 2.14 mostra o uso dedois filtros de magic lenses, um deles mostra uma viso aramada de blocos 3D e o outrouma viso aumentada 2D.

    As principais vantagens do uso dessa tcnica so a possiblidade de visualizar

    detalhes e contexto simultaneamente e modificar a apresentao de objetos para revelarinformaes escondidas, aumentar os dados de interesse ou eliminar informaesdesnecessrias do foco (BIER et al., 1993).

    Figura 2.14:Magic lenses: Uma lente de viso aramada 3D e uma lente de aumento 2D(BIER et al., 1993).

    2.2.4Zoom

    Zoom uma tcnica interativa muito conhecida e amplamente utilizada por diversasaplicaes. Ao representar graficamente conjuntos de dados com um grande nmero de

    itens de dados, importante que estes ltimos sejam exibidos de forma comprimida,com o objetivo de fornecer uma viso de overviewdo conjunto inteiro. Mas, ao mesmo

  • 7/25/2019 000624194

    30/106

    30

    tempo, interessante fornecer tambm uma visualizao diferenciada dos dados, emdiferentes resolues.

    A tcnica de zoom no significa apenas mostrar objetos de dados maiores, massignifica tambm que a representao dos dados muda automaticamente para apresentarmais detalhes, em nveis de zoom mais altos (KEIM, 2002). Os objetos podem, porexemplo, ser representados em um nico pixel, em nveis de zoom baixos; como cones,em um nvel de zoom intermedirio; e como objetos nomeados, em resolues altas.Uma viso overview permite ao usurio detectar modelos, correlaes e outliers noconjunto de dados, j uma viso com nvel de zoom mais alto permite melhorexplorao de uma rea de interesse, pois os itens de dados so exibidos com maiordetalhe.

    2.2.5Detalhes por Demanda

    Essa tcnica representa a possibilidade de obter, interativamente, mais detalhessobre os dados visualizados. Estes detalhes podem ser, por exemplo, valores de atributode um item de dado ou cone (ou glifo) ou informaes adicionais destes.

    Detalhes por demanda uma tcnica oferecida como alternativa mais rpida aconsultas dinmicas. Em vez de compor consultas e interpretar seus resultados, ousurio pode, em qualquer momento que sentir necessidade, solicitar rapidamente aexibio de detalhes acerca de um item de dado. Esta solicitao, geralmente, realizada por meio da seleo direta do item na visualizao, e os dados de detalhesolicitados, usualmente, so exibidos em um frame pop-up (como na figura 2.15, quemostra informaes adicionais sobre um filme selecionado) ou no painel de controle davisualizao.

    Figura 2.15: Usando a tcnica detalhes por demanda para obter informaes adicionaissobre um item de dado (extrado de AHLBERG; SHNEIDERMAN, 1994).

  • 7/25/2019 000624194

    31/106

    3 VISUALIZAES COORDENADAS: CONCEITOS EREVISO BIBLIOGRFICA

    Conectar e relacionar informaes em uma visualizao com informaes em outraauxilia o usurio no processo de explorao de um conjunto de dados e pode fornecercompreenses adicionais acerca do mesmo (ROBERTS, 2004). North e Shneiderman(1997), em seus experimentos com usurios, descobriram que a coordenao demltiplas visualizaes oferece como vantagens a melhora na performance do usurio, adescoberta de relacionamentos inesperados e a unificao do desktop.

    Muitas formas diferentes de interaes podem ser coordenadas, como operaes demanipulao, consultas, selees e mapeamentos visuais. Alm disso, uma ao emdeterminada visualizao pode ser conectada mesma ao em outra visualizao ou auma ao diferente (a possibilidade de cada combinao deve ser verificada, pois nemtodas so possveis). Ainda, tambm h formas diferentes para especificar umrelacionamento de coordenao, que pode ser unidirecional ou bidirecional.Considerando um par de visualizaes interligadas, apenas uma delas pode afetar a

    outra, com uma ligao unidirecional (nico sentido). J se a ligao estabelecida forbidirecional (duplo sentido), ambas as visualizaes so mutuamente afetadas.

    Duas visualizaes interligadas, geralmente, representam dados de um mesmoconjunto, cada uma utilizando uma tcnica de representao visual diferente. Outra

    possibilidade, no entanto, permitir que visualizaes interligadas representemconjuntos de dados diferentes. Neste caso, os conjuntos de dados considerados devem

    possuir uma relao entre si, de forma que seja possvel para uma aplicao estabelerum mapeamento de informaes em uma visualizao para informaes em outra.

    A seo abaixo apresenta as principais formas de coordenaes utilizadas porsistemas de mltiplas visualizaes coordenadas e as vantagens que o uso das mesmas

    oferece, e a seo seguinte a esta descreve alguns dos principais sistemas devisualizaes coordenadas relacionados a esse trabalho.

    3.1 Tipos de Coordenaes

    North e Shneiderman (1997) determinaram que as aes realizadas por usurios noprocesso de explorao de dados so limitadas seleo de itens e navegao emjanelas (zoom, scroll, pan, rotao, etc.). Com base nisto, eles desenvolveram umataxonomia de coordenaes que abrange trs possibilidades de combinao destas aes(uma ao em uma visualizao ligada outra ao numa segunda visualizao):

    seleoseleo, navegaonavegao e seleonavegao. O smbolo indica bidirecionalidade, o que significa que estas ligaes so vlidas nos dois

  • 7/25/2019 000624194

    32/106

    32

    sentidos. Os mesmos autores tambm determinaram que as trs possibilidades decoordenao podem ser aplicadas para visualizaes que representam o mesmo conjuntode dados, bem como para visualizaes que representam conjuntos relacionados.

    No entanto, Pattison e Phillips (2001) discordaram das determinaes acima,indicando outras formas de coordenao alm da seleo e navegao, como porexemplo, a ordenao de itens e agrupamentos. Da mesma forma, Boukhelifa et al.(2003) acredita em um uso mais amplo de coordenaes, exemplificado por um modeloem camadas, onde o usurio pode ligar qualquer aspecto do dataflow e processo deexplorao.

    Muitas so as coordenaes citadas na literatura (muitas vezes a mesma tcnica tratada por diferentes nomenclaturas), mas no h uma nica categorizao amplamenteaceita que organize as mesmas. Por esta razo, a seguir sero descritas algumascoordenaes, que foram identificadas como as mais utilizadas em sistemas de mltiplasvisualizaes coordenadas para explorao de dados. As sete primeiras coordenaes

    descritas (brushing-and-linking, reordenao de dimenses sincronizada, filtragemsincronizada, mapeamento de dados para propriedades visuais, scrollingsincronizado,zoom sincronizado e rotao sincronizada) conectam a mesma ao em todas asvisualizaes, ao contrrio das duas ltimas coordenaes (overview e detalhe e drilldown), que conectam aes diferentes em cada visualizao. Entre todas as tcnicasdescritas abaixo, apenas drill down no costuma ser implementada de forma

    bidirecional.

    3.1.1Brushing-and-Linking

    Brushing um processo no qual um usurio pode destacar, selecionar ou apagar um

    subconjunto de elementos representados graficamente, apontando-os com o mouse(MARTIN; WARD, 1995). Quando mltiplas visualizaes dos dados esto sendoexibidas simultaneamente, o brushing associado com outro processo, conhecido comolinking. Neste caso, elementos selecionados em uma visualizao so automaticamentedestacados em todas as demais, tornando possvel a deteco de dependncias ecorrelaes. Por exemplo, na figura 3.1, a seleo dos estados com mais alto nvel deeducao nos EUA, na visualizao scatter plot, revela que estes estados estolocalizados na regio nordeste do pas. Atravs da coordenao brushing-and-linking,os itens selecionados na scatter plot (em amarelo) so automaticamente selecionadostambm na representao de mapa.

    Brushing-and-linking o tipo de coordenao mais utilizada pelos sistemas devisualizaes coordenadas e empregada para a anlise de dados h muitos anos.Recentemente, esta tcnica tem sido usada tambm para ajudar usurios a obtereminformaes adicionais sobre pontos de dados selecionados. Alguns sistemas queimplementam esse tipo de coordenao so Spotfire (AHLBERG; WISTRAND, 1995),Visage (ROTH et al., 1996) e Snap-Together (NORTH, 2000), sistema no qual foigerado o cenrio da figura 3.1.

    A coordenao brushing-and-linking utilizada com maior freqncia paravisualizar equivalncias entre diferentes representaes do mesmo conjunto de dados,mas a mesma tambm utilizada, por alguns sistemas, para visualizar relaesarbitrrias entre diferentes conjuntos de dados. Por exemplo, registros de dadosrelacionados, mas em diferentes tabelas, podem ser destacados consultando uma base dedados relacional durante o processo de brushing-and-linking.

  • 7/25/2019 000624194

    33/106

    33

    Figura 3.1: Visualizaes coordenadas pela tcnica brushing-and-linking

    (NORTH, 2000)

    3.1.2Reordenao de Dimenses Sincronizada

    Esse tipo de coordenao permite que um usurio possa mudar a disposio em queatributos de dados (dimenses) aparecem em diferentes visualizaesmultidimensionais, simultaneamente. Na maioria das tcnicas de visualizaomultidimensionais, os atributos do conjunto de dados so posicionados na tela em umarranjo uni ou bi-dimensional (YANG et al., 2003). Devido a isto, deve ser escolhidaalguma ordem para as dimenses. Esta ordem geralmente interfere na expressividade davisualizao, pois diferentes arranjos de dimenses podem revelar aspectos diferentes

    dos dados e afetar a clareza e estrutura da representao visual (PENG; WARD;RUNDENSTEINER, 2004). Assim, caractersticas bem diferentes podem ser percebidasdo conjunto de dados, dependendo do arranjo das dimenses na visualizao.

    Apenas alguns sistemas de visualizaes multidimensionais permitem a reordenaode dimenses e esta realizada manualmente pelo usurio. XmdvTool (WARD, 1994) um exemplo de sistema que permite coordenar a reordenao de dimenses. Quando ousurio solicita manualmente uma alterao na ordem das mesmas, essa alterao realizada em todas as visualizaes multidimensionais disponveis, simultaneamente.

    3.1.3Filtragem Sincronizada

    O processo de filtragem consiste em particionar um conjunto de dados,dinamicamente, com o objetivo de focar em um determinado subconjunto de interesse(KEIM, 2002). No contexto de visualizaes coordenadas, a filtragem , geralmente,utilizada como consultas dinmicas (AHLBERG; SHNEIDERMAN, 1994). O usuriohabilita a eliminao de pontos de dados das visualizaes, especificando intervalos devalores para atributos em consultas. Cada widget grfico (geralmente, um slider) deconsulta dinmica representa um atributo de dados. Conforme o usurio muda ointervalo de um filtro de consulta dinmica, todas as visualizaes coordenadas so

    progressivamente alteradas, para exibir o novo montante de pontos de dados.

    CityOScope (BRODBECK; GIRARDIN, 2003) um exemplo de sistema que

    coordena o processo de filtragem da forma descrita acima. Outra forma de coordenarfiltragem implementada por sistemas de filter-flow, como Linkwinds (JACOBSON;BERKIN; ORTON, 1994). Neste tipo de sistema, o usurio conecta controles de filtro

  • 7/25/2019 000624194

    34/106

    34

    de consulta dinmica e visualizaes em uma rede pipeline. Selecionando intervalospara dimenses em um controle ou filtros da visualizao, os dados mostrados seguemnopipeline. Em todos os sistemas pesquisados na literatura, a filtragem sincronizada utilizada apenas em visualizaes que representam o mesmo conjunto de dados.

    A filtragem uma tcnica muito til para analisar a distribuio dos dados(agrupamentos e lacunas) e tendncias, assim como reduzir a desordem visual dasrepresentaes. Quando empregada de forma coordenada, esta tcnica evita que ousurio tenha que, repetidas vezes, focar uma visualizao em um determinadosubconjunto de dados, para visualiz-lo em todas as representaes visuais.

    3.1.4Mapeamento de Dados para Propriedades Visuais

    Esse tipo de coordenao mapeia valores de atributos (dimenses) para parmetrosvisuais de objetos de dados de visualizaes, como cor, tamanho, transparncia,orientao, entre outros (ver tabela 2.2 para exemplos de mapeamentos tpicos). Ousurio deve indicar qual atributo de dados deve ser mapeado para uma determinada

    propriedade visual, selecionando o nome do atributo no componente de interface grficaque representa a propriedade em questo. Logo aps a seleo, todas as visualizaescoordenadas exibiro seus objetos de dados com os valores do atributo selecionado pelousurio, mapeados para a propriedade visual por ele tambm escolhida. O mesmo tipode mapeamento visual aplicado em todas as visualizaes.

    A coordenao de mapeamentos de dados para propriedades visuais auxilia ousurio a identificar o posicionamento de determinados objetos de dados nas diferentesvisualizaes e perceber tendncias gerais do conjunto de dados. O sistema XmdvTool(WARD, 1994) permite a coordenao de mapeamentos de dados para diferentes mapas

    de cores. A figura 3.2 mostra as tcnicas Coordenadas Paralelas e Glifos em Estrelautilizando o mesmo mapa de cores, que representa os valores do atributo Origin. Pretorepresenta o valor mais baixo do atributo e verde claro o valor mais alto.

    3.1.5ScrollingSincronizado

    Esse tipo de coordenao conecta as scroll barsde duas ou mais janelas, mantendo-as sincronizadas. Uma scroll bar um mecanismo tpico de navegao em janela(panning), sendo assim, as tcnicas scrolling e panning sincronizado so anlogas.Quando o usurio movimenta a scroll bar de uma janela, as demais so deslocadasautomaticamente para a posio correspondente primeira. Esta navegao

    sincronizada evita a perda do relacionamento entre as visualizaes e a repetio tediosada ao de navegao em cada uma das janelas, pelo usurio (NORTH;SHNEIDERMAN, 1997). Com isto, as tarefas do usurio, como fazer comparaes eexaminar diferentes pontos de vista, so agilizadas.

  • 7/25/2019 000624194

    35/106

    35

    Figura 3.2: Visualizaes coordenadas com valores do atributo Originmapeadospara cor

    O scrolling sincronizado pode ser usado para navegar atravs do mesmo conjunto dedados em todas as janelas ou atravs de mltiplos conjuntos correspondentes (NORTH;SHNEIDERMAN, 1997). No primeiro caso, por exemplo, quando editando umdocumento HTML (representao de texto) em uma janela, til simultaneamentevisualizar a sada desse documento (representao do layout) como uma pgina web, emoutra janela. No caso de conjuntos de dados diferentes, o Microsoft Word fornece

    scrolling sincronizado entre as janelas de documento, notas de rodap e anotaes. Odeslocamento atravs do documento provoca o deslocamento das listas de notas derodap e anotaes, para mostrar os itens que so referenciados dentro da atual partevisvel do documento.

    Os exemplos de scrolling sincronizado citados acima so uni-dimensionais. Noentanto, este tipo de coordenao pode tambm ser aplicado para representaes visuaisde dimensionalidade maior. O sistema DEVise (LIVNY et al., 1997), por exemplo,implementapanning sincronizado em 2D, permitindo que o usurio conecte o eixo x ouy de mltiplos grficos, para que estes mostrem sempre os mesmos domnios eintervalos.

    3.1.6Zoom Sincronizado

    O zoom sincronizado permite que duas ou mais visualizaes apresentem o mesmonvel de detalhamento. Se o usurio executa uma operao de zoom em umavisualizao, as visualizaes coordenadas a esta sero automaticamente atualizadas

    para refletir a mesma operao.

    O sistema DEVise (LIVNY et al., 1997), por exemplo, permite ao usuriosincronizadamente realizar zoom em mltiplos grficos 2D, que possuam eixos x ou yem comum. Da mesma forma, Chi et al. (1997) arranjou vrias visualizaes 3D

    pequenas em um grid e sincronizou suas operaes de zoom (ver figura 3.3). O zoom

    sincronizado pode ser aplicado com visualizaes que representam o mesmo conjuntode dados ou conjuntos diferentes (como DEVise).

  • 7/25/2019 000624194

    36/106

    36

    Figura 3.3: Mltiplas visualizaes 3D em grid (CHI et al., 1997)

    3.1.7Rotao Sincronizada

    Esse tipo de coordenao consiste apenas em sincronizar rotaes executadas noespao visual de diferentes visualizaes, de forma que a orientao rotacional seja a

    mesma em todas elas. Esta tcnica utilizada apenas em representaes 3D.O sistema de visualizaes em grid proposto por Chi et al. (1997) utiliza rotaes

    sincronizadas para permitir a visualizao de pontos oclusos dos objetos em cada clulado grid. Na figura 3.3, possvel observar que todas as visualizaes 3D do gridrepresentado possuem a mesma orientao rotacional.

    3.1.8Overviewe Detalhe

    Ao contrrio de todas as coordenaes descritas acima, o overview e detalhe nocorresponde ao mesmo tipo de interao nas visualizaes interligadas. Este tipo decoordenao envolve, geralmente, apenas duas visualizaes e estas so conectadas por

    interaes diferentes.A idia fornecer uma visualizao de overviewpara orientao e uma visualizao

    de detalhe para tarefas adicionais. Selecionando um item na viso overviewfaz com quea viso de detalhe seja automaticamente atualizada para exibir este item (e vice-versa).

    Note que a ao de seleo na vista overview corresponde a uma ao de navegao(panning ou zoom) na vista de detalhe, pois o conjunto inteiro de dados no pode serexibido simultaneamente nesta ltima vista. O overview fornece uma viso do conjuntode dados inteiro e, por isto, os itens so exibidos de forma bastante reduzida. O detalhe,ao contrrio, fornece informaes detalhadas de uma pequena parte do conjunto,exibindo-a em propores bem maiores que o overview.

    A figura 3.4 mostra a coordenao overview e detalhe na representao de rvores.A visualizao da esquerda mostra a representao reduzida da rvore (overview) e a

  • 7/25/2019 000624194

    37/106

    37

    visualizao da direita mostra em detalhe apenas a sub-rvore selecionada no overview.Nessa figura, a visualizao de detalhe apenas uma verso ampliada do overview.No entanto, a aparncia, ou at mesmo o contedo, pode mudar entre as visualizaesde overview e de detalhe (CARD, 1999). Por exemplo, no sistema SeeSoft (BALL;

    EICK, 1996), o texto do cdigo de um programa mostrado com a largura de um nicopixel na viso de overview, j na viso de detalhe, ele mostrado com letras. A grandemaioria dos sistemas que implementam a coordenao overview e detalhe representam omesmo conjunto de dados em ambas as visualizaes.

    Ter uma visualizao de overview dos dados apresenta muitas vantagens. Ooverview reduz o tempo de busca, permite a deteco de modelos gerais e ajuda ousurio a escolher o prximo movimento (NORTH; SHNEIDERMAN, 1997). Suacoordenao com a visualizao de detalhe permite ainda um acesso muito mais rpidoa informaes detalhadas.

    Figura 3.4: Coordenao de overview e detalhe no sistema PDQ Tree-browser(KUMAR; PLAISANT; SHNEIDERMAN, 1997)

    3.1.9Drill Down

    A coordenao drill downpermite ao usurio navegar atravs de sucessivas camadasde uma base de dados hierrquica, com visualizaes separadas para cada camada.Selecionando um item pai em uma visualizao, os itens filhos deste so carregados emuma outra visualizao, como ocorre no Windows Explorer. Este tipo de coordenaono costuma ser implementado de forma bidirecional, ou seja, a coordenao ocorresomente em um sentido (da visualizao que exibe itens pais para aquela que exibe itensfilhos).

    Esta coordenao torna possvel a explorao de dados hierrquicos com um grande

    nmero de camadas e ainda de conjuntos de dados com um grande nmero de itens, quesuportam agregaes. Agregaes so mostradas em uma visualizao e o contedo de

  • 7/25/2019 000624194

    38/106

    38

    uma agregao selecionada exibido em outra visualizao (FREDRIKSON et al.,1999). Por exemplo, a figura 3.5 mostra agregaes de itens pelo nmero de automveisenvolvidos em incidentes, no grfico superior da figura, e os incidentes com 2 carrosenvolvidos (agregao selecionada) so exibidos no grfico inferior da figura. Uma

    forma diferente de implementao da tcnica drill down utilizada no sistema Visage(ROTH et al., 1996). Neste ltimo, o usurio precisa arrastar uma agregao de itens deuma visualizao e solt-la em outra para ver seu contedo detalhado.

    Figura 3.5: Usando a coordenao drill downpara visualizar o contedo de agregaesno Snap-Together (FREDRIKSON et al., 1999)

    3.2 Sistemas de Mltiplas Visualizaes Coordenadas

    Sistemas de visualizaes coordenadas podem ser classificados por seus nveis deflexibilidade em manipulaes de dados, visualizaes e coordenaes (NORTH;SHNEIDERMAN, 2000). Sistemas flexveis em dados (nvel 1) permitem que osusurios carreguem conjuntos de dados diferentes nas visualizaes. Sistemas flexveisem visualizaes (nvel 2) permitem a escolha de diferentes conjuntos de visualizaes,conforme mais apropriado para os dados. J os sistemas flexveis em coordenaes

    permitem que usurios escolham diferentes tipos de coordenaes entre pares devisualizaes.

    A maioria dos sistemas de visualizaes coordenadas de nvel 1, ou seja, flexveispara dados, mas no para visualizaes ou coordenaes. Usurios podem carregar seusprprios dados, mas estes so sempre apresentados com a mesma interface.

    Sistemas de nvel 2 incluem flexibilidade na escolha de visualizaes. Ferramentascomo EDV (EICK; WILLS, 1995), Spotfire (AHLBERG; WISTRAND, 1995) e Visage(ROTH et al., 1996) podem representar conjuntos de dados atravs de muitas tcnicas

  • 7/25/2019 000624194

    39/106

    39

    de visualizao diferentes, escolhidas pelo usurio. Todas as visualizaes socoordenadas atravs da tcnica brushing-and-linking, o que permite o estabelecimentode relaes entre itens de dados em diferentes visualizaes.

    Finalmente, sistemas de nvel 3 incluem flexibilidade nas coordenaes entrevisualizaes. Alguns deles fornecem apenas um tipo de coordenao, mas deixam ousurio escolher quais visualizaes coordenar. Como em sistemas desse nvel ascoordenaes so dinmicas, importante que os mesmos disponham de algum mtodo

    para representar visualmente as coordenaes ativas entre pares de visualizaes. Oobjetivo disto evitar a desorientao do usurio, que pode esquecer facilmente quaisconexes estabeleceu. Ferramentas como Snap-Together (NORTH, 2000), GeoVISTAStudio (GAHEGAN et al., 2000), DEVise (LIVNY et al., 1997) e Improvise(WEAVER, 2004) apresentam flexibilidade nas coordenaes.

    Os sistemas DEVise e Improvise podem ser utilizados para a representao de dadosmultidimensionais, porm ambos no disponibilizam visualizaes que mostram todas

    as dimenses destes dados em uma nica representao visual. DEVise tem como nicavisualizao um plot 2D e Improvise oferece tambm plots 3D e algumas tabelas.Assim, a forma utilizada para representar simultaneamente n-dimenses de dados nestasferramentas a criao de mltiplos plots2D. Embora este tipo de representao nofaa parte do foco desse trabalho, importante mencionar que o mesmo permite autilizao de coordenaes interessantes (como panning e zoom sincronizado de plotscom eixos comuns), que so disponibilizadas por DEVise e Improvise. Um pontonegativo destas ferramentas que elas no oferecem um recurso visual de rpido acesso

    para o usurio verificar as coordenaes ativas.

    A aplicao apresentada nesse trabalho classificada como um sistema flexvel em

    dados, visualizaes e coordenaes, pois suporta a escolha dos dados a seremrepresentados, das visualizaes que formaro um cenrio, bem como tambm dascoordenaes que conectaro estas ltimas.

    A seguir, sero abordadas com maior detalhamento as ferramentas de visualizaescoordenadas que possuem uma relao mais forte com o presente trabalho. So elas:XmdvTool, Snap-Together e GeoVista Studio.

    Snap-Together e GeoVista Studio so flexveis em dados, visualizaes ecoordenaes, enquanto XmdvTool flexvel somente em dados e visualizaes. Estaltima ser abordada aqui por ser especfica para a visualizao de dadosmultidimensionais e apresentar tcnicas de coordenao relevantes para o trabalho.

    3.2.1XmdvTool

    A aplicao XmdvTool (WARD, 1994) (RUNDENSTEINER et al., 2002) tem comofoco a visualizao exploratria de conjuntos de dados multidimensionais. Pararepresentar estes dados, ela disponibiliza quatro tcnicas tradicionais: CoordenadasParalelas, Matriz de Scatter Plots, Glifos em Estrela e Pilha Dimensional. No entanto,como estas tcnicas geram grande confuso visual e sobreposio de objetos quandorepresentando conjuntos com grande nmero de itens de dados, XmdvTool forneceainda uma verso hierrquica para cada uma das tcnicas mencionadas. O usurio pode,ento, escolher qual verso de uma tcnica utilizar. A nica diferena entre uma tcnica

    hierrquica e sua verso tradicional est no fato de que a primeira possibilita ao usuriofiltrar hierarquicamente objetos de dados separados em clusters, por meio da interao

  • 7/25/2019 000624194

    40/106

    40

    com uma rvore de mnimos e mximos, onde intervalos de consultas so especificados(RUNDENSTEINER et al., 2002).

    As visualizaes geradas por essa ferramenta so todas interligadas por um conjuntofixo e pr-determinado de coordenaes e apenas duas visualizaes podem ser exibidassimultaneamente (uma visualizao principal e outra auxiliar). Alm disso, todas asvisualizaes representam o mesmo conjunto de dados. As caractersticas maisinteressantes dessa ferramenta, no entanto, so suas possibilidades de coordenao, queabrangem brushing-and-linkingn-dimensional, reordenao e filtragem sincronizada dedimenses, filtragem hierrquica de objetos de dados e mapeamento de dados para cor(ver figura 3.2 para um exemplo).

    Brushing-and-linking n-dimensional permite ao usurio selecionar, atravs demanipulao direta, regies diferentes para cada dimenso do conjunto de dados, asquais sero consideradas tambm em outras visualizaes devido coordenao. Logo,apenas os objetos de dados contidos inteiramente dentro da regio de brushing n-

    dimensional sero destacados em todas as visualizaes. Na figura 3.6, as imagens (c) e(d) mostram em roxo as regies de brushing n-dimensional definidas por um usuriointeragindo diretamente nestas representaes e as imagens (a) e (b) mostramdestacados (em vermelho) os dados contidos inteiramente dentro da regio de brushingdefinida. As tcnicas de visualizao da figura esto interligadas, devido a isto asregies de brushing de ambas so anlogas.

    A reordenao e filtragem sincronizada de dimenses so realizadas pelo usuriomodificando componentes grficos em uma janela independente das visualizaes. Afiltragem faz com que um eixo vertical seja retirado da visualizao CoordenadasParalelas, uma aresta (ou raio) da visualizao Glifos em Estrela e uma linha e uma

    coluna da Matriz de Scatter Plots. A reordenao sincronizada, diferentemente, apenasmuda a posio destes elementos nas visualizaes citadas, conforme determinado pelousurio.

    Embora o sistema XmdvTool apresente tcnicas de coordenao interessantes evariadas para visualizaes multidimensionais, ele no flexvel em coordenaes e no

    permite a criao de mltiplas visualizaes (apenas duas), restringindo a liberdade deusurios no processo de explorao de dados. Alm disso, ele emprega apenas uma

    possibilidade de mapeamento de dados para propriedades visuais, quando muitas outraspoderiam ser utilizadas.

    3.2.2Snap-TogetherSnap-Together (NORTH, 2000) uma ferramenta de propsito geral, que suporta a

    visualizao exploratria de conjuntos de dados de diversos tipos. Usurios podem criarcenrios com mltiplas visualizaes e coorden-las da forma que desejarem. Umacoordenao pode corresponder a aes diferentes em cada visualizao (por exemplo,uma seleo de itens correspondendo a uma operao de zoom), mas o conjunto deaes suportadas por cada representao visual limitado seleo de itens enavegao em janela (scroll, pan, zoom, load, etc.). Alm disso, muitas combinaes deaes no so possveis. As principais coordenaes suportadas por Snap-Together so:brushing-and-linking, overview e detalhe, drill downe scrollingsincronizado (NORTH,SHNEIDERMAN, 2000).

  • 7/25/2019 000624194

    41/106

    41

    Figura 3.6: Brushing-and-linking n-dimensional no sistema XmdvTool. Os dadosselecionados so exibidos nas imagens (a) e (b) em vermelho, e a regio de brushingque indica os dados de interesse mostrada nas imagens (c) e (d), no espao de um glifoem estrela e no espao de coordenadas paralelas, respectivamente.

    Essa ferramenta permite tambm que cada visualizao de um cenrio representegraficamente dados de tabelas diferentes, mas relacionadas. Para isto, Snap-Togetherutiliza um modelo conceitual baseado no modelo relacional. Usurios podem,interativamente, estabelecer relacionamentos entre tabelas de dados relacionadas,conectando um atributo de uma tabela com um atributo de outra. Este relacionamento utilizado pela aplicao para mapear dados de uma visualizao para a outra.

    Apesar de Snap-Together prover um conjunto amplo de tcnicas de visualizao,apenas Coordenadas Paralelas e a visualizao Tabela representam tcnicasmultidimensionais. Para estas tcnicas, as aes possveis so ainda mais limitadas:selection, highlight e load, para Coordenadas Paralelas, e selection, load e scrool, para a

    visualizao Tabela. A ao highlight(destaque) provoca o mesmo efeito visual que aao selection, mas difere desta ltima porque executada quando o usuriosimplesmente passa o mouse sobre um objeto de dado, destacando-o. A ao load, que

    permite apenas o recebimento de dados, utilizada para isolar itens de interesse,exibindo apenas estes ltimos na visualizao. Finalmente, a ao scroll faz com que a

    barra de scrollda visualizao Tabela seja deslocada para exibir um determinado itemde dado. Esta ltima ao tambm apenas recebe dados. A figura 3.7 mostra um cenrioconstrudo em Snap-Together, para a explorao de duas tabelas relacionadas de dadosmultidimensionais. A primeira tabela (com dados sobre o censo em estados dos EUA)foi relacionada segunda (com dados sobre o censo em cidades dos EUA) atravs doatributo nome do estado, contido em ambas. Este relacionamento que determina omapeamento de informaes da visualizao Coordenadas Paralelas, que representa a

    primeira tabela, para informaes nas visualizaes Scatter Plot e Tabela, que

  • 7/25/2019 000624194

    42/106

    42

    representam a segunda tabela de dados. Isto pode ser comprovado observando a figura3.7: a ao selectionda visualizao Coordenadas Paralelas est coordenada com a aoloadda visualizao Tabela, ento a seleo de um item na primeira representao, nocaso o estado California, causa a exibio de informaes acerca de todas as cidades

    deste estado, apenas, na segunda visualizao.

    Figura 3.7: Cenrio construdo em Snap-Together para a explorao de duas tabelasrelacionadas de dados multidimensionais