Proposta de um Módulo de Data Mining para um Sistema de ... · estratégia ou quais táticas...

Post on 13-Dec-2018

219 views 0 download

Transcript of Proposta de um Módulo de Data Mining para um Sistema de ... · estratégia ou quais táticas...

Proposta de um Módulo de Data Mining para um Sistema de Scout no Voleibol

Émerson Butzen Marques1, Luis Henrique Raimann1, Alexandre de Oliveira Zamberlam1, Alexandre José Hoher2

1Instituto de Ciências Exatas e Tecnológicas (ICET) – Centro Universitário Feevale (FEEVALE) - RS-239, 2755 – 93.352-000 – Novo Hamburgo – RS – Brasil

2Instituto de Ciências da Saúde (ICS) – Centro Universitário Feevale (FEEVALE) - RS-239, 2755 – 93.352-000 – Novo Hamburgo – RS – Brasil

{butzen, alexz, alexandreh}@feevale.br, luisraimann@gmail.com

Abstract. This paper aims to demonstrate the importance of data mining in the

decision support system, in this case, the athlete’s performance evaluation

systems (Scout). Many of these systems are statistical and bring unnecessary

data and information. Therefore, data mining aims to get true information and

information previously unknown, helping most accurately the staff technical of

the teams of volleyball. Finally, it is described an idea of data mining module

to scout system.

Resumo. Este artigo visa demonstrar a importância da mineração de dados

nos sistemas de apoio à tomada de decisão, neste caso, os sistemas de

avaliação de desempenho de atletas (Scout). Muitos desses sistemas são

estatísticos e acabam por trazer informações desnecessárias. Portanto, a

mineração de dados visa buscar informações mais confiáveis e informações

até então desconhecidas, auxiliando de maneira mais precisa as comissões

técnicas das equipes de voleibol. Finalmente, é apresentada a idéia de um

módulo de mineração de dados para o sistema de scout.

Introdução

A gestão administrativa, comumente, aplicada em empresas, no processo de tomada de decisão, também ocorre em equipes de voleibol e/ou em outros esportes, com a finalidade de gerar melhores resultados. Dentro desse universo de equipes esportivas, foram elaborados sistemas estatísticos de monitoramento de desempenho de atletas e de equipes, também conhecidos como sistemas de scout. Esses sistemas permitem às comissões técnicas decidir onde um jogador deve sacar, qual sua posição na quadra oferece maior rendimento, qual jogador substituir e por quem, que tipo de treinamento deve ser realizado para apurar um atleta e/ou a equipe toda (treino de fundamentos de voleibol, posicionamento, jogadas, saque, etc). Enfim, permitem qual a melhor estratégia ou quais táticas utilizarem, são situações as quais uma comissão técnica de voleibol deve estar atenta (ZAMBERLAM, 2005). Contudo, a quantia de informações (precisas/desnecessárias) é mesmo assim enorme, deixando o processo de decidir bastante empírico, ou seja, dependente da experiência do técnico ou de algum integrante da comissão técnica.

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

A mineração de dados (data mining) entra nesse campo com o intuito de descobrir informações mais precisas, evitando assim informações desnecessárias. Dessa forma, o objetivo deste trabalho é apresentar uma proposta de um módulo de data

mining para o sistema de scout do projeto de pesquisa “A IA entrando na quadra de vôlei: Scout Inteligente” (ZAMBERLAM, 2005).

Nos EUA, a mineração de dados já está sendo usada em um sistema de scout, o Advanced Scout (BHANDARI et al.,1997), que auxilia as comissões técnicas de basquete somente após os jogos e apenas uma técnica de mineração é aplicada.

O texto é dividido em cinco seções. A primeira seção trata sobre Mineração de Dados, mostrando as principais técnicas e aplicações. A seção 2 aborda o Scout

Voleibol, ou seja, o sistema de avaliação de desempenho de atletas. Nessa seção, são apresentados noções de funcionamento e uso desse sistema. A seção 3 apresenta uma proposta de módulo de data mining em um sistema de scout. Na seção 4, é descrito um trabalho correlato realizado na NBA (liga norte-americana de basquete). Finalmente, as considerações e as referências bibliográficas.

1. Data Mining

Segundo Wives (2004) apud (FELDENS et al., 1998) Data Mining ou Mineração de Dados é uma etapa, a mais importante, do processo de descoberta do conhecimento em banco de dados (Knowledge Discovery in Databases - KDD). Gonchoroski (2007) apud (CABENA et al., 1997) aponta que a mineração de dados é o processo de extrair informações válidas antes desconhecidas, de grandes bases de dados, auxiliando em decisões cruciais no mundo dos negócios. Para isso, data mining utiliza-se de técnicas ou algoritmos de áreas como Aprendizado de Máquinas, Estatística, Redes Neurais, Algoritmos Genéricos, etc (ELMASRI; NAVATHE, 2005). O mesmo autor aponta que a mineração de dados apóia o conhecimento indutivo, descobrindo novas regras e padrões nos dados minerados. Para Kantardzic (2003), os dois primeiros objetivos da mineração de dados são: a predição e a descrição. A predição utiliza algumas variáveis ou campos de um conjunto de dados para prever valores desconhecidos ou futuros de outras variáveis de interesse. A descrição concentra-se em encontrar padrões nos dados que possam ser interpretados por humanos.

Como a mineração de dados é uma parte do processo de descoberta do conhecimento, etapas (Figura 1) devem ser cumpridas antes de aplicar-se alguma técnica de data mining. Conforme Bramer (2007), os dados possivelmente vêm a partir de muitas fontes, estes dados devem ser integrados e armazenados em lugar comum. O próximo passo é a preparação dos dados, então é aplicada alguma técnica de mineração de dados, que produz uma saída na forma de regras ou em algum tipo de padrão.

Figura 1. Etapas até a Data Mining (adaptação dos autores)

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

Essas regras ou padrões são também conhecidos como modos de descoberta, os modos mais conhecidos são descridos abaixo.

Regras de Associação (Association Rules) – Cujo objetivo é encontrar qualquer relação existente entre os valores das variáveis (BRAMER, 2007). Para Kantardzic (2003), regras de associação é uma das principais técnicas de mineração de dados, através dela é possível recuperar todos os padrões interessantes em uma base de dados. Como, por exemplo, jogadas de uma equipe de vôlei em um set (parte de um jogo), com base na análise de jogadas de um jogo completo;

Agrupamento (Clustering) – Uma dada população de eventos ou novos itens podem ser particionados (segmentados) em conjuntos de elementos ‘padrões’ (ELMASRI; NAVATHE, 2005). Bramer (2007) confirma que os algoritmos de agrupamento analisam os dados para encontrar grupos de itens que são semelhantes. Um exemplo no vôlei é o agrupamento de dados dos fundamentos de saque e bloqueio, coletados em jogos de uma equipe, e organizados em faixas de desempenho.

Padrões seqüenciais (Sequential Patterns) – Elmasri e Navathe (2005) apontam que a técnica de padrões seqüenciais é a investigação de seqüências de ações ou eventos. Han e Kamber (2006) escrevem que é uma técnica desafiadora, pois pode gerar e/ou testar um número combinatório explosivo de seqüências intermediárias. Por exemplo, a seqüência de uma jogada (comportamento da defesa e/ou do ataque) da equipe de vôlei adversária após um saque da outra equipe.

Padrões com séries temporais (Time-Series Data) – Para Elmasri e Navathe (2005) esses padrões podem ser encontrados em posições de uma série temporal de dados, que é uma seqüência de dados capturada a intervalos regulares. Han e Kamber (2006) confirmam dizendo que séries temporais consistem em seqüências de valores ou medidas repetidas, excessivamente, em intervalos de tempos. Pode ser exemplificado como padrões de comportamentos de equipes de voleibol após determinada faixa de pontuação (aspecto emocional dos atletas).

Cada modo de descoberta de conhecimento corresponde a técnicas diferentes, não existe uma técnica que seja melhor que outra. Através da sua aplicação aos problemas, é que se terá uma avaliação de qual se adequou melhor. No caso de um sistema de scout, não será diferente, terão que ser aplicadas técnicas, a fim de analisar os resultados, para definir a melhor técnica.

2. Scout

Scout ou sistema de avaliação de desempenho de atletas são sistemas que capturam e processam informações estatísticas de desempenho dos atletas da equipe e da adversária. Porém, eles não levam em consideração o histórico do jogador de toda uma temporada (comportamento do atleta em outros jogos) e o contexto de uma partida de vôlei, ou seja, o comportamento do atleta nos diferentes níveis da partida. Um set (parte de uma partida) de vôlei possui basicamente três níveis. O terceiro nível, próximo do final, é o de maior tensão em que o físico e o emocional do atleta devem estar ajustados. Dessa forma, os sistemas atuais, simplesmente, repassam dados para a comissão, que avalia essa gama diversificada referente aos fundamentos básicos do vôlei e/ou jogadas realizadas pela equipe adversária, num tempo extremamente reduzido e toma decisões

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

relacionadas com aqueles dados relatados. Decisões muitas vezes baseadas mais no conhecimento empírico do técnico ou da comissão do que no fator racional real daquela situação (ZAMBERLAM et al., 2005).

Bizzocchi (2004) aponta que nos jogos olímpicos de 1984, os norte-americanos foram os responsáveis pela inclusão do computador na quadra de voleibol, tornando-se obrigatório também para treinamentos e elaboração de planos táticos e técnicos.

A seleção brasileira de vôlei, comandada pelo técnico Bernardo Rezende (Bernardinho), utiliza-se dos dois scouts: tático e técnico. O tático faz um mapeamento da quantidade, do percentual e do tipo de jogadas do time adversário; analisa tendências dos atletas (direções, preferências e posicionamentos). O scout técnico analisa o próprio time, como cada atleta se comporta em cada fundamento, qual seu aproveitamento final. Isso possibilita, por exemplo, elaborar quadros evolutivos de saque de um determinado atleta (BERNARDINHO, 2006). A planilha, encontrada na Figura 2, foi apresentada pelo técnico da seleção brasileira, com o objetivo de exemplificar a utilização da análise estatística nos jogos da seleção. Essa planilha apresenta os dados coletados durante os Jogos Olímpicos, realizado na Grécia, na data do dia 29 de agosto de 2004. O jogo em questão foi à final dos Jogos Olímpicos, realizado entre Brasil e Itália.

Assim, após a descrição do que é e qual a finalidade de um sistema scout, segue na próxima seção a apresentação da proposta de um módulo com mineração de dados para o um sistema de scout inteligente.

Figura 2. Planilha para análise estatística dos fundamentos de voleibol

(BERNARDINHO, 2006)

3. Proposta

Um sistema scout, como já escrito, é um sistema estatístico de monitoramento de atletas, auxiliando em decisões importantes na gestão de equipes. Entretanto, a quantidade de informações continua muito grande, deixando o processo de decidir dependente da experiência do técnico ou de algum integrante da comissão técnica.

Por isso, surge a idéia deste trabalho: desenvolver um módulo de mineração de dados para o sistema: “Scout: Sistema de Monitoramento em Equipes de Voleibol” desenvolvido por Raimann (2007), parte integrante do projeto de pesquisa “A IA entrando na quadra de vôlei: Scout Inteligente”. Para facilitar a visualização, a Figura 3 ilustra o que está sendo realizado e como o módulo de mineração faria parte do sistema scout.

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

O módulo de mineração irá interagir com a base de dados, fornecendo informações mais precisas à comissão técnica, evitando assim o uso de complicadas planilhas, pois existem grandes dificuldades nas leituras das planilhas, os dados que são inseridos não passam por nenhuma filtragem, não ressaltando aos olhos os problemas ou as vantagens das equipes na partida.

Figura 3. Esquema geral do scout inteligente (ZAMBERLAM, 2005)

Na Figura 4 é possível visualizar a estrutura do banco de dados do sistema de scout desenvolvido por Raimann (2007), a fim de ilustrar em quais dados a mineração deverá atuar.

Figura 4. Modelagem do banco de dados do sistema scout (RAIMANN, 2007).

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

Através dessa estrutura dá para perceber a quantidade de dados que uma partida de voleibol pode gerar. O processo se inicia a partir do cadastro das equipes e seus atletas. Depois de cadastradas, são informados os jogadores que entram em quadra para a partida (duas equipes por partida). Por meio desses dados será controlada a rotação do jogo, que será realizada automaticamente pelo sistema. A partir desse ponto, dar-se-á a entrada de dados pelos scouters (pessoas que ficam na quadra cadastrando cada jogada e substituições ocorridas durante a partida). Após a partida ou set (para maiores detalhes sobre a dinâmica do voleibol, consulte (BIZZOCCHI, 2004)) é que o módulo de mineração de dados entrará em ação, através de uma das técnicas de mineração de dados, o módulo irá gerar relatórios para a comissão técnica, assim podendo tomar decisões para melhorar o desempenho ou corrigirem falhas de sua equipe. Por exemplo:

� Relatório de jogadas de uma equipe de vôlei em um set, com base na análise de jogadas de um jogo completo pressupondo o uso da técnica de regras de associação;

� Relatório com agrupamento de dados dos fundamentos de saque e bloqueio, coletados em jogos de uma equipe, e organizados em faixas de aproveitamento, técnica de agrupamento;

� Visualização de um comportamento padrão (seqüência de jogadas) da defesa de uma equipe de vôlei adversária após um saque da outra equipe. Técnica de padrões seqüências.

� Visualização de padrões de comportamentos de equipes de voleibol após determinada faixa de pontuação (aspecto emocional dos atletas), técnica de padrões com séries temporais;

Esses exemplos mostram informações importantes para uma comissão técnica de uma equipe de vôlei, pois são resultados que podem ser percebidos durante a partida, não após a partida como acontece geralmente nos sistemas de scout, em alguns sistemas, essas informações são levantadas manualmente, após isso, apresentadas às suas comissões técnicas.

Com esse sistema e esse módulo de data mining, espera-se que equipes que não tenham condições de adquirir um sistema de scout pago tenham melhores condições de desenvolver os fundamentos ineficientes de cada atleta, e obter estratégias de jogo num menor tempo, auxiliando a comissão técnica na sua tomada de decisão, elevando assim a qualidade do voleibol praticado pelas equipes. A seguir, um trabalho que realizou a integração entre processo de decisão e mineração de dados em um sistema de avaliação de desempenho.

4. Trabalho correlato - Advanced Scout: Data Mining and Knowledge

Discovery in NBA Data

Em (BHANDARI et al.,1997), é apresentado o software Advanced Scout (AS). Esse software procura e descobre padrões interessantes em dados de jogos da NBA (liga norte-americana de basquete). Sua primeira utilização se deu na temporada 1995-1996, onde dezesseis das vinte e nove equipes o receberam para avaliação. As comissões técnicas o avaliaram positivamente, afirmando ser uma valiosa ferramenta. Esse

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

software trabalha em quatro etapas: coleta de dados, pré-processamento, mineração de dados e interpretação do conhecimento descoberto.

A coleta de dados é feita por um software especialmente desenhado para o registro de dados de basquete. Esses dados são armazenados em uma base de dados comum a todas as equipes de basquete. Posteriormente, as equipes realizam o download dessa base de dados e a manipulam de forma independente e sigilosa.

O pré-processamento é feito após o download da base de dados. O AS permite realizar uma série de consistências na base de dados, visto que informações errôneas permitiriam interpretações erradas dos dados, assim os dados errados são corrigidos por meio de regras base ou através de alguém que tenha domínio do assunto. Após a consistência, os dados são transformados e reformatados. Os dados brutos são reformatados na forma de fichas de jogo, que são familiares para as comissões técnicas que, assim, analisam os eventos discretos (padrões) de um jogo. Nessa fase os dados são enriquecidos através da verificação das regras ou da entrada de dados adicionais.

A mineração de dados no AS ocorre quando um membro da comissão técnica inicia uma consulta geral. Automaticamente a mineração de dados procura por padrões interessantes na equipe da casa ou na visitante, em busca dos arremessos à cesta de basquete (um dos fundamentos do basquete, por exemplo), detectando o percentual padrão de desempenho (aproveitamento). As análises posteriores podem incluir consultas mais específicas em torno de atributos (como por exemplo, o jogador, a função do jogador, lado da quadra, etc.) ou fundamentos particulares (rebote, arremesso, etc.). A técnica de mineração de dados utilizada no AS é conhecida como Attribute

Focusing (AF) (BHANDARI, 1995).

A interpretação do conhecimento descoberto é a forma como o resultado da mineração de dados é mostrada. No AS, os resultado são vistos de duas formas: através de uma descrição textual ou gráfica. O objetivo é que os resultados sejam compreendidos facilmente pela comissão técnica. O processo de interpretação de padrões representa a descoberta de conhecimento e exige, normalmente, alguém que tenha domínio do assunto. Essa interpretação é facilitada pela possibilidade do usuário ter várias formas de aprofundar a análise interativamente para obter informações adicionais ao resultado.

5. Considerações Finais

A pesquisa apresentada neste artigo visa o estudo e o desenvolvimento de um módulo de mineração de dados para o sistema: “Scout: Sistema de Monitoramento em Equipes de Voleibol” desenvolvido por Raimann (2007).

Para a validação dessa proposta, serão coletados dados de partidas de vôlei de diversas equipes. Esses dados serão submetidos ao módulo de data mining, e os resultados serão analisados por comissões técnicas de equipes de voleibol.

Espera-se que novos trabalhos sejam desenvolvidos, como a adaptação desse módulo a outras plataformas de sistemas de scout.

Referências

BERNARDINHO. (2006) Transformando suor em ouro. Rio de Janeiro, RJ: Sextante.

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.

BHANDARI, Inderpal. (1995). “Attribute Focusing: Data mining for the layman” (Research Report RC 20136). IBM T.J. Watson Research Center.

BHANDARI, Inderpal; COLET, Edward; PARKER, Jennifer; PINES, Zachary; PRATAP, Rajiv; RAMANUJAM, Krishnakumar. (1997) Advanced Scout: Data Mining and Knowledge Discovery in NBA Data. Data Mining and Knowledge Discovery, Data Mining and Knowledge Discovery, Kluwer Academic Publishers, Vol. 1, No. 1, p. 121-125.

BINDER, Fábio Vinícius. (1994) Sistemas de apoio à decisão. São Paulo, SP: Érica.

BIZZOCCHI, Carlos “Cacá”. (2004) O voleibol de alto nível: da iniciação à competição. Barueri, SP: Ed. Manole.

BRAMER, Max. (2007) Principles of Data Mining (Undergraduate Topics in Computer Science). Londres, Inglaterra: Springer-Verlag London Ltd.

ELMASRI, Ramez; NAVATHE, Shamkant B. (2005) Sistemas de banco de dados. 4. ed. São Paulo, SP: Pearson Addison Wesley.

FREITAS, Henrique; BECKER, Joao Luiz; KLADIS, Constantin Metaxa; HOPPEN, Norberto. (1997) Informação e decisão: sistemas de apoio e seu impacto. Porto Alegre, RS: Ortiz.

GIUDICI, Paolo. (2003) Applied Data Mining: Statistical Methods for Business and Industry. Chichester, West Sussex, Inglaterra: John Wiley & Sons Ltd.

GONCHOROSKI, Sidinei Pereira. (2007) Utilização de técnicas de KDD em um call center ativo. Novo Hamburgo, RS. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Ciências Exatas e Tecnológicas, Feevale.

HAN, Jiawei; KAMBER, Micheline, (2006) Data Mining Concepts and Techniques. São Francisco, Califórnia, EUA: Morgan Kaufman Publishers.

KANTARDZIC, Mehmed. (2003) Data Mining: Conceps, Models, Methods, and Algotithms. Hoboken, Nova Jersey, EUA: John Wiley & Sons Inc.

MARTIN, James. (1984) An information systems manifesto. Englewood Cliffs, Nova Jersey, EUA: Prentice-Hall.

RAIMANN, Luís Henrique, (2007) Scout: Sistema de monitoração em equipes de voleibol. Novo Hamburgo, RS. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Instituto de Ciências Exatas e Tecnológicas, Feevale.

ZAMBERLAM, Alexandre de Oliveira; WIVES, Leandro Krug; GOULART, Rodrigo Rafael Villarreal; SILVEIRA, Roni Gilberto. (2005) A IA entrando na quadra de vôlei: scout inteligente. Hífen, Uruguaiana, RS , v.29, n.55/56.

WIVES, Leandro Krug. (2004) Utilizando Conceitos como descritores de Textos para o processo de identificação de conglomerados (clustering) de documentos. Porto Alegre, RS. Tese (Doutorado em Ciência da Computação). Instituto de Informática, UFRGS.

WAGNER, Eduardo Antonio. (2007) Utilizando data mining em pesquisa de clima organizacional. Novo Hamburgo, RS. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Instituto de Ciências Exatas e Tecnológicas, Feevale.

Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1Santa Maria - RS, junho de 2008.