Post on 12-Jul-2020
Análise e Modelagem de Processos
Introdução – Data Science e Big Data
Silvana Pereira Detro
• Data Science• Internet de Eventos• Big Data• Mineração de dados e de processo• Mineração de dados• Etapas do Knowledge Discovery Databases (KDD)• Métodos de Mineração de dados• Mineração de processos x Mineração de Dados
Engenharia de Produção 2
A importância dos dados
Nos últimos 10 minutos, nos geramos mais dados desde o tempo pré‐histórico até 2003
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)
Engenharia de Produção 3
Geração de dados
Comprando um café
Reabastecendo o carro
Fazendo uma ligação telefônica
Ajustando a temperatura
Enviando um e‐mail
Marcando uma consulta
Assistindo uma série
Engenharia de Produção 4
Geração de dados
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 5
Internet de eventos
Internet ofContent
Internet ofPeople
Internet ofThings
Internet ofplaces
Internet of events
“Big data” “Social” “Cloud” “Mobility”
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 6
Dados de eventos
Engenharia de Produção 7
Big Data
• Lei de Moore
• Outros exemplos:• Poder de computação• Capacidade de discos• …
2 = 1.048.576x em 40 anos
Engenharia de Produção 8
Big Data
• 2014 ‐ a quantidade de informação digital armazenada excedeu 4 zettabytes
• 2020: o “universo digital” irá crescer para 44 zettabytes
Engenharia de Produção 9
Questão 1,5 x 60 x 60 / 220 = 0,00515 segundos
Há 40 anos, uma viagem de trem de Eindhoven até Amsterdam levava aproximadamente 1,5 horas.
Quanto tempo levaria hoje, se a tecnologia de transporte seguisse a lei de Moore?
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 10
Questão 7 x 60 x 60 / 220 = 0,0240 segundos
Há 40 anos, uma viagem de avião de Amsterdam até Nova York
levava aproximadamente 7 horas.
Quanto tempo levaria hoje, se a tecnologia de transporte seguisse
a lei de Moore?
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 11
Como extrair valor dos dados?
Engenharia de Produção 12
5 V’s do Big Data
Volume Variedade Velocidade Veracidade
Big Data
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)
Valor
Engenharia de Produção 13
Os dados NÃO precisam ser “Big” para serem desafiadores
Questões envolvendo análise de dados estão por todas as partes!
Engenharia de Produção 14
Extrair VALOR dos dados!
Engenharia de Produção 15
Engenharia de Produção
Questões genéricas sobre a ciência dos dados
O queaconteceu?
Por quêaconteceu?
O que iráacontecer?
O quede melhor
podeacontecer?
16
Perguntas respondidas pela ciência de dados
Por quê os clientes precisam esperar tanto esperar tanto?Os colaboradores
seguem as diretrizes organizacionais?
Podemos prever os tempos de espera?
Quantos funcionários precisaremos amanhã?
Como podemos reduzir os custos?
Engenharia de Produção 17
Como as máquinas são utilizadas?
Quando e por quê as máquinas apresentam
falhas?
Quais componentes defeituosos podem ser
substituídos?
Podemos prever se uma máquina irá falhar na próxima
semana?
Quais as partes que precisam ser melhoradas?
Perguntas do nível organizacional até os níveis de hardware/software
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 18
Foco desta disciplina
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 19
Mineração de dados
• “A análise de conjuntos de dados (geralmente grandes) para encontrar relacionamentos e resumir os dados de maneiras novas, que são compreensíveis e úteis para o proprietário dos dados” (Hand et al., 2001).
Google Flu Trends data, África do SulEngenharia de Produção 20
Mineração de dados
• Extração de conhecimento de grandes volumes de dados;
• “data snooping", “fishing" e “data dredging";
• Centrada nos dados e não no processo;
• Consistem em um dos processos de KDD (Knowledge Discovery in Databases)
Engenharia de Produção 21
Mineração de processos
• Posicionamento
Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 22
Mineração de processos x Mineração de dados
• Começam a partir de dados
• Técnicas de mineração de dados geralmente não são centradas no processo;
• Técnicas tradicionais de mineração de dados não abordam tópicos como descoberta de processo, verificação de conformidade e análise de gargalo.
Engenharia de Produção 23
Mineração de processos x Mineração de dados
• Os modelos de processo de ponta‐a‐ponta (end‐to‐end) e a concorrência (concurrency) são essenciais para a mineração de processos;
• A mineração de processos assume logs de eventos onde os eventos têm timestamps (horário de início e fim) e referem‐se aos casos (cases), ou seja, instâncias do processo;
• A mineração de processos e a mineração de dados precisam ser combinadas para questões mais avançadas.
Engenharia de Produção 24
Referências
• Camilo, C.O. e Silva, J.C. 2009. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas. Instituto de Informática. Universidade Federal de Goiás.
• Google Flu Trends. Disponível em: https://www.google.org/flutrends/about/• Han, J., Pei, J. and Kamber, M., 2011. Data mining: concepts and techniques. Elsevier.• Hand, D., Mannila, H. and Smyth. P. Principles of Data Mining. MIT Press, Cambridge, MA, 2001.
• Van der Aalst, W.M.P. 2011. Process Mining Discovery, Conformance and Enhancement of Business Processes. Springer Heidelberg Dordrecht London New York.
• Van der Aalst, W.M.P. 2016. Data Science in Action: Process Mining. Second Edition, Springer.
• Witten, I.H., Frank, E., Hall, M.A., Pal, C.J. 2016. Data Mining: Practical MachineLearning Tools and Techniques. Morgan Kauffman.
Engenharia de Produção 25