hadoop é o ecossistema para big data

Post on 07-Jan-2017

220 views 2 download

Transcript of hadoop é o ecossistema para big data

Leandro EscobarLeandro.escobar@up.edu.br

PENSE BEM...

Até 70% dos dados são INATIVOSAPPFLUENT

Empresas UTILIZAM 15% dos dados disponíveisGARTNER

Em média, 65% dos atributos (campos) NÃO POSSUEM QUALIDADE suficiente para serem analisadosPesquisas acadêmicas Boa parte dos DADOS

INACESSÍVEIS estão dentro da empresa, mas EM SILOS

DAVENPORT

NO COMEÇO...

Ciência de

Dados

EstatísticaVisualização

Mineração

de Dados

Mineração

de Dados

Computação cognitiva

Aprendizado

de máquina

Reconhecimento

de padrões

LIMITAÇÃO DA ARQUITETURA

OS DADOS SÃO TRAZIDOS ATÉ A LÓGICA DO

PROGRAMA

A lógica fica centralizada nos

servidores

UMA NOVA ABORDAGEM

LEVAR A COMPUTAÇÃO ATÉ OS DADOS...

A lógica é distribuída

UMA NOVA ABORDAGEM

LEVAR A COMPUTAÇÃO ATÉ OS DADOS...

PARADIGMA DISTRIBUÍDO - MapReduce

BIG DATA

BIG DATA

VOLUME

De TeraBytes Para YotaBytes!

VARIEDADE

De dados estruturados

Para todo tipo de dados!

VELOCIDADE

De captação lenta

Para streaming de dados!

HADOOP É O ECOSSISTEMA PARA BIG DATA

A linguagem de programação que prevalece é o

POSSIBILIDADES DO BIG DATAACELERAR INTEGRAÇÕE DE DADOS

INSTITUIÇÃO DE ENSINO SUPERIOR ON LINESem Hadoop: 5 dias para gerar os indicadoresCom Hadoop: 2 horas

POSSIBILIDADES DO BIG DATAGEORREFERENCIAMENTO – ANTECIPAR A OCORRÊNCIA DE EVENTOS: Ex EPIDEMIAS

SINAN(Registro de casos de Dengue)

IBGE(Pnad)

MOTEOROLOGIA ONLINE(Accuweather)

POSSIBILIDADES DO BIG DATAMÁQUINAS DE RECOMENDAÇÃO – OFERECER OS PRODUTOS COM MAIOR POTENCIAL

POSSIBILIDADES DO BIG DATAANÁLISE DE SENTIMENTOS – SABER O QUE AS PESSOAS FALAM SOBRE AS EMPRESAS

POSSIBILIDADES DO BIG DATAANÁLISE DE REDES SOCIAIS – ANTECIPAR AMEAÇAS DE FRAUDES

- Relacionamento com fraudadores conhecidos: Novos consumidores que estão ligados a fraudadores;

- Redes extraordinariamente grandes e diversificadas: Grandes grupo, que surgem rapidamente, podem indicar um golpe prestes a ocorrer

- Anomalias estatísticas: As famílias que compartilham muitos sobrenomes ou diferentes indivíduos que compartilham os mesmos bens

POSSIBILIDADES DO BIG DATAANÁLISE DE REDES SOCIAIS– IDENTIFICAÇÃO DE PESSOAS INFLUENTES

• Oferecer produtos

• Formar opiniões

• Divulgar eventos

POSSIBILIDADES DO BIG DATAPREVISÃO DE EVENTOS– CONTROLE IOT– PREVISÃO DE DEFEITOS OU FALHAS

Conectar diferentes equipamentosAnalisar dados e prever eventos

BIG DATA NA UNIVERSIDADE POSITIVO

Projetos:- Monitoramento da velocidade da frota em tempo real

(Projeto Global)- Otimização no atendimento a incidentes- Previsão de demanda de lasanhas: BRF- Recomendação de estoques para loja de motocicletas- Análise de tendência de vendas de produtos em mercados, para

decisão de compra- Identificação de futuros pacientes de alto risco: Cliente sob sigilo- Apoio ao diagnóstico médico: Médicos sem fronteiras- Alertas de riscos de epidemias: Secretaria de Saúde do Paraná- Georreferenciamento de crises endêmicas: Secretaria de Saúde do

Paraná- Alertas de evasão de alunos: UP- Máquinas de recomendação para retenção de alunos: UP- Analise de expressões faciais durante as compras- Máquina de recomendação para e-commerce- Previsão de compras em empresas de varejo

O BIG DATA NOS PERMITE CONHECER AS PESSOAS, SEUS HÁBITOS, NECESSIDADES E DESEJOS, bem como ANTECIPAR EVENTOS E COMPORTAMENTOS

Dúvidas????

Leandro EscobarLeandro.escobar@up.edu.br

Muito obrigado!