Post on 24-May-2015
description
Super CrunchersPor que pensar com números e a nova maneira de ser
inteligente.
Quem concorda?
• A terra gira em torno do sol
• O ser humano evoluiu do macaco
• Um programa é melhor que um sommelier
Qualidade do vinho
12,145
+ 0,00117 . chuva no inverno
+ 0,0614 . temperatura média no crescimento
- 0,00386 . chuva na colheira
• Doutor MIT
• Professor de Yale
• Editor do Journal of Economics, Law and Organization
especialistas vs. analistas
• Estatística como um “telescópio” social
• Especialistas se tornam obsoletos
• Déficits cognitivos
• Nos agarramos a verdades
• Não lidamos bem com múltiplas informações
Origem•Armazenamento de dados•Parâmetro comprativo
Armazenamento de dados
• Aumento de 100 milhões desde 1956
• 1 terabyte
• 1.000 gigabytes
• US$ 400
Parâmetro comparativo
• Biblioteca do Congresso
• Maior do mundo em espaço em prateleiras
• 30 milhões de livros
• 58 milhões de manuscritos
• 20 tera de texto
• Walmart - 540 tera
• Google - 4 petabytes
Para que serve?
• Geeklogik• Axcion Corp.
Acxiom Corp.
• líder mundial em integração de dados
• 20 bilhões de registros sobre consumidores
• 850 terabytes de dados
• Inferências
• 70 perfis
Técnicas usadas
•regressão•testes randômicos•redes neurais
1. Regressão
• Reúne dados históricos
• Estima fatores causais que influenciam uma variável
• Usa dados passados para prever o futuro
Regressão “do mal• Serve empresas
engajadas em “concorrência analítica”
• 65% dos maiores estabelecimentos comerciais do mundo
• 70% cias aéreas, 40% bancos
• Walmart, Cassino Harrat
Regressão “do bem”• Forecast.com
• Comprou 50 bilhões de preços
• Definiu 115 indicadores
• Olha padrões históricos
• Seguro de US$ 10
• Zillow.com
• Dusknetwork
• Acelerador web do Google
2. Testes randômicos
• Funcionamento
• Depende do tamanho da mostra
• Certeza que os grupos são estatisticamente iguais
• Intervenção, tratamento diferenciado
Testes randômicos “do mal”
• Credit Indemnity
• 50 mil solicitações a ex-clientes
• Variação de taxas de juros: 3,25% a 11,75%
• Descobertas:
• Foto de mulher ou telefonema +4,5%
Testes randômicos “do bem”
• Seva Mandir
• Escolas rurais com 50% de faltas
• 120 comunidades, 2 grupos
• Máquina fotográfica
• Redução de faltas para quase 0%
3. Redes neurais
• Computador programado para atualizar respostas com base em dados novos
• Busca padrões mudando o peso de variáveis
• Problemas:
• Não explica como estabeleceu pesos
• Sobreadequação
Redes neurais e Epagogix
• Trabalhando em silêncio
• Prever rendimento bruto de filmes baseado em roteiro
• Resultado: 6 de 9 rendimentos precisos
• Mesmo dinheiro, sem estrelas
• Máquina vs. artistas: margem para experimentar
Obrigado
Juliano@naozero.com.br
www.naozero.com.br