Machine Learning Redes Neurais Além da fraude com inteligência artificial
www.tesla-ads.com [email protected]
o Empresa o Mercado o O que é aprendizado de máquina o Porque usar para prevenção de fraudes o Como aplicar ao seu negócio o ADS Platform
Empresa A Tesla ADS é uma empresa com foco em sistemas integrados e
automatizados de decisão. Como integrante do Startup Program da SAP e AWS Activate da Amazon
Web Services, nossas plataformas de serviços rodam usando o conjunto das melhores tecnologias do mercado, para servir como base para criação dos modelos de inteligência artificial.
Mercado
Fraudes em Cartão de Crédito
https://www.spcbrasil.org.br/ spc_brasil_apresentacao_pesquisa_fraudes_20141.pdf
Cartão de crédito clonado: Ø 53% Descobriu conferindo a fatura Ø 72% Cancelaram o cartão de crédito
Ø 63% Foram res=tuídos integralmente
Ø 66% Ficaram mais criteriozos com o uso do cartão
Cartão de crédito é o quinto lugar em nas
fraudes mais ocorridas
Fraudes em Cartão de Crédito
http://noticias.serasaexperian.com.br/maio-registra-161-102-tentativas-de-fraude-contra-o-consumidor-revela-indicador-serasa-experian/ Maio de 2015 registrou: -161.102 tentativas de fraude conhecida como roubo de identidade - Uma tentativa de fraude a cada 16,6 segundos no país.
Fraudes em Seguros http://www.cnseg.org.br/cnseg/servicos-apoio/noticias/ fraude-prejudica-todo-o-sistema-de-seguros.html A Confederação Nacional das Empresas de Seguros Gerais, Previdência Privada e Vida, Saúde Suplementar e Capitalização (CNseg) Como um câncer, a fraude prejudica todo o sistema de seguros. Os impactos da fraude não só para a seguradora, mas também para toda a sociedade, uma vez que isso gera aumento do preço do seguro e prejudica a entrada de novos consumidores. “Sem novos entrantes no mercado, fica mais complicado ter preços mais acessíveis”
Fraudes em Seguros http://www.cnseg.org.br/cnseg/servicos-apoio/noticias/ fraude-prejudica-todo-o-sistema-de-seguros.html Em números, as fraudes comprovadas, sem considerar previdência, saúde e capitalização, somaram R$ 448 milhões em 2014, ou seja, 1,7% em relação aos sinistros avisados dos Seguros Gerais. Em 2013, as fraudes totalizaram R$ 350 milhões (1,5%) e em 2012, R$ 340 milhões (1,2%). “Se colocar esse índice em cima dos sinistros suspeitos, o indicador sobe para 20%. Em cima dos sinistros investigados, avança para 25%.
O que é aprendizado de máquina
(machine learning)
Exemplos de Machine Learning As regras da estrada não funcionam aqui.
Exemplos de Machine Learning Minhas compras fazem o sistema aprender.
Meu feedback ensina o sistema a se aprimorar e evoluir
Exemplos de Machine Learning
Marcar os casos ensina o sistema a melhorar e evoluir
Compras anteriores fazem o sistema aprender.
Machine Learning é… “Sistemas inteligentes que aprendem automaticamente,
preveem e agem usando dados”
APRENDER PREVEEM
AGEM
“sem regras predefinidas"
Porque usar para prevenção de fraudes
Fraude é adversa
Disciplinas como otimização para
ferramentas de busca tem competidores de acordo com regras…
...prevenção de fraude tem
adversários hostis propositalmente
quebrando as regras
Padrões de Fraudes mudam rapidamente
Regras geradas por humanos não evoluem
rápido suficiente
Cada barra é um dia
Esta é $691,000
Fraude é de cauda-longa
Soma dos casos menores é mais danosa que os casos
maiores
país
varejo
emissor
cartão
valor
Regras Humanas Vs Modelos de Máquina Regras Humanas Olhar para todas transações para cada varejo nos úl=mos 30 dias Calcular a taixa de de desvio padrão do declínio para cada varejo por dia. Criar uma regra para cada segmento de varejo Ação: Negar transações quando a taixe de declínio aumentar no fator de 3x.
Um tamanho para todas regras, muitas revisões manuais
Modelos de Máquina(Redes Neurais) Olhar para todas transações negadas para cada varejo nos úl=mos 3 anos usando princípios de Big Data Calcular a taixa padrão de desvio para cada varejo por dia, por hora, localização, milhares de maneiras... Criar um modelo probabilís=co para cada varejo para capturar as nuâncias de cada um. Ação: Negar transações quando a probabilidade da taixa de declínio aumentar o risco além do normal dependendo do comportamento do lojista
Modelos probabilísticos encontram nuâncias de cada caso
Como aplicar ao seu negócio
Visão do processo
Processo de aprendizado
Passos para criação da Rede Neural
Pegar Dados
Design Modelo
Treinar/Testar Comparar Publicar
1. Pegar dados - dados históricos, terceiros, dados proprietátios.
2. Design do Modelo – Desenhar as funcionalidades do modelo que irão inferir no comportamento.
3. Treinar/Testar – Aprendizado supervisionado. Inferir uma função de dados nomeados consiste em exemplos de treinamento.
4. Comparação – Comparar contra a base, performance contra base atual para entender melhorias de performance.
5. Publicação – Prover novas configurações da caixa de areia para ambiente de produção
Muitas escolhas para treinar as Redes Neurais
Modelos probabilísticos encontram nuâncias de cada caso
Qual é uma zebra?
Métodos
Como sabemos que funciona?
ü ROC Curves
ü Ranges de detecção
ü Ranges de Falso Positivo
ü Objetivo: Maior taixa de detecção com menor taixa de falso positivo
MEDINDO E AVALIANDO A PERFORMANCE DA REDE
O que você precisa Infraestrutura
Storage Memória Processadores Largura de banda
Time Cientistas de dados Engenheiros Analista
Dados Base treinamento Over/Undersampling Overfitting
Sistema de predição em que a linha verde representa um modelo sobreajustado e a linha preta um modelo regularizado.
Intuição Humana ainda é necessária
hPp://www.tylervigen.com/view_correla=on?id=2948
Quebrando as regras Humanos+computadores=máquina definitiva de previsão
Entendível Escala de Big-Data
Fácil de usar – Machine Learning para todos
Aprendizado de Máquina Contínuo
“Testes de caixa branca para análises diárias” “Em memória ,
distribuída”
“democratizar o acesso para aprendizado estatístico avançado”
ADS Platform
ADS Platform A ADS Pla]orm roda 100% em memória no topo do SAP HANA e dentro da melhor
infraestrutura de cloud compu=ng do mercado, atendendo aos mais exigentes compliances como PCI-‐DSS e HIPPA.
Através do treinamento das nossas Redes Neurais com quan=dades massivas de dados, nossos modelos de IA aprendem e reconhecem novos padrões automa=camente, sem necessidade de reescrever código.
ADS Platform ü Precisão de 96% em menos de 1,5 s
ü Análises geográficas em tempo real
ü %Erro: ADS Platform 4% Vs +40% Processo tradicional Proposta de valor ü Redução de risco e custo
ü Tempo de resposta instantâneo
Sistema atual de tomada de decisões tornou-se completamente obsoleto.
ADS Platform - Telas ü Dashboard
ü Contendo o resumo diário e mensal dos modelos das redes neurais
ü Geoint (Geoprocessamento+inteligência)
ADS Platform - Telas ü Aplicação
Para testar manualmente os modelos das redes.
ADS Platform - Telas ü API
Token e documentação da API para integração, com resumo das chamadas
Machine Learning Redes Neurais Além da fraude com inteligência artificial
www.tesla-ads.com [email protected]
Obrigado
Top Related