AlfaCon LABs - Meetup Machine Learning (03/07/2014)

Machine Learning

Conceitos sobre aprendizagem de Máquina

A ideia

Problema Solução

Perguntas Respostas

Concept

Machine Learning (Aprendizado de Máquina) é uma área de

IA cujo objetivo é o desenvolvimento de técnicas

computacionais sobre o aprendizado bem como a construção

de sistemas capazes de adquirir conhecimento de forma

automática.

Um sistema de aprendizado é um programa de computador

que toma decisões baseado em experiências acumuladas

através da solução bem sucedida de problemas anteriores.

Definição

É a área de estudo que dá aos computadores a capacidade de

aprender sem serem explicitamente programados.

Diz-se que é um problema de Machine Learning quando:

Um programa de computador (P) aprende a partir da experiência

(E) na realização de uma determinada tarefa (T) e com uma

determinada medida de performance (Pe).

Se sua Pe aumenta na realização de T, aumenta E.

A inferência indutiva

A indução é a forma de inferência lógica que permite obter conclusões genéricas sobre um conjunto particular de

exemplos.

Na indução, um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados.

Portanto, as hipóteses geradas através da inferência indutiva podem ou não preservar a verdade.

Arquimedes KeplerDarwin

Formas de Aprendizado Indutivo

• SUPERVISIONADO

No aprendizado supervisionado é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de

exemplos de treinamento para os quais o rótulo da classe associada é conhecido.

• NÃO SUPERVISIONADO

No aprendizado não-supervisionado, o indutor analisa os exemplos fornecidos e tenta

determinar se alguns deles podem ser agrupados de alguma maneira, formando

agrupamentos ou clusters

Fluxograma

Aprendizado

Indutivo

Aprendizado

Supervisionado

Classificação Regressão

Aprendizado

Não

Supervisionado

SUPERVISIONADO

Requisitos:

Deve haver dados de treino. Todos os algoritmos supervisionados devem ser “treinados” com dados previamente

separados para esse fim.

• Regressão Logística: Faz previsão de dados contínuos (Preços, quantidades, temperaturas, etc)

• Classificação: Faz previsão de dados discretos. (Verificar spam, operações fraudulentas online, tipo de imagem, etc)

Não Supervisionado

Deixamos o computador aprender por si.

Através de um conjuntos de dados, o algoritmo deve ser capaz de identificar clusters (grupos distintos)

Ex. Agrupar notícias sobre o mesmo assunto

Modelos

Exemplos

Regressão Logística

Prever o valor de venda de casas, sabendo o tamanho em m², o número de quartos e a respectiva idade.

Classificação

Detecção de SPAM. Analisa-se e-mails e classifica-os como sendo spam ou não

Detecção de Anomalias/Fraudes: Analisa os indicadores de um equipamento e classifica-o como tendo uma

anomalia ou não. Analisa o comportamento do utilizador num website e classifica a possibilidade de atividade

fraudulenta.

Exemplos

Não supervisionado

• Catalogar e agrupar automaticamente fotos sobre o mesmo tema

• Identificar segmentos do mercado através de elementos recolhidos do perfil dos consumidores e do tipo de

consumo, para fazer promoções ou publicidade dirigida.

Algoritmos

A fim de retornar os melhores resultados, os algoritmos

desempenha uma função crucial para isso.

Ainda que AM seja uma ferramenta poderosa para a

aquisição automática de conhecimento, deve ser

observado que não existe um único algoritmo que

apresente o melhor desempenho para todos os

problemas.

Algoritmos

Escolha a vontade!!!

• K-means clustering

• Cobweb clustering

• DBScan

• Single-linkage clustering

• Neighbor joining

• Self-organizing maps

• Etc.....

Coeficiente de Linearidade

Regressão Linear

Investimento Lucro Tendência

30 430

21 335

35 520

42 490

37 470

20 210

8 195

17 270

35 400

25 480

Média 380

Investimento X Lucro

y = 9.7381x + 117.07

R² = 0.7385

0

100

200

300

400

500

600

0 5 10 15 20 25 30 35 40 45

Regressão Linear

Investimento Lucro Tendência

30 430 409,213

21 335 321,5701

35 520 457,9035

42 490 526,0702

37 470 477,3797

20 210 311,832

8 195 194,9748

17 270 282,6177

35 400 457,9035

25 480 360,5225

Média 380 379,9987

Investimento X Lucro

y = 9.7381x + 117.07

R² = 0.7385

0

100

200

300

400

500

600

0 5 10 15 20 25 30 35 40 45

Vídeo - Watson

CLIQUE NA IMAGEM PARA ASSISTIR AO VÍDEO

ou acesse: https://www.youtube.com/watch?v=Zct7M5j3Bls

Estudo de Caso

Cursos online:

Pergunta: Qual aluno desistirá antes de

concluir o curso?

Hipóteses de desistência:

O aluno está:

1. Desmotivado

2. Desiludido

3. Decepcionado

4. Contente ....

Questionamentos e agrupamentos

O que posso fazer para evitar que o aluno desista?

Alunos = []

Alunos << [12, 150, 3, 15]

Alunos << [4, 170,12, 25]

Alunos << [1, 10, 3, 25]

Alunos << [ 12, 20, 31, 15]

Labels = [1, 1, 0, 0]

Juremo = [6, 140, 25, 10]

Model.predict(Node.feature(Juremo))

MeetUp

Café com DadosAté a próxima

http://www.alfaconcursos.com.br/cafe-com-dados

Saiba mais sobre o Café Com Dados

AlfaCon LABs - Meetup Machine Learning (03/07/2014)

Technology

Transcript of AlfaCon LABs - Meetup Machine Learning (03/07/2014)