Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

27
Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205

Transcript of Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Page 1: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão Computacional – 2010Aula 0: Introdução

Paulo Sérgio RodriguesPEL205

Page 2: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Administrivia

• Aulas: Quartas: 18:30 às 22:10 hs

• Professor: Paulo Sérgio Rodrigues www.fei.edu.br/~psergio

[email protected]• Pré-requisitos: Programação, Álgebra, Cálculo e

Experiência na preparação de Documentos Acadêmicos

• Textbooks:“Digital Image Processing” by Rafael Gonzalez & Richard

Woods

“Vários artigos científicos”

Page 3: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Objetivos

• Introdução dos Principais problemas de Visão Computacional.   

• Introduzir os principais problemas e técnicasvolta às aplicações

• Dar aos alunos ferramentas e oportunidades para discutir, formalizar, implementar e escrever artigos com soluções razoáveis para problemas complexos.   

• Dar aos alunos uma visão geral da literatura e da área de visão computacional, bem como de sua complexidade e importância.

Page 4: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Por que estudar Visão Computacional?

• Imagens e vídeos existem em todo lugar• A cada dia, novas aplicações práticas têm

surgido:– Construção de modelos virtuais de estruturas

reais 3D.– segurança (quem está fazendo o que?)– Pós-processamento de vídeo– Reconhecimento de faces, gestos, etc..

• Vários problemas científicos desafiadores– Como funciona um sistema de reconhecimento de

objetos?

• Um entendimento melhor a respeito da visão humana.

Page 5: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Principais Tópicos tratados em Visão Computacional

• Detecção de Formas ou Movimento “Qual a forma 3D desse objeto?” • Segmentação

“O que pertence a que?”

• Tracking (Rastreamento) “A onde cada objeto vai?”

• Reconhecimento“O que é isso?”

Page 6: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão

Visão Top Down

x

Visão Bottom Up

Page 7: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão Bottom Up

Page 8: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Desafio: Visão Baseada em Contexto

Page 9: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão Bottom Up: Análise de Imagens com Base em informações de Cor, Forma ou Textura

Page 10: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão Top Down

Page 11: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão Top Down ou Bottom Up ?

Page 12: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão Computacional

Grandes Desafios Futuros

Page 13: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Telemedicina

Page 14: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Gerenciamento de Grandes Bases de Dados

Page 15: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Análise de Imagens em Vídeo

Page 16: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Ambientes Virtuais Colaborativos

Page 17: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Ambientes Virtuais Colaborativos

Page 18: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

TV-Digital

Page 19: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Sub-divisão da Disciplina

Visão de Baixo

Médio

Alto-Nível

Page 20: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão de Baixo Nível:

Geralmente é abordado, mas não necessariamente restrito a:

Transformações de Imagens: Transformada de Fourier, DFT, Propriedades, FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant

Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica

Filtragem: Espacial e Freqüência

Processamento baseado em Cor: Sistemas de Cores

Processamento Baseado em Gradiente: Detectores de Direção

Processamento Baseado em Textura: Matriz de Co-ocorrência

Compressão de Imagens: Compressão JPEG

Compressão de Vídeos: Detecção de Transição

Registro de Imagens: Entropia: Tradicional e Não-Extensiva

Morfologia Matemática

Page 21: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão de Médio Nível:

Geralmente é abordado, mas não necessariamente restrito a:

Segmentação de Imagens: Baseada em Cor, Gray-Scale, Pontos Principais, Movimento

Clusterização: K-Means, SOM, outros métodos, CrescimentoDe Região

Entropia: Tradicional e Não-Extensiva

Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo

Page 22: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão de Alto Nível:

Geralmente é abordado, mas não necessariamente restrito a:

Representação de Cenas: Código de Cadeia,Assinaturas de Imagens, Aproximação Poligonal, Squeletização

Descritores de Cenas: Descritores de Fourier, Momentos Invariantes, Descritores de Regiões

Morfologia Matemática, Análise de Imagens, Métodos Estruturais, Casamento de Padrões, Métodos Baseados em Strings e Linguagens de Autômatos

Classificadores Estatísticos: SVM, Redes Neurais, Redes Bayesianos

Page 23: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Visão de Baixo Nível:

Geralmente é abordado, mas não necessariamente restrito a

Restauração de Imagens:

Melhoramento de Imagens: Espacial e Freqüência

Filtragem: Espacial e Freqüência

Processamento baseado em Cor

Processamento Baseado em Gradiente

Processamento Baseado em Textura

Page 24: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Curso de Visão 2010: PEL205

Regras:

Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível

Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível

Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível

Prova Final (PF): Todo o Conteúdo

Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF

Média < 5.0 = D (Reprovado)5.0 <= Média < 7.5 = C7.5 <= Média < 8.5 = B 8.5 <= Média = A

Page 25: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Trabalhos Teóricos-Práticos

Assunto: TTPI -Visão de Baixo Nível; TTPII - Visão de Médio Nível; TTPIII - Visão de Alto Nível;

Trabalho em Equipe de até 3 alunos: Equipe I: Guilherme e Werner; Equipe II: Celso, André e Puff

De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão computacional não necessariamente vistos em sala, discutida e preparado experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação internacional.

Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo com os 5 níveis acima, discussão e debate com os colegas e com o professor. As notas são individuais. Para composição dessa nota, deverão ser entregues avanços semanais. Relatórios adiados diminuem 1% da nota por dia de atraso.

OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o professor da disciplina.

Page 26: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

TTP-I

Assunto: Visão de Baixo Nível

Equipe GW: Guilherme e Werner

O artigo consta do tema de Análise de Vídeo explorando o tema EntropiaNão-Extensiva para Detecção de Transições.

Uma sugestão do título e estrutura do artigo está disponível na página da disciplina.

Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no YouTube.

Artigos sugeridos para Trabalhos Relacionados também estão disponíveis.

Todo o Material deverá ser atualizado no DropBox.

Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor.

Data da entrega: 13 de Outubro de 2010

Page 27: Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

TTP-I

Assunto: Visão de Baixo Nível

Equipe CAP: Celso, André e Puff

O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia Não-Extensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outrassugeridas.

Uma sugestão do título e estrutura do artigo está disponível na página da disciplina.

Base de dados: disponível com o Professor

Artigos sugeridos para Trabalhos Relacionados também estão disponíveis.

Todo o Material deverá ser atualizado no DropBox.

Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor.

Data da entrega: 13 de Outubro de 2010