Trabalho PI I

13
Glossário Algoritmo C4. 5 - Hoje em dia muitas das tarefas realizadas por profissionais consiste simplesmente em fornecer a classificação de um caso que lhes é apresentado. O c4. 5 é um algoritmo que pode ser usado para auxiliar nessas tarefas, que algumas vezes é apenas uma decisão de sim ou não, concebida por um fornecedor de crédito ou algo um pouco mais complexo como o diagnóstico de uma doença. Muitas vezes essas classificações seguem um padrão, por isso muitos especialistas fazem a classificação de um caso olhando para modelos anteriores cuja classe é conhecida. O c4.5 é capaz de aprender, olhando para um conjunto desses casos, como eles são classificados e a partir daí fazer uma predição para novos casos.Ou seja, o c4.5 gera um classificador que é capaz de agir como um especialista, classificando os casos desconhecidos.O programa também possui um sistema de auto-avaliação, pelo qual o usuário pode construir um classificador e estudar a sua performance para os novos casos. Mineração de Dados - Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. Histograma - Um histograma é uma ferramenta de análise e representação de dados quantitativos, agrupados em classes de freqüência que permite distinguir a forma, o ponto central e a variação da distribuição, além de outros dados como amplitude e simetria na distribuição dos dados Redes Neurais Artificiais - Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento através da

description

Trabalho apresentado a disciplina de Projeto Interdisciplinar I, sob orientação do professor Islenho de Almeida.

Transcript of Trabalho PI I

Page 1: Trabalho PI I

Glossário

Algoritmo C4. 5 - Hoje em dia muitas das tarefas realizadas por profissionais consiste simplesmente em fornecer a classificação de um caso que lhes é apresentado. O c4. 5 é um algoritmo que pode ser usado para auxiliar nessas tarefas, que algumas vezes é apenas uma decisão de sim ou não, concebida por um fornecedor de crédito ou algo um pouco mais complexo como o diagnóstico de uma doença. Muitas vezes essas classificações seguem um padrão, por isso muitos especialistas fazem a classificação de um caso olhando para modelos anteriores cuja classe é conhecida. O c4.5 é capaz de aprender, olhando para um conjunto desses casos, como eles são classificados e a partir daí fazer uma predição para novos casos.Ou seja, o c4.5 gera um classificador que é capaz de agir como um especialista, classificando os casos desconhecidos.O programa também possui um sistema de auto-avaliação, pelo qual o usuário pode construir um classificador e estudar a sua performance para os novos casos.

Mineração de Dados - Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

Histograma - Um histograma é uma ferramenta de análise e representação de dados quantitativos, agrupados em classes de freqüência que permite distinguir a forma, o ponto central e a variação da distribuição, além de outros dados como amplitude e simetria na distribuição dos dados

Redes Neurais Artificiais - Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento através da experiência. Uma grande rede neural artificial pode ter centenas ou milhares de unidades de processamento; já o cérebro de um mamífero pode ter muitos bilhões de neurônios

Binarização - Binarização é um processo de segmentação para separar o objeto de interesse do fundo, consiste na conversão de uma imagem em tons de cinza ou colorida em uma imagem. Binária onde os pixels podem assumir apenas dois valores (0 ou 1, preto ou branco). Apartir de uma imagem em escala de cinza, por exemplo, você determina os níveis de cinza que serão igualados a preto ou a branco, deixando uma imagem com apenas duas tonalidades, é utilizado pra realçar imagens em varias áreas como a medicina.

Page 2: Trabalho PI I

Feedforward – Feedforward e dar idéias e sugestões para o profissional visando o aperfeiçoamento de determinadas competências que serão necessárias para o alcance de suas metas.

Back-popagation - Backpropagation é um algoritmo para treinamento de Redes Multicamadas mais difundido. Baseia-se no Aprendizado Supervisionado por Correção de Erros.

Luminância - Luminância é uma medida da densidade da intensidade de uma luz refletida numa dada direção, cuja unidade SI é a candela por metro quadrado (cd/m²). Descreve a quantidade de luz que atravessa ou é emitida de uma superfície em questão, e decai segundo um ângulo sólido.

Data Warehouse - Um data warehouse ou armazém de dados (português europeu), ou ainda depósito de dados, é um sistema de computação utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados, de forma consolidada. O desenho da base de dados favorece os relatórios, a análise de grandes volumes de dados e a obtenção de informações estratégicas que podem facilitar a tomada de decisão

Clustering - Pode ser definido como Cluster que é o nome dado a um sistema montado com mais de um computador, cujo objetivo é fazer com que todo o processamento da aplicação seja distribuído aos computadores, mas de forma que pareça com que eles sejam um computador só. Com isso, é possível realizar processamentos que até então somente computadores de alta performance seriam capazes de fazer.

Page 3: Trabalho PI I

Resumo

Este relatório apresenta a analise técnica - cientifica do trabalho de conclusão de curso USO DE ALGORITMOS DE CLASSIFICAÇAO PARA A DETECÇAO DE IMAGENS DE PLACAS DE CARRO, destacando os principais pontos fortes e fazendo uma critica as deficiências encontradas no mesmo, se levando em conta os critérios de avaliação que nos foram passados.

Page 4: Trabalho PI I

Sumario

Page 5: Trabalho PI I

1 INTRODUÇÂO

No mundo moderno e cada vez maior o uso da tecnologia para auxiliar o monitoramento e controle dos mais diversos meios que nos rodeiam, como na agricultura, previsões do tempo, sistemas de transportes, fluxo de pessoas e as mais diversas situações que englobam nossa sociedade atual, para podermos antecipar um problema e com mais agilidade poder corrigi-lo, tendo assim uma base de dados mais confiável.

Com o surgimento dos computadores ficou muito mais fácil elaborar projetos para se obter em tempo real os dados necessários para resolver sistemas que são difíceis de obter resultados manualmente, um exemplo e o controle do trafico de automóveis em nossas vias, como existe um grande numero de veículos o controle humano torna-se muito ineficiente, dificultando assim a identificação de veículos infratores, com o uso de algoritmos de classificação pode se criar um software que auxilia o trabalho humano, mais isso requer um estudo complexo de como as imagens são capturadas e como transformá-las em dados para serem processados e obter a saída esperada.

Este trabalho constitui o Relatório Tecnico-Cientifico sobre o trabalho USO DE ALGORITMOS DE CLASSIFICAÇAO PARA A DETECÇAO DE IMAGENS DE PLACAS DE CARRO que tem por objetivo primeiramente a constituição de um glossário com os termos menos conhecidos, depois será feita uma analise do material escrito, verificando se o mesmo atende as regras padrões nacionais se a clareza, pernitencia e relevância no texto, e por ultimo uma avaliação do software com a implementação de testes práticos verificando se o manual atende todos as duvidas de instalação e funcionamento, se a presença de erros e destacando pontos fortes e fazendo criticas com a apresentação de possíveis melhorias que poderiam ser implementadas.

Page 6: Trabalho PI I

2 Avaliação do texto

O trabalho em sua introdução consegue passar bem a idéia na qual ele vai trabalhar se levando em conta que o autor usa os termos técnicos que não são explicados ao leitor, isso leva a falta de um glossário com a explicação de palavras não muito comuns a pessoas que não tem muito conhecimento do assunto, mas estão de acordo com o tema proposto, demonstrando todo o principio de como e feita à capitação de imagens e transformando esses dados em um algoritmo para realizar o processamento da informação visual. Apresenta muitos trabalhos trazendo mais complemento ao assunto e demonstrando que e um tema muito estudo e pesquisado trazendo assim mais conteúdo ao assunto tratado.

A metodologia concentra-se na utilização de imagens obtidas de terceiros já em escalas de cinza que através de 4 etapas, que são explicadas no decorrer do texto com o auxilio de figuras, algoritmos e diagramas que conseguem passar bem a idéia do assunto que esta sendo transmitido.

Toda a pesquisa realizada resultou em dois softwares que funcionam em conjunto para obtenção das dados finais, e apresentam capacidades funcionais e não funcionais bem como os requisitos mínimos de hardware para o correto funcionamento dos programas,

A documentação técnica apresenta os algoritmos que resultaram no software mais a certa falta de documentação na parte de testes deixando em duvida o leitor sobre o funcionamento correto do software.

Algumas certas figuras com fluxogramas de funciomento do software que não estão muito bem explicadas deixando espaço para duvidas de como se desenvolve o processo de captura de imagens, processamento e apresentação de resultados.

Os testes foram feitos com uma boa base de figuras e através delas foram extraídos os registros de dados e destes não foram identificados muitos erros graves, e os que ocorreram estava em uma taxa aceitável conforme os padrões definidos na base de construção do software.

Os resultados finais foram satisfatórios em relação ao tema proposto no inicio e demonstrados de forma clara, mostrando que o algoritmo usado não e muito utilizado nesse tipo de processamento de dados, já que não e um

Page 7: Trabalho PI I

programa completo apresenta espaço para uma futura continuação do trabalho com a complementação da apresentação da informação em maiores detalhes.

Em relação à formação e montagem, todos os itens mais importantes estão presentes no trabalho, só havendo falta de um índice em ordem alfabética, pois como e um trabalho longo isso facilitaria a pesquisa de certo tema nele presente.

Todas as fontes consultadas estão de acordo com o tema pesquisado, e estão apresentados conforme as normas vigentes em relação a apêndices, bibliografias e anexos.

3 Avaliação do sistema/programa

O manual de instruções esta incluso no trabalho, e não apresenta como se procede a instalação desde o inicio do processo de instalação e dependendo do software e preciso rodar em modo de administrador e isso não e informado no manual. Não a opção de escolher onde você quer instalar o software com o próprio programa instalando em uma unidade de memória automaticamente. Não a informações sobre o espaço de disco necessário e uso uma biblioteca de ajuda caso haja algum problema durante a instalação.

Não a uma especificação do tamanho da imagem a ser utilizada na classificação, nem se algum outro tipo de imagem pode ser usado.

Na parte visual, certas partes são bem intuitivas e outras um pouco confusas para pessoas sem conhecimento no processamento de imagens e sem conhecimento da real utilidade do software.

Na parte funcional foi programa apresentou muitos erros de reconhecimento de placa em imagens muito claras, sendo necessário um aprimoramento do algoritmo nessa parte do software.

Page 8: Trabalho PI I

4 CONCLUSÂO

Por meios deste relatório concluímos que software traz um tema muito procurado e utilizado nos dias atuais, tendo uma base solida através de muito material pesquisado tanto na parte de desenvolvimento do algoritmo utilizado e implementação da teoria proposta através de muitos meios visuais como tabelas e figuras, podendo assim obter resultados satisfatórios em relação ao objetivo inicial, mesmo apresentando muitas deficiências no manual e erros no funcionamento software, mais deixa ainda um espaço para uma eventual melhoria futura, reconhecendo suas limitações e deficiências.

Page 9: Trabalho PI I

Referencias

ALGORTIMO de Aprendizado de Máquina. Disponível em:

http://www.inf.ufpr.br/aurora/tutoriais/arvoresdecisao/. Acesso em:

19 abr. 2011.

MINERAÇAO de dados.Disponivel em:

http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados.Acesso em:

22 abr. 2011.

REDES neurais artificiais. Disponível em:

http://www.icmc.usp.br/~andre/research/neural/.Acesso em:

24 abr. 2011.

HISTOGRAMA. Disponível em:

http://www.infoescola.com/estatistica/histograma/.Acesso em;

21 abr. 2011

FORUM Script Brasil > Programação & Desenvolvimento > C, C++ > O que e binarizaçao.Disponível em:

http://scriptbrasil.com.br/forum/index.php?showtopic=136159.Acesso em:

21 abr. 2011

FEEDFORWARD, o feedback focado no futuro. Disponível em:

http://sentirbem.uol.com.br/index.php?modulo=colunistas_mat&id_col=21.Acesso em:

Page 10: Trabalho PI I

19 abr. 2011

O ALGORITMO "Backpropagation”. Disponível em:

http://www.lncc.br/~labinfo/tutorialRN/frm4_backpropagation.htm.Acesso em:

15 abr. 2011

LUMINACIA.Disponivel em:

http://pt.wikipedia.org/wiki/Lumin%C3%A2ncia.Acesso em:

22 abr. 2011

ARMAZEM de dados. Disponivel em:

http://pt.wikipedia.org/wiki/Armaz%C3%A9m_de_dados.Acesso em:

22 abr. 2011

CLUSTER: principais conceitos. Disponível em:

http://www.infowester.com/cluster.php.Acesso em:

22 abr. 2011

NORMAS técnicas – Elaboração e Apresentação de Trabalho Acadêmico – Cientifico 2a Edição. Disponível em:

http://www.utp.br/legislacao_normas/NormasTecnicas.pdf.Acesso em:

22 abr. 2011

Page 11: Trabalho PI I