Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...

8
Text Mining Text Mining Sistemas de Informação e Gestão

Transcript of Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...

Page 1: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Text MiningText MiningSistemas de Informação e Gestão

Page 2: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

IntroduçãoIntrodução

Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar, encontrar e descobrir informação escrita na linguagem natural.

É possível manipular mais facilmente as informações não estruturadas como notícias, textos em websites, blogs etc.

Page 3: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Extracção de InformaçãoExtracção de Informação

Exemplo:◦José da Silva é funcionário da Empresa XYZ,

mora na Rua X, número 31, tem 35 anos de idade, e ...

Resultado:◦Nome: José da Silva◦Empresa: XYZ◦Endereço: Rua X, 31◦Idade: 35 anos

Page 4: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Text MiningText Mining

O processo de mineração de textos foi definido por Martins Junior (2003) em função das seguintes actividades:

1. Obtenção dos Documentos2. Pré-Processamento dos Documentos3. Extracção do Conhecimento ou Classificação4. Avaliação do Conhecimento

Page 5: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Obtenção dos DocumentosObtenção dos Documentos

Selecção dos documentos textuais a serem utilizados no processo de mineração.◦Texto Puro◦HTML◦XML◦etc.

Page 6: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Pré-ProcessamentoPré-Processamento

Consiste em Determinar uma forma padrão para a extracção do conhecimento / Classificação no documento condido

Page 7: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Extracção do ConhecimentoExtracção do Conhecimento

Operações realizadas com o intuito de capturar informações / classificar dados num conjunto de entrada não estruturado.

É a etapa de “mineração” propriamente dita.

Page 8: Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar,

Avaliação do ConhecimentoAvaliação do Conhecimento

Determina se o conhecimento é válido (se está coreto, e se é útil).