Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...
Transcript of Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...
Text MiningText MiningSistemas de Informação e Gestão
IntroduçãoIntrodução
Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar, encontrar e descobrir informação escrita na linguagem natural.
É possível manipular mais facilmente as informações não estruturadas como notícias, textos em websites, blogs etc.
Extracção de InformaçãoExtracção de Informação
Exemplo:◦José da Silva é funcionário da Empresa XYZ,
mora na Rua X, número 31, tem 35 anos de idade, e ...
Resultado:◦Nome: José da Silva◦Empresa: XYZ◦Endereço: Rua X, 31◦Idade: 35 anos
Text MiningText Mining
O processo de mineração de textos foi definido por Martins Junior (2003) em função das seguintes actividades:
1. Obtenção dos Documentos2. Pré-Processamento dos Documentos3. Extracção do Conhecimento ou Classificação4. Avaliação do Conhecimento
Obtenção dos DocumentosObtenção dos Documentos
Selecção dos documentos textuais a serem utilizados no processo de mineração.◦Texto Puro◦HTML◦XML◦etc.
Pré-ProcessamentoPré-Processamento
Consiste em Determinar uma forma padrão para a extracção do conhecimento / Classificação no documento condido
Extracção do ConhecimentoExtracção do Conhecimento
Operações realizadas com o intuito de capturar informações / classificar dados num conjunto de entrada não estruturado.
É a etapa de “mineração” propriamente dita.
Avaliação do ConhecimentoAvaliação do Conhecimento
Determina se o conhecimento é válido (se está coreto, e se é útil).