TCC - Classificação automática de opiniões
-
Upload
paulo-sousa -
Category
Technology
-
view
138 -
download
1
Transcript of TCC - Classificação automática de opiniões
Desenvolvimento de um Protótipo de Classificação Automática de
Opiniões
Paulo Henrique de Sousa
Orientador: Fernando Luiz de Oliveira
Introdução
• Mineração de dados;
• Descoberta de padrões e tendências;
• Provimento de vantagem competitiva.
Classificação de Opiniões
• Analise de Mídias Sociais;
• Automatização da classificação.
Processo KDD
KDD e KDT
Text Mining - Pré-processamento
• Tokenização;
• Limpeza – (Remoção de Stopwords);
• Stemming.
Tarefas de Text Mining
• Sumarização;
• Classificação;
• Clusterização;
• Associação.
Metodologia
• Referencial bibliográfico;
• Estudo da Weka API (algoritmo SVM e KNN);
• Base de Opiniões (APIs Facebook, Twitter e Google Plus);
• Desenvolvimento do Protótipo;
• Testes.
Protótipo de Classificação Automática
• Classificador de opiniões obtidas em tempo real.– O resultado pode apoiar os gestores da empresa;
• Classifica as opiniões em 5 categorias.– Positivas
– Muito positivas
– Negativas
– Muito negativas
– Neutras
Base de Conteúdo
• FacebookGraph API - Search
• TwitterAPI 1.1 - Search
• GoogleActivities - Search
Arquitetura do Protótipo
• Biblioteca de mineração– (Classe principal) ClassifierOptions
– TextDataBase
– TextReader
– WordProcessor
Arquitetura do Protótipo
Fluxo do projeto
Considerações Finais
• Para facilitar a análise das opiniões disponíveis na web é importante a utilização de ferramentas adequadas, tal como a apresentada neste trabalho;
• O trabalho foi muito importante por possibilitar o estudo de uma área promissora que é a mineração de dados e suas subáreas ;
• A utilização de palavras pré-classificadas com até 6 valores semânticos permite uma análise mais abrangente;
• Em um trabalho futuro podem ser utilizadas as APIs de streaming das redes sociais utilizadas.
Desenvolvimento de um Protótipo de Classificação Automática de
Opiniões
Paulo Henrique de Sousa