[RI] Slides Recuperação Da Informação - Trabalho (1)
-
Upload
vinicius-vieira-pessoni -
Category
Documents
-
view
225 -
download
6
description
Transcript of [RI] Slides Recuperação Da Informação - Trabalho (1)
![Page 1: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/1.jpg)
Recuperação da Informação 2015-1Implementação
Vinicius Pessoni
Universidade Federal de GoiásInstituto de Informática
Mestrado em Ciência da Computação
1
![Page 2: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/2.jpg)
Tópicos de Apresentação
● Revisão● Aplicação na Dissertação● Resultados● Conclusão
2
![Page 3: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/3.jpg)
Revisão
3
![Page 4: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/4.jpg)
Revisão - Conceitos
● Cluster: conjunto (agrupamento, grupo, aglomerado) de “objetos” (documentos, itens) similares;
● Algoritmos de Clusterização: agrupam um conjunto de objetos em subconjuntos ou “clusters”;
○ clusters internamente coerentes e claramente se distinguem;
● Forma mais comum de aprendizado não supervisionado:
○ SEM classificação prévia feita por experts humanos;
○ encontrar estrutura em dados não rotulados;4
![Page 5: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/5.jpg)
Revisão - Conceitos
● Técnicas de Clusterização:
○ Hierarchical clustering (hierárquico):
■ cria uma estrutura hierárquica de clusters (relacionamentos);
■ não define previamente quantos clusters devem ser;
■ maioria determinísticos;
○ Hard Clustering: cada item é membro de um e somente um cluster;
5
![Page 6: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/6.jpg)
Revisão - Otimização da Modularidade
● Sistemas sociais, tecnológicos e de informação podem ser descritos como redes complexas:
○ (grafo) topologia interconectada de nós, organização e aleatoriedade;
● Comunidades ajudam a descobrir informações;
● Alem disso, a meta-rede resultante, na qual os nós são as comunidades, ajuda a compreender a estrutura da rede original;
6
![Page 7: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/7.jpg)
Revisão - Otimização da Modularidade
● A qualidade das partições (comunidades) resultantes é medida pela modularidade;
● Modularidade: é um valor escalar entre -1 e 1 que mede a densidade dos links dentro de uma comunidade em relação aos links entre comunidades:
○ usada para comparar a qualidade de partições obtidas por diferentes métodos de clusterização;
○ também uma função para otimizar ( exata é NP Hard, necessário algoritmos aproximativos );
7
![Page 8: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/8.jpg)
Revisão - Otimização da Modularidade
● O método:
○ hierárquico, encontra partições com alta modularidade, mesmo em grandes volumes de dados (redes gigantes);
○ o algoritmo é dividido em duas fases, repetidas iterativamentes:
■ verificação de maximos locais ( mudança para comunidade vizinha );
■ criação da meta rede ( comunidades identificadas no passo 1);
8
![Page 9: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/9.jpg)
Clusterização - Otimização da Modularidade
9
![Page 10: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/10.jpg)
Implementaçãona
Dissertação
10
![Page 11: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/11.jpg)
Clusterização - Otimização da Modularidade
● Implementação na Dissertação (trabalho da disciplina):
○ queremos medir o nível cognitivo e auxiliar os discentes a melhorá-lo, com isso melhorando o desempenho nos cursos;
● método aplicado: questionário com 24 questões “em duplas”;
○ discentes marcam as respostas e o raciocínio utilizado;
● dados: respostas dos questionários de 250 discentes;
11
![Page 12: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/12.jpg)
Exemplo Questão
12
![Page 13: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/13.jpg)
Clusterização - Otimização da Modularidade
● Aplicação na Dissertação (trabalho da disciplina):
○ passo 1: modelar respostas dos alunos e questões do questionário como um grafo bipartido ( rede complexa ):
○ passo 2: desenvolver programa em java que traduz as respostas do questionário na estrutura de grafos lida pelo programa que trabalha os grafos ( gephi );
○ passo 3: montar o grafo no gephi;
13
![Page 14: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/14.jpg)
Clusterização - Otimização da Modularidade
● Aplicação na Dissertação (trabalho da disciplina):
○ passo 4: aplicar o algoritmo de descoberta de comunidades:
1. montar grafo aleatório;2. executar distribuição por forças ( Force Atlas 2 );3. descobrir parâmetros de estabilização;4. executar com parâmetros descobertos para verificar forma
estável;5. executar descoberta de comunidades;
○ passo 5: analisar as comunidades encontradas e o que isso significa para a pesquisa.
14
![Page 15: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/15.jpg)
Clusterização - Otimização da Modularidade
● Aplicação na Dissertação (trabalho da disciplina):■ uma questão está relacionada a outra pelo erro de um
discente em uma e outra;
Erros João: 1, 2, 5, 6, 8
Arestas: 1 -> 2;1 -> 5;1 -> 6;1 -> 8;
2 -> 5;2 -> 6;2 -> 8;
15
5 -> 6;5 -> 8; 6 -> 8.
1
2
João
1
2
![Page 16: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/16.jpg)
Clusterização - Otimização da Modularidade
4.1 Montar grafo aleatório
16
![Page 17: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/17.jpg)
Clusterização - Otimização da Modularidade
4.2 Distribuição por forças (Force Atlas 2)
17
![Page 18: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/18.jpg)
Clusterização - Otimização da Modularidade
4.3 Parâmetros de estabilização
Tolerância Velocidade: 0.01, pequeno, boa acurárcia e velocidade;
Modo LingLong: evidencia comunidades, é o nosso foco;
18
![Page 19: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/19.jpg)
Clusterização - Otimização da Modularidade
4.4 Verificar forma estável
19
![Page 20: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/20.jpg)
Clusterização - Otimização da Modularidade
4.5 Executar descoberta de comunidades
20
![Page 21: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/21.jpg)
Clusterização - Otimização da Modularidade
4.5 Executar descoberta de comunidades
21
![Page 22: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/22.jpg)
Clusterização - Otimização da Modularidade
Implicações para Pesquisa
● Indica agrupamento de dificuldade:○ fáceis, médias e difíceis;
● Confirmação da qualidade das questões das duplas de padrões:○ 1-2, 3-4, 5-6...;
● Confirma padrão de erro dos grupos ( 11,12, 13, 14 ) identificado por métodos estatísticos não paramétricos;
○ lembrar que nenhuma dessas informações foi informada;
● Diversas outras análises possíveis:○ triângulos (dependência entre 3 padrões);○ intermédio de caminho ( qual padrão fica entre um e outro );○ ... 22
![Page 23: [RI] Slides Recuperação Da Informação - Trabalho (1)](https://reader031.fdocumentos.tips/reader031/viewer/2022020219/563dbb06550346aa9aa9a399/html5/thumbnails/23.jpg)
Recuperação da Informação 2015-1Implementação
Vinicius Pessoni
Universidade Federal de GoiásInstituto de Informática
Mestrado em Ciência da Computação
23