MECANISMO DE SUGESTÃO E PROCESSO DE CARACTERIZAÇÃO DE REDES SOCIAISTrabalho de Graduação em Ciência da Computação CIn/UFPENitai Bezerra da Silva ([email protected])Orientador: Tsang Ing Ren ([email protected])
SUMÁRIO Problema – Por quê sugerir relacionamentos? Solução – O mecanismo de sugestão Como – Análise dos padrões de relacionamento
Modelos de redes complexas Rede social – A base de dados e o framework Processo de caracterização Mecanismo de Sugestão
Filtrar e ordenar Conclusões e Trabalhos Futuros
O PROBLEMA Rede Social
Composição de usuários (nós) e relacionamentos (arestas)
Criação dos relacionamentos depende de esforço do usuário Mecanismo simplista Atividade repetitiva
SOLUÇÃO Mecanismo
inteligente de sugestão
Benefícios Particular
Crescimento rápido da rede social
Comunitário Facilita o
crescimento de todas redes
COMO Análise dos padrões de
relacionamento Verificar padrões existentes
Sugerir nós que seguem o padrão
Quais padrões?
REDES COMPLEXAS Tentativa de modelar fenômenos
naturais em estruturas de redes Cérebro, colônia de formigas, células
biológicas, internet, redes sociais, etc. Evolução dos modelos:
Randômico (50’s) por Erodos e Rényi Small world (1998) por Watts e Strogatz Scale free (1999) por Barabási e Albert
REDES COMPLEXAS Modelos caracterizados pela forma em
que são criados e pelos vários resultados estatísticos
Algumas métricas estatísticas: Grau de um nó Distribuição do grau
REDES COMPLEXAS Coeficiente de agrupamento
É a probabilidade média de que dois nós vizinhos de outro dado nó são também vizinhos entre si
Propriedade observada com valor grande no mundo real“É mais provável você conhecer um amigo
dos seus amigos do que qualquer outra pessoa aleatoriamente” Melanie Mitchell
MODELO RANDÔMICO Regra de criação: Cada par de nós está
conectado com um probabilidade p uniforme
As propriedades chaves mostraram ser totalmente diferentes das observadas no mundo real.
A distribuição do grau é aproximadamente Gaussiana
O coeficiente de agrupamento é exatamente p
MODELO SMALL WORLD
Regra de criação: Comece com um anel onde cada nó liga-se com k dos seus vizinhos
mais próximos. Para cada aresta, com pequena probabilidade p religue uma das extremidades da ligação para qualquer outro nó randomicamente escolhido.
Propriedades: Distância geodésica média pequena
Cresce, até, logaritmicamente com o tamanho da rede
Na rede randômica o crescimento é linear Coeficiente de agrupamento
Valor muitas vezes maior do que numa rede randômica com mesma quantidade de nós e arestas
MODELO SCALE FREE
Regra de criação: Inicialmente existe um pequeno número de nós. Em cada passo
adiciona-se um novo nó, e é conectado a m nós existentes, para algum m. A probabilidade de fazer uma dessas ligações para um nó i é proporcional ao grau do nó i
Ligação preferencial: “Ricos ficam mais ricos”
Propriedades: Distribuição do grau seguindo uma lei de
potência
REDE SOCIAL – A BASE DE DADOS E O FRAMEWORK
Base de dados local Web Crawlers Base de dadosremota
Social Network Orkut
Pessoa
PK Uid
numero_amigos estado
Relações
PK id
FK1 UidPessoa1FK2 UidPessoa2
Procedimentos paracaracterização da rede
Ruby + SQL Server proceduresSQL Server
Procedimentos parasistema de sugestão
- Caracterizando a rede como scale free
- Caracterizando a rede como small world
SQL Server procedures
Serviço Web
SQL Server procedures
Duas bases: Usuários
Brasileiros Usuários
Indianos
PROCESSO DE CARACTERIZAÇÃO Como Scale Free
Gráfico de distribuição do grau das duas sub redes seguem leis de potência
1 63 1251872493113734354975596216837458078699310
500
1000
1500
2000
2500
3000
1 61 1211812413013614214815416016617217818419019610
5000
10000
15000
20000
25000
30000
35000
Brasileiros Indianos
893.295 usuários 3.133.267 usuários
Grau X Frequência
PROCESSO DE CARACTERIZAÇÃO
Como Small World
Coeficiente de agrupamento expressivo e distância geodésica média pequena
Conclusão: As redes analisadas são scale free e small world
Sub Rede Coeficiente de Agrupamento
Distância geodésica média
Quantidade de nós
Brasileira 0.1830 3,1454 1.935.003
Indiana 0.3478 3,7722 3.133.267
MECANISMO DE SUGESTÃO
Processo consiste de duas etapas: Filtrar os nós candidatos
Seletiva pelos nós com maior probabilidade Ordenar os nós candidatos
Mensurar algumas propriedades (índices) Calcular pesos de forma customizada Ponderar os índices e gerar os resultados
MECANISMO DE SUGESTÃO Etapa de Filtrar
Selecionar os nós mais prováveis A rede tem clustering coefficient
expressivo! O algorítmo se resume
a selecionar os nós comdistância geodésica = 2
“É mais provável você conhecer um amigo dos seus amigos do que qualquer outra pessoa aleatoriamente” Melanie Mitchell
MECANISMO DE SUGESTÃO
Etapa de ordenar Mensurar 3 índices
medidas de relacionamento entre dois nós São calculados independentemente entre o nó
central e cada um dos nós cadidatos Calcular os pesos
De forma otimizada e customizada para o usuário
MECANISMO DE SUGESTÃO 3 índices
Cada um é uma métrica de relacionamento entre o nó central e o nó candidato
Algumas definições
,onde Mij é o elemento ij da matriz de adjacência
MECANISMO DE SUGESTÃO Índice 1
Mede a quantidade de nós adjacentes ao vértice i e ao vértice j ao mesmo tempo
A quantidades de amigos em comum entre a pessoa i e a pessoa j
MECANISMO DE SUGESTÃO Índice 2
Mede a densidade de adjacência do conjunto medido no índice 1
Quão próximas estão estas pessoas Para o exempo acima essa medida é 0,5
MECANISMO DE SUGESTÃO Índice 3
Mede a densidade de adjacência do conjunto união entre os dois sub-conjuntos
A diferença para o segundo índice é que este considera distâncias geodésicas de tamanho 3, e não somente 2
MECANISMO DE SUGESTÃO Ponderação otimizada
Utiliza os padrões existentes no conjunto de nós já relacionados ao nó central
Pequena mudança na etapa de filtrar para incluir os nós já relacionados
Utilização de uma função de otimização para calibrar os índices
MECANISMO DE SUGESTÃO Função de otimização Calcula a média da posição da
classificação dos nós já relacionados ao nó central
Quanto menor esse valor melhor os nós já relacionados estão sendo classificados
Os nós candidatos mais bem classificados seguem o mesmo padrão
MECANISMO DE SUGESTÃO Nos experimentos a calibragem foi feita
manualmente baseada na função de otimização
Resultados:Sub-rede
Peso 1
Peso 2
Peso 3
Qtd de vértices adjacentes ao vértice central
Função de otimização
Brasileira
10 3 180 461 513,60
Indiana -38 -11 100 535 272,65
CONCLUSÕES E TRABALHOS FUTUROS O mecanismo de sugestão convergiu como esperado O aprofundamento no entendimento de redes sociais
abre possibilidades para aplicações comerciais Sugestor de produtos em redes de venda pela internet Sugestor de filmes em rede de locadora, etc.
Mehorias no mecanismo: Implementação do mecanismo de calibragem automático Melhoria e criação de mais índices
Outras pesquisas: Executar mais testes com sub redes de outras regiões
geográficas Utilização do feedback do usuário como medida de ajuste
DÚVIDAS?
Top Related