Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em...

103
universidade federal do rio grande do norte centro de ciências exatas e da terra departamento de física teórica e experimental programa de pós-graduação em física Contribuição ao Estudo de Redes Complexas: Modelo de Afinidade com Métrica Samuraí Gomes de Aguiar Natal, 31 de agosto de 2012

Transcript of Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em...

Page 1: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

universidade federal do rio grande do norte

centro de ciências exatas e da terra

departamento de física teórica e experimental

programa de pós-graduação em física

Contribuição ao Estudo de RedesComplexas: Modelo de Afinidade com

Métrica

Samuraí Gomes de Aguiar

Natal, 31 de agosto de 2012

Page 2: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

SAMURAÍ GOMES DE AGUIAR

Contribuição ao Estudo de Redes Complexas: Modelode Afinidade com Métrica

Dissertação de Mestrado apresentada ao Programa dePós-Graduação em Física do Departamento de FísicaTeórica e Experimental da Universidade Federal do RioGrande do Norte como requisito parcial para a obtençãodo grau de Mestre em Física.

Orientador: Profº. Dr. Luciano Rodrigues da SilvaCo-orientador: Dr. Gabriel Alves Mendes

Natal, 31 de agosto de 2012

ii

Page 3: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Para Pessoas Especiais:

Ao meu Deus.Ao meu esposo.Ao meu Filho.Aos meus Pais.

iii

Page 4: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Agradecimentos

Á Deus, pela fé, capacitação e força para alcançar meus objetivos.

Ao meu esposo, Daniel Bruno Urbano de Brito, e ao meu filho, Davi Gomes de AguiarBrito, pela compreensão, incentivo e todo amor dedicado, sem os quais não teria conseguidoconcluir este trabalho.

Aos meu pais, Marcos Antônio e Selênia Gomes, por todo amparo, educação, incen-tivo e confiança. Sem esse alicerce não teria sido possível chegar até aqui.

Aos meus irmãos, Camoí Gomes de Aguiar, Samira Gomes de Aguiar e Canoi Gomesde Aguiar e demais membros da família por sempre terem apoiado este sonho, com palavrasde amor e incentivo.

Ao Profº. Dr. Luciano Rodrigues da Silva, pela oportunidade dada e pela orientaçãorecebida.

Ao Dr. Gabriel Alves Mendes, co-orientador deste trabalho, por todas as discussõesque contribuíram para estes resultados.

Ao Profº. Dr. Antônio de Macedo Filho, pelas comentários que proporcionarammelhorar este trabalho.

Aos colegas Maurício Lopes de Almeida, Tiago Crisóstomo Carlos Nunes, AntônioMarques e Tiago Medeiros, por discussões e ideias que contribuíram para o resultado destadissertação.

Aos demais colegas e amigos do DFTE, Carlene Paula, Francisco Biagione, CristóvãoPorciano, Cyntia Vanessa, Aline Viol e Gislene Borges pelas palavras de ânimo e encoraja-mento que me sustentaram durante todo esse processo.

Aos professores do DFTE que contribuiram para minha formação profissional e aosfuncionários do departamento.

Finalmente, ao CNPq, pelo apoio financeiro concedido.

iv

Page 5: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

“Porque melhor é a sabedoria do que as jóias; e de tudoo que se deseja nada se pode comparar a ela.”

(Provérbios 8.11 - Bíblia)

v

Page 6: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Resumo

Atualmente o interesse por sistemas em grande escala e com um alto grau de com-plexidade tem sido muito abordado na comunidade científica, em diversas áreas do conheci-mento. Como exemplo, podemos citar a Internet, a interação entre proteínas, a colaboraçãode atores de cinema, dentre outros. Para melhor entender o comportamento desses sistemasinterligados, vários modelos na área de Redes Complexas foram propostos. Barabási e Albertpropuseram um modelo em que a ligação entre os constituintes do sistema se dava de formadinâmica e que privilegia sítios mais antigos, reproduzindo um comportamento característicoem alguns sistemas reais: distribuição de conectividade invariante por escala. Porém, essemodelo negligencia dois fatores, entre outros, observados em sistemas reais: homofilia e mé-trica. Dada a importância desses dois termos no comportamento global de redes, propomosnessa dissertação estudar um modelo dinâmico de ligação preferencial em que três fatoresessenciais são responsáveis pela competição por ligações: (i) conectividade (os sítios maisconectados são privilegiados na escolha por ligações); (ii) homofilia (conexões entre sítiossemelhantes são mais atrativas); (iii) métrica (a ligação é favorecida pela proximidade entreos sítios). Dentro dessa proposta, analisamos como o comportamento da distribuição de co-nectividade e evolução dinâmica da rede são afetados pela métrica através de αA (parâmetroque controla a importância da distância na ligação preferencial) e pela homofilia através do η(característica intrínseca do sítio). Percebemos que a medida que aumentamos a importânciada distância na ligação preferencial, as ligações entre os sítios se tornam locais e a distribuiçãode conectividade é caracterizada por uma escala típica. Paralelamente, ajustamos as curvasda distriuição de conectividade, para diferentes valores de αA, pela equação P (k) = P0e

−k/κq

proveniente da estatística não-extensiva de Tsallis.

vi

Page 7: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Abstract

Currently the interest in large-scale systems with a high degree of complexity hasbeen much discussed in the scientific community in various areas of knowledge. As an exam-ple, the Internet, protein interaction, collaboration of film actors, among others. To betterunderstand the behavior of interconnected systems, several models in the area of complexnetworks have been proposed. Barabási and Albert proposed a model in which the connec-tion between the constituents of the system could dynamically and which favors older sites,reproducing a characteristic behavior in some real systems: connectivity distribution of scaleinvariant. However, this model neglects two factors, among others, observed in real systems:homophily and metrics. Given the importance of these two terms in the global behavior ofnetworks, we propose in this dissertation study a dynamic model of preferential binding tothree essential factors that are responsible for competition for links: (i) connectivity (themore connected sites are privileged in the choice of links) (ii) homophily (similar connectionsbetween sites are more attractive), (iii) metric (the link is favored by the proximity of thesites). Within this proposal, we analyze the behavior of the distribution of connectivity anddynamic evolution of the network are affected by the metric by αA parameter that controlsthe importance of distance in the preferential binding) and homophily by η (characteristicintrinsic site). We realized that the increased importance as the distance in the preferredconnection, the connections between sites and become local connectivity distribution is cha-racterized by a typical range. In parallel, we adjust the curves of connectivity distribution,for different values of αA, the equation P (k) = P0e

−k/ηqq from the statistical non-extensive

Tsallis.

vii

Page 8: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Índice

Agradecimentos iv

Resumo vi

Abstract vii

1 Introdução 1

2 Principais conceitos e modelos de redes 6

2.1 Definição de Redes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.1.1 Grafos, conectividade e pólos . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.1 Distribuição de Conectividade . . . . . . . . . . . . . . . . . . . . . . 11

2.2.2 Menor Caminho Médio . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.3 Experimento de Milgran - o efeito de mundo pequeno . . . . . . . . . 17

2.2.4 Coeficiente de Agregação . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3 Redes correlacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.1 Correlação Grau-Grau . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.3.2 Coeficiente de Agregação . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.3.3 Homofilia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

viii

Page 9: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

2.4 Redes não-correlacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.5 Redes reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.5.1 WWW - World Wide Web . . . . . . . . . . . . . . . . . . . . . . . . 32

2.5.2 Rede de colaboração de atores de cinema . . . . . . . . . . . . . . . . 32

2.5.3 Redes celulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3 Modelos Teóricos 35

3.1 Modelo de Barabási . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.2 Modelo de Qualidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.3 Modelo de Afinidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4 Modelo Natal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.5 Ligação Preferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4 Modelo de Afinidade com Métrica 59

4.1 Descrição do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.2 Distribuição de Conectividade . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.3 Evolução temporal da conectividade dos sítios . . . . . . . . . . . . . . . . . 69

4.4 Ajuste das curvas da distribuição de conectividade . . . . . . . . . . . . . . . 74

4.5 Relevância do Modelo de Afinidade com Métrica . . . . . . . . . . . . . . . . 76

5 Conclusões e Perspectivas 77

Referências Bibliográficas 80

A Mecância Estatística não-extensiva de Tsallis 87

Apêndice A 87

A.1 Formalismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

ix

Page 10: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Lista de Figuras

2.1 Representação esquemática das sete pontes de Königsberg e sua simplificação em

forma de grafos. Cada porção de terra é um vértice e cada aresta é uma ponte. . . 7

2.2 (a) Rede Quadrada - a conectividade dos sítios é fixa. (b) Grafo com Pesos em

Arestas - As arestas mais espessas representam ligações com um peso maior. No

estudo de redes esse peso poderia estar associado ao nível de relacioamento entre

pessoas, por exemplo: namoro, noivado e casamento. Em que o namoro representa

a ligação mais fraca e o casamento a ligação mais forte. . . . . . . . . . . . . . . 8

2.3 (a) Rede direcionada - é possível calcular conectividade de entrada e saída do nó. A

conectividade de entrada do sítio 1 é ki = 3 e a de saída é ko = 3 portanto a conec-

tividade total é k1 = 6. (b) Mesma rede porém não direcionada. A conectividade

do sítio 1 é k1 = 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Representação das classes dos grafos. . . . . . . . . . . . . . . . . . . . . . . . . 11

2.5 Gráfico ilustrativo mostrando a diferença de comportamento de uma distribuição

do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência

(pontos azuis). Do lado esquerdo temos os gráficos plotados na escala linear e do

lado direito dados na escala log-log. Ambos possuem o mesmo grau médio 〈k〉 = 10. 13

2.7 (a) Mapa dos Estados Unidos onde a região azul mostra o local onde as cartas foram

distribuídas, região vermelha mostra o local onde a pessoa alvo se encontra. (b)

Esquema ilustrativo do resultado obtido no experimento de Milgram “Seis Graus de

sepração”. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.8 Vértice verde tem 6 vizinhos próximo, e 5 ligações entre eles (arestas vermelhas) o

coeficiente de agregação do sítio 1 é c1 = 1/3. . . . . . . . . . . . . . . . . . . . 20

x

Page 11: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

2.9 Exemplo de comunidades presentes em um grafo. . . . . . . . . . . . . . . . . . 20

2.10 Gráfico ilustrativo de correlação de grau. Linha Azul a rede não apresenta correlação

de grau. Linha vermelha a rede é desassociativa e linha preta a rede é assossiativa,

ou seja, as linhas vermelha e preta apresentam correlação de grau e a linha preta

mostra que não há correlação. . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.11 Função knn(k) não é monotônica portanto não possível definir se a rede é associativa

ou desassociativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.12 Rede de amizade em uma escola americana. As relações de amizade foram estabele-

cidas em grupos. Os nós amarelos representam os brancos; nós verdes representam

os afro-americanos; nós cor-de-rosa representam outros. . . . . . . . . . . . . . . 26

2.14 (a) Redes de Proteína são heterofóbicas enquanto que as redes de serviços móveis são

heterofílicas. (b) O diagrama de fases de (D,H) para esta classe de proteínas (MIPS

funcional classe 30) mostra que as interações entre proteínas são mais diádicas e

menos heterofílicas do que o esperado para configurações aleatórias. (c) Diagrama

de Fases para “mobile chat service”, ao contrário das proteínas, as redes móveis

são mais heterofílicas bem como diádicas, sendo mais espalhados ao longo da rede.

Figuras retiradas da referência [1] . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1 Exemplo ilustrativo de crescimento de uma rede de Barabási para m0 = 3 e m = 1. 37

3.2 (a) Distribuição de conectividade em Lei de Potência para o modelo de Barabási.

Simulação realizada param = 1, N = 2×105 e 200 amostras. (b) Evolução temporal

da conectividade dos sítios i = 10 e i = 97. Simulação realizada para a rede de

Barabási com m = 1, N = 105 e 1000 amostras. . . . . . . . . . . . . . . . . . . 39

3.4 Distribuição de conectividade para o Modelo de Qualidade. Simulação realizada para

m = 1, N = 105 e 3000 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.5 (a) Evolução temporal do sítio i = 10 para diferentes valores de η. Simulação

realizada para m = 1, N = 105 e 1000 amostras. (b) Dependência linear de β

com η, mostrando que dependendo da qualidade do sítio, sua taxa de aquisição de

ligações pode ser maior ou menor. Figura retirada da referência [2]. . . . . . . . 43

3.6 (a) Distribuição de conectividade para o Modelo de Afinidade. (b) Comparação

entre a distribuição de conectividade do Modelo de Qualidade (MQ) e o Modelo de

Afinidade (MA). Simulação realizada para m = 1, N = 105 e 1000 amostras. . . . 46

xi

Page 12: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

3.7 (a) Evolução temporal da conectividade do sítio no Modelo de Afinidade para dife-

rentes valores de η. (b) Dependência de β com η no Modelo de Afinidade, mostrando

que sítios com valores η ∼ 0.5 têm mais chances de tornarem-se pólos, visto que β é

máximo, equanto que sítios com valores de ηsim0.1 ou η ∼ 0.9, adquirem ligações a

um taxa muito mais lenta (β é mínimo). Figuras retiradas da referência [3]. . . . 48

3.8 (a) Menor caminho versus o tamanho do sistema, no Modelo de Afinidade, para dife-

rentes valores de m (b) Comportamento do coeficiente de agregação versus tamanho

do sistema, no Modelo de Afinidade, para diferentes valores de m. Figuras retiradas

da referência [3] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.9 Figura esquemática da dinâmica de crescimento e ligação preferencial do Modelo

Natal. Figura retirada da referência [4] . . . . . . . . . . . . . . . . . . . . . . 51

3.10 (a) Análise da distribuição de conectividade para αA = 2 e valores típicos de αG.

Simulação realizada para N = 104 e 3000 amostras. (b) Comportamento da rede ao

variar o parâmetro αA para αG = 2. Simulação realizada para N = 105 nós e 1000

amostras. As linhas foram ajustadas por uma função q-exponencial. . . . . . . . . 52

3.11 (a) Sítios distribuídos no plano para valores de αG = 0 e αA = 1. É possível

observar a preseça de pólo mesmo em uma rede pequena. (b) Sítios distribuídos no

plano para valores de αG = 0 e αA = 5. É notório que ao aumentamos o valor de

αA o surgimento de pólos é inibido. Ambas as figuras são simulações feita no pajek

para N = 300 e seus respectivos valores de αG e αA. . . . . . . . . . . . . . . . . 53

3.12 (a) Comportamento do de q com αA. (b) Comportamento de η com αA. . . . . . 54

3.13 (a) Evolução dinâmica da conectividade do sítio i = 10 para diversos valores de αA.

Podemos obervar como o expoente β, que traduz como a conectividade de um dado

sítio muda com o tempo, dimimui com o aumento de αA. (a) Comportamento do

expoente dinâmico β com relação a αA. . . . . . . . . . . . . . . . . . . . . . . 55

4.1 Ilustra o processo dinâmico de ligação preferencial do Modelo de Afinidade com

Métrica. As diferentes cores representam as características intrínsecas (η) do sítio.

O vértice que chega à rede é colocado a uma distância r do centro de massa e se liga

a um dos sítios pré-existentes da rede. . . . . . . . . . . . . . . . . . . . . . . . 62

xii

Page 13: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

4.2 A figura acima ilustra uma rede gerada pelo Modelo de Afinidade com Métrica. Os

sítios azuis, vermelhos e amarelos representam sítios com η < 0.33, 0.33 < η < 0.66

e η > 0.66 respectivamente. Simulação realizada no Pajek com 1000 sítios. . . . . 62

4.3 Ditribuição dos sítios no plano para αG = 0 e 5 com αA = 1 . . . . . . . . . . . . 64

4.4 (a) Ditribuição dos sítios no plano para αG = 0 e αA = 1. (b) Distribuição dos sítios

no plano para αG = 0 e αA = 5. Ao comparar as duas figuras vemos nitidamente que

as ligações entre os sítios muda quando variamos αA. Observamos que a as ligações

são distribuídas de forma mais homogênea em (b). Simulação gerada no Pajek para

uma rede de 300 sítios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4.5 Distribuição de conectividade do Modelo de Afinidade com Métrica para αA = 2

e diferentes valores de αG. Notamos que a distribuição de conectividade não sofre

alterações significativas ao variarmos αA. Simulação realizada para N = 105 sob 103

amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.6 Distribuição de concectividade com αG = 2 e diferentes valores de αA. É notória

a transição do regime de livre escala, descrita por uma lei de potência, para uma

rede aleatória clássica, quando aumentamos αA da rede. Os ajustes foram feitos

utilizando a equação de P (k) = P0e−k/κq , onde ek/κq ≡ [1 + (1 − q)k/κ]1/(1−q) da

mecâncica estatística não extensiva de Tsallis. As simulações foram realizadas para

N = 105 sob 103 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.7 Comparação entre Modelo Natal (MN) e o Modelo de Afinidade com Métrica (AM)

sob a variação do parâmetro αA. Simulação realizada para N = 105 sob 103 amostras. 69

4.8 Evolução temporal da conectividade do sítio i = 10. Cada ponto foi gerado para

uma rede de N = 105 sob 103 amostras. . . . . . . . . . . . . . . . . . . . . . . 71

4.9 Comportamento de β(η, αA) com η. Podemos observar que a dependência de β

com η é suavizada à medida que aumentamos a importância da distância na ligação

preferencial. Cada ponto foi gerado para uma rede de N = 105 sob 103 amostras. . 72

4.10 Comportamento de β(η, αA) com αA, analisado para valores de η = 0.1, η = 0.5 e a

rede geográfica. Cada ponto foi gerado para uma rede de N = 105 sob 103 amostras. 73

4.11 Ajustes das curvas para diferentes valores de αA controlados pelos parâmetros, q

e κ, da função q-exponencial. (a) q é uma função decrescente de αA. (b) κ é um

parâmetro crescente de αA. Simulações realizadas para N = 105 e 103 amostras. . 75

xiii

Page 14: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Lista de Tabelas

2.1 Tabela ilustrativa mostrando redes reais o tipo de correlação de grau existente em

cada uma delas. N representa o tamanho do sistema e r é o coeficiente de correlação

de Pearson. Tabela retirada da Ref. [5] . . . . . . . . . . . . . . . . . . . . . . . 24

2.2 Dados de redes reais. N é o número de sítios, E é o número de arestas, γ é o

expoente da distribuição de conectividade, C é o coeficiente de agregação e l é o

menor caminho médio.Tabela retirada da referência [2] . . . . . . . . . . . . . . 34

3.1 Sumário dos mecanismos de alguns modelos de rede.Tabela retirada da referência [6] . . 58

4.1 O Modelo de Afinidade com Métrica, tem como casos particulares o Modelo de

Barabási-Albert, o Modelo de Afinidade e o Modelo Natal. É um modelo mais com-

pleto que engloba na rega de ligação preferencial o efeito da conectividade, homofilia

e métrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

xiv

Page 15: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capıtulo 1Introdução

Muitos sistemas reais, em diversas áreas do conhecimento (física, biologia, química,sociologia, economia, tecnologia, etc.), apresentam um alto grau de coplexidade. O estudode suas propriedades, por meio de abordagens clássicas, não obteve sucesso. Existem muitossistemas que têm um número grande de constituintes e que suas propriedades macroscópicasou coletivas não estão, em geral, relacionadas com as propriedades de seus constituintes indi-viduais, neste caso, estamos diante de um sistema complexo. Uma das grandes dificuldadesencontradas ao se estudar sistemas complexos está no fato de que os modelos matemáticosutilizados para descrever esses sistemas estão relacionados com a solução de equações dife-renciais não-lineares, o que torna muito difícil a solução numérica e/ou analítica (quandoexistente) de tal sistema [7].

Dentro dessa grande área de Sistemas Complexos existem sub-áreas de estudo dasquais uma delas é Redes Complexas, área a qual nos remeteremos nessa dissertação. Esta éuma área de estudo interdisciplinar, que usa o formalismo matemático da teoria de grafos eas ferramentas da Mecânica Estatística para compreender sistemas que podem ser modeladoscomo grafos (ou redes). Nas últimas décadas alguns integrantes da comunidade científica têmmostrado um grande interesse no estudo desses sistemas. Constantemente nos deparamoscom sistemas que se organizam e se agrupam, estabelecendo conexões, ligações entre seusconstituintes, construindo assim, estruturas complexas que podem ser analisadas utilizandoo formalismo de redes.

Um exemplo de um sistema complexo bastante conhecido e que faz parte do cotidiano

1

Page 16: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 1. Introdução 2

de praticamente todas as pessoas é a Internet. Hoje em dia, a internet tem se tornado omaior e mais completo meio de comunicação, propagação de informação e entretenimento. Ainternet é um sistema dinâmico que tem crescido constantemente. A cada instante milharesde computadores ou disposivos de telecomunicação (celulares, smartphones, tablets, etc.) temsido interligados por conexões físicas ou sem fio (wireless). Com o avanço tecnológico pode-seenviar e receber informações “quase que instantaneamente” a qualquer hora e em qualquerlugar, mostrando o quanto as pessoas estão conectadas. As informações se propagam muitorapidamente nessa rede, um vídeo é colocado na internet e em algumas horas ele já marcamilhões de acessos. Como estudar esse tipo de sistema com tantos constituintes conectadosentre si e que evolui constantemente com o aumento de computadores ou dispositivos móveis?Como se progaga a informação nessa rede? Uma das maneiras de estudar o comportamentoe as propriedades desse sistema é tratá-lo como um grafo, onde os nós são os computadoresou dispositivos físicos, e os cabos de rede ou conexões sem fio são as ligações. Através dessaabordagem é possível obter informações como: menor caminho (caminho mais curto que unedois nós na rede), o quanto os sítios estão agregados entre si e como a conectividade estádistribuída entre eles.

A internet é apenas um dos sistemas que podem ser estudados através das ferra-mentas da área de Redes Complexas. Redes estão presentes em quase todos os aspectos denossas vidas. O mundo tecnológico que nos rodeia está repleto de redes. Como exemplo des-sas redes tecnológicas temos as redes de comunicação, que consistem de telefones e celulares,redes de aeroportos, rede elétrica, Internet e World-Wide Web. A sociedade também está"conectada"por relações de amizade, relações profissionais, idéias em comum, relações de ne-gócios entre pessoas e empresas, etc. Todos esses tipos de interações entre as pessoas tambémpodem constituir uma rede. Podemos ainda observar que cidades e países estão interligadospor estradas e aeroportos. Na biologia temos ainda a rede de propagação de epidemias, redesneurais, redes de interação entre genes e proteínas. Temos também redes ecológicas, taiscomo a relação presa-predador, como por exemplo a rede da cadeia alimentar [8]. O mundofísico é também rico em fenômenos de redes, tais como, a interação entre átomos e a matéria,entre monômeros em polímeros, entre grãos em meios granulares e a rede de relações entreconfigurações similares de proteínas. São ínumeros os exemplos de sistemas que podem serestudados sob a perspectiva de redes. De fato, qualquer sistema que possua "objetos"queestão interligados por algum tipo de relação, podem ser estruturados como uma rede.

A Teoria de Grafos é usada matematicamente para descrever os conceitos em redes.Grafos representam as propriedades topológicas principais de uma rede pelo simples trata-

Page 17: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 1. Introdução 3

mento da rede como um conjunto de nós e arestas. A teoria de grafos tem suas raízes noséculo XVIII com o famoso problema das pontes de Königsberg, solucionado por Euler que éconsiderado o pai dessa teoria. O problema consistia em encontrar um caminho a qual fossepossível visitar todas as porções de terra da cidade passando por todas as pontes uma únicavez. Para resolver este problema, Euler representou a cidade por um grafo, em que os vérticesrepresentavam as porções de terra e as ligações representavam as pontes. Ele mostrou que eraimpossível realizar tal trajeto. Os simples argumentos utilizados por Euler para solucionaro problema mostraram a força da teoria de grafos, permitindo a dedução de propriedades desistemas do mundo real por meio da construção de um modelo muito básico.

A teoria de grafos, no entanto, geralmente se concentra no estudo de grafos especiaiscom propriedades extremas, grafos estáticos. Os exemplos de redes reais citados em pará-grafos anteriores são dificilmente apropriados para tais pesquisas por meio da abordagemde teoria de grafos. Estas redes mudam constantemente no tempo. Por exempmlo, laçossociais são criados e desfeitos constantemente, redes tecnológicas são mudadas diariamentepela adição de novos nós, redes biológicas mudam por processos evolutivos e por processosambientais, etc. O tratamento de grafos padrão não conseguia descrever estas redes quemudam constantemente.

Por volta de 1960, os matemáticos Paul Erdös e Alfred Rényi fizeram as primeirasanálises em Redes Complexas introduzindo um novo conceito que permitia o tratamentodessas redes o qual deu origem à Teoria de Grafos Aleatórios. A ideia consistia em combinaros conceitos da teoria de grafos com as ferramentas da teoria da probabilidade e considerarfamílias de grafos ao invés de grafos específicos. A teoria de grafos aleatórios está para ateoria de grafos assim como a mecânica estatística está para a física Newtoniana. A teoriamicroscópica fundamenta o comportamento de pequena escala, mas quando o conjunto inteiroé considerado, novos conceitos estatísiticos e comportamentos coletivos surgem.

Uma vez que a física estatística lida com sistemas de muitos átomos e moléculas inte-ragentes, é natural considerar que os métodos utilizados nessa área sejam úteis no estudo deredes. De fato, estudos da física estatística, como: percolação, dimensionamento, parâmetrosde ordem, renormalização, auto-similaridade, transições de fase, e expoentes críticos estãopresentes também na área de grafos aleatórios, e são usados no estudo de tais redes [8].

Com o avanço tecnológico e computadores cada vez mais potentes, no fim do séculoXX, com o acesso a dados de grande escala e ferramentas para analizá-los, tornou-se claroque a teoria de grafos aleatórios clássicos era falha na descrição de muitas redes do mundo

Page 18: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 1. Introdução 4

real [8]. Os trabalhos de Barabási e Albert sobre a WWW [9], e o de Faloutsos et al. sobreos roteadores de Internet [10] mostraram que a distribuição de ligações entre os sítios dessessistemas não era completamente aleatória, e não podia ser descrita pela teoria de grafosde Erdös e Rényi. Estas redes, no entanto apresentavam uma distribuição do tipo Lei dePotência com o expoente γ entre 2 e 3 (geralmente), caracterizando o surgimento de pólos.Nestas redes a distribuição de ligações entre os sítios não era democrática. Poucos sítiosapresentavam alta conectividade enquanto que a maioria dos sítios tinham pouquíssimasligações.

Redes desse tipo foram primeiro estudadas por Barabási o qual propôs um modelosimples para a obtenção de redes com distribuição de conectividade do tipo lei de potênciada forma P (k) ∝ k−γ [9]. A partir do modelo de Barabási-Albert muitos modelos teóri-cos foram propostos incluindo os ingredientes necessários para se obter uma distribuição deconectividade em lei de potência.

O modelo de Barabási-Albert, embora muito importante devido aos resultados pro-duzidos, não leva em conta um fator extremamente importante em sistemas competitivos.Nem todos os sítios, mesmo tendo a mesma conectividade, têm a mesma habilidade de compe-tir por ligações. Desta forma, apenas a idade do sítio determinada se ele será muito conectadoou não, no modelo de Barabási. Esse “problema”, deu origem a diversos outros modelos, den-tre os quais podemos citar três: o Modelo de Qualidade [11], o Modelo de Afinidade [3] eo Modelo Natal [12, 13], os quais serão apresentados com mais detalhes no decorrer destetrabalho. No Modelo de Qualidade, o sítio nasce com uma habilidade intrínseca de adquirirligações e quanto maior essa habilidade, maior a sua capacidade em ganhar ligações. Já noModelo de Afinidade, o sítio nasce com uma dada característica e tende a se ligar a outrossítios que sejam semelhantes a ele, explorando a ideia muito comum em redes sociais de “ho-mofilia”. Neste sentido, os sítios mais conectados serão aqueles que tiverem característicasmais semelhante ao todo. Dado que na maioria dos modelos propostos, a distância entre ossítios é puramente topológica, o Modelo Natal inclui métrica no estudo de redes complexas,passando a considerar a distância Euclidiana entre os sítios. Neste modelo os sítios que estãomais próximos geograficamente tendem a se ligar.

Observamos que em diversas redes sociais, a ligação entre indivíduos é estabalecidapor vínculos de afinidade e distância. Pessoas desenvolvem relacionamentos devido à proxi-midade geográfica (relacionamentos profissionais, por exemplo) e por semelhanças (amizadas,casamentos, etc.). Propomos nessa dissertação um modelo de redes que busca englobar es-tes dois fatores na ligação preferencial. Analisaremos um sistema competitivo que incorpora

Page 19: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 1. Introdução 5

em sua distribuição de conectividade três fatores responsáveis pela competição por ligações:afindade, distância, e conectividade. Através dos resultados dessa simulaçao pretendemosanalisar como o efeito da distância influencia nas ligações por homofilia.

A dissertação está organizada em cinco capítulos. No capítulo dois serão aborda-dos os conceitos inicias necessários para a compreensão da área de redes, as característicasprincipais de uma rede, suas propriedades topológicas e alguns exemplos de redes reais. Noterceiro capítulo serão apresentados quatro modelos teóricos necessários para a compreensãoe fundamentação deste trabalho: o Modelo de Barabási-Albert, o Modelo de Qualidade, oModelo de Afinidade e o Modelo Natal. No quarto capítulo apresentaremos a nossa contri-buição ao estudo de Redes Complexas. Será discutido um modelo mixto, chamado Modelode Afinidade com Métrica, o qual engloba a distância Euclidiana, apresentada no ModeloNatal, e o efeito de Homofilia, proveniente do Modelo de Afinidade. Ainda neste capítuloapresentaremos os resultados gerados por este modelo, bem como as discussões. No últimocapítuto, apresentaremos as conclusões e perspectivas para trabalhos futuros.

Page 20: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capıtulo 2Principais conceitos e modelos de redes

Redes estão presentes em quase todos os aspectos de nossa vida: tecnológico, social,econômico, ecológico e biológico. A abordagem de sistemas com vários componentes interli-gados pode ser descrita, de forma simples, na área de redes complexas. Atualmente, sistemascom vários componentes interligados têm sido estudados sob a perspectiva de redes devidoao avanço computacional, que tem permitido simular sistemas com um número de elementoscada vez maior, e também devido à simplicidade de tratamento encontrada nessa área. Nestecapítulo revisaremos os conceitos fundamentais necessários à compreensão desses sistemas emostraremos algumas das características gerais de algumas redes reais.

2.1 Definição de Redes

De uma forma bem simples, uma rede é um conjunto de objetos conectados entresi. A fundamentação matemática do estudo de redes está na Teoria de Grafos. Pode-sedizer que essa teoria teve seu início em 1736 na cidade de Königsberb quando o matemáticosuíço Leonard Euler resolveu o problema das “pontes de Königsberb”. O rio Pregel cortava acidade de tal forma que ela possuía duas ilhas. Devido à dificuldade de transporte de cargase pessoas através de barcos, sete pontes foram construídas entre as ilhas e suas margens. Oproblema clássico das pontes de Königsberg consistia em responder à seguinte questão: existealgum caminho pelo qual seja possível atravessar todas as sete pontes e retornar ao ponto

6

Page 21: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 7

de partida sem passar pela mesma ponte mais de uma vez? Euler considerou o problemae montou um diagrama representativo do mapa da cidade. Essa representação esquemáticaé o que chamamos hoje de grafos (ver Fig. 2.1)1, ele modelou o problema de tal formaque cada porção de terra foi representada por um vértice e cada ponte por uma aresta [14].Através dessa modelagem simples Euler mostrou que era impossível realizar este trajeto, poisos vértices deveriam apresentar um grau2 par de arestas e como todos os vértices possuíamum grau ímpar, o percurso se tornava impossível [15].

Figura 2.1: Representação esquemática das sete pontes de Königsberg e sua simplificação em formade grafos. Cada porção de terra é um vértice e cada aresta é uma ponte.

A teoria de grafos é utilizada para descrever matematicamente os conceitos da te-oria de redes. Grafos representam as propriedades topológicas essenciais de uma rede pelotratamento da mesma como sendo um conjunto de nós e arestas [8]. Os físicos, em geral,empregam a seguinte nomenclatura: os vértices (ou nós) recebem o nome de sítios e as ares-tas (ou arcos) são as conexões (ou ligações). Embora algumas vezes redes e grafos sejamapresentados como sinônimos, existe uma diferença sutil e conceitual entre esses termos. Osgrafos são representações abstradas de redes complexas, enquanto que em redes, os nós earestas possuem propriedades do sistema que está sendo estudado. Por exemplo, a rede de

1Figura retirada do site2O grau de um nó diz respeito à quantidade de primeiros vizinhos.

Page 22: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 8

computadores pode ser modelada por grafo, em que os vértices são os computadores e asarestas são os cabos entre eles. Apesar do conceito de grafos ser muito simples essa teoria émuito eficaz e tem sido aplicada com êxito na compreensão de diversos sistemas complexos[9, 16, 17, 18, 19, 10, 20, 21, 22, 23].

2.1.1 Grafos, conectividade e pólos

Em termos matemáticos um grafo G(V,E) consiste de dois conjuntos finitos e nãovazios de V vértices, E arestas (denotando as ligações entre os vértices) e uma função demapeamento (“mapping funcion”) que define como os vértices estão conectados uns aos ou-tros [24] (ver Fig. 2.2). É importante notar que em muitos contextos biológicos e físicos,V (número de vértices) define o tamanho da rede, uma vez que identifica o número de cons-tituintes que compõe o sistema. No entanto, em teoria de grafos, V define a ordem do grafoequanto que o seu tamanho é definido como o número de arestas E [25]. A menos queseja especificado, iremos sempre nos referir a N como sendo o tamanho do sistema. Pelasimplicidade do conceito de grafos, as propriedades estudadas dentro dessa teoria são umaferramenta poderosa para compreensão das redes complexas.

(a) Rede Quadrada

67

8

1

32

5

4

(b) Grafo com Pesos em Arestas

Figura 2.2: (a) Rede Quadrada - a conectividade dos sítios é fixa. (b) Grafo com Pesos em Arestas- As arestas mais espessas representam ligações com um peso maior. No estudo de redes esse pesopoderia estar associado ao nível de relacioamento entre pessoas, por exemplo: namoro, noivado ecasamento. Em que o namoro representa a ligação mais fraca e o casamento a ligação mais forte.

O número de arestas de um vértice é definido como grau do vértice, essa grandezaé também chamada de conectividade k. Se dois vértices estão conectados, dizemos que

Page 23: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 9

eles são adjacentes ou vizinhos. Para um grafo de tamanho N o número máximo de ligaçõesque são permitidas é N(N − 1)/2. As redes podem ser direcionadas3 ou não direcionadas,dizemos que ela é direcionada se as arestas têm direção neste caso existe uma conexão deentrada e outra de saída, de forma que a conectividade total de um sítio será k = ki + ko,onde ki é a conectividade de entrada (in) e ko a conectividade de saída (out). Se a redefor não direcionada falamos apenas em conectividade do sítio. Uma outra propriedade dasredes é que elas podem apresentar peso em suas arestas, representando um custo ou umadistância, ligações que podem ser desfeitas mais facilmente que outras, expressando ligaçõesfortes ou fracas (ver Fig. 2.2.b). As redes podem ser classificadas ainda como estáticas oudinâmicas. Nas redes estáticas o número de sítios e ligações é constante, enquanto que emredes dinâmicas o crescimento se dá com a adição de novos nós e arestas a cada instantede tempo. Nessa dissertação trataremos apenas de redes não-direcionas e sem pesos, casocontrário, explicitaremos (ver Fig. 2.3).

(a) Direcionado (b) Não Direcionado

Figura 2.3: (a) Rede direcionada - é possível calcular conectividade de entrada e saída do nó. Aconectividade de entrada do sítio 1 é ki = 3 e a de saída é ko = 3 portanto a conectividade total ék1 = 6. (b) Mesma rede porém não direcionada. A conectividade do sítio 1 é k1 = 6.

As redes são mapeadas de acordo com a forma como os seus sítios se conectam. Essaforma define sua topologia (ou sua estrutura). Podemos caracterizar os grafos de acordo comsua topologia , da seguinte forma (ver Fig. 2.4)4 [24]:

1. Grafos Aleatórios - têm estruturas completamente aleatórias não exibindo uma formadefinida, seus vértices apresentam conectividades que flutuam em torno de uma graumédio.

3Grafos direcionados são chamados de digrafos.4Figuras retiradas do site http://www.gta.ufrj.br/grad/12_1/freenet/otimizacao.html

Page 24: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 10

2. Grafos Regulares - têm estruturas determinísticas bem definidas (rede triangular, redequadrada, rede hexagonal, etc.), e todos os sítios possuem a mesma conectividade.

Entre estes dois extremos existem duas classes de grafos muito importantes:

1. Mundo Pequeno - na maior parte estruturado porém parcialmente aleatório em suaestrutura; Possui um alto grau de agrupamento entre seus sítios e um caminho muitocurto entre eles.

2. Árvore (Livre Escala) - na maior parte aleatório e parcialmente estruturado. Umacaracterística desse tipo de grafo é possuir coeficente de agregação zero (ver seção2.2.4). Nesse tipo de grafo só há um caminho entre dois sítios quaisquer da rede.

Podemos classificar os nós pela sua conectividade. O nó com o maior grau em umgrafo, ou seja, o sítio mais conectado, é chamado de pólo. Podem existir mais de um pólo e apresença deles em uma rede muda a estrutura da mesma, mudando assim sua topologia. Ospólos são caracetísticos de redes de livre escala.

2.2 Conceitos

A dinâmica de uma rede é definida por um conjunto de micro regras que gover-nam o comportamento dos nós e ligações. Estas regras são dadas em um micro nível, paradistingui-las de comportamentos em nível macro da rede. Especificamente, as regras a nívelmicro ditam o comportamento de ligações e nós, e as regras a nível macro ditam o apare-cimento de propriedades globais da rede. Por exemplo, a ligação preferencial (as ligaçõessão atraídas por nós muito conectados), é uma micro regra, enquanto que a distribuiçãoem lei de potência da rede é uma regra a nível macro. Os cientistas estão interessadosprincipalmente com o entendimento das propriedades globais pelo estudo das micro regras[24]. Este comportamento global pode ser evidenciado pelo estudo de diversas propriedades.Nesta seção abordaremos aquelas que são essenciais para a compreensão deste trabalho, taiscomo: distribuição de conectividade, coeficiente de agregação, menor caminho, homofilia ecorrelações.

Page 25: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 11

(a) Regular (b) Aleatório (c) Mundo Pequeno

(d) Árvore

Figura 2.4: Representação das classes dos grafos.

2.2.1 Distribuição de Conectividade

A distribuição de grau é a característica estatística mais simples de uma rede alea-tória, e geralmente é só o primeiro passo para a descrição da rede. A estrutura topológica deum grafo está totalmente relacionada com a sua distribuição de grau. Portanto, a escolha dadistribuição é fundamental ao criar um modelo de rede, pois esta determina a classe do grafo.Em redes reais, o cálculo da distribuição de conectividade P (k) é importante na classifica-ção dos diferentes tipos redes quanto à sua topologia. Notavelmente, em muitas situações oconhecimento da distribuição de grau é suficiente para o entendimento da rede e o que estáacontecendo nela.

A distribuição de conectividade determina como estão distribuídas as ligações entreos sítios da rede. Matematicamente, P (k) é definida como sendo a probabilidade de um sítio,

Page 26: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 12

escolhido ao acaso, ter exatamente k ligações, de forma equivalente, mostra a fração de sítiosde uma rede que apresentam conectividade k. Em redes direcionadas é necessário considerarPin(k) e Pout(k) representando a conectividade de entrada e saída do nó, respectivamente. Osnós de uma rede, com excessão de redes regulares, possuem um número distinto de ligações.A forma como a conectividade está ditribuída na rede é analisada pelo gráfico de P (k), oupelo cálculo de seus momentos de ordem n.

〈kn〉 =∑k

knP (k) (2.1)

O primeiro momento caracteriza a conectividade média da rede 〈k〉. O segundo momentoé uma medida das flutuações da distribuição de conectividade. Para compreender melhor oconceito de distribuição de conectividade, listaremos abaixo algumas das distribuições obser-vadas no estudo de redes complexas.

a. Distribuição de Poisson: essa distribuição descreve sistemas com um número muitogrande de constituintes (N →∞) e eventos que ocorrem com probabilidade p pequena.É uma distribuição discreta e pode ser definida como:

P (k) =e−〈k〉〈k〉k

k!(2.2)

Uma vez que P (k) ∼ 1/k!, essa função decai muito rapidamente para k grande, porémtodos os seus momentos de ordem n são finitos, mesmo que o tamanho da rede N →∞.A conectividade média da rede é dada por 〈k〉 =

∑k kP (k). Uma rede que pode ser

descrita por esse tipo de distribuição é a Rede Aleatória Clássica. Grafos aleatóriosclássicos seguem uma distribuição de Poisson quando seu número de vértices tende aoinfinito e sua 〈k〉 é fixa. Devido à essa propriedade dizemos que esse sistema possuiuma escala típica de distribuição (ver Fig. 2.5)5.

b. Distribuição de conectividade tipo Lei de Potência: Dada por

P (k) ∝ k−γ (2.3)

com γ sendo o expoente característico da distribuição. Ao contrário da distribuiçãode Poisson, em que as redes descritas por esta apresentam uma escala típica, redescom comportamento em Lei de Potência não apresentam uma escala típica para sua

5Figura retirada da Ref. [26]

Page 27: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 13

Figura 2.5: Gráfico ilustrativo mostrando a diferença de comportamento de uma distribuição dotipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Dolado esquerdo temos os gráficos plotados na escala linear e do lado direito dados na escala log-log.Ambos possuem o mesmo grau médio 〈k〉 = 10.

conectividade. Devido à essa propriedade tais redes descritas por essa distribuição sãoditas livres de escala.

Inúmeras redes reais têm uma distribuição de grau que decai mais lentamente, ondeos pólos surgem com uma notável probabilidade e desempenham um papel essencial.Estas redes são descritas por uma lei de potência com o expoente característico γ entre2 e 3, em geral. É possível ver matematicamente para redes livres de escala que quandoN → ∞, ou seja, para redes de tamanho infinito, todos os momentos de ordem n > 1

divergem quando γ ≤ 3, que é a faixa de valores de γ para a maioria das redes reais[27].

c. Distribuição Discreta: uma distribuição de probabilidade pode ser discreta ou contínua,porém as redes que crescem deterministicamente têm um espectro de distribuição dis-creto. Todas as simulações realizadas para esta dissertação são feitas com distribuiçõesdiscretas.

Podemos ainda classificar as redes de duas formas de acordo com a sua distribuiçãoP (k): redes homogêneas e redes heterogêneas. As redes homogêneas tais como as redesaleatórias e mundo pequeno possuem uma distribuição de conectividade binomial ou de pois-son onde as conectividades se distribuem em torno de um valor médio 〈k〉. Dizemos que aconectividade está homogeneamente distribuída na rede. Contudo, as redes heterogêneas,tais como as redes de livre escala têm uma distribuição de conectividade de “cauda longa”,seguem uma lei de potência e não apresentam uma conectividade típica. Nestas redes existem

Page 28: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 14

sítios muito conectados e sítios quase sem conexão. Uma das maiores características de redesheterogêneas é que elas são altamente robustas a ataques aleatórios e altamente frágeis aataques dirigidos aos pólos, isto é, as propriedades de conectividade de uma rede heterogêneacomo um todo, não são afetadas pela remoção aleatória de uma fração de nós quando com-parada com uma rede homogênea. Contudo, elas são drasticamente afetadas pela remoçãopreferencial dos pólos, levando à fragmentação da rede [28]. O nível de heterogeneidade deuma rede pode ser medida pelo parâmetro κ:

κ =〈k2〉〈k〉

(2.4)

As redes de livre escala são caracterizadas por κ → ∞, enquanto que as redes homogêneaspossuem κ ∼ 〈k〉 [26].

2.2.2 Menor Caminho Médio

É possível estabelecer um caminho entre dois sítios quaisquer em rede complexa detal forma que o comprimento desse caminho pode ser medido pela quantidade de ligaçõesintermediárias entre estes nós. Na maioria das vezes não existe um único caminho entreeles, porém o caminho de maior interesse físico é o que chamamos de menor caminho. Ocomprimento entre dois vértices quaisquer é calculado pela soma do número total de arestasentre eles. Quando dois vértices i e j estão desconectados, define-se a distância entre elesinfinita, ou seja, dij =∞.

O menor caminho tem um papel importante no transporte de informação dentrode uma rede, como por exemplo, o envio de um pacote de dados de um computador paraoutro através da internet. A geodésica (o menor caminho) fornece um caminho ótimo para atransmissão desse pacote de dados, permitindo uma transferência mais rápida e econômica,em termos de recursos do sistema. Um outro exemplo é o processo de retirada do petróleo, éde extrema importância encontrar o menor caminho entre o poço injetor e o coletor. Destaforma, o estudo do menor caminho em uma dada rede desempenha um importante papel nacaracterização da sua estrutura interna [29]. Esse conceito é muito importante no estudo depropagação de informação em uma rede.

De uma maneira formal dizemos que a medida da separação típica entre dois nósem um grafo é dada pelo comprimento do menor caminho médio, também conhecido como

Page 29: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 15

comprimento do caminho característico. Podemos definir o menor caminho médio da redecomo sendo a média de dij tomada sobre todos os N(N − 1)/2 pares de vértices (i, j).

l =2

(N)(N − 1)

∑i<j

dij (2.5)

Em alguns grafos aleatórios, o menor caminho médio cresce logaritmicamente com o tamanhodo sistema N , ou seja, 〈l〉 ∼ logN . O fato de que qualquer par de sítios está conectado poruma distância pequena caracteriza o efeito de mundo pequeno. A rede de colaboração deatores e a WWW são dois importantes exemplos de redes que apresentam esse comporta-mento.

Ao falar de caminho em redes, um outro conceito interessente é o de diâmetro darede lD. Ao contrário do menor caminho médio, lD se refere ao maior comprimento entredois sítios quaisquer da rede. A importância deste se aplica a análises referentes à robustezda rede, ou seja, o quanto ela é vulnerável a ataques dirigidos6 ou aleatórios7 (ver Fig. 2.6).Alterações no valor do diâmetro são indicativos de quão forte é a estrutura topológica darede.

6Ataques direcionados aos pólos.7Ataques direcionados aos sítios da rede de forma estocástica.

Page 30: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 16

Figura 2.6: Figura exibindo a fragilidade e robustez das redes aleatórias e delivre escala.

Figura retirada do site http://escoladeredes.net/profiles/blogs/redes-complexas-da-internet-as

Page 31: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 17

2.2.3 Experimento de Milgran - o efeito de mundo pequeno

O estudo do menor caminho na rede remete-nos imediatamente a um experimentofamoso que, ao estudar a distância média entre duas pessoas quaisquer da sociedade, mostrouque esse valor era muito menor que o esperado, disseminando a ideia de que o “mundo épequeno”. Em 1967, Stanley Milgram realizou um experimento para medir a distância emuma rede de “conhecidos” nos Estados Unidos [30]. A questão em estudo foi: Quantasligações intermediárias separam dois indivíduos (distantes geograficamente) aleatoriamenteselecionados?

Milgram escolheu duas regiões para fazer sua experiência: Nebraska e Kansas, comopontos de partida, e Massachusetts, como alvo. A pessoa alvo foi escolhida em Massachusettse um número grande de pessoas escolhidas aleatoriamente em Nebraska e Kansas, receberamuma carta contendo as seguintes instruções:

1. Se você conhece a pessoa alvo, envie a carta diretamente para ela;

2. Caso contrário, envie uma cópia destas instruções para uma pessoa “conhecida” (alguémque você saiba o primeiro nome) que provalmente tenha mais chance de conhecer apessoa alvo.

O resultado da experiência foi surpreendente, pois esperava-se que um número muito grandede cartas fossem necessárias para chegar à pessoa alvo. Milgram mostrou no seu experi-mento que as pessoas estão separadas umas das outras, em média, por apenas “seis graus deseparação”, ou seja, é necessário, em média, apenas seis pessoas para ligar quaisquer duaspessoas nos EUA. Embora esse experimento tenha sido realizado apenas nos Estados Unidos,acredita-se que este número representa um resultado global (ver Fig. 2.7)8. A contribuiçãode Milgran foi além calcular a distância entre as pessoas, este resultado é uma das primeirasdemonstrações diretas do efeito de mundo pequeno [31]. Inúmeras redes reais tem comporta-mento do tipo mundo pequeno. Esse fenômeno deu origem ao estudo de uma classe de redescomplexas que apresentam essa característica as quais foram chamadas de redes de mundopequeno.

8Figura retirada do site http://www.tiagodoria.ig.com.br/2008/05/28/os-6-graus-de-separacao-da-wikipedia

Page 32: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 18

(a)(b)

Figura 2.7: (a) Mapa dos Estados Unidos onde a região azul mostra o local onde as cartas foramdistribuídas, região vermelha mostra o local onde a pessoa alvo se encontra. (b) Esquema ilustrativodo resultado obtido no experimento de Milgram “Seis Graus de sepração”.

2.2.4 Coeficiente de Agregação

O Coeficiente de Agregação é uma grandeza que informa o quanto os primeirosvizinhos de um dado sítio estão conectados entre si. Isso nos dá uma característica local donó e foi primeiro introduzida por Watts e Strogatz. Depois da distribuição de conectividade,o coeficiente de agregação é um dos parâmetros mais estudados em redes reais [32]. Estárelacionado com ciclos de comprimento três (triângulos de ligações) presentes na vizinhançade um dado sítio. Em muitas redes é achado que se o vértice A está conectado com o vérticeB e o vértice B está conectado com o vértice C então existe uma grande probabilidade deque A esteja conectado com C9.

Na linguagem de redes sociais dizemos que “o amigo de um amigo são prováveisamigos” [31]. De maneira formal o coeficiente de agregação é a probabilidade que doisvizinhos próximos de um nó estejam conectados entre si, em outras palavras, se um nó j temkj (grau do sítio j) vizinhos próximos com nj (número de todas as conexões dos vizinhosmais próximos do sítio j) conexões entre eles o cofeciente de agregação local é:

cj(kj) =nj

kj(kj − 1)/2(2.6)

9Essa propriedade também é conhecida como Transitividade da rede

Page 33: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 19

Em que kj(kj − 1)/2 é o número total de ligações possíveis entre os vizinhos dos sítio j. Ocoeficiente de agregação médio da rede pode ser obtido fazendo-se a média dos ci individuaispelo tamanho da rede, ou seja, pelo número total de vértices.

C =1

N

∑i

ci =1

N

∑i

niki(ki − 1)/2

(2.7)

O cálculo dessa grandeza é muito útil em redes sociais devido ao fenômeno de for-mação de “panelinhas”. Pessoas tendem a se organizar em grupos por meio de interesses ousemelhanças que existem entre si (ver Fig. 2.8). Uma propriedade muito importante presenteem algumas redes são as comunidades. Devido à sua semelhança ao conceito de agregaçãoessas propriedades são as vezes confundidas. Dizemos que uma comunidade é um conjuntode vértices compartilhando as mesmas propriedades topológicas, equanto que um grupo ou“cluster” é uma parte de um grafo onde existem mais ligações internas do que externas. Noentanto, as propriedades que os vértices têm em comum podem ser as ligações, desta formaum grupo pode ser sempre associado a uma comunidade do mesmo tipo e comunidades geral-mente correspondem a subgrafos agregados. Estas quantidades não são apenas importantespara a caracterização topológica do grafo, mas atualmente elas podem dar alguma informaçãosobre a formação da rede e sua funcionalidade (ver Fig. 2.9) [25].

2.3 Redes correlacionadas

Na seção anterior falamos da formação de comunidades em redes, mostrando quevértices com propriedades semelhantes se agrupam. A medida de quão similares dois vérticessão geralmente é quantificada por uma quantidade matemática chamada de correlação.

Além de sua distribuição de conectividade, é possível caracterizar as redes pela pre-sença de correlações [33]. Pesquisas realizadas para medir correlações em redes reais têmmostrado que muitas delas são correlacionadas [31, 23, 5]. Mesmo que a análise de dadosempíricos de redes reais indiquem a ausência de correlações, não significa que a mesma nãoexista, geralmente indica apenas que as correlações são fracas, ou que um método inedaquadofoi utilizado para detectar tais correlações. É importante ressaltar que todos os modelos decrescimento de redes são correlacionados, pois em processos de crescimento a presença deligações entre os nós depende da idade e do grau desses nós, e existe uma assimetria entre os

Page 34: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 20

1

Figura 2.8: Vértice verde tem 6 vizinhos próximo, e 5 ligações entre eles (arestas vermelhas) ocoeficiente de agregação do sítio 1 é c1 = 1/3.

Figura 2.9: Exemplo de comunidades presentes em um grafo.

Page 35: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 21

nós mais jovens e os mais velhos. Portanto, as correlações são praticamente inevitáveis, noentanto o tipo de correlação presente no sistema depende do modelo [27].

2.3.1 Correlação Grau-Grau

Em geral, a primeira propriedade estudada de um vértice é a sua conectividade.Dentre vários tipos de correlações que podem aparecer em redes complexas, a mais simplesé observar a conectividade dos primeiros vizinhos de um sítio [27, 34, 33]. Essa correlaçãopode ser descrita pela junção destes graus e pode ser expressada teoricamente em termosda probabilidade condicional P (k|k′). Geralmente esse tipo de correlação é chamada deCorrelação grau-grau e representa a probabilidade de que uma aresta escolhida aleatoriamenteconecte nós de grau k e k′ [33].

A completa informação sobre correlações grau-grau em redes reais podem ser obtidaspela medida de sua distribuição grau-grau conjunta P (k, k′). Porém, do ponto de vistanumérico é mais conveniente expressar essa correlação pelo significado do grau médio dosprimeiros vizinhos, pois diminui o custo computacional. Para medir essa correlação iniciamosde um vértice cujo o grau é k e então calculamos o grau médio 〈k〉 dos seus primeiros vizinhos.Essa função é em geral uma função do grau do vértice origem (aquele que se está analizando ograu dos primeiros vizinhos) e determina a “assortatividade” do grafo [25]. Dado um vérticei com conectividade ki temos [33]:

knn,i =1

ki

∑j∈V (i)

kj (2.8)

Onde o knn,i expressa o grau médio dos vizinhos mais próximos (nn - “nearest neighbors”) dosítio i e a soma é sobre todos os primeiros vizinhos do vértice i. A partir do cálculo do graumédio dos vizinhos podemos verificar a presença de correlação entre graus através de:

knn(k) =1

Nk

∑i/ji=k

knn,i (2.9)

onde Nk é o número de sítios com conectividade k e o somatório é sobre todos os primei-ros vizinhos so sítio i com grau ki = k. Podemos ainda reescrever essa última expressão

Page 36: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 22

alternativamente por:knn(k) =

∑k′

k′P (k′|k) (2.10)

A distribuição grau-grau tem levado às primeiras classificações de redes complexas de acordocom esta propriedade. Através do cálculo dessa grandeza podemos observar se a rede écorrelacionada ou não correlacionada a nível de conectividade (ver Fig. 2.10). Uma vezobservada a existência de correlações de grau em redes podemos classicar essas correlaçõesde duas formas:

• “Assortative mixing” - quando a função knn(k) é uma função crescente de k, dizemosque a rede correspondente exibe associatividade, isto é, os pólos da rede tendem a seconectar com os sítios mais conectados e então dizemos que existe uma correlação

positiva [33, 27, 34];

• “Desassortative mixing” - quando knn(k) é uma função decrescente de k a rede cor-respondente exibe desassociatividade, ou seja, os pólos da rede tendem a se conectarcom os sítios menos conectados e então dizemos que existe uma correlação negativa

[33, 27, 34]. Algumas vezes a curva knn(k) não é monotônica como na Fig. 2.10 eclaramente a distinção entre os dos tipos de correlação é impossível (ver Fig. 2.11).

Sociólogos geralmente caracaterizam correlações de grau-grau por uma quantidademais “rude” do que knn(k). Esta é conhecida como “Pearson correlation coeficient”, ou seja,coeficiente de correlação de Pearson que é definido como [27]:

r =〈kk′〉l − 〈k〉l〈k′〉l〈k2〉l − 〈k〉l

2 (2.11)

Onde k e k′ são os nós das extremidades finais de uma aresta e 〈〉l denota a médiasobre todas as ligações da rede. O coeficente de Pearson é um padrão de função de correlaçãoem pares normalizada de tal maneira que −1 ≤ r ≤ 1 e se a rede é não correlacionada, r = 0.

Um impressionante padrão que surge quando redes de diferentes tipos são compara-das é que a maioria das redes sociais parecem ser associativas enquanto que as redes biológicase tecnológicas parecem ser não associativas (ver Tab. 2.1) [34]. Estudos mostram que as redesque são associativas, percolam mais facilmente e apresentam uma robustez maior à remoçãode vértices [5, 34].

Page 37: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 23

disassortative assortative

uncorrelated

Figura 2.10: Gráfico ilustrativo de correlação de grau. Linha Azul a rede não apresenta correlaçãode grau. Linha vermelha a rede é desassociativa e linha preta a rede é assossiativa, ou seja, as linhasvermelha e preta apresentam correlação de grau e a linha preta mostra que não há correlação.

kFigura 2.11: Função knn(k) não é monotônica portanto não possível definir se a rede é associativaou desassociativa.

Page 38: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 24

Redes N rCo-autores de física 52 909 0.363Co-autores de biologia 1 520 251 0.127Co-autores de matemática 253 339 0.120Colaboração de atores em filmes 448 913 0.208Diretores de companhia 7 673 0.276Internet 10 697 −0.189

World-Wide Web 269 504 −0.065

Interações de Proteína 2 115 −0.156

Rede neural 307 −0.163

Cadeia alimentar 92 −0.276

Grafos aleatórios 0Gillaway et al. δ/(1 + 2δ)

Barabási e Albert 0

Tabela 2.1: Tabela ilustrativa mostrando redes reais o tipo de correlação de grau existente em cadauma delas. N representa o tamanho do sistema e r é o coeficiente de correlação de Pearson. Tabelaretirada da Ref. [5]

2.3.2 Coeficiente de Agregação

Falamos na seção 2.2.4 sobre o coeficiente de agregação. O coeficiente de agregaçãoé um tipo específico de correlação. Geralmente, redes reais apresentam estruturas fortementeagregadas (ver Tab. 2.2). Porém, alguns modelos, como por exemplo, Molelo de Barabási,Modelo de Qualidade, apresentam um coeficiente de agregação baixo. Muitos esforços foramfeitos para inventar mecanismos especiais com o intuito de aumentar a agregação mesmo empequenas redes. Porém, pesquisas recentes tem mostrado que o alto coeficiente de agregaçãoem alguns modelos de redes propostos é apenas um efeito de tamanho finito, ou seja, esseefeito tende a desaparecer com o aumento do tamanho do sistema [35, 9, 6, 27]. Nestes casos,não há necessidade de mecanismos eficientes para produção de forte agregação na rede. Oproblema então consiste em concluir com segurança se o coeficiente de agregação é um efeitodo tamanho finito da rede ou não [36] .

Em 2009 Newman propôs um modelo em que é possível verificar a presença deagregação na rede, sem contudo que esse efeito desapareça quando o sistema cresce [37]. Essemodelo é uma generalização direta do modelo de configuração [38] e possui um coeficiente

Page 39: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 25

de agregação finito mesmo em redes infinitas [27].

2.3.3 Homofilia

Uma característica muito importante que está presente, principalmente em redessociais, é a Homofilia. A medida dessa grandeza em uma rede, expressa o quão conectadosestão os sítios que apresentam características similares. Os indivíduos em uma rede socialgeralmente tendem a se agrupar por suas semelhanças, afinidades, interesses em comum, etc.Esse comportamento coletivo dá origem ao que chamamos de comunidades, em que pessoasse agrupam por terem um mesmo ideal, ou a mesma forma de se vestir, a mesma filosofiade vida, etc. Se escolhermos um grupo de amigos veremos que eles não representam umaamostra aleatória da população, contudo, quando vistos de forma global, eles apresentamcaracterísticas semelhantes entre si. Podemos citar como exemplo desse agrupamento porcaracterísticas em comum, uma pesquisa realizada em uma escola, para verificar os laços deamizade entre crianças. Evidenciou que crianças de uma mesma etnia estebeleciam vínculosde amizade em uma proporção bem maior do que entre crianças de diferentes etnias (verFig. 2.12)10).

Estudos na área de sociologia tem sido realizados no âmbito de compreender o pro-cesso de formação da sociedade. Similaridades nos atributos dos seres humanos tais como,idade, sexo, cor, religião, valores, inteligência, educação, etc. parecem caracterizar a forma-ção e dissolução de relacionamentos, como por exemplo em chats online, melhores amigos ecasamentos. Pesquisas mostram que a homofilia parece afetar fortemente as conexões entreos indivídios de uma sociedade [39]. Existem evidências empíricas que em muitas redesos sítios vizinhos mostram significante correlação em suas propriedades. Em sociologia essefenômeno é frequentemente chamado de “assortative mixing” [39].

A homofilia também tem tido significante importância no processo de propagação deinformação. Trabalhos recentes inspirados em redes de mundo pequeno, os quais mostram aimportância do menor caminho médio na transmissão de informação, têm estudado como sedá a propagação de informação por meio desses caminhos. Acredita-se que o menor caminhonão é o único achado interessante em redes de mundo pequeno, mas que existe outro achadode importância fundamental: Pessoas tendem a encontrar caminhos curtos para propagação

10Figura retirada do site http://escoladeredes.net/profiles/blogs/redes-complexas-da-internet-as

Page 40: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 26

Figura 2.12: Rede de amizade em uma escola americana. As relações de amizade foram estabelecidasem grupos. Os nós amarelos representam os brancos; nós verdes representam os afro-americanos;nós cor-de-rosa representam outros.

de informação de um indivíduo fonte a um indivíduo alvo, mesmo sabendo pouco sobre oindivíduo alvo ou mesmo sobre a rede. Özgür S. and David Jensen, acreditam que duascaracterísticas são responsáveis por permitir a navegação em redes de mundo pequeno. Aprimeira delas é a homofilia, ou seja, a tendência de que os atributos de nós conectadosestejam correlacionados. Pessoas tendem a relacionarem-se entre si por morarem em umamesma área geográfica, porque têm a mesma ocupação, etc. A segunda características é aexistência de nós altamente conectados em uma rede, ou seja, existem pessoas que têm umnúmero grande de conhecidos e atuam como pólos em uma rede e estas, por sua vez, seconectam a diferentes círculos sociais [40], facilitando assim a progaração de informação.

Essas duas características estão amplamente presentes em redes reais e ambas levam aalgoritmos de navegação. Ao considerar a homofilia, privilegia-se um algoritmo de navegaçãoque transmite informações aos vizinhos que são mais similares ao vértice alvo. Enquantoque a consideração do grau, dá origem ao um algoritmo que favorece os vizinhos com maiornúmero de ligações, os pólos. Podemos observar que estas duas características apontadas porÖzgür S. e David Jensen, são extremamente importantes para compreensão da propagaçãode informação em uma rede de mundo pequeno [40].

Embora as pessoas pareçam formar laços de acordo com princípios de homofilia, éevidente que em diversas redes de relacionamento estes laços podem se estabelecer também

Page 41: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 27

por heterofilia. Laços de heterofilia também são formados voluntariamente, indíviduos quetendem a se unir não por suas semelhanças, mas por suas diferenças [39].

Uma forma de medir a presença de homofilia ou heterofilia em uma rede é através damedida de “Diaticidade” e “Heterofilicidade”. Em muitas redes reais, o número de ligaçõesentre nós compartilhando uma propriedade em comum é muito maior que o esperado se assuas características fossem distribuídas na rede ao acaso. E este fenômeno é chamado de“diadic effect” (efeito diádico) [1]. O estudo deste efeito nos permite caracterizar a redede uma outra maneira. Suponha que tenhamos uma rede na qual possamos separar seusintegrantes em dois grandes grupos11, separados por suas características, como por exemplo,empresários (E) e comerciantes (C). Ao olharmos para duplas de indivíduos, os seguintesagrupamentos são possíveis: E−E (empresário-empresário), E−C (empresário-comerciante)e C − C (comerciante-comerciante). Chamamos esse processo de contagem de duplas (dyadcounts). Imagine que tenhamos n1 empresários e n0 comerciantes, onde N = n1 + n0. Dequantas formas é possível agrupar esses indíviduos ao acaso com probabilidade p?

mEE =

(n1

2

)× p =

n1(n1 − 1)

2× p (2.12)

mEC =

(n1

1

)(n0

1

)× p = n1(N − n1)× p (2.13)

Para quantificar o efeito de Diaticidade (D) e heterofilicidade (heterophilicity) (H) presentesna rede é necessário calcular a fração de ligações mEE e mEC presentes na mesma de talforma que:

D ≡ mEE

mEE

e H ≡ mEC

mEC

(2.14)

Através dessa grandeza podemos então analisar a rede. Definimos a mesma comodiádica seD > 1, indicando a tendência dos nós com caracaterísticas semelhantes conectarem-se mais densamente entre eles do que o esperado para uma configuração aleatória. Do mesmomodo, a rede é antidiádica se D < 1 o que significa que os indíviduos com característicassemelhantes tendem a se conectar menos densamente entre eles. Similarmente dizemos quea rede é heterofílica se H > 1, ou seja, temos mais ligações entre nós com propriedadesdiferentes do que nós com propriedades iguais quando comparada com sua configuraçãoaleatória, e dizemos que a rede é heterofóbica quando H < 1, existindo poucas conexõesentre os nós com propriedades diferentes quando comparado com configurações aleatórias

11Por simplicidade escolhemos dois, poderiam ser mais grupos, porém quanto mais características na rede,mas difícil analisá-la

Page 42: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 28

(ver Fig. 2.13) [1].

(a) Configuração Aleatória (b) Configuração Real

Figura 2.13: (a) Configuração aleatória da rede de empresários e comerciantes. Temos mEC = 6,mEE = 2 e mCC = 5. (b) Configuração real. Nesta rede de comerciantes e empresários o númerototal de indivíduos é N = 12 com n1 = 6 e n2 = 6. Temos mEC = 3 e mEE = 3 e mCC = 7, o totalde ligações presentes na rede é M = 13. Ao compararmos as duas configurações (Real e aleatória),podemos concluir que a rede real de comerciantes e empresários é Diádica (D = mEE

mEE, portanto

D = 32 > 1) e Heterofóbica (H = mEC

mEC, portanto H = 5

7 < 1).

Foram estudadas a distribuição de características dos nós em sistemas biológicos esócioeconômicos, demostrando a relevância desta metodologia proposta [1]. Abaixo apresen-taremos dois sistemas aos quais foram analisados os efeitos de diaticiadade e heterofilicidade.

1. Interação proteína-proteína: Foram analizadas N = 1379 proteínas com M = 2493

ligações existentes entre elas. Ao analisar a natureza dessas ligações, foi encontradoque todas as classes funcionais são diádicas e heterofóbicas, mostrando uma estruturaaltamente modular12, ou seja, é possível verificar a estruturas de “comunidades” narede. Ela pode ser separada em módulos (ver Fig. 2.14.a) [1].

2. Rede de telefones móveis: Para análise desta rede utilizou-se uma amostra de N =

5×106 usuários de celulares eM = 10, 7 milhões de ligações entre eles que represantamas chamadas (de voz ou mensagens de texto) em um período de 15 dias. Serviços detelefone mostram uma forte tendência de apresentar heterofilia, implicando que usuáriosde um serviço tendem a possuir um alto número de contatos com não usuários também.Observou-se que o uso de Chat é mais diádico e heterofílico do que o esperado parauma rede aleatória (ver Fig. 2.14.b) [1].

12Modularidade reflete a tendência de nós se agruparem em comunidades fortemente interligadas [41].

Page 43: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 29

(a)

(b)

(c)

Figura 2.14: (a) Redes de Proteína são heterofóbicas enquanto que as redes de serviços móveis sãoheterofílicas. (b) O diagrama de fases de (D,H) para esta classe de proteínas (MIPS funcional classe30) mostra que as interações entre proteínas são mais diádicas e menos heterofílicas do que o esperadopara configurações aleatórias. (c) Diagrama de Fases para “mobile chat service”, ao contrário dasproteínas, as redes móveis são mais heterofílicas bem como diádicas, sendo mais espalhados ao longoda rede. Figuras retiradas da referência [1]

Page 44: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 30

2.4 Redes não-correlacionadas

A maioria das redes reais são correlacionadas, como vimos na seção anterior, porém,do ponto de vista teórico, algumas vezes é necessário estudar modelos sem correlação, poisas soluções analíticas do modelo, só são possíveis na ausência de correlações [33]. Para redesnão-correlacionadas, o grau dos nós presentes nas extremidades de uma aresta são completa-mente independentes. Portanto, a probabilidade condicional P (k′|k) pode ser simplesmenteestimada como sendo a probabilidade de que qualquer aresta aponte para um vértice de grauk′, conduzindo à seguinte expressão:

Pnc(k′|k) =

k′P (k′)

〈k〉(2.15)

Note que a probabilidade independe de k [33].

O Modelo de Configuração foi o primeiro introduzido com um algoritmo para gerarredes aleatórias não-correlacionadas com uma dada distribuição de grau P (k) [42]. O modeloopera em dois passos [42]:

1. Inicia-se a rede atribuindo a cada vértice i, a partir de um conjunto N , um número de“stubs”, ki, obtidos da distribuição P (k), sob o vínculo de que a soma

∑i ki é par;

2. Pares desses “stubs” são escolhidos uniformemente ao acaso e os vértices correspondentessão conectados por uma aresta não direcionada.

Dada a natureza aleatória da distribuição das arestas, este algoritmo gera redes comuma distribuição de grau esperada e sem correlações entre os graus dos vértices conecta-dos. Porém, este modelo permite a formação de autoconexões e múltiplas conexões entre osvértices. Todavia, quando a distribuição de grau esperada tem flutuações limitadas (〈k〉 éfinito), o número de tais conexões patológicas é pequeno e podem ser desprezadas no limitetermodinâmico. Neste caso, pode-se adicionar um vínculo extra no segundo passo de talforma a evitar as múltiplas conexões13 e autoconexões14, sem contudo modificar o resultadoda rede [42]. A representação deste modelo muda drasticamente quando a distriuição degrau esperada tem flutuações ilimitadas.

13Várias conexões entre o mesmo par de sítios.14Sítios conectados a si mesmos.

Page 45: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 31

Quando tratamos de rede sem escala, ou seja, P (k) ∼ k−γ, com 2 < γ ≤ 3, obser-vamos que o segundo momento diverge. Ao utilizar o modelo de configuração para construirredes não-correlacionadas com esse tipo de distribuição, observamos que a fração de auto-conexões e múltiplas conexões geradas pelo algoritmo, não podem ser negligenciadas. Estecomportamento, embora seja completamente aceitável na matemática e teoria de grafos, nãoé comum no mundo real, o que indica que, de uma forma geral, redes de livre escala tendem aapresentar correlação de grau. Portanto, é possível através do modelo de configuração, cons-truir redes não-correlacionadas com distribuição em lei de potência, porém não é possívelextrair o efeito das auto-conexões e múltiplas conexões, sem no contudo, incluir correlaçõesno sistema [42, 33]. No entanto, em 2005, M. Catanzarro, M. Boguñá e R. Pastor-Satorraspropuseram um modelo em que é possível construir redes não-correlacionadas sem múltiplasconexões e auto-conexões com distribuição de conectividade arbitrária (incluindo distribui-ção em lei de potência), e com o coeficiente de agregação médio em concordância com aspredições teóricas [33].

2.5 Redes reais

O mundo tecnológico que nos redeia é completamente cheio de redes. Redes de comu-nicação, consistindo de telefones e celulares, a rede de energia elétrica, redes de comunicaçãode computadores, redes de linhas aéreas e em particular a World-Wide-Web (WWW) sãouma parte importante da nossa vida diária. A sociedade também pode ser vista como umarede. A rede de relacionamento entre indivíduos, relações de trabalho, ou passatempos emcomum, rede de negócios e relações entre pessoas e empresas são exemplos de redes sociaise econômicas. Países e cidades estão conectados por estradas e redes aéreas. Epidemias seespalham pela rede da população. São uma infinidade de exemplos de sistemas estudadosatravés dos conceitos de redes [25].

Diversas redes reais existem e podem ser classificadas basicamente em três grandesgrupos: as redes tecnológicas, biológicas e sociais. Nesta seção mostraremos alguns redesreais e suas propriedades. Como exemplo de rede tecnológica mostraremos a WWW, redeque tem crescido a cada dia que passa e de uma importância fundamental na sociedade.Como exemplo de rede social mostraremos a rede de colaboração da atores de cinema e porfim mostraremos a rede de interação de proteínas, como exemplo de rede biológica. Muitas

Page 46: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 32

outras redes reais já foram estudadas tais como: redes de contatos sexuais, rede da cadeiaalimetar, internet, rede de co-autores, redes neurais, redes celulares, etc. Aqui apresentaremosapenas três destas redes reais. Ao final desta seção mostraremos uma tabela com algumaspropriedades topológicas das redes reais 2.1.

2.5.1 WWW - World Wide Web

A WWW é uma coleção de webpages armazenadas em muitos servidores ao redor domundo. Estas páginas são acessadas usando um protocolo de comunicação conhecido comoHTTP (Hyper Text Transfer Protocol). Este protocolo dita os detalhes do pedido enviadopelo cliente (usuário do computador) para uma certa página [8]. A WWW é uma das maioresredes para o qual as informações topológicas estão atualmente disponíveis. Os nós da rede sãorepresentados pelos documentos (webpages) e as ligações são representadas pelos hyperlinks(URLs) que apontam de um documento a outro. Devido à importância que a WWW temno cotidiano das pessoas (informação, marketing, pesquisa...), tem crescido muito o interessepor pesquisas desse sistema [6].

As ligações na WWW são direcionadas, portanto a rede é caracterizada por dois tiposde distribuição: a distribuição de conectividade de saída e entrada do nó, Pout(k) e Pin(k),respectivamente. Estudos têm mostrado que ambas as distribuições tem uma cauda em Leide potência. Para um subconjunto da rede WWW com N = 325729 o expoente característicoda distribuição encontrado em 1999 foi γin = 2.1 e γout = 2.45. Posteriormente Broder etal., em 2000, calcularam o exponentes γin e γout da distribuição e verificaram que, para umaamostra de 200 milhões de documentos, γin = 2.1 e γout = 2.72, mostrando uma constância noγin um aumento no γout. Apesar do grande número de nós, a WWW exibe propriedades depequeno mundo, a qual apresenta um menor caminho médio dado por l = 11.2 [9]. Em 2002,Newman mostrou que para uma rede WWW não-direcionada apresenta uma siginificantedesassociatividade com coeficiente de Pearson dado por r = −0.065 (Ver Fi. 2.12) [5].

2.5.2 Rede de colaboração de atores de cinema

Esta rede é baseada no banco de dados de filmes na internet, o qual contém todos

Page 47: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 33

os filmes e seu elenco desde 1890. Nesta rede os nós são os atores, e dois nós tem uma arestaem comum se os mesmos atuaram juntos em algum filme. Esta rede está continuamente seexpandindo. A mesma tinha 225226 nós em 1998 [43], e cresceu para 449913 nós em maiode 2000. O comprimento do menor caminho da rede de atores é próximo do valor para umarede aleatória de mesmo tamanho, l = 3.65 comparado com l = 2.9, porém o coeficente deagregação é mais de 100 vezes maior que de um grafo aleatório. A distribuição de grau darede de colaraboração de atores de cinema segue uma lei de potência P (k) ∼ k−γactor , ondeγactor = 2.3±0.1 [9, 44, 6]. Esta rede social, em acordo com pesquisas realizadas a respeito decorrelações, apresenta correlação positiva de grau, ou seja, os sítios mais conectados tendem aestabelecer conexões entre si. O coeficiente de Pearson calculado para esta rede foi r = 0.208

[5].

2.5.3 Redes celulares

Em 2000 Jeong et al. estudaram o metabolismo de 43 organismos representandotodos os três domínios da vida, modelando-os em redes no qual os nós são os substratos (taiscomo ATP , ADP , H2O) a as ligações representam as reações químicas predominantementedirecionadas no qual os substratos podem participar [45]. A distribuição de conectividadede entrada e saída encontradas seguem uma lei de potência para todos os organismos, osexpoentes variam entre 2.0 e 2.4. O menor caminho médio foi calculado e o valor encontradofoi l ≈ 3.3 para todos os organismos [45, 6].

Uma outra rede semelhante para a caracterização da célula é descrita pelas inte-rações proteína-proteína, onde os nós são as proteínas e elas estão conectadas se tem sidodemonstrado experimentalmente que interagem entre si. Um estudo dessas interações físicasmostram que a distribuição de conectividade dessas interações entre proteínas segue uma leide potência com uma cauda exponencial cortada dada por P (k) ∼ (k + k0)

−γe−(k+k0)/kc comk0 = 1 e kc = 20, o expoente encontrado foi γ = 2.4 [46, 6]. Estudos posteriores mostraramque a rede de interação de proteínas com N = 2115 nós é desassociativa com respectivocoeficiente de Pearson dado por r = −0.156, ou seja, proteínas que interagem com muitasoutras tendem a se conectar com proteínas menos interagentes [5].

Page 48: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 2. Principais conceitos e modelos de redes 34

Rede ou subgrafo N E γ C C/Cr l l/lr Refs.1 Mapa completodo domínio nd.edu da Web 325 729 1 469 680 γi = 2.1,

γo = 2.45- - 11.2 - [47]

2 WWW analisado pelo Altavista (1999) 2711× 108 2130× 109 γi = 2.1,γo = 2.7

- - 16 1 [19]

3 (outro ajuste) γi = 2.10,γo = 2.82

[48]

4 Mapa de páginas de um domínio da WWW 260× 105 - γi = 194 - - - - [49]5 Mapa com ligações sem direções da WWW 153 127 270× 106 - 0.108 470 3.1 0.936 Um conjunto de páginas 4923 1335× 107 γi = 2.05 - - - -7 Outro conjunto de páginas - - γi = 2.05 - - - -8 Conjunto de páginas de uma universidade - - γi = 2.63 - - - -9 Conjunto de páginas de cientistas 56880 - γi = 2.66,

γo = 2.82- - - -

10 Internet (1998) 4389 8256 γi = 2.2 - - 4 0.6 [10]11 Internet (1999) 6374 13 641 γi = 2.2 0.24 3.3× 102 3.7 0.58 [23]12 Internet a nível de roteadores (1995) 3888 5012 γi = 2.5 - - 12.1 1.39 [10]13 Internet a nível de roteadores (2000) 150 000 200 000 γi = 2.3 - - 10 0.814 Citações 783 339 6 716 198 γi = 3 - - - - [22]15 (outro ajuste) γi = 2.9 [50]16 (outro ajuste) γi = 2.5 [51]17 Citações no Physical Review D 24 296 351 872 γi = 3 [22]18 (outro ajuste) γi = 2.6 [50]19 (outro ajuste) γi = 2.3 [51]20 (outro ajuste) γi = 1.9 [52]21 Colaboção de atores de cinema 212 250 61 085 555 γi = 2.3 - - 4.54 1.25 [47]22 (outro ajuste) γi = 3.1 [44]23 Colaboração 1 388 989 1028× 107 γi = 2.5 0.066 6× 103 4.6 0.9 [16]24 Co-autores 56 627 4898× 106 γi = 1.2 0.726 0.24× 103 4.0 1.88 [16]25 Colaboração 70 975 0.132× 106 γi = 2.1 0.59 1.1× 104 9.5 1.16 [53]26 Colaboração 209 293 1214× 106 γi = 2.4 0.76 1.4× 104 6 1.2 [53]27 Relações sexuais 2810 - γi = 3.4 - - - - [21]28 Reações metabólicas 200− 800 600− 3000 γi = 2.2,

γo = 2.20.32 12 3.2 0.95 [45, 54]

29 Interações entre proteínas 1870 2240 γi = 2.5 0.022 4.4 6.8 0.8 [46, 55]30 Cadeia alimentar 470 000 17 000 000 γi = 2.7 0.44 2.8× 103 2.65 0.87 [20]31 Cadeia alimentar do parque Silwood 154 366 γi = 1 0.15 5 3.4 1.0532 "Java Developement Framework" 1376 2174 γi = 2.5 0.06 25 6.39 1.02 [56]33 Jogo de computador 1989 4.78× 103 γi = 2.85 0.08 35 6.2 1.28 [56]34 Circuitos eletrônicos 2× 104 4× 104 γi = 3 0.03 150 6 135 Chamadas telefônicas 47× 106 8× 107 γi = 2.1 - - - -36 E-mail 5165 6.57× 104 γi = 1.5 0.156 3.25× 103 4.95 0.48 [57]37 "Energy landscape net for a 14-atom cluster" 4196 87 219 γi = 2.78 0.073 7.4 2.32 1.04 [58]

Tabela 2.2: Dados de redes reais. N é o número de sítios, E é o número de arestas, γ é o expoenteda distribuição de conectividade, C é o coeficiente de agregação e l é o menor caminho médio.Tabelaretirada da referência [2]

Page 49: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capıtulo 3Modelos Teóricos

Redes de muitas unidades interagentes desempenham um papel importante em epi-demologia, ecologia, regulação de gene, redes neurais e muitos outros campos. Em muitosestudos dessas redes o número de nós é considerado fixo e a presença de uma ligação entredois nós é tratada como um evento aleatório independente das outras ligações. Enquantoestes modelos têm um rico comportamento e considerável utilidade, eles não são necessaria-mente apropriados para descrever redes que crescem, onde a adição de nós e ligações podemdepender de características locais da rede onde o crecimento está ocorrendo. O estudo damaioria das redes complexas tem sido iniciado pelo desejo de entender vários sistemas reais,variando de redes de comunicação à cadeia alimentar. Os resultados experimentais no estudode redes reais demonstram que muitas destas redes apresentam comportamento de livre es-cala, ou seja, sua distribuição segue uma lei de potência para um k grande. As redes comessa característica diferem bastante das redes aleatórias clássicas pois apresentam algunspoucos nós com uma conectividade muito alta enquanto que a maioria dos nós apresentabaixa conectividade. A distribuição de grau desses sistemas desvia-se significativamente deuma distribuição de Poisson. A teoria de grafo aleatório (Erdös e Rényi) e a teoria de Small-World (Watts e Strogatz) não servem para reproduzir as características de tais redes. Devidoà presença desse tipo de distribuição em várias redes reais alguns pesquisadores passaram ase questionar a respeito de quais mecanismos seriam responsáveis pelo surgimento de livreescala nesses sistemas [6].

Neste capítulo apresentaremos alguns modelos teóricos de redes com distribuiçãoem lei de potência que serão úteis para a compreensão deste trabalho. Dentre os modelos

35

Page 50: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 36

apresentados estão: Modelo de Barabási-Albert, Modelo de Qualidade, Modelo Natal (modelogeográfico) e o Modelo de Afinidade.

3.1 Modelo de Barabási

A distribuição de conectividade em lei de potência na abordagem de redes foi estu-dada por Barabási e Albert em 1999 [9], os quais argumentaram que a natureza de livreescala em redes reais está baseada em dois mecanismos compartilhados entre muitas redesreais. A ideia central do modelo consiste em crescer uma rede preferencialmente adicionandonovas conexões a nós mais conectados, para explorar a ideia: “os ricos ficam cada vez maisricos”. O primeiro mecanismo apontado por Barabási e Albert é o crescimento da rede, poisas redes reais são dinâmicas, ou seja, a quantidade de nós e ligações vão crescendo a cadainstante. O segundo mecaninismo é a ligação preferencial visto que em alguns sistemas asligações entre os sítios parece se dar de forma preferencial e não de forma aleatória, ou seja,existe uma tendência de que os nós mais jovens se conectem a nós altamente conectados. [6].

Estes dois ingreditentes crescimento e ligação preferencial inspiraram a introdu-ção do modelo de Barabási-Albert, o qual levou a uma rede com distribuição de conectividadeem lei de potência [9]. Vale a pena salientar que o modelo proposto por Barabási não foio primeiro a incluir ligação preferencial e obter uma distribuição de conectividade em leide potência, acredita-se que a primeira consideração rigorosa de ligação preferencial se deupor volta de 1925 por Yule [59], que a usou para explicar a distribuição da lei de potênciado número de espécies por gênero de plantas com flores, processo que ficou conhecido como“Processo de Yule”. Posteriormente outros modelos com estas características foram propostostambém por Simon [60], por Price [61] dentre outros.

O algoritmo para a construção de uma rede de Barabási-Albert é o seguinte:

1. Inicia-se a rede com m0 sítios;

2. A cada passo de tempo adiciona-se um novo sítio j à rede e este se ligará a m(≤ m0)

sítios diferentes pré-existentes na rede. A probabilidade do sítio pré-existente i recebera ligação do sítio recém chegado j, é proporcional à conectividade ki do sítio i pré-

Page 51: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 37

existente na rede, e é dada por:

∏(ki) =

ki∑j kj

(3.1)

3. Repete-se o passo anterior até o tamanho desejado do sistema, depois de t passos detempo este procedimento resulta em uma rede com N = t+m0 sítios e mt ligações.

Esta regra de ligação preferencial privelegia os sítios que têm maior conectividade detal forma que os nós mais conectados têm mais chances de adquirir ligações (ver Fig. 3.1).A combinação desses dois fatores, crescimento e ligação preferencial, produzem resultadosinteressantes. Podemos obervar que somente os sítios mais antigos podem tornarem-se pólose uma vez que um pólo foi estabelecido os sítios mais jovens nunca poderão alcançá-lo, ouseja, nunca terão a chance de tornarem-se pólos também. Podemos observar estes resultadosna figura 3.2.

Figura 3.1: Exemplo ilustrativo de crescimento de uma rede de Barabási para m0 = 3 e m = 1.

Barabási e Albert mostraram analiticamente que P (k) ∼ k−γ com γ = 3, no limitetermodinâmico, no modelo proposto de Barabási-Albert. Devido ao crescimento constanteda rede (chegada de novos sítios e estabelecimento de novas ligações) a conectividade dossítios varia com o tempo, portanto é possível calcular a taxa com que um determinado sítioadquire ligações. No modelo de Barabási-Albert todos os sítios adquirem ligações a umamesma taxa. Isso significa que os sítios mais antigos sempre serão os hubs da rede. O cálculo

Page 52: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 38

da evolução temporal de um sítio qualquer é dada por:

∂ki∂t

= m∏

(ki) =ki∑

jN−1kj

mas∑j

kj = 2mt−m

∂ki∂t

=ki2t

ki(t) = m

(t

ti

) 12

(3.2)

Pode-se observar então que a evolução temporal da conectividade do sítio i nascidono tempo ti, para este modelo, segue também uma lei de potência com expoente característicoβ = 0.5.

Além da distribuição em lei de potência o modelo de Barabási-Albert tem outraspropriedades que podem ou não concordar com resultados empíricos de redes reais. Umacaracterística de algumas redes reais é a coexistência do coeficiente de agregação e menorcaminho médio, portanto é necessário verificar se a rede gerada por esse modelo tem um ca-ráter de pequeno mundo, dessa forma, Barabási e Albert calcularam o comprimento do menorcaminho (l) e perceberam que este é muito menor neste modelo do que para grafos aleató-rios com o mesmo número de sítios. Foi mostrado também que l aumenta aproximadamentelogaritmiamente com N . [6].

Análises com respeito a correlações de grau existentes na rede de Barabási-Albertforam feitas. Em contrastre com a teoria de grafos aleatórios clássicos com distribuição degrau arbitrária, em que o grau dos nós são não-correlacionados, Krapivsky e Redner têmmostrado que no modelo de Barabási-Albert as correlações se desenvolvem espontaneamenteentre os graus dos nós conectados [62].

Outra propriedade importante de uma rede é seu coeficiente de agregação. O mo-delo de Barabási-Albert com m = 1 corresponde a um grafo tipo árvore com coeficiente deagregação nulo, pois não existem “panelinhas”. Portanto, só é possível calcular o coeficientede agregação neste modelo considerando m > 1. Não existe uma predição analítica para ocoeficiente de agregação no modelo de Barabási-Albert mas achava-se que para redes de livreescala o coeficiente de agregação seria cerca de cinco vezes maior que o de grafos aleatóriose que este fator amentaria lentamente com o número de nós (ver Fig. 3.3). Contudo, no mo-delo de Barabási-Albert o coeficiente de agregação decresce com o tamanho da rede, seguindo

Page 53: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 39

100

101

102

103

104

k

10-8

10-6

10-4

10-2

100

P(k)

γ = 2.92

(a)

100

101

102

103

104

105

t/ti

100

101

102

<k i>

β10

= 0.50β

97 = 0.49

(b)

Figura 3.2: (a) Distribuição de conectividade em Lei de Potência para o modelo de Barabási. Simu-lação realizada para m = 1, N = 2 × 105 e 200 amostras. (b) Evolução temporal da conectividadedos sítios i = 10 e i = 97. Simulação realizada para a rede de Barabási com m = 1, N = 105 e 1000amostras.

Page 54: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 40

(a) (b)

Figura 3.3: (a) Coeficiente de Agregação vesus tamanho da rede. (b) Comprimendo do menorcaminho l vesus tamanho da rede no modelo de Barabási-Albert com 〈k〉 = 4, comparado com umgrafo aleatório de mesmo tamanho e grau médio. Figura retirada da referência [6].

aproximadamente uma lei de potência C ∼ N−0.75 [6]. O seu coeficiente de agregação seaproxima de zero para N → ∞. O baixo coeficiente de agregação não está, contudo, relaci-onado ao mecanismo de ligação preferencial. Existem alguns modelos de redes com ligaçãopreferencial e coeficiente de agregação alto. Porém, como era esperado, esta rede é uma redede pequeno mundo. Um ponto interessante é comportamento de l para m = 1 e m > 1 [27].

l(m = 1) ∼ lnN e l(m > 1) ∼ lnN

ln lnN(3.3)

Apesar destes resultados apresentados, o modelo de Barabási-Albert é um modelomínimo que captura os mecanismos responsáveis para uma distribuição em lei de potência,porém quando comparado com redes reais é evidente que apresenta limitações: prediz umadistribuição de conectividade em lei de potência com expoente fixo (γ = 3), enquanto que osexpoentes medidos para algumas redes reais variam entre 2 e 3 em geral. Redes reais tambémpodem apresentar uma distribuição tais como exponenciais cortadas. Estas diferenças entreeste modelo e as redes reais levam a um interessante questionamento a respeito de comopoderíamos mudar o expoente de escala da distribuição [6].

Page 55: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 41

3.2 Modelo de Qualidade

O modelo de livre escala de Barabási-Albert negligencia um importante aspectode sistemas competitivos, nem todos os nós são igualmente suscetíveis a adquirir ligações.Inúmeros exemplos em sistemas reais demonstram que a conectividade do nó e a taxa decrescimento não depende apenas de sua idade. Por exemplo, na WWW alguns documentos(através da combinação de bom conteúdo e marketing) adquirem um número maior de ligaçõesem um tempo muito menor ultrapassando facilmente sites mais antigos. Outro exemplo sãoalguns trabalhos de pesquisa que em um curto espaço de tempo adquirem um grande númerode citações. É possível então associar esse comportamento a alguma qualidade intrínseca dosnós tais como habilidades sociais de um indivíduo, o conteúdo de uma página da web, oumesmo o conteúdo de um artigo científico. Essa habilidade que o nó tem de competir porligações foi chamada de “qualidade” do nó.

Em 2001 Bianconi e Barabási ao observarem este aspecto competitivo em redes reais,propuseram um modelo que levasse em conta a habilidade que um determinado sítio da redetem de adquirir ligações. Eles propuseram um modelo onde a cada sítio da rede é atribuídoum parâmetro ηi chamado de “qualidade” o qual não muda com tempo. Assim, a cadainstante de tempo um novo sítio j com qualidade ηj é adicionado ao sistema onde a escolhado parâmetro η de cada sítio é feita por uma distribuição ρ(η) [11]. A existência da qualidadealtera a ligação preferencial e a taxa com que cada nó adquire ligações, ou seja:

∏i

=ηiki∑j ηjkj

(3.4)

Observe que ao mudar a regra de ligação preferencial (Eq. 3.4), acrescentando oparâmetro de qualidade, o exponente γ da distribuição de conectividade muda assumindo ovalor de γ = 2.25, no limite termodinâmico (ver Fig. 3.4.a). Neste modelo, sítios jovens compoucas ligações, podem adquirir ligações a uma alta taxa contanto que o seu parâmetro dequalidade seja alto, mesmo tendo nascido muito tempo depois, este sítio pode vir a tornar-se um pólo devido à sua habilidade de adquirir ligações, diferentemente do que aconteciano modelo de Barabási-Albert, em que a idade do sítio era o fator determinante para estetornar-se um pólo. A Evolução temporal da conectividade de um sítio neste modelo é dado

Page 56: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 42

100

101

102

103

104

105

k

10-8

10-6

10-4

10-2

100

P(k)

γ = 2.4

Figura 3.4: Distribuição de conectividade para o Modelo de Qualidade. Simulação realizada param = 1, N = 105 e 3000 amostras.

por:

kηi(t, t0) = m

(t

t0

)β(ηi)onde, β(ηi) =

ηiC

(3.5)

Na Eq. 3.5 podemos ver que o exponte dinâmico β não é mais constante como no modelo deBarabási-Albert, mas agora ele depende da qualidade. A constante C foi calculada analiti-camente por Bianconi e Barabási, os quais mostraram que C = 1.255 (ver Fig. 3.5.b).

Page 57: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 43

100

101

102

103

104

105

t/t10

100

101

102

103

104

<k 10

>

η10

= 0.3η

10 = 0.6

η10

= 0.9

(a)

(b)

Figura 3.5: (a) Evolução temporal do sítio i = 10 para diferentes valores de η. Simulação realizadapara m = 1, N = 105 e 1000 amostras. (b) Dependência linear de β com η, mostrando quedependendo da qualidade do sítio, sua taxa de aquisição de ligações pode ser maior ou menor.Figura retirada da referência [2].

Page 58: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 44

3.3 Modelo de Afinidade

Em muitos sistemas reais a semelhança entre seus constituintes é fundamental paraque se estabeleçam vínculos entre eles. Inúmeros estudos em redes sociais mostram que arede é afetada pela preferência de ligação entre integrantes que sejam semelhantes entre si.É fácil ver que as pessoas tendem a se aproximar por compartilharem a mesma fé, ou porquegostam de um mesmo time de futebol, são fãs de um determinado cantor ou ator, têm omesmo esporte em comum, estudam em uma mesma escola, fazem um mesmo curso etc.Poderíamos continuar listando vários fatores que parecem influenciar no estabelecimento devínculos entre as pessoas, mas o curioso é que as chances de se estabalerem vínculos aumentamse estes indivíduos compartilham algo em comum.

Observando esse comportamento em algumas redes reais Almeida M.L. et al. pro-puseram um modelo chamado “Modelo de Afinidade” o qual incorpora um parâmetro queleva em conta a semelhança entre os sítios. Cada sítio da rede possui uma característicaintrínseca a qual é responsável por definir o grau de afinidade deste com outros sítios darede. Essa difereça entre os atributos de cada sítio foi chamada de afinidade ou homofilia.Neste modelo a ligação preferencial explora a ideia de semelhança entre os nós fazendo comque sítios com características parecidas tenham uma chance maior de estarem conectados. Aafinidade resulta de uma mudança da ligação preferencial no modelo de Qualidade, podemosexpressá-la matematicamente como sendo |ηi−ηj| com ηj representando a a característica dosítio que está chegando e ηi a característica dos sítios já existentes na rede [3]. É importanteressaltar que no Modelo de Qualidade o termo η era usado para quantificar a habilidade deum determinado sítio adquirir ligações, porém, no modelo de Afinidade, esse parâmetro serefere à uma característica intrínseca do sítio que não está associada à sua capacidade decompetir por ligações.

O algoritmo do modelo de Afinidade é o seguinte:

1. Inicia-se a rede com m0 sítios, aos quais está associado uma característica ηi escolhidaaletatoriamente por meio de uma distribuição p(η) = cte no intervalo [0, 1].

2. A cada passo de tempo um novo sítio, com uma característica ηi, é adicionado aosistema. Este liga-se preferencialmente a m(≤ m0) sítios pré-existentes na rede. Aprobabilidade do sítio i receber a nova ligação é proporcional ao produto de ki e a

Page 59: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 45

afinidade entre o sítio i e o sítio que está chegando, j, ou seja:

∏i

=[1− Aij]ki∑j kj[1− Aij]

, onde, Aij = |ηi − ηj| (3.6)

3. Repetimos o passo anterior até o tamanho desejado. No final teremos uma rede comN = t+m0 sítios e mt ligações.

As simulações realizadas para este modelo dá-nos informações a respeito da topologiae dinâmica da rede. Ao construir esta regra de ligação preferencial evidenciou-se uma disputaentre conectividade e afinidade fazendo com que o expoente característico da distribuiçãofosse alterado. A distribuição de conectividade segue uma lei de potência P (k) ∼ k−γ comγ = 2.84 (ver Fig. 3.6), valor muito maior do que o encontrado na rede de Bianconi-Barabási(γ = 2.25), porém é menor, do que o expoente da rede de Barabási-Albert (γ = 3.0). Esseresultado pode ser compreendido observando-se os sítios mais conectados da rede. No modelode Qualidade os sítios com potencial para tornarem-se pólos, são aqueles que nascem no inícioda construção da rede e com parâmetro de qualidade alto. Estes sítios são os responsáveis peloexpoente da distribuição de conectividade no Modelo de Qualidade. O fato desse expoenteser menor que o expoente do modelo de Barabási-Albert e do Modelo de Afinidade, mostraque os pólos existentes nessa rede são produtos de uma democratização, ou seja, não somenteos sítios que nasceram no ínicio da rede tem a chance de tornarem-se pólos, mas qualquersítio que tenha nascido com um fator de qualidade alto tem potencial para tornar-se um pólotambém [3].

É importante notar que a distribuição de caracteterísticas do sítio é uniformementedistribuída no intervalo [0, 1], isso significa que todos os valores dos atributos têm igualchance de serem sorteados. Os sítios com η ∼ 0.5 serão provavelmente os pólos da redepois apresentam afinidade com sítios com η > 0.5 e η < 0.5. Uma vez que a afinidade édefinida pelo módulo da diferença entre os atributos de um sítio, os sítios com valores de ηpróximos de 0.5 possuem uma certa simetria. estes têm afinidade tanto com vizinhos à suaesquerda como com vizinhos à sua direita, fazendo com que desta forma a conexão deste aoutros sítios da rede seja definida pela conectividade, privilegiando assim, os pólos presentesno sistema. Devido a esse fenômeno o expoente γ do Modelo de Afinidade tende a aumentarem comparação ao Modelo de Qualidade [3].

Diferentemente do Modelo de Qualidade, onde os sítios com alta qualidade tinhammais chances de tornarem-se pólos e a dependência de β com η era linear, no Modelo de

Page 60: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 46

100

101

102

103

104

k

10-8

10-6

10-4

10-2

100

P(k)

γ = 2.84

Modelo de Afinidade

(a)

100

101

102

103

104

105

k

10-8

10-6

10-4

10-2

100

P(k)

MQMA

(b)

Figura 3.6: (a) Distribuição de conectividade para o Modelo de Afinidade. (b) Comparação entrea distribuição de conectividade do Modelo de Qualidade (MQ) e o Modelo de Afinidade (MA).Simulação realizada para m = 1, N = 105 e 1000 amostras.

Page 61: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 47

Afinidade os sítios com valores de η próximos a 0.5 adquirem ligações a uma taxa maior doque sítios com η ∼ 0.9 (ver Fig. 3.7). Isso mostra que sítios que apresentam mais semelhançasa outros (características mais comuns), serão os prováveis pólos.

Foi observado também por Almeida M.L. et al. [3] que o modelo de Afinidade apre-senta um comportamento típico em redes de pequeno mundo, porém o valor do comprimentodo menor caminho médio l é maior do que no Modelo de Qualidade, para redes de mesmotamanho. Esse comportamento é explicado pela presença de super-pólos na rede de Biaconi-Barabási, que devido à grande quantidade de ligações que possuem, tendem a aproximar ocaminho entre os sítios da rede. No modelo de Afinidade, os pólos possuem menos ligaçõesquando comparados a estes super-pólos, por este motivo, o menor caminho médio que ligadois sítios quaisquer tende a aumentar (ver Fig. 3.8.a).

Estudos referentes a aglomeração de sítios também foram realizados. Foi observadoque o coeficiente de agregação dimimui lentamente com o tamanho da rede através da equaçãoC ∼ N−0.746. Este resultado diz que a quantidade de vizinhos conectados entre si, as“panelinhas”, diminiu com o tamanho do sistema (ver Fig. 3.8.b).

O modelo de Afinidade é adequado para descrever redes em que os sítios tendem ase conectar por suas semelhanças. Este comportamento é muito observado em redes sociais,como descrito no início desta seção. No entanto, este não é o único modelo a observar oefeito da homofilia em redes. Estudos similares a este estão sendo propostos em outrasáreas, mostrando a relevância deste fenômeno observado no mundo real. Dentre os modelospropostos está o modelo de Currarini e Redondo (2011) [63], na área de economia, que propõeum modelo simples de homofilia em redes sociais. Este, por sua vez, estuda a formação deredes socias no contexto de uma rede heterogênea e observa a tendência de agentes do mesmotipo conectarem-se uns aos outros. O modelo proposto pode ser aplicado a uma variedadede fenômenos alternativos, tais como relações de amizade e casamentos.

Page 62: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 48

(a)

(b)

Figura 3.7: (a) Evolução temporal da conectividade do sítio no Modelo de Afinidade para diferentesvalores de η. (b) Dependência de β com η no Modelo de Afinidade, mostrando que sítios com valoresη ∼ 0.5 têm mais chances de tornarem-se pólos, visto que β é máximo, equanto que sítios com valoresde ηsim0.1 ou η ∼ 0.9, adquirem ligações a um taxa muito mais lenta (β é mínimo). Figuras retiradasda referência [3].

Page 63: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 49

(a) (b)

Figura 3.8: (a) Menor caminho versus o tamanho do sistema, no Modelo de Afinidade, para dife-rentes valores de m (b) Comportamento do coeficiente de agregação versus tamanho do sistema, noModelo de Afinidade, para diferentes valores de m. Figuras retiradas da referência [3]

3.4 Modelo Natal

Grande parte dos trabalhos na área de redes são puramente topológicos, não levamem conta a métrica, porém em muitas redes reais a distância euclidiana é um fator importanteque não pode ser desprezado. Em 2004, Soares D. J. B. et al. apresentaram um modelode crescimento e ligação preferencial, que leva em conta a distância geográfica entre sítios,buscando analizar a relação entre a estatística não extensiva de Tsallis e Redes de livre escala[12, 13].

A dinâmica da rede gerada por este modelo segue uma regra em que cada sítio quechega deve ser colocado no plano a uma distância r do centro de massa. A forma como ossítios estão distribuídos no plano é determinada por uma função PG(r) que segue uma leide potência. O expoente característico dessa função é αG1 e é o parâmetro que controla ocrescimento do sistema, ou seja, αG define quão próximos ou distantes estão os sítios uns dosoutros. O sítio recém chegado é ligado a um dos sítios preexistentes da rede obedecendo auma regra de ligação preferencial a qual é proporcional à sua conectividade e inversamenteproporcional a rαAij , onde rij é distância Euclidiana do sítio i ao sítio j e αA2 é o parâmetroreponsável pela ligação entre os nós. Podemos observar que no Modelo Naltal haverá umacompetição entre conectividade e distância. O sítio jovem ao chegar terá que decidir se

1O índice “G” utilizado aqui se refere à palavra em inglês growth que significa crescimento.2A índice “A” refere-se à palavra inglesa attchment que significa ligação

Page 64: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 50

quer se conectar ao sítio mais popular (com maior conectividade) ou ao sítio que está maispróximo dele. Esta competição tende a sumir quando αA → 0 e desaparece completamentequando αA = 0, reproduzindo nesse limite um comportamento característico da rede deBarabási-Albert, a qual tem topologia, mas não tem métrica (ver Fig. 3.7) [12, 13].

Para gerar uma rede com esse tipo de ligação prerencial, foi utilizado o seguintealgoritmo:

1. O sítio i = 1 é colocado em uma origem arbitrária no plano;

2. O sítio i = 2 é colocado a uma distância r do sítio i = 1 escolhida aleatoriamente,segundo a distribuição:

PG(r) ∝ 1

r2+αGonde, αG ≥ 0 (3.7)

depois o segundo sítio liga-se ao primeiro.

3. A partir deste momento o centro de massa do sistema é calculado e o novo sítio (i > 2)é colocado no plano a uma distância r do centro de massa, esta distância é dadapela distribuição de probabilidade do item anterior. O sítio recém-chegado irá entãoconectar-se a um dos sítios pré-existentes da rede através da seguinte regra de ligaçãopreferencial:

PA(ki) =kir−αAij∑

j kjr−αAij

(3.8)

4. O passo anterior deve ser realizado até o tamanho desejado da rede.

Podemos observar que essa regra de crescimento e ligação preferencial proporcionaum ambiente competitivo (ver Fig. 3.9) de tal forma que o sítio que chega à rede terá alta pro-babilidade de se conectar aos sítios mais próximos a ele bem como aos sítios mais populares.É possível analisar essa rede variando dois parâmetros αA e αG. Ao variarmos αG mantendoαA constante, observamos que a distribuição de conectividade não sofre alterações tão sig-nificativas, porém, ao variar αA mantendo αG constante é notório que este parâmetro mudasignificativamente o comportamento da distribuição de conectividade. Esta regra de ligaçãopreferencial gera uma rede de livre escala quando αA pequeno, mas a medida que αA cresce arede vai se aproximando de um comportamento exponencial, ou seja vai entrando no regimede escala típica, diminuindo a frequência de pólos, ou seja, as ligações ficam homogeneamentedistribuídas (ver Fig. 3.10 e Fig 3.11).

Page 65: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 51

Figura 3.9: Figura esquemática da dinâmica de crescimento e ligação preferencial do Modelo Natal.Figura retirada da referência [4]

Em geral, estudos de redes complexas não consideram a distância geográfica entre ossítios da rede. Porém, ao considerarmos as distâncias euclidianas o problema de redes, queantes era apenas topológico, entra na classe de sistemas com interações de longo alcance, detal forma que podem ser descritos pela mecância estatística não extensiva. Por este motivo,as curvas da distribuição de conectividade geradas por este modelo, são bem ajustadas pelaequação P (k) = P0e

−k/ηqq , onde a função q-exponencial é definida da seguinte forma:

exq ≡ [1 + (1− q)x]1/(1−q) (ex1 = ex) (3.9)

onde ηq > 0 é número característico de ligações. A equação acima está relacionada coma estatística não-extensiva de Tsallis (ver Apêndice A). Pode-se encontrar uma relação dosparâmetros q e ηq com respeito ao parâmetro αA pela Eq. 3.9 . Observamos que aproxima-damente em αA = 2 a fução q(αA) cai exponencialmente com αA tendendo assintoticamentepara 1. De forma contrária, ηq(αA) tende a crescer com αA, porém de forma não linear (verFig. 3.12).

Análises da evolução dinâmica da conectividade de cada sítio foram feitas e observou-se que a evolução temporal da conectividade do sítio depende agora de αA. Quando 0 <

αA < 1 (a distância pouco influencia), encontramos valores altos de β, indicando que ossítios aumentam sua conectividade a uma taxa bem maior do que o encontrado para valoresde αA ∼ 5 (ver na Fig. 3.13).

É importante ressaltar que outros modelos foram propostos considerando métrica.

Page 66: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 52

10-8

10-7

10-6

10-5

10-4

10-3

10-2

10-1

100

100

101

102

103

P(k

)

k

αG = 0.0αG = 1.0αG = 2.0αG = 3.0

(a)

10-7

10-6

10-5

10-4

10-3

10-2

10-1

100

100

101

102

103

P(k

)

k

αΑ = 0.0αΑ = 3.0αΑ = 4.0αΑ = 5.0

Tsallis

(b)

Figura 3.10: (a) Análise da distribuição de conectividade para αA = 2 e valores típicos de αG.Simulação realizada para N = 104 e 3000 amostras. (b) Comportamento da rede ao variar oparâmetro αA para αG = 2. Simulação realizada para N = 105 nós e 1000 amostras. As linhasforam ajustadas por uma função q-exponencial.

Page 67: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 53

(a)

(b)

Figura 3.11: (a) Sítios distribuídos no plano para valores de αG = 0 e αA = 1. É possível observara preseça de pólo mesmo em uma rede pequena. (b) Sítios distribuídos no plano para valores deαG = 0 e αA = 5. É notório que ao aumentamos o valor de αA o surgimento de pólos é inibido.Ambas as figuras são simulações feita no pajek para N = 300 e seus respectivos valores de αG e αA.

Page 68: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 54

1

1.1

1.2

1.3

1.4

1.5

1 2 3 4 5 6 7 8

q

αA

(a)

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 1 2 3 4 5 6 7 8

η q

αA

(b)

Figura 3.12: (a) Comportamento do de q com αA. (b) Comportamento de η com αA.

Page 69: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 55

100

101

102

103

100

101

102

103

104

<k

i>

t/ti

αA = 0.0

αA = 1.0

αA = 2.0

αA = 3.0

αA = 4.0

αA = 5.0

(a)

0

0.2

0.4

0.6

0.8

1

0 1 2 3 4 5 6 7 8

β

αA

(b)

Figura 3.13: (a) Evolução dinâmica da conectividade do sítio i = 10 para diversos valores de αA.Podemos obervar como o expoente β, que traduz como a conectividade de um dado sítio muda como tempo, dimimui com o aumento de αA. (a) Comportamento do expoente dinâmico β com relaçãoa αA.

Page 70: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 56

Por exemplo, estudos de propagação de epidemias têm apontado a distância como um fatorrelevante no espalhamento de doenças. É achado que a geografia desepenha um papel maisimportante do que os pólos na disseminação de epidemias. Xu X.-J et al propuserem um mo-delo de propagação de epidemia em redes de livre escala, considerando os efeitos da distânciageográfica e encontraram alguns resultados interessantes. Nas redes que são geograficamentemais vinculadas, com conexões locais mais fortes, a epidemia prevalece significantemente,indicando que redes com mais conexões locais tem um risco maior de disseminar doenças[64].

3.5 Ligação Preferencial

Observamos que nas seções anteriores todos os modelos apresentam um fator em co-mum: a ligação preferencial, que é a suposição que a probabilidade de um dado sítio recebernovas ligações aumenta com a sua conectividade. Como visto na seção 3.1, o modelo deBarabási-Albert assume que a probabilidade de um nó i se ligar ao nó j é proporcional àconectividade kj do nó j. Porém, esta suposição envolve duas hipóteses: (i)

∏i (a probabi-

lidade do sítio i receber a ligação) depende de ki, em contraste ao grafos aleatórios clássicos(∏

i = p); (ii)∏

i é linear em ki, ou seja a probabilidade de um sítio receber ligações é pro-porcional à k. É observado que em algumas redes reais a ligação preferencial é linear comki concordando com o modelo proposto por Barabási e Albert. No entanto, em outras redesa dependência de

∏i com ki é sublinear de forma que

∏i ∼ k−αi com α = 0.8 ± 0.1 para

neurociência, rede de co- autores e a rede de colaboração de atores, por exemplo [65, 6].

O efeito de um∏

i não linear na dinâmica e topologia da rede foi explicado porKrapivsky et al. em [51], mostrando analiticamente que a natureza de livre escala em redesé destruída para ligação preferencial não-linear em k. O único caso no qual a topologia deredes é livre escala, é quando a ligação preferencial é assintoticamente linear com k no limitede k →∞. Através desses resultados pode-se encontrar que a distribuição de probabilidadecorresponde a P (k) ∼ k−γ, onde o valor de γ está entre 2 e ∞ [6]. E observa-se quealgumas redes reais têm um expoente característico 2 < γ ≤ 3. Por este motivo, é importanteconsiderar a ligação preferencial em modelos que simulam redes com topologia em livre escala(ver Tab. 3.1).

O valor do expoente γ também nos dá informações importantes sobre a rede. Nota-

Page 71: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 57

se que a medida que γ cresce a rede torna-se mais homogênea. Se tomarmos o modelo deBarabási-Albert como padrão observamos que se γ > 3, o sítios da rede tendem a ter o mesmonúmero de conexões, inibindo o surgimento de pólos. Enquanto que, se γ < 3 percebemosque existem polós cada vez mais conectados, caracterizando o surgimento de super-pólos.Portanto, se tomarmos a rede Barabási como referência podemos dizer que valores de γ > 3

caracterizam redes mais cada vez mais homogêneas, em sua distribuição de conectividade,enquanto que valores de γ < 3 caracterizam redes cada vez mais heterogêneas.

Page 72: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 3. Modelos Teóricos 58

Novo Conceito ou Mecanismo Limits de γ ReferênciasCrescimento Linear, ligação preferencial linear γ = 3 [9]

Ligação Preferencial não linear∏(ki) ∼ kαi sem escala para α 6= 1 [51]

Ligação Preferencial Assintoticamente γ →∞ se a∞ →∞

∏(ki) ∼ a∞Ki com ki →∞ γ∞ se a∞ →∞ [51]

Atratividade inicial γ = 2 se A = 0∏(ki) ∼ A+ ki γ →∞ se A→∞ [66, 67]

Acelerar o crescimento 〈k〉 ∼ tθ γ = 1.5 se θ → 1

constante inicial de atratividade γ → 2 se θ → 0 [68]

Acelerar o crescimento γ = 1.5 para k � kc(t) [17]〈k〉 = at+ 2b γ = 3 para k � kc(t) [69]

Arestas internas com prob. p γ = 2 seq = 1−p+m

1+2m

Redirecionamento de aresta com prob. q γ →∞ se p, q,m→ 0 [6]

c arestas internas γ → 2 se c→∞ou remoção de c arestas γ →∞ se c→ −1 [70]

Envelhecimento gradual γ → 2 se ν → −∞∏(ki) ∼ ki(t− ti)−ν γ →∞ se ν → 1 [67]

Fitness de nós multiplicativos P (k) ∼ k−1−c

ln(k)∏∼ ηiki [11]

Fitness de nós multiplicativos-aditivos P (k) ∼ k−1−c

ln(k)∏i ∼ ηi(ki − 1) + ζi 1� m� 2 [71]

Aresta invariante P (kin) =d

k√

2ln(akin)

Copiando com prob. p γ = (2− p)/(1− p) [72, 73]

Redirecionando com prob. r γ = 1 + 1/r [62]

Caminhando com prob. p γ ' 2 para p > pc [74]

Viculando a arestas γ = 3 [68]

p arestas internas direcionadas γin = 2 + pλ∏(ki, kj) ∝ (kini + λ)(koutj + µ) γout = 1 + (1− p)−1 + µp/(1− p) [75]

1− p arestas internas direcionadas γin = 2 + p

Atividade linear preferencial alterada γout ' 2 + 3p [76]

Tabela 3.1: Sumário dos mecanismos de alguns modelos de rede.Tabela retirada da referência [6]

Page 73: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capıtulo 4Modelo de Afinidade com Métrica

O interesse pelo estudo de redes sociais tem crescido muito na área de economia esociologia [63]. O mercado financeiro lida com pessoas que estão interligadas por relaçõessociais afetivas ou profissionais. Diversos fatores contribuem para a criação de laços entre osindivíduos de uma sociedade. Atualmente dois destes fatores têm sido bastante estudados: a“homofilia” e a “distância”. É notório que as pessoas tendem a estabelecer vínculos por suassemelhanças, ideais, objetivos, etc. Estas características em comum fazem com que as pessoasse organizem em grupos sociais. Como exemplo disso temos o grupo dos góticos - jovense adultos que se vestem de preto, com penteados bem ousados e maquiagens “sombrias”.Podemos citar também os índios de uma mesma tribo - se pintam com as mesmas cores,usam brincos ou argolas para caracterizarem a tribo da qual fazem parte. As torcidas detime de futebol também são um excelente exemplo, grupos que tendem a se juntarem paraorganizar fã-clubes. A homofilia é uma das grandes responsáveis pelo desenvolvimento derelacionamentos na sociedade. No entanto, a distância geográfica também desempenha umpapel importante no estabelecimento de laços sociais uma vez que pode desfazer ou intensificartais relacionamentos construídos por homofilia.

Pesquisas em sociologia tem investigado o papel da homofilia em redes sociais. Foimostrado que a presença deste fator influencia diretamente na propagação de informação emuma rede [40], no estabelecimento de relacionamentos (amizades, casamentos, relações detrabalho, etc.), formação de comunidades [39], compreensão dos conceitos de segregação,mobilidade social e vários outros fenômenos [77].

59

Page 74: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 60

Estudos recentes têm analisado o efeito da homofilia na população humana sob nu-merosas dimensões sociodemográficas incluindo raça, gênero, idade, classe social e educação.Estas pesquisas concluíram que amigos, colegas de trabalho, cônjuges, e outras associaçõestendem a ser mais similares umas as outras do que membros aleatoriamente escolhidos damesma população [77], evidenciando que as relações foram desenvolvidas por homofilia. Osestudos, porém, foram realizados entre pessoas de uma mesma região geográfica.

Com o aumento dos meios de comunicação, principalmente a internet, as pessoastendem a se conectar independentemente de barreiras geográficas e diferentes fusos horários,diminuindo assim o vínculo de barreiras físicas e estabelecendo novos laços. Pesquisas rea-lizadas em meios sociais online por H. Bisgin et al., mostraram que a distância não tinhanenhuma influência na formação dessas redes. Porém eles indicaram a distância como um dosfatores mais fortes que levam à homofilia no mundo físico, segundo eles, é a localidade devidoà proximidade geográfica [77] que tende a intensificar os laços por afinidades. A homofilia edistância estão correlacionadas no processo de formação de redes sociais. A distância podeintensificar o efeito da homofilia ou dissolvê-lo.

Imagine um estudo para verificar as relações de amizade em uma escola. Ao analisaros laços de amizade entre alunos, não há necessidade de observar o quão distantes geogra-ficamente eles estão, uma vez que se encontram no mesmo ambiente: a escola. Todos osindivíduos do grupo se encontram em uma mesma região geográfica e os relaciomentos de-senvolvidos provavelmente se deram por semelhanças entre eles (homofilia). No entanto, se oestudo é direcionado a verificar o quanto que os alunos dessa escola moram próximos uns dosoutros independentemente do tipo de relacionamento que tenham desenvolvido, a afinidadeentre eles não é um fator importante a ser levado em conta. O que mais contribuirá paramedir a conectividade entre eles é a distância entre suas casas. Contudo, se a pesquisa évoltada a saber o quão conectadas estão os alunos que têm um relacionamento de amizadena escola e moram próximos, a homofilia e a distância desempenharão um papel igualmenteimportante nesse processo. Em algumas redes reais os dois fatores contribuem juntos para aformação da rede.

Apresentaremos neste capítulo um modelo mixto nomeado “Modelo de Afinidadecom Métrica” que envolve a dinâmica do Modelo de Afinidade, proposto por Almeida M. L etal., e do Modelo Natal prosposto por Soares D. J. et al.. Desta forma, pretendemos estudaro efeito conjunto da homofilia e distância em uma rede.

Page 75: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 61

4.1 Descrição do Modelo

O nosso modelo consiste em gerar uma rede baseada em homofilia Aij e métrica rij. Afunção Aij = |ηi−ηj| define o quão semelhantes são os sítios da rede, onde ηi e ηj representamas caractetísticas intrínsecas do sítio i e do sítio j respectivamente. A função rij representaa distância Euclidiana entre os sítios i e j. A rede é construída através de dois mecanismos:crescimento e ligação preferencial. O crescimento ocorre com adição de nós e ligações a cadapasso de tempo. Dessa forma, iniciamos a rede com um sítio de característica η1, invarianteno tempo, em uma posição arbitrária no plano. Cada novo sítio i adicionado à rede terá umacaracterística intrínseca ηi a qual será útil na determinação da homofilia entre os sítios pré-existentes na rede. O passo seguinte é posicionar o sítio recém-chegado a uma distância r docentro de massa da rede e ligá-lo a um dos sítios existentes. A ligação preferencial se dá devidoao caráter competivo por ligações. O sítio recém-chegado deverá escolher a qual dos sítiospré-existentes se conectar. Na escolha estocástica por ligação, três fatores são responsáveispela competição, os quais são: proximidade, semelhança e popularidade. A escolha por sítiosmais próximos geograficamente privilegia o efeito da distância. No entanto, a escolha daconexão pela semelhança entre suas características, acentua o efeito da homofilia, enquantoque, a preferência por ligações entre sítios mais populares privilegia aqueles que possuemuma alta conectividade (pólos) (ver Fig. 4.1 e Fig 4.2). Como vimos no capítulo anterior, aoalterar a regra de ligação preferencial, mudamos a estrutura topológica da rede (distribuiçãode conectividade, menor caminho, coeficente de agregação, correlações existentes na rede,etc). Cada um destes termos presentes (homofilia, distância e popularidade), quando vistosisoladamente, mudam o comportamento da distribuição de conectividade e evolução temporalda conectividade de um sítio. Estudaremos neste capítulo o efeito conjunto da conectividade,afinidade e métrica.

Page 76: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 62

Figura 4.1: Ilustra o processo dinâmico de ligação preferencial do Modelo de Afinidade com Métrica.As diferentes cores representam as características intrínsecas (η) do sítio. O vértice que chega à redeé colocado a uma distância r do centro de massa e se liga a um dos sítios pré-existentes da rede.

Figura 4.2: A figura acima ilustra uma rede gerada pelo Modelo de Afinidade com Métrica. Ossítios azuis, vermelhos e amarelos representam sítios com η < 0.33, 0.33 < η < 0.66 e η > 0.66respectivamente. Simulação realizada no Pajek com 1000 sítios.

O algoritmo para gerar o Modelo de Afinidade com Métrica é:

1. Inicia-se a rede com um sítio i = 1 em uma origem arbitrária do plano. É atribuídoa ele uma característica η1, invariante no tempo obtida de uma distribuição uniformeρ(η) = cte.

2. Em seguida, adicionamos o sítio i = 2 a uma distância r do sítio i = 1, obtida dadistribuição:

P (r) ∼ 1

r2+αG→ αG ≥ 0 (4.1)

e uma caracaterística η2 é atribuída ao sítio i = 2 e este liga-se ao sítio i = 1.

Page 77: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 63

3. Para colocar os sítios (i ≥ 3) no plano, o centro de massa do sistema é calculado1

e o sítio recém chegado é então colocado a uma distância r do centro de massa dosistema obedecendo a distribuição do item (2). Ao sítio recém-chegado é atribuída umacaracterística ηi e ele será então conectado a um dos sítios pré-existentes da rede comuma probabilidade dada por:

Π(ki) =ki[1− Aij]r−αAij∑j kj[1− Aij]r

−αAij

. (4.2)

onde o índice i se refere a um sítio pré-existente na rede e o índice j se refere ao sítiorecém chegado, rij é a distância geográfica entre os sítios i e j, ki é a conectividade dosítio i, e Aij = |ηi − ηj| é termo de homofilia introduzido em Almeida M.L. et al. queretrata a afinidade entre os sítios.

4. O passo anterior é repetido até o tamanho desejado da rede.

Observe que o nosso modelo é baseado em dois parâmetros controláveis: αG e αA(ver Eq. 4.1 e Eq. 4.2). O parâmetro αG é utilizado na distribuição das posições dos sítiosno plano. Ao aumentar o valor de αG diminuímos a distância geográfica entre os nós da rede(ver Fig. 4.3), deste forma, para αG = 0 temos a situação que os sítios encontram-se maisespalhados.

O parâmetro αA regula a importância da distância na ligação entre os sítios. QuandoαA é pequeno, a importância da distância é reduzida e se torna desprezível quando αA =

0. Neste limite, esperamos que nosso modelo apresente resultados em concordância com omodelo de Afinidade, abordado na seção 3.3, uma vez que, apenas o efeito da conectividadee homofilia permanecem na rede. Por outro lado, a medida que o valor de αA é aumentadoa distância se torna cada vez mais relevante. Note que existe uma transição na distribuiçãode conectividade, de um regime de livre escala para um regime de escala típica. No regimede baixos valores de αA interações de longo alcance são permitidas entre os sítios da rede.Porém, no limite de valores elevados do expoente αA, as interações entre os sítios da redepassam a ser apenas locais (interações entre primeiros vizinhos)(ver Fig. 4.4). Podemos dizerque αA controla a homogeneidade da rede. Para valores pequenos de αA a rede é heterogênea(presença de pólos) e para valores grandes a rede torna-se homogênea (ausência de pólos),em sua conectividade.

1A massa do sítio é fixa, m = 1.

Page 78: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 64

-10 -8 -6 -4 -2 0 2

0

5

10

αG

= 0α

G = 5

Figura 4.3: Ditribuição dos sítios no plano para αG = 0 e 5 com αA = 1

4.2 Distribuição de Conectividade

Analisamos o comportamento da distribuição de conectivade sob dois aspectos. Oprimeiro foi mantendo o parâmetro αA fixo na ligação preferencial e variando αG (a formacomo os sítios estão distribuídos no plano). A segunda análise foi observar o comportamentoda distribuição de conectividade mantendo o αG fixo para diversos valores de αA, controlandoassim a importância da distância na ligação preferencial. Na primeira análise, percebemosque a distribuição de concectividade não sofre alterações significativas sob a variação de αG,quando αA = 2 (ver Fig. 4.5). Este comportamento demonstra que a variação da distânciageográfica entre os sítios (proximidade ou afastamento), não tem influência significativa nasligações, mantendo a distribuição de conectividade praticamente inalterada.

Por outro lado, a variação do parâmetro αA, altera a topologia da rede, uma vez queinfluencia expressivamente a distribuição de conectividade (ver Fig. 4.6). Evidenciamos que,

Page 79: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 65

(a)

(b)

Figura 4.4: (a) Ditribuição dos sítios no plano para αG = 0 e αA = 1. (b) Distribuição dos sítiosno plano para αG = 0 e αA = 5. Ao comparar as duas figuras vemos nitidamente que as ligaçõesentre os sítios muda quando variamos αA. Observamos que a as ligações são distribuídas de formamais homogênea em (b). Simulação gerada no Pajek para uma rede de 300 sítios.

para valores intermediários de αA, o Modelo de Afinidade com métrica, encontra-se entreduas classes de redes, as redes livres de escala, caracterizadas pela presença de pólos, e arede aleatória clássica que apresenta conectividade típica. Esse mesmo comportamento foiobservado no Modelo Natal, como vimos no capítulo 3. O parâmetro αA controla a homo-geneidade da rede. Ao compararmos as distribuições de conectividade geradas pelo ModeloNatal e o Modelo de Afinidade com Métrica para os mesmos valores de αA, notamos que ascurvas de P (k) praticamente não variam. Este comportamento indica que embora as inte-rações entre os sítios tenha mudado devido à presença de homofilia, esta praticamente nãoaltera a distribuição de conectividade (ver Fig. 4.7). Mesmo que a distribuição de conec-

Page 80: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 66

tividade permaneça inalterada na presença da homofilia, isso não significa que não tenhamocorrido alterações na rede. Embora γ tenha variado muito pouco, a forma como as ligaçõesforam distribuídas foi alterada e essa mudança pode ter afetado outras grandezas (menorcaminho médio, coeficiente de agregação, correlações, etc.). Portanto, para esta rede, o es-tudo da distribuição de conectividade aparentemente não nos fornece informações novas arespeito do comportamento topológico da rede. Podemos ver que quando αA = 0, o nossomodelo se comporta como o Modelo de Afinidade, como era esperado, já que a distribuiçãode conectividade, nesse limite, só depende da afinidade e conectividade.

Page 81: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 67

10-8

10-7

10-6

10-5

10-4

10-3

10-2

10-1

100

100

101

102

103

P(k

)

k

αG = 0.0αG = 1.0αG = 2.0αG = 3.0

Figura 4.5: Distribuição de conectividade do Modelo de Afinidade com Métrica para αA = 2 e dife-rentes valores de αG. Notamos que a distribuição de conectividade não sofre alterações significativasao variarmos αA. Simulação realizada para N = 105 sob 103 amostras.

Page 82: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 68

10-6

10-5

10-4

10-3

10-2

10-1

100

100

101

102

103

P(k

)

k

αA = 0.0αA = 1.0αA = 2.0αA = 3.0αA = 4.0αA = 5.0

Tsallis

Figura 4.6: Distribuição de concectividade com αG = 2 e diferentes valores de αA. É notória atransição do regime de livre escala, descrita por uma lei de potência, para uma rede aleatória clássica,quando aumentamos αA da rede. Os ajustes foram feitos utilizando a equação de P (k) = P0e

−k/κq ,

onde ek/κq ≡ [1 + (1− q)k/κ]1/(1−q) da mecâncica estatística não extensiva de Tsallis. As simulaçõesforam realizadas para N = 105 sob 103 amostras.

Page 83: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 69

10-8

10-7

10-6

10-5

10-4

10-3

10-2

10-1

100

100

101

102

103

104

P(k

)

k

αA = 0.0 (MN)αA = 3.0 (MN)αA = 4.0 (MN)αA = 5.0 (MN)αA = 0.0 (AM)αA = 3.0 (AM)αA = 4.0 (AM)αA = 5.0 (AM)

Figura 4.7: Comparação entre Modelo Natal (MN) e o Modelo de Afinidade com Métrica (AM)sob a variação do parâmetro αA. Simulação realizada para N = 105 sob 103 amostras.

4.3 Evolução temporal da conectividade dos sítios

Para analisarmos a evolução temporal da conectividade de um sítio, observamos comoβ, expoente que traduz a taxa com que cada sítio recebe ligações durante o crescimento darede, se escala com αA e com η. Essa análise nos permite verificar como a distância e acaracterística intrínseca do sítio afetam a taxa que um dado sítio da rede adquire ligações(ver Fig. 4.8).

Observamos que nos modelos apresentados no capítulo anterior, a forma com quecada sítio adquiria ligações no tempo era alterada devido à mudanças na regra de ligaçãopreferencial. No modelo de Barabási-Albert, β é constante e igual a 0.5 para todos os sítiosda rede. Isso se traduz no fato de que a idade do sítio é determinante para ele se tornarum pólo, uma vez que todos os sítios adquirem ligações a uma mesma taxa. No entanto, noModelo de Qualidade o expoente não é mais constante e depende linearmente de ηi. Isso nos

Page 84: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 70

mostra que a maneira com que a conectividade de um dado sítio muda no tempo dependeda habilidade que ele tem de adquirir novas ligações. Os resultados mostraram que sítioscom uma qualidade alta têm um alto potencial para tornarem-se pólos. Posteriormente, noModelo de Afinidade vimos que β continua dependendo de η, porém de forma não linear,onde η representa uma característica intrínseca e não mais uma habilidade. Este resultadomostra que sítios com valores de η ∼ 0.5, adquirem ligações a uma taxa muito maior do queos outros sítios. No Modelo Natal, β depende de αA, exibindo um comportamento assintóticoquando αA & 5, neste regime β assume um valor constante em torno de 0.15, resultado esteque traduz o fato de que todos os sítios da rede adquirem ligações a uma mesma taxa, porémmuito lenta.

Em nosso modelo, o expoente β depende de dois parâmetros, αA e ηi. Ao analisarmosβ(ηi) notamos que em regimes de 0 < αA < 1 o comportamento de β é similar ao observadono Modelo de Afinidade, expressando uma forte relação entre os pólos e valores de η ∼ 0.5

(região intermediária). Porém, para valores de αA & 5, observamos que todos os sítiosadquirem ligações a uma mesma taxa, indicando que o aumento de αA na ligação preferencialminimiza o efeito da homofilia na rede. Esse resultado expressa que, a medida que a distânciase torna mais importante que a afinidade, as diferenças ou semelhanças entre os sítios, deixade ser relevante no crescimento da rede. É como se não fosse mais possível enxergar asdiferentes características entre eles. A rede tende para um regime de homogeneidade de suaconectividade em que a característica do sítio não é relevente na disputa por ligações, osistema se comporta como uma rede aleatória clássica em todas as suas propriedades (verFig. 4.9).

Page 85: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 71

100

101

102

103

104

t/t10

100

101

102

<k 10

>

αA

= 0α

A = 1

αA

= 2α

A = 3

αA

= 4α

A = 5

Figura 4.8: Evolução temporal da conectividade do sítio i = 10. Cada ponto foi gerado para umarede de N = 105 sob 103 amostras.

De forma semelhante, analisamos o comportamento de β com αA. Podemos observarque β praticamente não muda para 0 < αA < 1, nesse regime β é mais sensível a variaçõesde η. Na região intermediária de 1 < αA < 5, β decresce rapidamente com o aumento deαA. Porém, no limite em que αA & 5 β assume valores constantes independentemente deη. A presença de homofilia na rede, para pequenos valores de αA, permite que sítios comcaracterísticas intrínsecas (η ∼ 0.5) consigam ligações a uma taxa maior do que os sítioscom outros valores de η. Podemos observar esse comportamento comparando a evoluçãotemporal da conectividade de sítios com η = 0.5 e η = 0.1 com outro sítio nascido no mesmotempo dado pela dinâmica do Modelo Natal, o qual não existe a influência da homofilia(ver Fig. 4.10). Observamos também que quando a distância tem um peso maior na ligaçãopreferencial todas as curvas convergem aproximadamente para um mesmo valor de β.

Page 86: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 72

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0 0.2 0.4 0.6 0.8 1

β

η

αA = 0.0

αA = 1.0

αA = 2.0

αA = 5.0

Figura 4.9: Comportamento de β(η, αA) com η. Podemos observar que a dependência de β comη é suavizada à medida que aumentamos a importância da distância na ligação preferencial. Cadaponto foi gerado para uma rede de N = 105 sob 103 amostras.

Page 87: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 73

0.1

0.2

0.3

0.4

0.5

0.6

0 1 2 3 4 5 6 7 8

β

αA

η = 0.5

η = 0.1

MN

Figura 4.10: Comportamento de β(η, αA) com αA, analisado para valores de η = 0.1, η = 0.5 e arede geográfica. Cada ponto foi gerado para uma rede de N = 105 sob 103 amostras.

Page 88: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 74

4.4 Ajuste das curvas da distribuição de conectividade

As curvas geradas pela distribuição de conectividade, foram ajustadas utilizandoequação P (k) = P0e

−k/κq proveniente da mecânica estatística não-extensiva de Tsallis (ver

Apêndice A), onde os parâmetros q e κ foram ajustados para diferentes valores de αA (verFig. 4.11.a e Fig. 4.11.b). A escolha do ajuste das curvas por funções q-exponenciais, se deudevido à uma única função conseguir ajustar todas as distribuições de conectividade paratodos os valores de αA e αG. Porém, segundo [13] esse ajuste não representa uma coincidênciaapenas, mas expressa uma forte correlação entre a mecânica estatística não-extensiva e asRedes Complexas, uma vez que esses sistemas estão fora do equilíbrio e possuem interações delongo alcance. Observamos que a função que descreve as curvas tende para uma exponencialpadrão quando αA & 5 o que já era esperado, uma vez que o sistema está caminhando paraum regime de distribuição de conectividade típica. Redes desse tipo, podem ser descritaspela distribuição de Poisson. Observemos que para valores pequenos de αA o parâmetro qnão varia, no entanto, à medida que aumentados o valor de αA vemos que q → 1, limiteeste da função exponencial padrão. Quando 1 < αA < 5, q apresenta um comportamentodecrescente com αA. O parâmetro κ, ao contrário é uma função crescente de αA. Esterepresenta o número característico de ligações do sistema. Note que ao aumentar o valor αA,κ tende a número constante de ligações.

Ao compararmos o gráfico de q(αA) com β(αA) percebemos que embora β se torneconstante para valores αA & 5, q continua decrescendo. Esse comportamento de q podeindicar que mudanças, ainda que pequenas, estejam ocorrendo no sistema. O comportantode q(αA) pode trazer informações a respeito dessas mundaças mesmo que esta não sejaperceptível no gráfico de β(αA).

Page 89: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 75

1

1.05

1.1

1.15

1.2

1.25

1.3

1.35

1.4

0 1 2 3 4 5 6 7 8

q

αA

(a)

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 1 2 3 4 5 6 7 8

κ

αA

(b)

Figura 4.11: Ajustes das curvas para diferentes valores de αA controlados pelos parâmetros, q e κ,da função q-exponencial. (a) q é uma função decrescente de αA. (b) κ é um parâmetro crescente deαA. Simulações realizadas para N = 105 e 103 amostras.

Page 90: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 4. Modelo de Afinidade com Métrica 76

4.5 Relevância do Modelo de Afinidade com Métrica

Podemos observar pela Tabela 4.1 que o Modelo de Afinidade com Métrica, é ummodelo mais completo e que tem como caso particular os modelos expostos no capítuloanterior. Observamos que quando αA = 0 e Aij = 0, é possível reproduzir o modelo deBarabási-Albert, em que não existe métrica e a semelhança entre os sítios não importa (ηi =

cte). No caso em que somente αA = 0 é possível reproduzir o Modelo de Afinidade, onde asemelhança entre os sítios é relevante e a métrica não é levada em conta. Quando fazemosAij = 0 no Modelo de Afinidade com Métrica, reproduzimos o Modelo Natal, em que asemelhança entre os sítios não importa e a distância Euclidiana entre eles é considerada. Comisso, queremos mostrar a relevância do estudo desse modelo na área de Redes Complexas.

Modelo Ligação Preferencial Fator Competitivo por LigaçõesBarabási-Albert Πi ∝ ki Conectividade

Modelo de Afinidade Πi ∝ ki|1− Aij| ConectividadeHomofilia

Modelo Natal Πi ∝ kir−αAij Conectividade

DistânciaAfinidade com Métrica Πi ∝ ki|1− Aij|r−αAij Conectividade

HomofiliaDistância

Tabela 4.1: OModelo de Afinidade comMétrica, tem como casos particulares o Modelo de Barabási-Albert, o Modelo de Afinidade e o Modelo Natal. É um modelo mais completo que engloba na regade ligação preferencial o efeito da conectividade, homofilia e métrica.

Page 91: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capıtulo 5Conclusões e Perspectivas

Neste trabalho apresentamos um modelo que gera uma rede complexa através dosmecanismos de crescimento e ligação preferencial, onde a regra de ligação preferencial incluitrês fatores competitivos: a conectividade, a métrica e a afinidade. Mostramos que a presençada afinidade no Modelo Natal praticamente não altera sua distribuição de conectividade, eque a importância dada à distância na regra de ligação preferencial altera expressivamentesua distribuição de conectividade P (k). A rede foi gerada por meio de dois parâmetros con-troláveis: αG e αA. Mostramos ainda que a distribuição de conectividade não sofre alteraçõessignificativas à medida que variamos αG para αA = 2. Isso não significa que não tenha havidomudanças na rede. Embora γ tenha mudado pouco, a forma que as ligações foram distribuí-das entre os sítios foi alterada. No entanto, a distribuição de conectividade é muito sensívela variações αA. Este fato indica que a semelhança entre as características intrínsecas do sítiotêm pouca influência na distribuição de conectividade independentemente do valor de αA.Vimos ainda que esse comportamento da rede ao variar o αA está intimamente relacionadoà homogeneidade da conectividade na rede de tal forma que, para valores de αA ∼ 2 a redeé totalmente heterogênea, exibindo uma distribuição de conectividade em que temos muitossítios com baixa conectividade e poucos sítios com alta conectividade. Porém, redes geradascom αA > 3 são mais homogêneas em sua distribuição de conectividade, fato este que indicaa ausência de pólos na rede. Este comportamento é característico de uma rede aleatóriaclássica, onde P (k) apresenta um valor típico. Portanto, αA é o parâmetro responsável pelahomogeneidade das ligações.

77

Page 92: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 5. Conclusões e Perspectivas 78

Analisamos também o comportamento dinâmico da rede em relação à β, expoenteassociado à evolução temporal da conectividade de um dado sítio. Em nosso modelo, βdepende de dois parâmetros: αA e ηi. Indicando que a taxa com que cada sítio adquire ligaçõesdepende do quão importante a distância é na ligação preferencial e de sua semelhança comoutros sítios existentes na rede. Os resultados mostraram que quando a distância tem um pesopequeno na ligação preferencial (αA ∼ 1), β tem um valor máximo para valores de ηi ∼ 0.5.Este comportamento é semelhante ao observado no modelo de Afinidade, indicando que sítioscom valores de η ∼ 0.5 têm um potencial maior para tornarem-se pólos. Isto se dá porque ossítios com η ∼ 0.5 são aqueles que têm maior chance de apresentar características semelhantesa outros sítios da rede aumentanto suas chances de receber ligações. É importante notar que,para um mesmo valor de αA todos os sítios semelhantes (características parecidas), recebemligações a taxas muito próximas.

Quando αA ∼ 5 o expoente β torna-se constante e todos os sítios adquirem ligações auma mesma taxa, independentemente de sua característa intrínseca η. Este comportamentode β indica que, quando a rede é heterogênea em sua conectividade, a característica intrín-seca do sítio é um fator importante na competição por ligações, ou seja, a semelhança oudiferença entre os sítios tem grande influência nas conexões entre eles. Porém, no regime dehomogeneidade da rede, η não influencia mais na aquisição por ligações. Portanto, η tem umainfluência maior na rede quando a mesma é heterogênea e tende a diminuir sua influênciaà medida que a mesma vai tornando-se homogênea, perdendo totalmente a importância noregime de conectividade típica (αA & 5). Notamos que o valor do expoente β diminui paratodos os sítios a medida que αA aumenta. Isso mostra que no regime de valores altos de αAa taxa com que cada sítio adquire ligações é muito baixa.

As distribuições de conectividade de nosso modelo foram ajustadas utilizando aequação P (k) = P0e

−k/κq proveniente da mecânica estatística não-extensiva de Tsallis, onde

ek/κq ≡ [1 + (1 − q)k/κ]1/(1−q). Vimos que os parâmetros q (índice entrópico) e κ (númerocaracterístico de ligações) foram ajustados para cada valor de αA. Redes aleatórias clássicastêm uma conectividade típica e podem ser descritas por uma distribuição do tipo Poisson (ex-ponencial). Vimos que a função q-exponencial, tende para uma exponencial padrão quandoq → 1. Esse comportamento foi observado no gráfico de q(αA) em que vemos claramente quequando a rede caminha para o regime homogêneo q decresce com o aumento de αA tendendoa 1. Obervamos que quando q → 1 a função q-exponencial tende para uma exponencialpadrão, função apropriada para descrever redes aleatórias clássicas. Ao contrário do queobservamos no comportamento de q(αA), κ(αA) é uma função crescente de αA. À medida

Page 93: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Capítulo 5. Conclusões e Perspectivas 79

que αA cresce o número característico de conexões, κ tende a um valor constante, indicandoque nesse limite o regime de conectividade é típica.

Os resultados aqui expostos, embora úteis na compreensão do comportamento deredes com essas características, podem ainda ser muito mais explorados, uma vez que ou-tros aspectos ainda podem ser analisados. Nesse sentido, pretendemos realizar medidas dediaticidade e heterofilicidade, bem como de associatividade para podermos investigar a exis-tência de correlações na rede. O modelo de Barabási-Albert apresenta desassociatividadecom relação a conectividade, porém não sabemos como a homofilia e distância afetam essecomportamento da conectividade. Queremos ainda verificar se há formação de comunidadesou agregados de sítios com caracterísiticas semelhantes, para isso é necessário realizar simu-lações com valores de m > 1. Ao ampliar este estudo para outros valores de m pretendemosanalisar mais detalhadamente a existência de correlação entre a proximidade dos sítios esuas características semelhantes, bem como a formação de comunidades. Em nosso modelo,utilizamos uma distribuição de características η uniforme. Queremos ainda verificar como arede se comporta quando a função de distribuição de η é alterada. Em nossas simulações,apenas a importância da distância foi controlada na regra de ligação preferencial, uma outraproposta seria alterar a regra de ligação preferencial por: Π(ki) ∝ ki[1 − Aij]αηr−αAij , ondeo expoente αη controla a intensidade das ligações por homofilia, permitindo a existência devínculos muito fortes entre sítios semelhantes. Finalmente, pretendendemos ainda, estudarcomo se propagam informações, ideias, doenças, etc. nessa rede e verificar como a distânciae a homofilia constribuem nesse processo de propagação.

Page 94: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas

[1] PARK, J.; BARABÁSI, A.-L. Distribution of node characteristics in complex networks.PNAS, v. 104, p. 17916–17920, 2007.

[2] MENDES, G. A. Contribuições ao estudo das redes complexas: Modelo de qualidade.2007. Dissertação (Mestrado em Física) - Universidade Federal do Rio Grande do Norte,2007.

[3] DE ALMEIDA, M. L. Dinâmica e estrutura de redes complexas no modelo de afinidade.2009. Dissertação (Mestrado em Física) - Departamento de Física Teórica e Experimental- UFRN, 2009.

[4] DE MACEDO FILHO, A. Conexão entre as redes complexas e a estat’ística de kaniada-kis e busca eficiente das propriedades críticas do processo epidêmico difusivo 1d. 2011.Tese (Doutorado em Física) - Departamento de Física Teória e Experimental - UFRN,2011.

[5] NEWMAN, M. E. J. Assortative mixing in networks. Physical Review Letters, Wood-bury, v. 89, p. 208701, 2002.

[6] ALBERT, R.; BARABÁSI, A.-L. Statistical mechanics of complex networks. Review ofModern Physics, v. 74, p. 1–51, 2002.

[7] DILAO, R. A ciência dos sistemas complexos. Departamento de Física do IST, v. 1, p.1–14, 1995.

[8] COHEN, R.; HAVLIN, S. Complex networks: Structure, robustness and function. Cam-bridge University Press, 2010.

80

Page 95: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas 81

[9] BARABÁSI, A.-L.; ALBERT, R. Emergence of scaling in random networks. Science,Washington, v. 286, p. 509–512, 1999.

[10] FALOUTSOS, M.; FALOUTSOS, P.; FALOUTSOS, C. On power-law relationship ofthe internet topology. Com. Commun. Rev., v. 29, p. 251, 1999.

[11] BIANCONI, G.; BARABÁSI, A.-L. Competition and multiscaling in evolving networks.Europhysics Letters, Les Ulis, v. 54, p. 436–442, 2001.

[12] SOARES, D. J. B. Contribuição ao estudo de modelos estocásticos geométricos e deséries temporais. 2004. Dissertação (Mestrado em Física) - Departamento de FísicaTeórica e Experimental - UFRN, 2004.

[13] SOARES, D. J. B.; TSALLIS, C.; MARIZ, A. M.; DA SILVA, L. R. Preferential atta-chment growth model and nonextensive statistical mechanics. Europhysics Letters, LesUlis, v. 70, p. 70–76, 2005.

[14] HOLANDA, B. Teoria dos grafos, 2011.

[15] EULER, L. Solvtio problematis ad geometriam sitvs pertinentis. Commentarii Acade-miae Scientiarum Imperialis Petropolitanae, v. 8, p. 128–140, 1736.

[16] NEWMAN, M. E. J. Clustering and preferential attachment in growing networks. Phys.Rev. E, v. 64, p. 025102, 2001.

[17] BARABÁSI, A.-L.; JEONG, H.; NEDA, Z.; RAVASZ, E.; SHUBERT, A.; VICSEK,T. Evolution of the social network of scientific collaborations. preprint cond-mat, p.0104162, 2001.

[18] ALBERT, R.; BARABÁSI, A.-L. Diameter of the world-wide web. Nature, London, v.401, p. 130, 1999.

[19] BRODER, A.; KUMAR, R.; MAGHOUL, R.; RAGHAVAN, P.; RAJAGOPALAN, S.;STATA, R.; TOMKINS, A.; WIENER, J. Graph structure in the web. ComputerNetwork, v. 33, p. 309–320, 2000.

[20] I CANCHO, R. F.; SOLÉ, R. V. The small world of human language. The Royal Society,v. 268, p. 2261–2265, 2001.

[21] LILJEROS, F.; EDLING, C. R.; AMARAL, L. A. N.; STANLEY, H. E.; ABERG, Y.The web of human sexual contacts. Nature, London, v. 411, p. 907–908, 2001.

Page 96: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas 82

[22] S.REDNER. How popular is your paper? an empirical study of the citation distribution.Eur. Phys. J. B., v. 4, p. 131–134, 1998.

[23] PASTOR-SATORRAS, R.; VáZQUEZ, A.; VESPIGNANI, A. Dynamical and correla-tion properties of the internet. Phys. Rev. Lett., v. 87, p. 258701, 2001.

[24] LEWIS, T. G. Network science, theory and applications. Wiley, 2009.

[25] CALDARELLI, G. Scale-free networks: complex webs in nature and technology. Oxford,2007.

[26] MATA, A. Transições de fases em um processo de reação-difusão em metapopulaçõesheterogêneas. 2011. Dissertação (Mestrado em Física) - Universidade Federal de Viçosa,2011.

[27] DOROGOVTSEV, S. N. Lectures on complexs networks. First. ed. New York, 2010.

[28] TANAKA, G.; MORINO, K.; AIHARA, K. Dynamical robustness in complex networks:the crucial role of low-degree nodes. Scientific Reports, v. 2, p. 232, 2012.

[29] BOCCALETTI, S.; LATORAB, V.; MORENO, Y.; CHAVEZ, M.; HWANG, D.-U.Complex networks: Structure and dynamics. Physics Reports, v. 424, p. 175–308, 2006.

[30] MILGRAM, S. The small world problem. Psycholgy Today, v. 2, p. 60, 1967.

[31] NEWMAN, M. E. J. The structure and function of complex networks. SIAM Review,v. 45, p. 167–256, 2003.

[32] BOLLOBAS, B.; JANSON, S.; RIORDAN, O. Sparse random graphs with clustering.Random Structures & Algorithms, v. 38, p. 269–323, 2011.

[33] CATANZARO, M.; BOGUNÁ, M.; PASTOR-SATORRAS, R. Generation of uncorre-lated random scale-free networks. Physical Review E, v. 71, p. 027103–1 – 027103–4,2005.

[34] PARK, J.; NEWMAN, M. E. J. Orgin of degree correlations in the internet and othernetworks. Physical Review E, v. 68, p. 026112, 2003.

[35] BOLLOBAS, B.; RIORDAN, O. M. Mathematical results on scale-free random graphs.in handbook of graphs and networks: From genome to the internet. Wiley-VCH, Berling,2002.

Page 97: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas 83

[36] DOROGOVTSEV, S. N. Clustering of correlated networks. Phys. Rev. E, v. 69, p.027104, Feb 2004.

[37] NEWMAN, M. E. J. Random graphs with clustering. Phys. Rev. Lett., v. 103, p.058701, Jul 2009.

[38] BOLLOBAS, B. A probabilistic proof of an asymptotic formula for the number oflabelled random graphs. Eur. J. Combinatorics, v. 1, p. 311, 1980.

[39] RIVERA, M. T.; SODERSTROM, S. B.; UZZI, B. Dynamics of dyads in social networks:Assortative, relational, and proximity mechanisms. Annual Review of Sociology, v. 36,p. 91–115, 2010.

[40] ÖZGÜR, S.; JENSEN, D. Navigation networks by using homophily and degree. PNAS,v. 105, p. 12758–12762, 2008.

[41] FOSTER, D. A.; FOSTER, J. G.; GRASSBERGER, P.; PACZUSKI, M. Clusteringdrives assortativity and community structure in ensembles of networks. Phys. Rev. E,v. 84, p. 066117, 2011.

[42] SERRANO, M. A.; BOGUNÁ, M. Weighted configuration model. cond-mat.dis-nn, p.0501750, 2005.

[43] WATTS, D. J.; STROGATZ, S. H. Collective dynamics of small-world networks. Nature,London, v. 393, p. 440–442, 1998.

[44] RÉKA, A.; ALBERT-LÁSZLÓ, B. Topology of evolving networks: Local events anduniversality. Phys. Rev. Lett., v. 85, p. 5234–5237, Dec 2000.

[45] JEONG, H.; TOMBOR, B.; ALBERT, R.; OLTVAI, Z. N.; ; BARABáSI, A.-L. Thelarge-scale organization of metabolic networks. Nature, London, v. 407, p. 651–654,2000.

[46] JEONG, H.; MASON, S. P.; BARABÁSI, A.-L.; OLTVAI, Z. N. Lethality and centralityin protein networks. Nature, London, v. 411, p. 41–42, 2001.

[47] BARABÁSI, A.-L.; ALBERT, R.; JEONG, H. Mean-field theory for scale-free randomnetworks. Physica A, Amsterdam, v. 272, p. 173–187, 1999.

[48] NEWMAN, M. E. J.; STROGATZ, S. H.; WATTS, D. J. Random graphs with arbitrarydegree distributions and their applications. Phys. Rev. E, v. 64, p. 026118, 2001.

Page 98: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas 84

[49] ADAMIC, L. A.; HUBERMAN, B. A. Power-law distribution of the world wide web.Science, Washington, v. 287, p. 2115, 2000.

[50] TSALLIS, C.; DE ALBUQUERQUE, M. P. Are citations of scientific papers a case ofnonextensivity? Eur. Phys. J. B., v. 13, p. 777–780, 2000.

[51] KRAPIVSKY, P. L.; REDNER, S.; LEYVRAS, F. Connectivity of growing randomnetworks. Phys. Rev. Lett., v. 85, p. 4629, 2000.

[52] VÁZQUEZ, A. Statistics of citation networks. cond-mat.stat-mech, p. 010503, 2001.

[53] BARABÁSI, A.-L.; JEONG, H.; NÉDA, Z.; RAVASZ, E.; SHUBERT, A.; VICSEK, T.Evolution of social network of scientific collaborations. Physica A, Amsterdam, v. 311,p. 590–614, 2002.

[54] WAGNER, A.; FELL, D. A. The small world inside large metabolic networks. Procee-dings the Royal Society B, v. 268, p. 183–1810, 2001.

[55] WAGNER, A. The yeast protein interaction network evolves rapidly and contains fewredundant duplicate genes. Mol. Biol. Evol., v. 18, p. 1283, 2001.

[56] VALVERDE, S.; SOLÉ, R. V. Self-organized critical traffic in parallel computernetworks. Physica A, Amsterdam, v. 312, p. 636–648, 2002.

[57] ABE, S.; SUZUKI, N. Itineration of the internet over nonequilibrium stationary statesin tsallis statistics. Phys. Rev. E, v. 67, p. 016106, Jan 2003.

[58] DOYE, J. P. K. Network topology of a potential energy landscape: A static scale-freenetwork. Phys. Rev. Lett., v. 88, p. 238701, May 2002.

[59] YULE, G. U. A mathematical theory of evolution, based on the conclusions of dr. j. c.willis, f.r.s. Philosophical Transactions of the Royal Society of London, v. B213(402-410),p. 21–87, 1925.

[60] SIMON, H. A. On a class of skew distribution functions. Biometrika, v. 42, p. 425–440,1955.

[61] DE S. PRICE, D. J. Networks of scientific papers. Science, Washington, v. 149, p.510–515, 1965.

Page 99: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas 85

[62] KRAPIVSKY, P. L.; REDNER, S. Organization of growing random networks. Phys.Rev. E, v. 63, p. 066123, 2001.

[63] CURRARINI, S.; REDONDO, F. V. Serch and homophily in social networks. WorkingPapers. Department of Economics, University of Venice. No. 2 4 /WP/2010. ISSN 1827-3580.

[64] XU, X.-J.; WANG, W.-X.; ZHOU, T.; CHEN, G. Geographical effects on epidemicspreading in scale-free networks. arXiv:physics Physics.soc-ph, v. 1, p. 060256, 2008.

[65] JEONG, H.; NÉDA, Z.; ALBERT-LÁSZLÓ, B. Measuring preferential attachment forevolving networks. cond-mat.stat-mech, v. v1, p. 0104131, 2001.

[66] DOROGOVTSEV, S. N.; MENDES, J. F. F. Exactly solvable analogy of small-worldnetworks. Europhysics Letters, Les Ulis, v. 50, p. 1–7, 2000.

[67] DOROGOVTSEV, S. N.; F., M. J. F.; SAMUKHIN, A. N. Www and internet modelsfrom 1955 till our days and the “popularity is attractive” principle. preprint cond-mat,p. 0009090, 2000.

[68] DOROGOVTSEV, S. N.; MENDES, J. F. F.; SAMUKHIN, A. N. Scaling propertiesof scale-free evolving networks: Continuous approach. Phys. Rev. E, v. 63, p. 056125,2001.

[69] DOROGOVTSEV, S. N.; F., M. J. F. Language as an evolving word web. Proc. R. Soc.London Ser. B, v. 268, p. 2603, 2001.

[70] DOROGOVTSEV, S. N.; MENDES, J. F. F. Scaling behaviour of developing anddecaying networks. Europhysics Letters, Les Ulis, v. 52, p. 33, 2000.

[71] ERGÜN, G.; G. J., R. Growing random networks with fitness. preprint cond-mat, p.0103423, 2001.

[72] KUMAR, R.; RAGHAVAN, P.; RAJALOPAGAN, S.; SIVAKUMAR, D.; TOMKINS,A. S.; UPFAL, E. The web as a graph, 2000.

[73] KUMAR, R.; RAGHAVAN, P.; RAJALOPAGAN, S.; SIVAKUMAR, D.; TOMKINS,A. S.; UPFAL, E. Stochastic models for the web graph, 2000.

[74] VÁZQUEZ, A. Knowing a network by walking on it: emergence of scaling. preprintcond-mat, p. 0006132, 2000.

Page 100: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Referências Bibliográficas 86

[75] KRAPIVSKY, P. L.; RODGERS, G. J.; REDNER, S. Degree distributions of growingnetworks. Phys. Rev. Lett., v. 86, p. 5401, 2001.

[76] TADIĆ, B. Dynamics of directed graphs: the world-wide web. Physica A, Amsterdam,v. 293, p. 273, 2001.

[77] BISGIN, H.; AGARWAL, J.; XU, X. Investigating homophily in online social networks.IEEE/WIC/ACM Internetional Conference on Web Intellingence and Intelligent AgentTechnology, p. 533–536, 2010.

[78] TSALLIS, C. Nonextensive statistics: Theoretical, experimental and computationalevidences and connections. cond-mat.stat-mech, v. 1, p. 9903356, 1999.

Page 101: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Apendice AMecância Estatística não-extensiva de Tsallis

A mecânica estatística padrão de Boltzman-Gibbs, é extensiva, ou seja, a entropia dedois subconjuntos de um gás é a soma das entropias individuais, de cada subconjunto. Porémmuitos objetos na natureza interagem por meio de interações de longo alcance (interação gra-vitacional, forças de Coulomb). Além do mais, a propriedade de aditividade (extensividade)é frequentemente violada em sistemas reais. A mecânica estatística de Boltzman-Gibbs(BG)parece descrever satisfatoriamente a natureza se as interações microscópicas efetivas são decurto alcance, se a memória microscópica é também de curto alcance e se as condições decontorno não são (multi)fractais [78]. O formalismo padrão (BG) é aplicável, segundo C.Tsallis, enquanto que o espaço de fase não seja (multi)fractal. Muitos sistemas na naturezanão obedecem aos critérios estabelecidos pela estatística de BG.Na prática, a nova termo-estatística generalizada se reduz à padrão quando as interações tornam-se de curto alcance[78].

Com a finalidade de descrever esses sistemas que não podem ser descrito por (BG),Constantino Tsallis em 1988, propôs uma nova fórmula para a entropia na qual contém aentropia padrão (BG) como um caso particular. Originalmente esta entropia generalizadaresultou ser não-extensiva na ausência de correlações por isso o nome “mecânica estatísticanão-extensiva”, porém tem sido mostrado recentemente que ela tornar-se extensiva para sis-temas fortemente correlacionados. Na última década, a entropia de Tsallis tem encontradomuitas aplicações em física do plasma, astrofísica, fractais, turbulência, finanças, sistemascom correlações de longo alcance e sistemas complexos.

87

Page 102: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Apêndice A. Mecância Estatística não-extensiva de Tsallis 88

A.1 Formalismo

Tsallis introduziu uma nova entropia caracterizada por um índice q, denominado deíndice entrópico que caracteriza o grau de não-extensividade do sistema, e que tem a seguinteforma:

Sq =kBq − 1

(1−

W∑i

pqi

)(A.1)

esta expressão é normalizada por∑

i pi, com q ∈ <. kB, na expressão acima, é a constante deBoltzmann, pi é a probabilidade de encontrar o sistema no estado microscópico i. No limiteem que q = 1, a q-entropia, representada por Sq recupera a entopia extensiva padrão de BG.

A Eq. A.1 pode ser reescrita, como:

Sq = −kBW∑i=1

pqi lnq(pi) (A.2)

onde a função q-logaritmica é definida, na teoria de Tsallis, por:

lnq(x) ≡ x1−q − 1

1− q, ∀(x, q) (A.3)

Quando q = 1 temos que ln1(x) = ln(x), recupera o logaritmo padrão. Pode-severificar que expq(lnq(x)) = lnq(expq(x)) = x. Dentro dessa q-álgebra é possível definir afunção inversa do q-logaritmo que é a função q-exponencial, dada por:

expq(x) ≡ [1 + (1− q)x]1/(1−q),∀(x, q) (A.4)

porém, tem que satisfazer à seguinte condição [1 + (1− q)x] > 0 e para qualquer outro valorexpq(x) = 0. É possível mostrar que quando q = 1 a q-exponencial tende para a exponencialpadrão.

A teoria proposta por Tsallis viola o princípio da aditividade estabelecido no terceiropostulado da Temodinâmica que diz que a entropia é uma função contínua, diferenciável emonotonicamente crescente da energia e é aditiva sobre os sub-sistemas constituintes de umdado sistema composto. Na estatística de BG temos S(A+ B) = S(A) + S(B), no entanto,

Page 103: Contribuição ao Estudo de Redes Complexas: Modelo de ...€¦ · do tipo Poisson (pontos em vermelho) e uma distribuição do tipo Lei de Potência (pontos azuis). Do lado esquerdo

Apêndice A. Mecância Estatística não-extensiva de Tsallis 89

na entropia de Tsallis temos:

Sq(A+B)

kB=Sq(A)

kB+Sq(B)

kB+ (1− q)Sq(A)

kB

Sq(B)

kB(A.5)

Observe que quando q = 1 a entropia BG é recuperada e o terceiro postulado daTermodinâmica não é violado. A não-extensividade do sistema está justamente no termo(1 − q)[Sq(A)Sq(B)]/k2B. Quando q > 0 a entropia torna-se subextensiva e superextensivaquando q < 0.

A violação da aditividade representa o rompimento do conceito de sistema isolado.Da Eq. A.5 é possível ver que cada subsistema (A,B) do sistema composto A+B contribuipara aditividade da entropia com um fator de Sq(A)[1 + 1

2(1 − q)Sq(B)] e Sq(B)[1 + 1

2(1 −

q)Sq(A)]. Este comportamento indica que um sistema já sentia a presença do outro mesmoantes da junção, o que indica que o sistema antes da junção, não estava isolado.

Em 2004, Soares [12] mostrou que é possível relacionar a q-exponencial com redes li-vres de escala através da distribuição de conectividade P (k) [12, 13]. Uma grande quantidadedessas redes, segundo [4] seguem uma lei de potência para a distribuição de conectividade epode ser escrita como:

P (k) ∼ 1

(k0 + k)γ(A.6)

com k > 0 e γ > 0. Se redefinirmos k0 e γ como:

k0 ≡ηq

q − 1e γ ≡ 1

1− q(A.7)

a equação A.6 pode ser reescrita e assume a forma:

P (k) = P0 expq(−k/ηq) (A.8)

onde P0 é a constante de normalização, ηq é uma constante positiva e que está associada aonúmero caractetístico de ligações da rede.