Evolução, Genética e Computação - DCA | FEEC ...lboccato/topico_2_inspiracao_biologica.pdf ·...

28
IA707 Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux Tópico 2 Evolução, Genética e Computação 1 Evolução, Genética e Computação 1 Base biológica 1.1 Hereditariedade (BURNS, 1983) A história da genética é fascinante principalmente pela velocidade com que se evoluiu de observações a demonstrações experimentais dos mecanismos fundamentais envolvidos. Na antiguidade, defendia-se a idéia de que o sexo era determinado pela procedência do líquido seminal no homem: se do testículo direito sexo masculino; se do testículo esquerdo sexo feminino. A mulher era vista apenas como uma “incubadeira” neste processo.

Transcript of Evolução, Genética e Computação - DCA | FEEC ...lboccato/topico_2_inspiracao_biologica.pdf ·...

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 1

Evolução, Genética e Computação

1 Base biológica

1.1 Hereditariedade (BURNS, 1983)

A história da genética é fascinante principalmente pela velocidade com que se

evoluiu de observações a demonstrações experimentais dos mecanismos

fundamentais envolvidos.

Na antiguidade, defendia-se a idéia de que o sexo era determinado pela

procedência do líquido seminal no homem: se do testículo direito sexo

masculino; se do testículo esquerdo sexo feminino. A mulher era vista apenas

como uma “incubadeira” neste processo.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 2

1672: descoberta do óvulo pelo holandês Graaf as fêmeas de mamíferos

também apresentam ovulação!

1675: descoberta do espermatozóide pelo holandês Von Leeuwenhoeck.

1866: idéias efetivas acerca da hereditariedade monge agostiniano Gregor

Mendel (República Tcheca). Ele atacou o problema de modo simples e lógico,

escolheu material adequado, concentrou-se em poucas características contrastantes,

desenvolveu um programa de cruzamentos controlados, tratou os resultados de

forma eficiente e sugeriu fatores causais (hoje chamados de genes) como sendo os

responsáveis pelos fenômenos observados.

Ninguém havia chegado tão perto da compreensão real da hereditariedade (ficou

faltando, em essência, apenas elucidar os mecanismos celulares envolvidos), mas

foram necessários mais de 30 anos para que a comunidade científica se desse conta

da importância e eficácia desses resultados.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 3

É curioso constatar que um dos fatores que dificultaram a assimilação dos

resultados de Mendel foi justamente o intenso debate reinante nos meios

científicos após a divulgação da teoria de seleção natural de Darwin.

1900: redescoberta das idéias de

Mendel de forma independente por

três pesquisadores.

1a lei de Mendel: Cada caráter é

condicionado por dois fatores. Eles

separam-se na formação dos gametas,

passando apenas um fator por gameta.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 4

1.2 Do Darwinismo ao Neo-Darwinismo

DARWIN (1859) sugeriu que, para haver evolução, é necessário que exista uma

população de indivíduos sujeita a:

1. Reprodução com herança;

2. Variação; e

3. Seleção Natural.

Embora Darwin tenha considerado essas hipóteses como suficientes para explicar

a origem das espécies, hoje elas são aceitas apenas como suficientes para explicar

os processos ecológicos.

Na época de Darwin (meados de 1800), entretanto, sabia-se muito pouco sobre os

processos de reprodução e praticamente nada sobre genética. Além disso, não

havia um bom entendimento sobre como operam os mecanismos de seleção

natural.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 5

A união da genética com diversos conceitos e teorias sobre seleção natural leva ao

que hoje é chamado de Neo-Darwinismo.

Sobre a Seleção Natural

O princípio da seleção natural indica que os indivíduos cujas variações se adaptam

melhor ao ambiente terão maior probabilidade de sobreviver e se reproduzir.

A seleção natural é probabilística, e seu alvo primário é o indivíduo, embora seu

efeito resultante vá se manifestar na espécie como um todo. A espécie é o

beneficiário final do processo evolutivo (MAYR, 1988).

Exemplo clássico: mariposa salpicada (Biston betularia)

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 6

Antes da revolução industrial, a mariposa salpicada clara era comumente

encontrada em regiões urbanas na Grã-Bretanha. Desde 1850, a frequência de

ocorrência da forma escura em torno de regiões bastante industrializadas, como ao

redor de Manchester e Birmingham, aumentou drasticamente de 1 para 90%.

Em regiões menos industrializadas, a mariposa escura continuou sendo rara.

1.3 Terminologia biológica

A terminologia biológica a ser empregada representa uma analogia com as

entidades biológicas reais, sendo que as entidades computacionais corresponderão

invariavelmente a estruturas bem mais simples que seus equivalentes biológicos.

Célula órgão sistema organismo população comunidade

ecossistema

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 7

Célula

Órgão

Sistema

Organismo

Nível fisiológico

População

Comunidade

Ecossistema

Nível ecológico

Figura 1: Divisão hierárquica dos sistemas biológicos (de Castro & Timmis, 2002).

Célula: unidade estrutural básica dos seres vivos, que se compõe de numerosas

partes, sendo as fundamentais a parede ou membrana, o protoplasma e o núcleo. A

célula é a menor unidade de matéria viva que pode existir de maneira

independente, e ser capaz de se reproduzir. Toda célula de um mesmo organismo

contém o mesmo conjunto de um ou mais cromossomos. Nos seres humanos, cada

célula somática (não-germinativa) contém 23 pares de cromossomos.

Cromossomo: estrutura nucleoprotéica formada por uma cadeia de DNA, sendo a

base física dos genes nucleares, os quais estão dispostos linearmente. Cada espécie

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 8

apresenta um número característico de cromossomos. Quando os cromossomos são

arranjados em pares (cada cromossomo proveniente de um dos pais, embora haja

exceções), os respectivos organismos são chamados diplóides. Organismos cujos

cromossomos não se apresentam aos pares são chamados haplóides.

gene gene

gene

Figura 2: Ampliação de um organismo para enfocar o material genético. Organismo célula

cromossomo gene DNA

Genes: blocos funcionais de DNA, os quais codificam uma proteína específica. É a

denominação que damos hoje ao fator mendeliano. Cada gene está localizado em

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 9

uma posição (locus) particular do cromossomo. Quando dois genes se comportam

segundo a 1a lei de Mendel, são ditos alelos, e se encontram no mesmo locus de

dois cromossomos homólogos. Para exemplificar em termos muito simples, é

possível pensar um gene como o responsável pela definição de uma característica

do indivíduo, como a cor dos olhos. As diferentes colorações (azul, castanho etc.)

correspondem a alelos. No entanto, também existem pontos de vista muito mais

refinados (DAWKINS, 1990).

Como muitos organismos apresentam células com mais de um cromossomo, o

conjunto de todos os cromossomos compõe o material genético do organismo,

denominado genoma.

A B A A B A B B A B

Cromossomo diagramático Locus

Alelos: {A, B}

Gene

Figura 3: Ilustração pictórica de um cromossomo salientando o locus, os genes e os alelos.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 10

Epistasia: interferência funcional

entre genes localizados em

posições diferentes.

Exemplo: gene associado à

calvície total é epistático sobre os

genes de coloração de cabelo

(inibe a ação).

pleiotropia: quando um único gene

afeta múltiplas características

fenotípicas.

poligenia: quando uma única

característica fenotípica é

determinada pela interação

simultânea de muitos genes.

gene produto caráter

Figura 4: Pleiotropia e poligenia.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 11

1.4 Fenótipo x Genótipo (FOGEL, 1995)

1909: introdução dos conceitos de genótipo e fenótipo.

Genótipo: representa o conjunto específico de genes do genoma. Neste caso,

indivíduos com o mesmo genoma são ditos terem o mesmo genótipo.

Fenótipo: é a manifestação do genótipo no comportamento, fisiologia e morfologia

do indivíduo, como um produto de sua interação com o ambiente.

A seleção natural opera somente na expressão fenotípica do genótipo (MAYR,

1970; HARTL & CLARK, 1989).

Para modelar este fenômeno, ATMAR (1992) estendeu um resultado da literatura

baseado no emprego de dois espaços de estados:

1. G: espaço genotípico (representa a informação);

2. P: espaço fenotípico (representa o comportamento).

Com G e P definidos, é possível criar quatro funções, onde I representa um

conjunto de efeitos do ambiente (entrada), na forma:

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 12

f1: I G P (epigênese);

f2: P P (seleção);

f3: P G (sobrevivência genotípica);

f4: G G (variação genética).

A adaptação evolutiva ocorre a partir da aplicação iterativa dessas funções.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 13

g1

p1p2

g2g2*

f1

f2

f3

f4Espaço genotípico G

Espaço fenotípico F

Figura 5: Evolução explicada através de mapeamentos entre os espaços genotípico e

fenotípico.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 14

1.5 Adaptação evolutiva

Sob um processo de competição por recursos limitados e seleção natural,

indivíduos mais bem adaptados têm uma maior probabilidade de sobreviver e

propagar seu material genético. A adaptação (fitness) pode ser definida como a

probabilidade de sobrevivência e reprodução (viabilidade), ou então como uma

função do número de descendentes que o organismo produziu (fertilidade).

ATMAR (1994) indicou que uma medida singular da adaptação evolutiva é dada

pela habilidade de uma população antecipar seu ambiente e agir no sentido de

atender aos requisitos associados às predições realizadas.

Uma alternativa a esta definição de medida de adaptação é a idéia simplificada de

que a adaptação pode ser medida em termos de mudanças na freqüência gênica

dentro da população (FISHER, 1930). Esta definição despreza os efeitos importantes

de pleiotropia e poligenia, ao assumir a relação (um gene) (uma característica)

para descrever o relacionamento (genótipo) (fenótipo).

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 15

Sistemas naturais em evolução são fortemente pleiotrópicos e altamente

poligênicos (HARTL & CLARK, 1989). Além disso, a seleção natural atua sobre uma

coleção de características fenotípicas, e não sobre uma única característica isolada.

Como conseqüência, um gene não pode ser considerado como uma unidade

individual de seleção, pelo fato de não ser possível atribuir a um gene isolado um

valor significativo para o seu nível de adaptação.

Logo, a evolução se refere mais apropriadamente a mudanças em adaptação e

diversidade, e não diretamente a mudanças na freqüência gênica.

Além disso, a evolução é oportunista, ou seja, características críticas serão

intensamente otimizadas, enquanto características menos críticas podem sofrer

uma grande variedade de tratamentos alternativos.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 16

1.6 Reprodução assexuada e sexuada

Embora os detalhes da evolução biológica ainda não estejam completamente

compreendidos, existem alguns aspectos fundamentados em fortes evidências

experimentais:

1. a evolução é um processo que opera sobre cromossomos e não sobre

organismos;

2. a seleção natural é o mecanismo que relaciona cromossomos com a eficiência

da entidade que eles representam, permitindo assim que organismos mais bem

adaptados ao meio ambiente tenham uma taxa maior de reprodução;

3. o processo evolutivo se dá durante o estágio reprodutivo. Dentre os fenômenos

que podem ocorrer neste estágio é possível citar a mutação e a recombinação

genética (crossover);

4. o processo evolutivo não possui memória direta.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 17

Reprodução assexuada: na natureza, a codificação da informação genética é

realizada de modo a admitir reprodução assexuada. Neste caso, os filhos

apresentam quase sempre a mesma informação genética do pai. Um número muito

grande de organismos naturais se reproduzem de forma assexuada, incluindo a

maior parte das bactérias.

Replicação

Haplóide

Divisão

Mitose

Figura 6: Reprodução assexuada em cromosomos haplóides.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 18

Reprodução sexuada: neste caso, os filhos apresentam uma informação genética

que corresponde a uma combinação da informação genética de seus pais. Na

reprodução sexuada diplóide, cada pai fornece uma célula haplóide denominada

gameta, formada por cromossomos resultantes da recombinação dos pares de

cromossomos existentes nos respectivos pais. Os cromossomos presentes nos

gametas fornecidos pelos pais se emparelham para gerar uma nova célula diplóide.

Replicação

Diplóide

Separação dos homólogos

Meiose

Ovo

Esperma

Zigoto diplóide

Gametas haplóides

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 19

Durante a reprodução sexuada, os cromossomos estão sujeitos à recombinação.

Recombinação ou crossover: consiste na troca aleatória de material genético entre

dois cromossomos.

Figura 7: Recombinação genética (crossover) entre dois cromossomos.

1.7 Mutação

Tanto na reprodução assexuada como na sexuada, o processo de cópia do material

genético dos pais está sujeito a erros, denominados mutações. Uma mutação

corresponde então a uma troca aleatória, no processo de cópia do material

genético, de um nucleotídeo por outro.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 20

Nucleotídeo: unidade elementar do DNA.

Figura 8: Ilustração de diferentes tipos de mutação.

A mutação é uma conseqüência inescapável da existência de sistemas que se

reproduzem continuamente em um universo com diferencial de entropia positivo,

sendo um mecanismo importante de implantação da diversidade entre os

indivíduos.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 21

Em estágios iniciais do processo evolutivo natural, as taxas de mutação podem ter

sido muito maiores. O fato de que as taxas de mutação atuais nos organismos vivos

são muito baixas na maioria dos casos observados pode ser devido a estes

organismos, como espécie, terem atingido um estado de estacionariedade em

relação às condições ambientais atuais. Neste caso, o nível de evolução orgânica

atual não deve servir de referência para nenhum tipo de implementação

computacional de algoritmo evolutivo.

Geralmente, a recombinação deve ter probabilidades de ocorrência muito maior

que a mutação.

Observação: em implementação computacional, à primeira geração de indivíduos é

geralmente imposto um determinado nível de diversidade.

Teoricamente, as taxas ótimas de mutação são inversamente proporcionais ao

número de variáveis de decisão envolvidas e diretamente proporcionais à distância

do ótimo. A probabilidade de ocorrência de mutação deve ser inversamente

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 22

proporcional ao tamanho da população (DE JONG, 1975). Existem estratégias que

incorporam a definição da taxa de mutação ao próprio genótipo.

2 A notação computacional

Obs: as informações contidas nesta seção podem não ser genéricas e também

podem referir-se ao caso de algoritmos evolutivos específicos.

Um cromossomo haplóide geralmente corresponde a uma estrutura de dados (e.g.,

uma cadeia de bits) que representa um candidato à solução (indivíduo de uma

população) de um problema.

Um gene corresponde a um único bit, ou, então, a um pequeno bloco de bits

adjacentes que codificam um elemento particular da solução candidata. Por

exemplo, em otimização de funções multiparamétricas, o conjunto de bits utilizado

para codificar um parâmetro específico pode ser considerado um único gene.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 23

Em uma cadeia de bits, um alelo é 0 ou 1. Para alfabetos maiores, mais alelos

podem ser considerados para cada posição (locus).

A grande maioria das aplicações de algoritmos evolutivos emprega codificação

haplóide e baseada em um único cromossomo. Neste caso, o genótipo passa a

corresponder à configuração de bits do cromossomo.

1 0 0 0 1 1 0 0 1 0

Cromossomo utilizando representação binária

Locus

Alelos: {0,1}

Gene

Figura 9: Estrutura de dados (cadeia de bits ou binária) de um algoritmo evolutivo.

2.1 Superfície de adaptação

Uma vez definido o processo de codificação (representação) para um dado

problema, o objetivo é buscar uma solução desejada dentre todos os possíveis

candidatos à solução (elementos do espaço de busca).

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 24

Genótipo: uma solução potencial de um dado problema pode ser codificada na

forma de uma ou mais cadeias cromossômicas (estrutura de dados).

Fenótipo: a decodificação de um ou mais cromossomos leva a um ponto na

superfície de adaptação, definida no espaço de busca.

Espaço de busca normado: coleção de candidatos à solução do problema + uma

norma (operador que estabelece a noção de vizinhança).

Nota: os algoritmos evolutivos geralmente assumem que existe alguma correlação

entre candidatos à solução que sejam vizinhos (segundo a norma estabelecida).

Assumindo representação haplóide e baseada em um único cromossomo, e

considerando genes correspondentes a um único bit, o número de possíveis

candidatos à solução em função do comprimento do cromossomo é dado nas

figuras a seguir:

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 25

0 2 4 6 8 100

200

400

600

800

1000

1200

comprimento

candidatos

10 12 14 16 18 200

2

4

6

8

10

12x 10

5

comprimento

candidatos

Superfície de adaptação: foi originalmente definida pelo biólogo Sewell Wright,

em 1931, como a representação do nível de adaptação de todos os genótipos.

Observe que aqui é realizada uma avaliação diretamente sobre o genótipo, sem

considerar o fenótipo.

Exemplo: suponha que cada genótipo é uma cadeia de bits de comprimento p, e

que a distância entre dois genótipos é dada pela distância de Hamming, ou seja, o

número de posições cujos bits são diferentes. Também suponha que a cada

genótipo pode ser atribuído um nível de adaptação. Neste caso, a superfície de

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 26

adaptação vai ser um mapeamento de dimensão p+1, que associa a cada genótipo

no espaço de dimensão p um nível de adaptação definido no eixo p+1.

No contexto de superfícies de adaptação, a evolução é um processo responsável

pela movimentação da população nesta superfície, a partir de operadores genéticos

como mutação e recombinação, no sentido de conduzir os indivíduos para as

regiões de máximo local. Neste caso, a seleção natural pode ser vista como um

processo que conduz à maturação ou aumento da adaptação média da população.

Obs: a idéia de evolução a partir do deslocamento da população ao longo de uma

superfície de adaptação fixa é biologicamente irreal, porque um indivíduo da

população não pode receber um valor de adaptação independente dos demais.

O nível médio de adaptação de um indivíduo em um ambiente não-estacionário

varia em função da dinâmica do ambiente e das interações deste indivíduo e de

outros com o ambiente e entre si.

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 27

3 Da Biologia Evolutiva para a Computação Evolutiva

Biologia

(Genética)

Algoritmos

Evolutivos

Cromossomo Estrutura de dados

Gene Um ou mais atributos ocupando uma determinada posição da

estrutura de dados

Locus Posição ocupada por um gene em uma estrutura de dados

Alelo Diferentes valores (dados) que um gene pode assumir

Crossover Troca de porções entre duas ou mais estruturas de dados

Mutação Variação aleatória em uma estrutura de dados individual

Fitness Valor que quantifica a qualidade relativa (nível de adaptação) de

um indivíduo dada a função de avaliação

Seleção Processo que permite a sobrevivência e reprodução dos

indivíduos mais aptos em detrimento dos menos aptos

Genótipo Estrutura de dados que representa uma solução candidata a um

determinado problema

Fenótipo Decodificação de um ou mais cromossomos que leva a um ponto

da superfície de adaptação, definida no espaço de busca

IA707 – Profs. Leandro de Castro/Levy Boccato/Fernando Von Zuben/Romis Attux

Tópico 2 Evolução, Genética e Computação 28

4 Bibliografia

ATMAR, W. On the Rules and Nature of Simulated Evolutionary Programming. Proc. of the First Ann. Conf. On Evolutionary

Programming, pp. 17-26, 1992.

ATMAR, W. Notes on the Simulation of Evolution. IEEE Trans. on Neural Networks, vol. 5, no. 1, pp. 130-148, 1994.

BERGSON, H. A Evolução Criadora, Editora da Unesp, 2010.

BURNS, G.W. The Science of Genetics - An Introduction of heredity. 1983.

DARWIN, C. The Origin of Species, John Murray, 1859 (Penguin Classics, 1985).

DAWKINS, R. The Selfish Gene, Oxford University Press, 1990.

DE CASTRO, L. N. & TIMMIS, J. I.. Artificial Immune Systems: A New Computational Intelligence Approach, Springer

Verlag, 2002 C

DE JONG, K.A. An analysis of the behavior of a class of genetic adaptive systems. Ph.D. Thesis, The University of Michigan,

1975.

FISHER, R.A. The Genetical Theory of Natural Selection. Clarendon Press, 1930.

FOGEL, D.B. Evolutionary Computation: Toward a New Philosophy of Machine Intelligence, IEEE Press, 1995.

HARTL, D.L., CLARK, A.G. Principles of Population Genetics. Sinauer, 1989.

MAYR, E. Populations, Species, and Evolution. Belknap Press, 1970.

MAYR, E. Toward a New Philosophy of Biology: Observations of an Evolutionist. Belknap Press, 1988.

MITCHELL, M. An Introduction to Genetic Algorithms. MIT Press, 1996.