Omar Paranaiba Vilela Neto Projeto, Otimização, Simulação...

Omar Paranaiba Vilela Neto

Projeto, Otimização, Simulação e Predição dePropriedades de Nanoestruturas através de

Técnicas da Inteligência Computacional:Nanotecnologia Computacional Inteligente

Tese de Doutorado

Tese apresentada ao Programa de Pós–graduação em Nan-otecnologia do Departamento de Engenharia Elétrica da PUC-Rio como requisito parcial para obtenção Do título de Doutorem Nanotecnologia

Orientador : Prof. Marco Aurélio C. PachecoCo–Orientador: Prof. André Silva Pimentel

Rio de JaneiroAgosto de 2009

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

Projeto, Otimização, Simulação e Predição dePropriedades de Nanoestruturas através de

Técnicas da Inteligência Computacional:Nanotecnologia Computacional Inteligente

Tese apresentada ao Programa de Pós–graduação em Nan-otecnologia do Departamento de Engenharia Elétrica do Cen-tro Técnico Científico da PUC-Rio como requisito parcial paraobtenção Do título de Doutor em Nanotecnologia. Aprovadapela Comissão Examinadora abaixo assinada.

Prof. Marco Aurélio C. PachecoOrientador

Departamento de Engenharia Elétrica — PUC-Rio

Prof. André Silva PimentelCo–Orientador

Departamento de Química — PUC-Rio

Rio de Janeiro, 26 de Agosto de 2009

Graduou-se em Engenharia de Computação na Pontifícia Univer-sidade Católica do Rio de Janeiro. Mestrado na área de Sistemasde Apoio à Decisão no Departamento de Engenharia Elétrica daPontifícia Universidade Católica do Rio de Janeiro.

Ficha CatalográficaVilela Neto, Omar Paranaiba

Projeto, Otimização, Simulação e Predição de Pro-priedades de Nanoestruturas através de Técnicas da In-teligência Computacional: Nanotecnologia ComputacionalInteligente / Omar Paranaiba Vilela Neto; orientador: MarcoAurélio C. Pacheco; co–orientador: André Silva Pimentel.— Rio de Janeiro : PUC-Rio, Departamento de EngenhariaElétrica, 2009.

v., 162 f: il. ; 29,7 cm

1. Tese (doutorado) - Pontifícia Universidade Católicado Rio de Janeiro, Departamento de Engenharia Elétrica.

Inclui referências bibliográficas.

1. Engenharia Elétrica – Tese.2. Nanociência. 3. Nanotecnologia. 4. Química Com-putacional. 5. Inteligência Computacional. 6. AlgoritmosGenéticos. 7. Redes Neurais Artificiais.I. Pontifícia Universidade Católica do Rio de Janeiro. De-partamento de Engenharia Elétrica. II. Título.

CDD: 510

Aos meus pais Paulo Antônio e Cora Alice e à minha esposa Adrissa

Agradecimentos

Ao CNPq, FAPERJ e à PUC-Rio pelos auxílios concedidos, sem os quais este

trabalho não poderia estar sendo realizado.

Aos meus orientadores Prof. Marco Aurélio C. Pacheco e Prof. André Silva

Pimentel pelos ensinamentos e parceria.

Aos professores Ênio da Silveira, Marco Cremona, José Robertod’Almeida,

Patrícia Lustoza e Marley Vellasco pelas discussões, conselhos e ajuda.

Aos meus grandes parceiros neste trabalho Anderson Pires Singulani, Lean-

dro Fontoura Cupertino e Iury Steiner Bezerra pelo trabalho emequipe.

Aos amigos André Vargas Abs da Cruz, Douglas Mota Dias, Bruno Melo,

Rafael Martinez, Renato “Barbosinha” de Oliveira e Eugênio da Silva pelo apoio e

incentivo.

Aos amigos do suporte Bernardo, Manuela, André e “Cardosinho”pelos

serviços e atenção prestada.

Aos demais amigos do ICA.

Aos funcionários da secretaria e da oficina que ajudaram sempre quando foi

necessário.

Ao meu sobrinho João Paulo e à minha irmã Lisa Paula pela torcida, confiança

e amor.

Resumo

Vilela Neto, Omar Paranaiba; ; .Projeto, Otimização, Simulação ePredição de Propriedades de Nanoestruturas através de Técnicasda Inteligência Computacional: Nanotecnologia Computacional In-teligente. Rio de Janeiro, 2009. 162p. Tese de Doutorado — Departa-mento de Engenharia Elétrica, Pontifícia Universidade Católica do Riode Janeiro.

Esta tese investiga o potencial das técnicas da Inteligência Computacional (Re-des Neurais e Algoritmos Genéticos) no apoio ao desenvolvimento da Nanociênciae Nanotecnologia. As aplicações da Inteligência Computacional (IC) investigadasenvolvem a simulação, a inferência, a otimização e a síntesede nanoestruturas e na-nodispositivos. O apoio dos sistemas de computação nesta área vem sendo denomi-nado “Nanotecnologia Computacional” ou “Nanociência Computacional”. O apoiomais comum é através do uso de simuladores dedicados a nanodispositivos específi-cos e dos métodos de modelagem molecular que usam teorias da mecânica clássicae quântica para imitar o comportamento de sistemas atômicose moleculares, sendopossível preverem características de nanoestruturas. Esta tese investiga a aplicaçãodas técnicas de Inteligência Computacional (IC) nas metodologias citadas acima etambém na predição de características de dispositivos a partir de dados experimen-tais. Neste caso, utilizam-se as Redes Neurais para construir sistemas de inferênciacapazes de relacionar um conjunto de parâmetros de entrada com as característicasfinais das nanoestruturas, permitindo aos pesquisadores prever o comportamento deoutras nanoestruturas ainda não realizadas experimentalmente. A partir dos siste-mas de inferência, Algoritmos Genéticos são então empregados com o intuito deencontrar o conjunto ótimo de parâmetros de entrada para a síntese de uma nano-estrutura desejada. Numa outra linha de investigação, os Algoritmos Genéticos sãousados para a otimização de funções de base para cálculos ab initio. Neste caso, sãootimizados os expoentes das funções gaussianas que compõemas funções de base,aprimorando alguns métodos propostos na literatura. Em outra abordagem, os mé-todos de computação evolutiva são aplicados na otimização de agregados atômicose moleculares, permitindo aos pesquisadores estudar teoricamente os agregados for-mados experimentalmente. Por fim, o uso da computação evolutiva, aliado ao usode simuladores, é aplicado na síntese automática de OLEDs e circuitos de Autô-matos Celulares com Pontos Quânticos (QCA), permitindo a obtenção de soluçõesinovadoras e de alta eficiência. Os sistemas híbridos de otimização e inferência sãoconcebidos para prever a altura, a densidade e o desvio padrão de pontos quânticosauto-organizáveis, apresentando erros percentuais muitobaixos, próximo a 10%. Omódulo de elasticidade de nanocompósitos também é previstopor um sistema seme-lhante e apresenta erros percentuais ainda menores, por volta de 4%, superando osmodelos analíticos propostos na literatura. Em ambos os casos os sistemas tornam-se ferramentas importantes para a área. Os Algoritmos Genéticos, juntamente com osoftware de modelagem molecular Gaussian03, otimizam os parâmetros de funçõesque geram expoentes de primitivas gaussianas de funções de base (para cálculoshartree-fock), obtendo energias menores do que aquelas apresentadas na literatura.Os Algoritmos Genéticos, em conjunto com algoritmos de otimização local pre-sentes no Gaussian03, também se mostram eficientes na busca pelas geometrias debaixa energia dos agregados atômicos de (LiF)nLi+, (LiF)n e (LiF)nF-, obtendouma série de novos isômeros ainda não propostos na literatura, principalmente para

n > 2. Uma metodologia semelhante é aplicada em um sistema inédito para enten-der a formação de agregados moleculares de H2O iônicos, partindo-se de agregadosneutros. Os resultados mostram como os agregados podem ser obtidos a partir dediferentes perspectivas, formando estruturas ainda não investigadas. Este trabalhotambém apresenta a síntese automática de circuitos de QCA robustos, ou seja, comalto grau de polarização das células de saída, minimizando ainterferência externaao circuito. Os circuitos obtidos apresentam grau de polarização semelhante àquelespropostos pelos especialistas, mas com uma importante redução na quantidade decélulas. Por fim, um sistema envolvendo Algoritmos Evolutivos e um modelo ana-lítico de OLEDs multicamadas otimizam as concentrações de materiais orgânicosem cada camada com o intuito de obter dispositivos mais eficientes. Os resultadosapresentam um dispositivo 9,7% melhor que uma solução sintetizada anteriormente,sendo estas comprovadas experimentalmente. Os resultadosda pesquisa permitemconstatar que a inédita integração das técnicas de Inteligência Computacional comNanotecnologia Computacional, aqui denominada “Nanotecnologia ComputacionalInteligente”, desponta como uma promissora alternativa para acelerar as pesquisasem Nanociência e o desenvolvimento de aplicações nanotecnológicas.

Palavras–chave

Nanociência. Nanotecnologia. Química Computacional. InteligênciaComputacional. Algoritmos Genéticos. Redes Neurais Artificiais.

Abstract

Vilela Neto, Omar Paranaiba; ; . . Rio de Janeiro, 2009. 162p. PhDThesis — Department of Engenharia Elétrica, Pontifícia UniversidadeCatólica do Rio de Janeiro.

Keywords

Sumário

1 Introdução 151.1 Motivação 151.2 Objetivos 171.3 Contribuições 171.4 Descrição do Trabalho 191.5 Organização do Trabalho 20

2 Nanotecnologia Computacional 212.1 Introdução 212.2 Taxonomia da Nanociência e Nanotecnologia 242.3 Modelagem Molecular 252.4 Nanoinformática 342.5 Simulação de Nanodispositivos 362.6 Computação de Alto Desempenho 362.7 Computação Inspirada na Nanotecnologia 37

3 Técnicas de Inteligência Computacional 393.1 Computação Evolucionária 393.2 Redes Neurais 47

4 Inferência e Otimização de Nanoestruturas 584.1 Introdução 584.2 Pontos Quânticos - PQ 594.3 Nanocompósitos 67

5 Projeto Automático de Nanodispositivos 775.1 Otimização de OLEDs Multicamadas 775.2 Otimização de Circuitos de QCA Robustos 84

6 Otimização de Funções de Base 936.1 Introdução 936.2 Criando uma Função de Base 956.3 Método da Coordenada Geradora Hartree-Fock - GCHF 966.4 Expansão Polinomial 976.5 Detalhes Computacionais 986.6 Resultados e Discussões 98

7 Otimização de Agregados Atômicos e Moleculares 1077.1 Introdução 1077.2 Histórico 1087.3 Descrição do Problema 1097.4 Agregados de Li e F 1147.5 Agregados de H2O 118

8 Conclusões e Trabalhos Futuros 128

8.1 Trabalhos Futuros 131

Referências Bibliográficas 134

A Tabela com os Experimentos dos Pontos Quânticos 149

B Tabela com os Experimentos dos Nanocompósitos 153

C Resultados para os agregados de Li e F 158

D Síntese de OLEDs multicamadas 162

Lista de figuras

1.1 Áreas de Atuação e desenvolvimento da Nanotecnologia. 16

2.1 Relação entre o planeta Terra, uma bola de futebol e um fulereno. 212.2 Ilustração de escalas abaixo de 1 metro. Destaque para a escala

nanométrica (1nm a 100nm). 222.3 Sub-divisões da Nanociência e Nanotecnologia. 242.4 Algumas das ferramentas usadas no desenvolvimento da Nano-

ciência e Nanotecnologia. 242.5 Taxonomia da Nanotecnologia. 25

3.1 Procedimento padrão do Algoritmo Genético. 403.2 Modelo co-evolucionário genérico. 433.3 Gráfico com a superposição de 4 pulsos retangulares, cada um

com largura 100 e altura 0,0025, representando a distribuição deprobabilidade para uma variável 45

3.4 Forma da superposição de 2 pulsos de distribuição de probabili-dade após algumas gerações do algoritmo. 46

3.5 Representação gráfica de um neurônio artificial. 483.6 Exemplo de uma rede neural não recorrente. 503.7 Exemplo de uma rede neural recorrente com duas entradas e

duas saídas. 513.8 Treinamento supervisionado de uma rede neural. (Adaptado de

(Reed, 1998)) 533.9 Validação cruzada. Ilustração de dois momentos distintos do

treinamento: generalização da rede (a) e supertreinamento (b). 563.10 Dependência entre o ponto inicial e o erro final obtido. 57

4.1 Densidade de estado nos materiais semicondutores. De cimapara baixo: material bulk, poço quântico, fio quântico e pontoquântico. 60

4.2 Esquemático de três formas de crescimento: Frank-van derMerwe (a), Volmer-Weber (b), Stranski-Krastanov (c). 61

4.3 Imagem de um ponto quântico. Créditos Maurício Pamplona 614.4 Arquitetura da Rede Neural para inferir a altura média dos pontos

quânticos. 634.5 Comparação entre as medidas feitas por um AFM e as previsões

obtidas pela RNA. 644.6 Variação da altura média dos pontos quânticos com relação ao

tempo de deposição e à composição de alumínio. 654.7 Resultado da inferência da densidade de pontos quânticos. De

cima para baixo: conjuntos de treinamento, validação e teste. 664.8 Resultado da inferência do desvio da altura dos pontos quânti-

cos. De cima para baixo: conjuntos de treinamento, validação eteste. 67

4.9 Procedimento de otimização dos parâmetros para síntese depontos quânticos. 68

4.10 Curva da evolução da otimização dos PQ. 684.11 Arquitetura da Rede Neural para inferir o módulo de Young de

Nanocompósitos. 714.12 Comparação entre os valores da literatura e as previsões obtidas

pela RNA. 724.13 Inferância de um compósito de PMMA/CNF 734.14 Comparação de Modelos para o compósito de argila orgânica

(bis(hydroxyl ethyl)-(methyl)) com “nylon-6” 744.15 Comparação de Modelos para o compósito de montemorilonita

com SBR 744.16 Comparação de Modelos para o compósito de montemorilonita

com NBR 754.17 Comparação de Modelos para o compósito de montemorilonita

com CNBR 76

5.1 a)Representação esquemática de um dispositivo multicamadaotimizado. A região graduada é representada em escala decinza. b) A representação do cromossomo. 80

5.2 Um exemplo de como criar uma solução para um cromossomo. 805.3 Eficiência x Densidade de Corrente dos dispositivos 1 e 2 835.4 Uma célula de QCA. As cargas estão localizadas nos pontos

pretos. 845.5 Estados de polarização de uma célula de QCA. 855.6 Interferência entre duas células de QCA lado a lado. 855.7 Circuito com multicamadas. 865.8 A arquitetura do modelo de síntese automática. 875.9 (A) Circuito sintetizado por especialista; (B) Circuito sintetizado

em (VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho. 905.10 (A) Circuito sintetizado por especialista; (B) Circuito sintetizado

em (VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho. 91

7.1 Simplificação da superfície de energia por degraus. 1097.2 Exemplo do operador de crossover criado por Deaven e Ho. 1097.3 Fluxograma da otimização de agregados atômicos e moleculares. 1107.4 Cromossomo do agregado iônicos. 1107.5 Cromossomo do agregado molecular. 1107.6 Dois agregados genitores. 1127.7 Dois filhos inválidos. 1137.8 Dois novos indivíduos gerados. 1137.9 Formação de agregados de água positivos através da perda de

um elétron. 1207.10 Formação de agregados de água iônicos através da agregação

de moléculas iônicas. 1227.11 O cromossomo para encontrar a posição mais estável do íon na

superfície do agregado e a figura ilustrativa do problema em 2D. 123

Lista de tabelas

3.1 Funções de ativação e suas respectivas derivadas. 49

4.1 Valores fixados para gerar a figura 4.6. 644.2 Conjunto ótimo de parâmetros encontrado pelo AG. 684.3 Normalização dos dados para a RNA. 714.4 Resultado obtido pelo AG para o melhor nanocompósito. 76

5.1 Validação do Modelo de concentração graduada. Os parâmetrosn e n’ são usadas para calcular a mobilidade na região graduada.O modelo calcula a relação V/J0.5. 79

5.2 Resultados da otimização por AG. Os valores da coluna “ante-rior” se referem a (Gusso, 2004). 82

5.3 Comparação entre melhor configuração otimizada por AG, me-lhor configuração de (Gusso, 2004) e melhor configuração de(Ma, 2002). Em negrito o melhor resultado para cada caso. 82

6.1 A primeira coluna apresenta o átomo, juntamente com a mul-tiplicidade e termo de simetria. A segunda coluna apresenta otamanho das funções de base. As últimas três colunas mostramo tamanho do cromossomo para cada experimento. 99

6.2 Tamanho das sequências aritméticas usadas para gerar os ex-poentes das funções gaussianas. 99

6.3 Diferença (micro-hartree) entre as energias obtidas e a energiado estado fundamental dos átomos da primeira linha da tabelaperiódica. A última coluna mostra o estado fundamental de cadaátomo. 101

6.4 Os cromossomos de todas as otimizações. 1026.5 O cromossomo da otimização do Ne. Genes variam de 0 a 4. 1036.6 Número de Gerações nos experimentos. 1036.7 Diferenças de energia (micro-hartree) entre os resultados obti-

dos pelo polinômio sugerido em (Klobukowski, 1994) e o estadofundamental para os átomos de C e Ne. 104

6.8 Comparação dos resultados obtidos pelo polinômio sugeridoem (Klobukowski, 1994) com aqueles otimizados neste trabalho.Todos para o átomo de C. 104

6.9 Comparação dos resultados obtidos pelo polinômio sugeridoem (Klobukowski, 1994) com aqueles otimizados neste trabalho.Todos para o átomo de Ne. 104

6.10 Resultados obtidos para o átomo de neônio. 106

7.1 Aptidão dos indivíduos. 1117.2 Estruturas dos aglomerados (LiF )2Li+. 1157.3 Estruturas dos aglomerados (LiF )3Li+. 1157.4 Estruturas dos aglomerados (LiF )2. 1167.5 Estruturas dos aglomerados (LiF )3. 116

Lista de tabelas 14

7.6 Estruturas dos aglomerados (LiF )2F−. 1177.7 Estruturas dos aglomerados (LiF )3F−. 1177.8 Estruturas dos aglomerados (H2O)n. 1207.9 Estruturas dos aglomerados (H2O)+n . 1217.10 Estruturas dos aglomerados (H2O)nH2O+. 1257.11 Estruturas dos aglomerados (H2O)nH3O+. 1267.12 Estruturas dos aglomerados (H2O)nH3O+. 127

B.1 Dados retirados de tabelas disponíveis na literatura. 154B.2 Dados retirados de tabelas disponíveis na literatura. (continuação)155B.3 Dados retirados de gráficos disponíveis na literatura. 156B.4 Dados retirados de gráficos disponíveis na literatura. (continuação)157

C.1 Estruturas dos aglomerados (LiF )4Li+. 158C.2 Estruturas dos aglomerados (LiF )4. 159C.3 Estruturas dos aglomerados (LiF )4F−. 160C.4 Estruturas dos aglomerados (LiF )5F−. 161

1Introdução

1.1Motivação

A Nanociência e a Nanotecnologia têm sido vistas com um grande potencial

para propiciar benefícios em diversas áreas, tais como o desenvolvimento de novos

medicamentos, despoluição da água e do ar, aperfeiçoamentodas tecnologias de

comunicação e informação, produção eficiente de energia, desenvolvimento de

materiais mais leves e resistentes etc.

A Nanotecnologia e a Nanociência são áreas genuinamente interdisciplina-

res. Elas têm possibilitado a colaboração entre pesquisadores de áreas diferentes,

permitindo a troca de informações, ferramentas e técnicas.Um entendimento da

química e física da matéria e de processos na escala nanométrica é relevante para

todas as disciplinas científica, desde a química e a física até a biologia, medicina,

engenharia e ciência dos materiais. A figura 1.1 ilustra algumas áreas de atuação da

Nanotecnologia e algumas de suas aplicações.

Esta área do conhecimento lida com estruturas da matéria quepossuem di-

mensões da ordem de um bilionésimo do metro. Não é fácil determinar quando o

ser humano tirou proveito de materiais na escala nanométrica pela primeira vez.

Sabe-se que no século IV antes de cristo os romanos fabricavam vidros usando me-

tais na escala nanométrica. Por exemplo, a grande variedadede diferentes e bonitas

cores nos vitrais das catedrais medievais é devido à presença de nanopartículas,

como ouro e prata, no vidro fabricado (Poole, 2003).

Porém, foi somente nos últimos anos que ferramentas sofisticadas foram de-

senvolvidas para investigar e manipular a matéria na escalananométrica, propici-

ando um avanço nas pesquisas e um aumento significativo no número de descober-

tas e desenvolvimentos tecnológicos. Dois marcos deste novo avanço científico e

tecnológico foram as invenções do microscópio de tunelamento (scanning tunne-

ling microscope - STM) em 1982 e o microscópio de força atômica (atomic force

microscope - AFM) em 1986. Estas ferramentas utilizam uma ponta nanométrica

para produzir imagens de uma superfície com resolução atômica, além de serem ca-

pazes de manipular átomos e moléculas, possibilitando a criação de nanoestruturas

Capítulo 1. Introdução 16

Figura 1.1: Áreas de Atuação e desenvolvimento da Nanotecnologia.

rudimentares.

Aliado a este desenvolvimento da Nanotecnologia e da Nanociência vem o

desenvolvimento de modelos computacionais de sistemas químicos e físicos, que

permitem aos pesquisadores a simulação de possíveis nanomateriais, dispositivos e

aplicações. O apoio dos sistemas de computação recebe o nomede “Nanotecnologia

Computacional”. Alguns desses sistemas de apoio à Nanotecnologia utilizam técni-

cas de Inteligência Computacional, o que poder-se-ia chamarde “Nanotecnologia

Computacional Inteligente”. Porém, o uso de técnicas de Inteligência Computaci-

onal no desenvolvimento e auxílio da Nanotecnologia e da Nanociência pode ser

mais explorado, até mesmo pelo fato de se poder considerar a Nanotecnologia e a

Nanociência como áreas novas e ainda pouco exploradas.

A Inteligência Computacional fornece uma variedade de técnicas inspira-

das na natureza, tais como Algoritmos Genéticos (AG), Redes Neurais Artificiais

(RNA) e Sistemas Fuzzy, empregadas no desenvolvimento de sistemas inteligen-

tes. Hardware Evolucionário (EHW), por exemplo, se refere à síntese automática e

à otimização de circuitos eletrônicos, utilizando sistemas reconfiguráveis controla-

dos por Algoritmos Genéticos. EHW pode ser adaptada e, consequentemente, apli-

cada no desenvolvimento de nanodispositivos. No caso dos circuitos eletrônicos,

os processos de síntese automática e otimização consideramum espaço de busca

composto por todos os possíveis circuitos que podem ser implementados com os

dispositivos disponíveis. Circuitos são continuamente simulados e avaliados a fim

de encontrar um circuito otimizado que implemente a lógica desejada. EHW já

foi aplicado com sucesso na síntese automática de circuitosconvencionais e não

convencionais (Zebulum, 2002), em diferentes aplicações (digital, analógico, VLSI

CMOS, etc.). Redes Neurais Artificiais, por outro lado, são inspiradas na estrutura

e comportamento do cérebro humano e têm sido usadas em uma variedade de pro-

blemas. As RNA podem, por exemplo, serem usadas na classificação de padrões,

previsão de séries temporais e aproximação de funções, abstraindo informações de

grandes bases de dados.

A combinação destas técnicas inteligentes com a Nanociência e a Nanotec-

nologia pode ser fundamental para acelerar o desenvolvimento de aplicações na-

notecnológicas revolucionárias. Dentre os possíveis benefícios causados por essas

técnicas podemos citar a síntese automática de nanoestruturas e nanodispositivos

inimagináveis, a inferência de propriedades de novos materiais baseado em experi-

mentos anteriores, a simulação mais eficientes de nanodispositivos, etc.

1.2Objetivos

Este trabalho tem como objetivo principal investigar o papel da Inteligência

Computacional no desenvolvimento da Nanotecnologia e Nanociência. As aplica-

ções de Inteligência Computacional na Nanotecnologia e Nanociência são investi-

gadas em três diferentes processos: caracterização, projeto e simulação. Em carac-

terização, o objetivo é investigar o uso de técnicas de inferência no desenvolvimento

de um sistema de previsão do comportamento de nanodispositivos em função dos

parâmetros utilizados na síntese. Já o projeto pode ser dividido em dois subproje-

tos distintos. O primeiro visa, em conjunto com o sistema de inferência já descrito,

obter os parâmetros ótimos para a síntese de nanodispositivos. O segundo projeto

pretende projetar novas estruturas com o auxílio de simuladores, através da otimi-

zação dos parâmetros e da estrutura. Por fim, a respeito da simulação, o objetivo

é investigar como a Inteligência Computacional pode aumentar a eficiência dos re-

sultados e auxiliar os pesquisadores a obterem resultados semelhantes aos obtidos

experimentalmente.

1.3Contribuições

Em função dos objetivos apresentados acima, este trabalho se concentrou na

investigação do papel da Inteligência Computacional no apoio ao desenvolvimento

da Nanociência e Nanotecnologia. Diferentes estudos foramrealizados e as contri-

buições fornecidas por este trabalho estão listadas a seguir:

– Sistema de Inferência de Nanoestruturas: esta tese propôs e desenvolveu

um sistema de inferência capaz de caracterizar as propriedades de diferentes

nanoestruturas antes mesmo de sua produção. Tal sistema é aqui denominado

“Experimento Virtual”. Tal caracterização só pode ser realizada devido ao

desenvolvimento de um sistema computacional que, a partir de experimentos

anteriormente realizados, aprende a relacionar os parâmetros de síntese das

nanoestruturas com as propriedades de saída. Neste trabalho, dois estudos

de casos diferentes são apresentados e ambos apresentam bons resultados.

Um estudo foi publicado no Journal of Crystal Growth (Singulani, 2008), um

dos mais renomados meios de circulação na área de crescimento no meio

acadêmico, e o outro foi recentemente submetido a uma importante revista

científica na área de compósitos.

– Projeto Automático de Nanodispositivos: neste caso, utiliza-se Algoritmos

Genéticos para o projeto automático de nanodispositivos, otimizando a es-

trutura de modo a encontrar soluções inovadoras e otimizadas. Dois tipos de

nanodispositivos diferentes foram automaticamente projetados neste trabalho.

Circuitos de Autômatos Celulares com Pontos Quânticos (QCA) robustos e

LEDs orgânicos emissores de luz. Ambos apresentaram soluções inovadoras

e inimagináveis.

– Otimização de Parâmetros para Simulação: os Algoritmos Genéticos, jun-

tamente com o software de modelagem molecular Gaussian03, otimizam os

parâmetros de funções que geram expoentes de primitivas gaussianas de fun-

ções de base para cálculos hartree-fock, obtendo energias menores do que

aquelas apresentadas nas referencias. Estes resultados serão em breve subme-

tidos para publicação.

– Otimização de Agregados Atômicos e Moleculares: novamente os Algorit-

mos Genéticos, em conjunto com algoritmos de otimização local presentes no

Gaussian03, se mostram eficientes na busca pelas geometriasde baixa energia

dos agregados atômicos de (LiF)nLi+, (LiF)n e (LiF)nF-, obtendo uma série

de novos isômeros ainda não propostos na literatura, principalmente para n>

2; Os resultados obtidos para os agregados neutros e positivos foram recen-

temente publicados no Journal of Physical Chemistry A (Fernandez, 2009).

Já os resultados para os agregados negativos já foram aceitos e serão publica-

dos em breve na mesma revista. Além disso,Uma metodologia semelhante é

aplicada em um sistema inédito para entender a formação de agregados mo-

leculares de H2O iônicos, partindo-se de agregados neutros. Os resultados

mostram como os agregados podem ser obtidos a partir de diferentes pers-

pectivas, formando estruturas ainda não investigadas na área científica. Os

resultados obtidos estão sendo compilados em um artigo que será em breve

submetido a uma importante revista científica.

1.4Descrição do Trabalho

Este trabalho foi desenvolvido em 8 etapas descritas a seguir:

– Um estudo sobre Nanociência e Nanotecnologia.Para isso realizou-se

uma pesquisa bibliográfica sobre Nanociência e Nanotecnologia. Nesta etapa

estudaram-se os aspectos históricos, os fundamentos, bem como o desenvol-

vimento da Nanotecnologia até os dias atuais.

– Um estudo das técnicas de Inteligência Computacional.O estudo resultou

na escolha das técnicas utilizadas nas aplicações desenvolvidas neste trabalho.

– Um estudo sobre Nanotecnologia Computacional.Realizou-se uma pes-

quisa bibliográfica com o objetivo de verificar a situação atual do apoio com-

putacional à Nanociência e Nanotecnologia. Fez-se um estudo sobre modela-

gem molecular a fim de conhecer e utilizar os métodos computacionais.

– Inferência de Nanodispositivos.Esta etapa pode ser dividida em três sub-

etapas. A primeira é a obtenção de dados a partir de experimentos realizados

por especialistas. A segunda é a escolha do modelo de inferência utilizado. E

por fim a realização dos experimentos e validação dos resultados.

– Inferência e Otimização de Nanodispositivos.Esta etapa utiliza-se do sis-

tema de inferência descrito anteriormente. Os parâmetros de entrada do sis-

tema de inferência são otimizados por um Algoritmo Genéticocom o objetivo

de sintetizar nanodispositivos com características pré-determinadas.

– Otimização de Nanodispositivos.Esta etapa visa à utilização de um Algo-

ritmo Genético, juntamente com um simulador de nanodispositivo, para pro-

jetar automaticamente o nanodispositivo de maior eficiência.

– Otimização de Parâmetros de Simulação.Aqui, pretende-se otimizar pa-

râmetros usados em sistemas de modelagem molecular, aplicados tanto para

cálculos de dispositivos nanométricos quanto para cálculode sistema sub-

nanométricos. Pretende-se otimizar as funções de base de modelosab initio.

– Otimização da Geometria Molecular.Nesta etapa foram usados sistemas

evolutivos para a otimização da geometria molecular e buscade conformações

de agregados atômicos e moleculares.

1.5Organização do Trabalho

Esta tese está dividida em 7 capítulos adicionais, descritos a seguir:

O capítulo 2 discute o apoio computacional à Nanociência e Nanotecnologia,

classificando e discutindo cada uma das linhas importantes.

O capítulo 3 introduz e descreve resumidamente as principais técnicas de

Inteligência Computacional usadas neste trabalho.

O capítulo 4 discute a utilização de técnicas de Inteligência Computacional

no projeto e otimização de dispositivos nanoestruturados.Duas aplicações são

apresentadas: Pontos Quânticos e Nanocompósitos.

O capítulo 5 apresenta o projeto automático de nanodispoditivos através

da otimização das estruturas e dos parâmetros envolvidos. Duas aplicações são

apresentadas: Os circuitos de QCA e os OLEDs multicamadas.

O capítulo 6 apresenta e discute a otimização de funções de base utilizadas

em cálculos de modelagem molecularab initio.

O capítulo 7 apresenta o uso da computação evolutiva na otimização da

geometria de agregados atômicos e moleculares. Os casos estudados e os novos

operadores propostos serão apresentados e discutidos.

E, finalmente, o capítulo 8 conclui o trabalho e apresenta as sugestões de

trabalhos futuros.

2Nanotecnologia Computacional

2.1Introdução

O prefixo “nano” vem do grego e significa anão. Este prefixo também é usado

para determinar um bilionésimo de uma determinada unidade de medida. Logo, um

nanômetro é igual a um bilionésimo de um metro (1nm= 10−9m). Para se ter uma

ideia da dimensão nanométrica, a figura 7.9 mostra a relação entre uma estrutura

nanométrica, uma bola de futebol e o planeta Terra.

Figura 2.1: Relação entre o planeta Terra, uma bola de futebole um fulereno.

Observe que a relação entre o fulereno e a bola de futebol é aproximadamente

a mesma entre a bola e o planeta Terra. Este exemplo mostra o quão pequeno são as

estruturas nanométricas.

Há muitas discussões sobre qual o tamanho de um material paraque este seja

considerado uma nanoestrutura. Neste trabalho vamos usar adefinição dada em

(Bhushan, 2007) que considera uma nanoestrutura aquela que tenha pelo menos

uma dimensão entre 1nm e 100nm. Obviamente, muitas estruturas que não se

encaixam na dimensão pré-determinada, mas estão próximas desta, podem ser

consideradas como nanoestruturas. A figura 7.10 apresenta outra comparação entre

diferentes dimensões, com destaque para a dimensão nanométrica.

Apesar da palavra “Nanotecnologia” ser usada por mais de 20 anos (foi usada

pela primeira vez em 1974 pelo pesquisador japonês Norio Taniguchi para descrever

a fabricação precisa de materiais na escala nanométrica (Taniguchi, 1974)), existem

diversas definições na literatura. Um trabalho de pesquisa realizado pelaThe Royal

Societye pelaThe Royal Academy of Engineeringem 2004 definem a Nanociência

e a Nanotecnologia de forma concisa (Dowling, 2004):

Capítulo 2. Nanotecnologia Computacional 22

Figura 2.2: Ilustração de escalas abaixo de 1 metro. Destaque para a escala nano-métrica (1nm a 100nm).

Nanociência: é o estudo dos fenômenos e manipulação de materiais em

escalas atômicas, moleculares e macromoleculares, onde aspropriedades diferem

significativamente daqueles em maior escala.

Nanotecnologia: é o projeto, caracterização, produção e aplicação de estrutu-

ras, dispositivos e sistemas controlando a forma e o tamanhona escala nanométrica.

O fator chave para o desenvolvimento de novos e aperfeiçoados materiais,

desde o aço no século 19 até os materiais dos dias atuais, tem sido a habilidade de

controlar a matéria em escalas cada vez menor. As propriedades dos materiais, tais

como as tintas e os chips de computadores, são determinadas por sua estrutura na

escala nano ou micro. Com o aumento do conhecimento e controlena escala nano,

haverá grande potencial no desenvolvimento de materiais com novas características,

funções e aplicações.

Segundo (Mansoori, 2005), a principais razões pelas quais as nanoestruturas

são tão importantes são:

– Com a redução do tamanho até a nanoescala, os efeitos quânticos começam e

dominar. As propriedades dos elétrons na matéria são influenciadas pelas va-

riações na nanoescala. É possível variar as propriedades micro e macroscópi-

cas da matéria alterando a configuração nanométrica dos materiais. Portanto,

é possível alterar o transporte de cargas, os efeitos magnéticos, a temperatura

de fusão e outras características sem mudar a composição química do material

usado.

– Uma característica fundamental das entidades biológicasé a organização

sistemática da matéria na nanoescala. O desenvolvimento daNanociência

e da Nanotecnologia permitirá inserir nanoestruturas feitas pelo homem no

interior de células vivas. Também permitirá criar novos materiais usando as

características de automontagem da natureza. Certamente, acombinação da

matéria viva com a ciência dos materiais existente hoje propiciará avanços

tecnológicos ainda inimagináveis.

– Componentes na escala nano possuem uma razão superfície porvolume muito

maior que os materiais em maior escala. Por exemplo, uma partícula de 30

nm possui 5% dos seus átomos na superfície, uma partícula de 10 nm, 20%

dos átomos e uma de 3 nm já possui 50% dos seus átomos na superfície.

Isto os torna ideais para muitas aplicações, tais como: materiais compósitos,

catalisadores,drug delivery, e armazenamento de energia (ex. hidrogênio e

gás natural).

– Sistemas macroscópicos feitos a partir de nanoestruturaspodem ter uma

densidade muito maior do que aqueles feitos a partir de microestruturas.

Assim, é possível criar novos conceitos de dispositivos eletrônicos, circuitos

menores e mais rápidos, funções lógicas mais complexas e umaredução

significativa no consumo de energia.

Aliado aos desenvolvimentos citados, um novo e emergente campo de pes-

quisa vem ganhando força nos últimos anos. Trata-se da Nanotecnologia Computa-

cional, ou seja, o uso de técnicas computacionais no desenvolvimento da Nanociên-

cia e Nanotecnologia.

A precisão dos métodos de teoria quântica e atômica aumentoumuito nos úl-

timos anos, chegando ao ponto em que simulações podem ser usadas para prever o

comportamento da matéria sob algumas condições. Aliado a isso, o aumento do po-

der computacional e das técnicas de visualização 3D tornaram tais simulações ainda

mais rápidas e precisas. Mais recentemente, principalmente devido ao massivo uso

da internet, verifica-se um grande aumento na quantidade de informações científi-

cas (revistas, artigos, sites, etc.) disponíveis. Tudo isso contribuí significativamente

para o aumento da importância da Nanotecnologia Computacional.

A Nanotecnologia Computacional (ou Nanociência Computacional

(Bhushan, 2007)) surge como uma ferramenta de engenharia fundamental para

o projeto de novos nanodispositivos, tais como outros métodos computacionais

foram e são usados para os projetos da atual geração de sistemas de engenharia (ex:

automóveis, navios, aviões, microdispositivos e circuitos integrados).

2.2Taxonomia da Nanociência e Nanotecnologia

Nesta tese é proposta uma subdivisão da Nanociência e Nanotecnologia em

suas diversas subáreas.

Em um nível mais alto, a Nanotecnologia e a Nanociência serãodividas em

três subgrupos: aplicações, estruturas e ferramentas, conforme ilustrado na figura

Figura 2.3: Sub-divisões da Nanociência e Nanotecnologia.

As aplicações englobam tudo que já foi produzido ou espera-se produzir com

a Nanotecnologia. Já as estruturas englobam todas as nanoestruturas mais utilizadas

no desenvolvimento dos nanodispositivos, tais como: pontos quânticos, nanotubos,

dendrímeros, etc.

Já a subárea de ferramentas pode ser dividida em três subseções: caracteriza-

ção, manipulação e computacional, vide figura 2.4.

Figura 2.4: Algumas das ferramentas usadas no desenvolvimento da Nanociência eNanotecnologia.

Nesta tese o foco principal é na Nanotecnologia Computacional Inteligente.

Portanto, o ramo das ferramentas computacionais apresentado anteriormente será

desmembrado nas diversas áreas da Nanotecnologia Computacional. A figura 2.5

apresenta a taxonomia proposta neste trabalho.

Figura 2.5: Taxonomia da Nanotecnologia.

As subdivisões da Nanotecnologia Computacional, propostasneste trabalho,

serão descritas nas próximas seções.

2.3Modelagem Molecular

Segundo (Simpson, 1989), “modelo” é uma descrição simplificada ou ideali-

zada de um sistema ou processo, geralmente em termos matemáticos, criado para

facilitar cálculos ou previsões. Portando, Modelagem Molecular refere-se a méto-

dos e técnicas para imitar o comportamento de moléculas ou sistemas moleculares.

Técnicas computacionais revolucionaram a modelagem molecular, já que muitos

cálculos seriam impossíveis sem o uso de computadores.

Neste capítulo faremos uma breve descrição dos métodos e técnicas mais

tradicionais, dando mais destaque aos métodos mais usados neste trabalho (Hartree-

Focke Teoria do Funcional da Densidade (DFT)). Discutiremos a respeito da teoria,

tempo computacional e tamanho dos sistemas modelados ou simulados.

2.3.1Mecânica Molecular

A Mecânica Molecular usa as leis da física clássica para descrever as estrutu-

ras e propriedades de moléculas. Métodos de Mecânica Molecular estão disponíveis

em muitos programas de computadores, incluído MM3, HyperChem, Quanta, Sybyl

e Alchemy (Foresman, 1996).

Os métodos de Mecânica Molecular, diferentemente dos métodos quânticos,

descritos mais a frente, não tratam explicitamente os elétrons em um sistema

molecular. Ao contrário, a computação é realizada baseada na interação entre os

núcleos. Os efeitos eletrônicos estão geralmente implícitos nos campos de força,

através dos parâmetros.

Estas aproximações tornam os métodos de Mecânica Molecularcomputaci-

onalmente muito baratos e permite que eles sejam usados parasistemas grandes,

contendo muitos milhares de átomos (Kadau, 2006) (Arkhipov, 2006). Porém, as

aproximações também geraram várias limitações, dentre as quais podemos citar:

– Cada campo de força obtém bons resultados somente para um conjunto

limitado de moléculas, relacionados às aquelas que foram parametrizadas.

Nenhum campo de força pode ser usado para todos os sistemas moleculares.

– Desconsiderar os elétrons significa que os métodos de Mecânica Molecular

não podem tratar problemas químicos onde os efeitos eletrônicos são predo-

minantes. Por exemplo, eles não podem ser usados para descrever processos

que envolvem a formação ou quebra de ligações químicas.

2.3.2Métodos Quânticos - ab initio

Obviamente, os métodos quânticos usam as leis da mecânica quântica ao invés

das leis da física clássica como base para os cálculos. A Mecânica quântica diz que

a energia e outras propriedades relacionadas a uma moléculadevem ser obtidas

resolvendo a equação de Schrödinger.

Porém, a solução exata para a equação de Schrödinger não é computacio-

nalmente viável, exceto para sistemas muito simples. Logo,métodos de química

quântica são caracterizados pelas suas várias aproximações matemáticas.

A equação de Schrödinger ( 5-4 ) descreve a função de onda de uma partícula:(

2m∇2 + V(~r)

ψ(~r , t) = i~∂ψ

∂t(~r , t) (2-1)

Nesta equação,ψ é a função de onda,mé a massa da partícula,~ é a constante

de Planck dividida por 2π e V é o potencial de campo onde a partícula está se

movendo. O produto deψ com seu complexo conjugado (ψ ∗ ψ, frequentemente

escrito como|ψ|2) é interpretado como a distribuição de probabilidade da partícula.

A equação de Schrödinger para uma coleção de partículas, como uma molé-

cula, é muito similar. Neste caso,ψ deve ser uma função com as coordenadas de

todas as partículas, além do tempo t.

Os problemas que serão descritos aqui são independentes do tempo e pode-se

escrever a equação de Schrödinger como na equação 2-2.

Hψ(~r) = Eψ(~r) (2-2)

ondeE é a energia do sistema eH é o operado Hamiltoniano. Detalhes sobre a mecâ-

nica quântica podem ser encontrados na literatura (Bhushan,2007) (Pauling, 1985)

(Cohentannoudji, 1979).

Teoria Hartree-Fock (HF)

Conforme já dissemos, a solução exata da equação de Schrödinger não é

possível para a maioria dos sistemas. Porém, um número de simplificações e

aproximações permite encontrar soluções aproximadas paraum grande conjunto

de moléculas.

A aproximação de Born-Oppenheimer é a primeira de um conjuntode outras

aproximações usadas para simplificar a equação de Schrödinger (Leach, 2001). Ela

simplifica o problema da molécula separando os movimentos dos núcleos e dos elé-

trons. Esta aproximação é possível porque a massa de um núcleo típico é milhares

de vezes maior que a massa de um elétron. O núcleo se move vagarosamente se

comparado com o elétron e este reage de forma instantânea as mudanças de posição

do núcleo. Logo, a distribuição eletrônica em um sistema molecular depende das

posições dos núcleos e não de suas velocidades. Ou seja, o núcleo parece fixo para

os elétrons e a movimentação eletrônica pode ser descrita como ocorrendo em um

campo de núcleos fixos. Assim, considerando esta aproximação, a função de onda

da molécula pode ser escrita da seguinte forma:

Ψtot(ncleos,eltrons) = Ψ(eltrons)Ψ(ncleos) (2-3)

Logo, a energia total do sistema é dada pela soma da energia nuclear (repulsão

eletrostática entre os núcleos) e a energia eletrônica.

Segundo o princípio da anti-simetria, quando trocarmos qualquer par de

elétrons a densidade eletrônica de se manter a mesma, mas a função de onda deve

trocar de sinal. Isto se deve ao fato dos elétrons serem indistinguíveis. Portanto, a

forma funcional da função de onda de sistema polieletrônicos deve respeitar este

princípio. Um determinante é a maneira mais simples de escrever a forma funcional

permitida da função de onda, respeitando o princípio da anti-simetria. Está forma é

chamada de determinante de Slater 2-4 (Leach, 2001).

Ψel(1,2, ...,n) =1√

χ1(1) χ2(1) ... χN(1)

χ1(2) χ2(2) ... χN(1)

. . ... .

χ1(N) χ2(N) ... χN(N)

Cada linha é formada pela representação de todas as possíveiscombinações

do elétron i com todas as combinações orbital-spin. O fator multiplicativo é neces-

sário para a normalização.

Esta formulação não é apenas um truque matemático para formar funções de

onda anti-simétricas. A mecânica quântica especifica que a localização do elétron

não é determinística, mas sim uma densidade de probabilidade, podendo estar em

qualquer lugar. Este determinante mistura todos os orbitais atômicos possíveis com

todos os átomos do sistema molecular para formar a função de onda.

O operador HamiltonianoH para um sistema de N-elétrons pode ser escrito

da seguinte forma:

∇2i −

1r1A− 1

r1B− · · · + 1

1r13+ · · ·

onde os elétrons são identificados por números (1, 2, ...) e osnúcleos pelas letras (A,

B, ...),∇ corresponde à energia cinética er representa a distância entre dois elétrons

ou entre um elétron e um núcleo.

Como a teoria Hartree-Fock já é bem descrita na literatura (Leach, 2001,

Szabo, 1989), esta tese não se prenderá em detalhes e apresentará a expressão

da energia de uma forma concisa, demonstrando os três tipos de interação que

contribuem para a energia eletrônica total do sistema.

A primeira contribuição vem da energia cinética e potencialde cada elétron

se movendo no campo formado pelos núcleos. Para N elétrons emN orbitais

moleculares esta contribuição pode ser escrita da seguinteforma:

Ecoretotal =

dτ1χi(1)

−12∇2

i −M

χi(1) =N

Hcoreii (2-6)

A segunda contribuição da energia vem da repulsão eletrostática entre pares

de elétrons. A interação depende da distância elétron-elétron e é calculada da

seguinte forma:

Ji j =

∫ ∫

dτ1dτ2χi(1)χ j(2)

χi(1)χ j(2) (2-7)

O símboloJi j é frequentemente usado para representar a interação Coulom-

biana entre elétrons. A contribuição total da interação Coulombiana para a energia

eletrônica do sistema é obtida através de um somatório dubloenvolvendo todos os

elétrons, tal como mostrado na equação 6-8.

ECoulombtotal =

Ji j (2-8)

Por fim, a última contribuição para a energia é a interação de troca. Esta

interação aparece porque a movimentação dos elétrons com spins paralelos são

correlatados. Elétrons com o mesmo spin tendem a se “evitar”e sentem uma

pequena repulsão, dando origem a uma pequena energia. A interação de troca é

expressa da seguinte forma:

Ki j =

∫ ∫

dτ1dτ2χi(1)χ j(2)

χi(2)χ j(1) (2-9)

A contribuição total é dada pela equação 6-10.

ETrocatotal =

j′=i+1

Ki j (2-10)

O apóstofro emj′ indica que o somatório é somente para os elétrons com o

mesmo spin que o elétroni.

A próxima aproximação envolve a expressão do orbital molecular como uma

combinação linear dos orbitais atômicos (LCAO). Logo, um orbital molecular é

definido pela equação 2-11.

cµiχµ (2-11)

ondecµi são conhecidos como coeficientes de expansão do orbital molecular. Os

orbitais atômicos, por sua vez, são formados pela combinação linear de funções

gaussianas (ou funções de Slater) e podem ser definidos pela equação 2-12

χµ =∑

dµpgp (2-12)

ondedµp são constantes em uma função de base definida.

Toda esta construção resulta na seguinte expansão para os orbitais molecula-

φi =∑

cµiχµ =∑

cµi(∑

dµpgp) (2-13)

O problema agora é como encontrar o conjunto de coeficientescµi que formam

a função de onda. A teoria Hartree-Fock aproveita o princípio variacional que

diz que a energia obtida através de uma função de onda aproximada será sempre

maior que a energia da função de onda correta. Em outras palavras, o problema se

transformou em encontrar o conjunto de coeficientes que minimizam a energia da

função de onda resultante.

Durante os cálculos, assume-se que cada elétron se move em umcampo

“fixo” formado pelos núcleos e os outros elétrons. Este fato tem uma implicação

muito importante, pois a solução encontrada quando calculada a equação para

um elétron vai naturalmente afetar a solução para outros elétrons no sistema. A

estratégia geral para este problema é conhecida como “campoauto-consistente”

(SCF - do inglês, self-consistent field). Uma maneira para resolver este problema é

a seguinte. Primeiramente um conjunto de soluções para o problema Hartree-Fock

é fornecido. Os cálculos são realizados e as equações Hartree-Fock fornecem um

segundo conjunto de soluções, que são usadas na próxima interação. O processo é

repetido, minimizando a energia, até que os resultados paratodos os elétrons não

são mais alterados.

O método mais tradicional para resolver este problema é a equação de

Roothaan-Hall (Leach, 2001).

Teoria do Funcional de Densidade (DFT)

A Teoria do Funcional da Densidade (DFT, do inglês -Density Functional

Theory) tornou-se, nas últimas décadas, um importante método parao estudo de es-

trutura eletrônica de sólidos e moléculas (Morgon, 2007).Parte do atrativo do DFT

está no fato de que sistemas, de tamanho moderado a grande (Ntomos≥ 20), podem

ser estudados, com uma precisão química aceitável, a um custo computacional me-

nor do que os métodos correlacionados tradicionais, como a teoria da pertubação e

coupled cluster(Morgon, 2007, Leach, 2001). O desenvolvimento de funcionais de

troca e correlação mais precisos e de algoritmos eficientes de integração numérica

tem impulsionado o desenvolvimento desse método.

A densidade eletrônica,ρ(r), foi usada pela primeira vez como variável básica

na descrição de um sistema eletrônico no início do século XX por Drude, que

aplicou a teoria dos gases a um metal, considerando-o como umgás homogêneo de

elétrons, para desenvolver a sua teoria sob condução térmica e elétrica. Mais tarde,

o modelo de Thomas-Fermi utilizou-se de argumentos estatísticos para aproximar

a distribuição de um gás de elétrons e desenvolver o funcional da energia. Esse

modelo foi aperfeiçoado para incluir a energia de troca paraum gás de elétrons

desenvolvido por Dirac. O funcional de energia (E) de Thomas-Fermi-Dirac é dado

E[ρ] = CF

ρ(r)5/3dr +∫

ρ(r)ν(r)dr

∫ ∫

ρ(r1)ρ(r2)|r1 − r2|

dr1dr2 −Cx

ρ(r)4/3dr, (2-14)

ondeCF =310(3π2)2/3 eCx =

π)1/3.

Na equação 6-11 os quatro termos da direita, correspondem à energia cinética,

ao potencial externo, ao potencial de Coulomb e à energia de troca, respectivamente.

ρ e r são a densidade eletrônica e as coordenadas, respectivamente. Entretanto,

são muito simples para reproduzir a estrutura quântica de camadas dos átomos ou

ligações químicas.

O uso da densidade eletrônica,ρ(r), como variável básica foi legitimada com

a publicação de dois teoremas por Hohenber e Kohn em 1964 (Hohenberg, 1964),

que fornecem os fundamentos da DFT. Em 1965, Kohn e Sham estabeleceram uma

forma de contornar o problema de se encontrar o funcional da energia cinética

exato que permite realizar os cálculos DFT (Kohn, 1965). O desenvolvimento

computacional dos cálculos de DFT leva a equações matemáticas semelhantes às

equações Hartree-Fock-Roothan.

Teoremas de Hohemberg e Kohn

A energia total de um sistema eletrônico molecular é dado por:

Ψ(r1, r2, ..., rn)∗HBOΨ(r1, r2, ..., rn)dr1dr2...drN = 〈Ψ |HBO|Ψ〉 (2-15)

ondeΨ(r1, r2, ..., rn) é a solução do estado fundamental do Hamiltoniano eHBO

é o Hamiltoniano de um sistema eletrônico molecular na aproximação de Born-

Oppenheimer.

Neste caso, o potencial externo (relacionado aos elétrons devido às cargas

dos núcleos) pode ser separado em um funcional trivial da densidade eletrônica e a

energia total vai ser escrita da seguinte forma:

Eo =⟨

∣T + Ve

∣Ψ⟩

ρ(r)ν(r)dr (2-16)

ondeν(r) é o potencial externo.

Logo, percebe-se que o número de elétrons,N, e o potencial externo em que

estes se movem definem completamente o sistema de muitos elétrons, ou seja, o

Hamiltoniano do sistema.

Primeiro Teorema:

O primeiro teorema de Hohemberg-Kohn (HK) estabelece que o potencial

externo é um funcional único deρ(r) além de uma constante aditiva. Em outras

palavras, demonstra que a densidade eletrônica de um sistema determina o potencial

externo e o número de elétron, N, e consequentemente, o Hamiltoniano do sistema.

Como a energia do sistema é calculada mediante a resolução da equação de

Schrödinger,HBOΨ = EΨ, a energia de um sistema eletrônico é determinada pela

densidade eletrônicaρ(r), ou seja:

E = Eν[p] (2-17)

ondeν explicita a dependência com o potencial externoν(r).

Segundo Teorema:

O segundo teorema estabelece que, havendo qualquer aproximação da densi-

dade eletrônica, ˜ρ(r), de modo que ˜ρ(r) ≥ 0 e∫

ρ(r)dr = N, a energia total será

sempre maior ou igual a energia exata do sistema, ou seja,E[ρ] ≥ E[ρ] = Eo.

Pode-se, então, definir um funcional universal

F[ρ] =⟨

∣T + Ve

∣Ψ⟩

, (2-18)

poisT eVe aplicam-se universalmente a todos os sistemas eletrônicos.

É preciso observar que ˜ρ(r) define seu próprio ˜ν(r) e, consequentemente, o

HamiltonianoH e Ψ(r1, r2, ..., rN). A funçãoΨ(r1, r2, ..., rN), por sua vez, pode ser

usada como uma função tentativa para o sistema com o potencial externoν(r). De

acordo com o princípio variacional, tem-se

Eo = Eν[ρ] = F[ρ] +∫

ρ(r)νrdr ≤ Eν[ρ] = F[ρ] +∫

ρ(r)νrdr (2-19)

Os dois teoremas de HK mostram como se pode determinar o estado fun-

damental de um sistema com um dado potencial externo, usando-se a densidade

eletrônica tridimensional como variável básica, em vez de se utilizar a função de

onda de N-elétrons, que é muito mais complexa. A prova de cadaum dos teoremas

é apresentada em (Vianna, 2004).

Equações de Kohn-Sham

Kohn e Sham reescreveram a equação 4-1, tornando explícita arepulsão

elétron-elétron de Coulomb e definindo uma nova função universalG[ρ]:

Eν[ρ] = G[ρ] +12

∫ ∫

ρ(r1)ρ(r2)|r1 − r2|

dr1dr2 +

ρ(r)ν(r)dr, (2-20)

ondeG[ρ] é dado por:

G[ρ] = Ts[ρ] + EXC[ρ] (2-21)

e Ts[ρ] é o funcional da energia cinética de um sistema de elétrons que não

interagem e tem a mesma densidade eletrônica de um sistema deelétrons que

interagem. Dessa forma,EXC[ρ] inclui não só o termo de interação elétron-elétron

não clássica (troca e correlação), mas também a parte residual da energia cinética,

T[ρ] − Ts[ρ], em queT[ρ] é a energia cinética exata para o sistema de elétrons que

interagem.

De acordo com Kohn e Sham, é possível utilizar um sistema de referência

de elétrons que não interagem com um Hamiltoniano que tenha um potencial local

efetivo,νe f(r).

KKS = −12∇2 + νe f(r). (2-22)

O operador Hamiltoniano,HKS, realmente descreve um sistema de elétrons

que não interagem. Para se obter a função de onda,ΨKS, do estado fundamental

desse sistema de referência de elétrons que não interagem, descrito pelo Hamiltoni-

ano anterior, deve-se utilizar a mesma aproximação empregada no método Hartree-

Como o potencial efetivo,νe f(r), depende da densidade eletrônica,ρ(r), as

equações de Kohn-Sham são resolvidas por meio de um procedimento autoconsis-

tente (KS-SCF).

No esquema Kohn-Sham, a densidade eletrônica exata do estado fundamental

de um sistema de elétrons que interagem é gerada a partir da solução de um

problema auxiliar do sistema de elétrons que não interagem.As equações KS, assim

como as equações de Hartree-Fock, geram equações de um elétron que descrevem

sistemas de muitos elétrons. As equações KS, em princípio, são exatas, uma vez que

incorporam totalmente os efeitos da correlação eletrônica(troca e correlação) e as

soluções delas equivalem, formalmente, à resolução exata do problema variacional

da DFT.

O esquema KS permite calcular a densidade eletrônica do estado fundamental.

Todas as outras propriedades do sistema podem, igualmente,ser calculadas, desde

que os funcionais da densidade eletrônica sejam devidamente conhecidos.

Funcionais de troca-correlação (XC)

Embora os teoremas de Hohembeg e kohn estabeleçam que existeum funcio-

nal da densidade eletrônica, este é completamente desconhecido. Entre os pesquisa-

dores que têm trabalhado no desenvolvimento de funcionais de XC, há um consenso

de que vários desses funcionais devem ser adequados para cálculos de determinadas

propriedades e de que, dificilmente, haverá um funcional de XC no futuro próximo.

Assim, um funcional de XC deve ser utilizado em função das propriedades que se

deseja calcular. Na prática, os diferentes funcionais de XCe forma como foram

desenvolvidos caracterizam os vários métodos DFT conhecidos.

A procura por melhores funcionais de XC baseia-se, normalmente, na intuição

física ou matemática ou, ainda, simplesmente por meio de tentativa e erro. No

entanto são conhecidas algumas restrições e propriedades que um funcional de XC

razoável deve satisfazer. Existem diversos funcionais diferentes na literatura e os

principais podem ser vistos em (Morgon, 2007, Leach, 2001).

Métodos Pós-Hartree-Fock

A literatura apresenta uma grande quantidade de métodos quesurgiram para

corrigir as limitações dos métodos HF. Normalmente estes métodos apresentam

resultados melhores, mas são computacionalmente mais caros. Como exemplo

podemos citar: CI, CC, Full CI, MP2, MP3, MP4, etc.

2.3.3Métodos Semi-Empíricos

Quando as ideias dos cálculos de orbitais molecularesab initio surgiram pela

primeira vez, ficou claro que o número de operações aritméticas necessárias para

investigar sistemas simples era muito grande. Aproximações drásticas eram então

necessárias. Uma alternativa foi ignorar os elétrons, exceto os de valência. Com

estas aproximações, os cálculos dos orbitais se tornaram possíveis com a ajuda de

parâmetros, que substituam os cálculos necessários.

Sem dúvida, a grande vantagem dos métodos semi-empíricos sobre os mé-

todosab initio é a rapidez do cálculo, permitindo o estudo de moléculas maiores.

Existe uma outra vantagem embutida. Como os métodos são geralmente parametri-

zados a partir de dados experimentais, alguns efeitos de correlação eletrônica estão

embutidos nos cálculos. Porém, isto também pode ser uma desvantagem, pois não

se sabe quais efeitos estão contemplados, dificultando a melhoria destes cálculos.

Dinâmica Molecular

Até o momento, os métodos descritos tratam as moléculas e os sistemas

moleculares de forma estática. Porém, muitas vezes é importante saber como as

moléculas interagem entre sí de forma dinâmica, ou seja, em movimento. O método

que calcula a dinâmica entre as moléculas é conhecido como dinâmica molecular

(Goodman, 1998) (Leach, 2001).

O movimento de um dos átomos em uma molécula é influenciado pelos

átomos ao seu redor, que são afetados, por outro lado, pelo átomo em questão. Este

tipo de equação, contendo equações diferenciais, têm sido estudada em detalhes.

Em geral, estas equações não podem ser resolvidas analiticamente, mas soluções

aproximadas podem ser encontradas facilmente por métodos computacionais.

Uma simulação de dinâmica molecular se inicia, dando aos átomos em uma

molécula alguma energia cinética. Isto faz com que a molécula se mova e é

possível saber como é esse movimento resolvendo as equaçõesde movimento do

Newton. Isto é feito analisando a energia da molécula e usando esta informação

para predizer o que acontecerá em um curto período de tempo a frente. Este

cálculo é computacionalmente caro, sendo necessário muitopoder computacional

para predizer o movimento de uma molécula em poucos picossegundos. Apesar de

prever o comportamento por um tempo muito curto, as informações obtidas podem

ser muito relevantes para o entendimento de um processo químico.

2.4Nanoinformática

Nanoinformática pode ser definida como um banco de dados dinâmico para

armazenar, manipular e recuperar informações relevantes àNanociência e à Nano-

tecnologia (Bhushan, 2007) (Schmidt, 2007).

A sociedade atual está saturada de informações. A invenção epopularização

da internet possibilita a pesquisa sobre qualquer tema em questão de minutos. Ali-

ado a isto, as novas ferramentas de caracterização permitemque os cientistas obte-

nham novos dados a todo momento, compartilhando-os com seuscolaboradores ao

redor do mundo. Manipular a informação, organizá-la, padronizá-la, compartilhá-la,

analisá-la e até mesmo visualizá-la já tem se tornado parte importante das atividades

científicas atuais.

Os cientistas têm usado diversas estratégias para manipular a grande quanti-

dade de dados disponíveis nos dias de hoje. Algumas áreas, como a astronomia, há

muito tempo já utilizam profissionais especializados na manipulação de seus dados

(Schmidt, 2007). Mais recentemente, os biólogos criaram umgrande banco de da-

dos e ferramentas matemáticas e computacionais complexas para manipular e dar

sentido a grande quantidade de dados obtidas dos processos de sequenciamentos

do genoma humano e de outras espécies. Esta iniciativa deu origem a uma nova

e importantíssima área de pesquisa, chamada Bioinformática, e também a base de

dados importantes, tais como ainternational Protein Information Resource(PIR) e

aBioBricks Foundation’s Registry of Standard Biological Parts.

Atualmente, os cientistas envolvidos em Nanociência e Nanotecnologia já

começam a imaginar a criação de uma “nanoinformática”, ondeeles poderão

manipular a informação armazenada sobre o nanomundo. Este tema foi discutido

recentemente no NanoFrontiers Workshop (Schmidt, 2007). Obviamente que a

comunidade científica, massivamente interdisciplinar, sebeneficiará do uso desta

base de dados padronizada e das ferramentas de manipulação desenvolvidas.

Os participantes do NanoFrontiers Workshop fizeram afirmações e questio-

namentos bastante interessantes sobre o surgimento da nanoinformática. Alguns

cientistas a veem como uma fronteira entre os pioneiros cientistas da Nanotecnolo-

gia e a nova era do desenvolvimento nanotecnológico acelerado pelo conhecimento

contido em bases de dados. Por outro lado, alguns cientistassão mais céticos sobre

o desenvolvimento de tais ferramentas e como elas poderão ajudar no desenvolvi-

mento da nanociência.

Pode-se destacar três pontos chaves da nanoinformática:

– Base de Dados: no seu nível mais básico a nanoinformática compreende uma

rede de base de dados para auxiliar os pesquisadores em questões práticas. As

teorias e respostas para estas questões já podem estar disponíveis, o problema

é ter acesso a elas. Tais informações em Nanociência e Nanotecnologia estão

geralmente disponíveis em jornais de diferentes assuntos eem diferentes

países. A nanoinformática poderá unificar os dados similares e criar fácil

acesso a eles.

– Ferramentas: uma grande quantidade de dados pode não ser muito útil quando

não há ferramentas de manipulação eficientes. Usar e manipular os dados em

um nível aceitável requer o uso de ferramentas computacionais complexas.

Também poderá ser necessário o desenvolvimento de novos simuladores e

ferramentas inteligentes para integrar diferentes tipos de dados. A Inteligên-

cia Computacional terá um papel importantíssimo no desenvolvimento das

ferramentas eficientes de manipulação de dados, tal como será discutido no

próximo capítulo.

– Colaborações: a nanoinformática facilitará a colaboraçãode cientistas ao

redor do mundo. Estes poderão compartilhar informações, ferramentas e

até instrumentos remotamente. Isto possibilitaria a formação de grandes

laboratórios virtuais.

2.5Simulação de Nanodispositivos

Além dos métodos de modelagem molecular discutidos anteriormente, exis-

tem métodos de simulação desenvolvidos exclusivamente para determinadas nano-

estruturas ou nanodispositivos. Neste caso, o pesquisadorestá preocupado apenas

com o comportamento do dispositivo estudado e um conjunto deequações matemá-

ticas podem fornecer as respostas desejadas.

Um exemplo de simulador de nanoestruturas pode ser encontrado em

(Gusso, 2004), onde os autores utilizam um conjunto de equações para modelar o

transporte de carga em LEDs orgânicos de múltiplas camadas.Os resultados obtidos

pelo simulador desenvolvido foram validados por experimentos realizados previa-

mente.

O simulador de autômatos celulares com pontos quânticos (Quantum Dot

Celular Automata- QCA) desenvolvido na universidade de Calgary é outro exemplo

de simulação de nanodispositivos (Walus, 2002).

Mais um exemplo de simulador de nanoestruturas é o desenvolvido por John-

son para simulações de cristais fotônicos (Johnson, 2002).O programa calcula as

estruturas de banda e os modos eletromagnéticos de estruturas dielétrica periódi-

cas. Este simulador pode ser usado também para a simulação deguias de ondas e

sistemas ressonantes.

Além dos exemplos citados acima, existem uma grande variedade de outros

simuladores de nanoestrutura e nanodispositivos na literatura. O site nanoHUB.org

fornece um conjunto de simuladores de diferentes tipos (Goasguen, 2005). Muitos

deste simuladores podem ser usadoson-line e outros podem ser obtidos no site e

executados nos computadores pessoais.

2.6Computação de Alto Desempenho

O uso de ferramentas computacionais no desenvolvimento da Nanociência

e Nanotecnologia só é viável graças ao grande avanço computacional obtido nos

últimos anos. Grande parte das simulações, principalmenteaquelas envolvendo

modelagem molecular, necessitam de um grande poder de processamento. A seguir

vamos citar algumas alternativas para amenizar este problema.

A alternativa mais tradicional para cálculos computacionais longos é o uso de

aglomerados (oucluster) de computadores. Este consiste de um grupo de compu-

tadores que trabalham juntos e que podem ser vistos como um único computador.

Os componentes de um aglomerado de computadores são normalmente conectados

uns aos outros por uma rede local e rápida. Estes aglomeradossão projetados para

melhorar o desempenho de computadores individuais.

Mais recentemente, pesquisadores têm demonstrado a possibilidade de imple-

mentar simulações em hardware dedicados. As plataformas digitais reconfiguráveis

(FPGAs) estão sendo utilizadas com este propósito (Fagerstrom, 2002) (Gu, 2006).

Tais plataformas já são utilizadas com sucesso em problemasde processamento de

sinais e comunicação. O artigo de (Gu, 2006) mostra que a implementação de um

código de dinâmica molecular simples em FPGA foi capaz de acelerar o tempo de

processamento de 31 a 88 vezes.

Na última década surgiu a necessidade do desenvolvimento deplacas gráficas

de alto desempenho para o uso em videogames. Esta demanda foiobtida através

de novas arquiteturas de hardware nas unidades de processamento gráfico (GPUs),

tais como aquelas encontradas no Sony PlayStation 3 e nVidiaGeForce 8800

GTX. Recentemente, (Ufimtsev, 2008) demonstrou o uso de GPUs no cálculo das

integrais de repulsão de dois elétrons, obtendo uma aceleração de mais de 130 vezes

quando comparado ao cálculo realizado em uma CPU AMD Opterom tradicional.

No mesmo trabalho, os autores realizaram o cálculo da matrizde Coulomb para

uma molécula de DNA em 19,8 segundos contra 1600 segundos necessários pelo

AMD Opteron.

O desenvolvimento da Nanotecnologia permitirá a criação denovas arqui-

teturas de processadores, os quais serão muito mais rápidosdo que os existentes

atualmente. No caminho contrário, tal avanço auxiliará o desenvolvimento dos si-

muladores de nanoestruturas, permitindo um grande avanço tecnológico. Dentre as

novas arquiteturas e paradigmas computacionais obtidos pela Nanotecnologia po-

demos destacar os transistores de nanotubos de carbono (Paul, 2006) e os autômatos

celulares com pontos quânticos (VilelaNeto, 2007).

2.7Computação Inspirada na Nanotecnologia

O próximo capítulo apresentará os métodos de Inteligência Computacional

que são inspirados na natureza. Logo, pode-se considerar que a Nanotecnologia e

a Nanociência venham a inspirar o desenvolvimento de novas técnicas de Inteli-

gência Computacional. A Nanociência explora uma natureza diferente daquela com

a qual estamos acostumados, com novas características e leis. À medida que estas

pesquisas se desenvolvem novas descobertas são feitas, podendo inspirar os pesqui-

sadores a criar novos sistemas de computação que sejam úteisno desenvolvimento

de problemas do dia a dia.

Até o momento, não se conhece nenhum algoritmo que tenha sidodesen-

volvido a partir do comportamento de algum sistema ou estrutura nanométricos.

Porém, a mecânica quântica já inspirou o desenvolvimento não só de um conjunto

de algoritmos, como também de uma nova forma de computação.

Um computador quântico é um dispositivo que faz uso direto decertos fenô-

menos da mecânica quântica para realizar operações com dados. Estes fenômenos

permitem construir, em teoria, computadores que obedecem novas leis mais per-

missivas de complexidade computacional (Spector, 2004). Otermo "computação

quântica"é, portanto, usado para descrever processos computacionais que se ba-

seiam nestes fenômenos específicos e que são, assim, capazesde diminuir o esforço

e a complexidade para se resolver determinados problemas.

Devido à grande dificuldade de implementação de um computador quântico,

(Moore, 1995) propôs uma nova abordagem. O objetivo desta nova abordagem é

criar algoritmos clássicos (capazes, portanto, de serem executados em computa-

dores clássicos) que tirem proveito dos paradigmas da física quântica, de forma a

melhorar o desempenho dos mesmos na resolução de problemas.

Com relação aos métodos de Inteligência Computacional, (Han,2000) propôs

um algoritmo evolutivo com inspiração quântica usando representação binária.

Neste modelo, o algoritmo evolutivo proposto é também caracterizado por um

cromossomo, uma função de avaliação e uma dinâmica populacional. Porém, neste

caso, os genes do cromossomo simulam osq-bits dos computadores quânticos. Já

o trabalho de (AbsDaCruz, 2005) estende o algoritmo evolutivo com inspiração

quântica para a solução de problemas numéricos.

3Técnicas de Inteligência Computacional

Inteligência computacional é um ramo da ciência da computação que utiliza

algoritmos e técnicas que imitam algumas habilidades cognitivas, como reconhe-

cimento, aprendizado e evolução, para criar programas, de alguma forma, inteli-

gentes. Dentre os algoritmos mais conhecidos, tem-se: Computação Evolucionária,

Redes Neurais Artificiais e Lógica Fuzzy. Neste trabalho, as técnicas utilizadas fo-

ram a Computação Evolucionária e as Redes Neurais Artificiais que são descritas a

seguir.

3.1Computação Evolucionária

Esta seção resume os principais conceitos sobre os algoritmos evolucionários.

Primeiramente, é feita uma breve explicação sobre o princípio de funcionamento

de um Algoritmo Genético (AG), descrevendo suas partes principais. Em seguida,

a co-evolução é descrita. Por fim, uma alteração do AG é apresentada através do

Algoritmo Genético com Inspiração Quântica (AGIQ).

3.1.1Algoritmos Genéticos

Essencialmente, Algoritmos Genéticos são métodos de buscae otimização

que têm sua inspiração nos conceitos da teoria de seleção natural das espécies

proposta por Darwin (Mitchell, 1996, Koza, 1992, Goldberg,1989, Back, 1996,

Fogel, 1966). Os sistemas desenvolvidos a partir deste princípio são utilizados para

procurar soluções de problemas complexos ou com espaço de soluções (espaço

de busca) muito grande, o que os tornam problemas de difícil modelagem e

solução quando se aplicam métodos de otimização convencionais, ou programação

matemática.

Estes algoritmos são baseados nos processos genéticos de organismos bio-

lógicos para procurar soluções ótimas ou sub-ótimas. Para tanto, procede-se da se-

guinte maneira: codifica-se cada possível solução de um problema em uma estrutura

chamada de “cromossomo”, que é composta por uma cadeia de bits ou caracteres.

Estes cromossomos representam indivíduos, que são evoluídos ao longo de várias

Capítulo 3. Técnicas de Inteligência Computacional 40

gerações, de forma similar aos seres vivos, de acordo com os princípios de sele-

ção natural e sobrevivência dos mais aptos, descritos pela primeira vez por Charles

Darwin em seu livroA Origem das Espécies. Emulando estes processos, os Algo-

ritmos Genéticos são capazes de “evoluir” soluções de problemas do mundo real.

Os cromossomos são então submetidos a um processo evolucionário que en-

volve avaliação, seleção, cruzamento e mutação. Após vários ciclos de evolução a

população deverá conter indivíduos mais aptos. Os AGs utilizam uma analogia di-

reta deste fenômeno de evolução na natureza, onde cada indivíduo representa uma

possível solução para um problema dado. A cada indivíduo atribui-se um valor de

adaptação: sua aptidão, que indica o quanto a solução representada por este indi-

víduo é boa em relação às outras soluções da população, cujo análogo em progra-

mação matemática é o resultado da função objetivo. Desta maneira, o termo Popu-

lação refere-se ao conjunto de todas as soluções com as quaistrabalha o sistema.

Aos indivíduos mais adaptados é dada a oportunidade de se reproduzir mediante

cruzamentos com outros indivíduos da população, produzindo descendentes com

características de ambas as partes. A mutação também tem um papel significativo,

ao introduzir na população novos indivíduos gerados de maneira aleatória.

O processo de evolução começa com a criação aleatória dos indivíduos que

formarão a população inicial. A partir de um processo de seleção baseado na apti-

dão de cada indivíduo, são escolhidos indivíduos para a fasede reprodução, que cria

novas soluções utilizando-se para isto um conjunto de operadores genéticos. Deste

modo, a aptidão do indivíduo determina o seu grau de sobrevivência e, assim, a pos-

sibilidade de que o cromossomo possa fazer parte das gerações seguintes. O proce-

dimento básico de um algoritmo genético é resumido na Figura3.1 (Davis, 1991).

Figura 3.1: Procedimento padrão do Algoritmo Genético.

Para determinar o final da evolução pode-se fixar o número de gerações, o

número de indivíduos criados, ou ainda condicionar o algoritmo à obtenção de uma

solução satisfatória, isto é, quando se atingir um ponto ótimo. Outras condições

para a parada incluem o tempo de processamento e o grau de similaridade entre

os elementos numa população (convergência). As seções seguintes apresentam em

mais detalhes cada um dos componentes de um algoritmo genético.

Representação

A solução de um problema pode ser representada por um conjunto de parâ-

metros (genes), unidos para formar uma cadeia de valores (cromossomo); a este

processo chama-se codificação. As soluções (cromossomos) são codificadas atra-

vés de uma sequência formada por caracteres de um sistema alfabético. Original-

mente, utilizou-se o alfabeto binário (0, 1). Porém, novos modelos de AGs co-

dificam as soluções com outros alfabetos, como por exemplo com números reais

(Michalewicz, 1996). Assim, a representação é um aspecto fundamental na mode-

lagem de um AG para a solução de um problema. Ela define a estrutura do cromos-

somo, com os respectivos genes que o compõem, de maneira que este seja capaz de

descrever todo o espaço de busca relevante do problema. A decodificação do cro-

mossomo consiste basicamente na construção da solução realdo problema a partir

do cromossomo. Isto é, o processo de decodificação constrói asolução para que esta

seja avaliada pelo problema.

Avaliação

A avaliação é a ligação entre o AG e o problema a ser solucionado. Ela é

feita através de uma função que melhor representa o problemae tem por objetivo

oferecer uma medida de aptidão de cada indivíduo na população corrente, que irá

dirigir o processo de busca. Dado um cromossomo, a função de avaliação consiste

em associar um valor numérico, o qual supõe-se proporcionalà “utilidade” ou

“habilidade” do indivíduo representado em solucionar o problema em questão.

Muitas vezes a avaliação é realizada por um simulador ou um código externo ao

3.1.2Operadores

Operadores genéticos são algoritmos que modificam os genes possibilitando

a evolução da solução. Existem duas classes de operadores: cruzamento e muta-

ção. A geração de novos cromossomos pode ser realizada tantopelo cruzamento

quanto pela mutação, ou ainda pelos dois simultaneamente. Os operadores de muta-

ção são responsáveis pela divergência das soluções, explorando o espaço de busca;

enquanto que os operadores de cruzamento fazem com que as soluções se com-

binem, tirando proveito de um determinado subespaço de busca. Esses operadores

variam de acordo com a representação utilizada. Neste trabalho, grande parte dos

experimentos utilizam a representação real e os operadoresrelacionados serão des-

critos a seguir. Alguns estudos de casos fazem uso de outros tipos de operadores,

estes serão descritos no momento adequado. Outros operadores podem ser encon-

trados na literatura (Michalewicz, 1994).

O operador real mais usual é o cruzamento aritmético. Este consiste de uma

combinação linear entre dois genes, conforme mostrado na equação 3-1.

vf = f (vp1, vp2) = α · vp1 + (1− α) · vp2 (3-1)

ondeα ∈ [0,1] é uma variável aleatória evf é o valor do gene do filho, gerado em

função dos valores dos genes dos paisvp1 evp2.

Entre as mutações, os dois tipos mais comuns são a mutação uniforme e a

não uniforme. A uniforme explora todo o espaço de busca igualmente, equação 3-2,

sendo independente dos pais.

vf = α · (vmax− vmin) + vmin (3-2)

ondevmax e vmin são, respectivamente, os valores máximo e mínimo que tal gene

pode assumir, ou seja, as restrições de limite desse gene.

Já a mutação não uniforme, faz com que os genes sorteados no espaço se

concentrem em torno do gene do pai, em função do número de gerações decorrido

e de umbit aleatório.

vf = f (vp1) =

vp1 + ∆(t, vmax− vp1) se o bit for 0

vp1 − ∆(t, vp1 − vmin) se o bit for 1(3-3)

∆(t, y) = y ·(

1− α(1− tT )b

ondet é a geração atual eT o número máximo de iterações do algoritmo. Por fim,b

é um parâmetro que determina o grau de dependência de acordo com o número da

geração.

3.1.3Co-evolução

Para se aplicar algoritmos evolucionários com sucesso em problemas com

complexidade cada vez maior, torna-se necessário introduzir noções explícitas de

modularidade nas soluções para que elas disponham de oportunidades razoáveis de

evoluir na forma de subcomponentes co-adaptados (Potter, 2000).

Existem duas razões principais pelas quais algoritmos evolucionários con-

vencionais não são totalmente adequados para resolver estetipo de problema. Em

primeiro lugar, os algoritmos genéticos convencionais impedem, a longo prazo, a

preservação de certos componentes da solução pois, por estarem codificados por

completo em um indivíduo, eles são avaliados como um todo e apenas os subcom-

ponentes que pertencem a indivíduos com avaliações altas serão preservados. Em

segundo lugar, o fato da representação estar relacionada a uma solução completa e

por não haver interações entre os membros da população, não existe pressão evo-

lucionária para a ocorrência de co-adaptação, ou seja, não existe pressão para a

adaptação de um subcomponente dada a ocorrência de uma mudança em outro sub-

componente (Potter, 2000).

No entanto, a decomposição do problema tem um aspecto importante que

deve ser levado em conta e que está relacionado com a evoluçãode subcompo-

nentes interdependentes. Se for possível decompor o problema em subcomponentes

independentes, cada um deles pode evoluir sem haver necessidade de se preocupar

com os outros. Pode-se visualizar isto imaginando que cada subcomponente evolui

no seu próprio espaço de busca, desacoplado do espaço de busca dos outros com-

ponentes.

O modelo co-evolucionário cooperativo genérico (Potter, 2000) é mostrado na

figura 3.2.

Figura 3.2: Modelo co-evolucionário genérico.

Apesar de serem mostradas apenas duas espécies neste modelo, o mesmo

pode ser usado para n espécies diferentes. Cada espécie evolui em sua própria

população (pois como já foi mencionado, elas são isoladas geneticamente) e se

adaptam ao ambiente através de repetidas aplicações do algoritmo evolucionário.

Para se calcular a aptidão dos indivíduos de uma determinadaespécie, deve-se

submetê-lo ao modelo do domínio (que contém a função de avaliação) juntamente

com um ou mais colaboradores de cada uma das outras espécies (de modo a formar

a solução completa).

Algoritmo Genético com Inspiração em Computação Quântica

A computação quântica é uma área recente de pesquisa, que utiliza fenômenos

quânticos para resolver problemas de complexidade exponencial em um tempo

aceitável. O uso de sistemas clássicos inspirados nesses fenômenos pode produzir

um ganho substancial em relação ao tempo de processamento e,eventualmente,

em relação à qualidade da solução e tem mostrado bons resultados em problemas

benchmark(Han, 2000, Han, 2002, Davis, 1991).

Algoritmos Genéticos com Inspiração Quântica

Os algoritmos evolucionários com inspiração quântica são baseados nos

conceitos de bits quânticos, ou “qubits”, e na superposiçãode estados da mecânica

quântica (Han, 2000, Han, 2002, Davis, 1991). O estado de um bit quântico pode

ser representado por:

|φ >= α|0 > +β|1 > (3-5)

ondeα eβ são números complexos que especificam as amplitudes de probabi-

lidade dos estados correspondentes.|α2| dá a probabilidade do qubit estar no estado

0 quando observado e|β2|, por sua vez, dá a probabilidade do qubit estar no estado

1 quando observado. A normalização das amplitudes garante que

|α2| + |β2| = 1 (3-6)

O algoritmo evolucionário com representação binária (Han,2000, Han, 2002)

funciona bem somente quando esta representação é a mais adequada para o pro-

blema específico. No entanto, em alguns casos, a representação por números re-

ais é mais eficiente (no caso de otimização de funções, por exemplo, onde se de-

seja encontrar um valor máximo, ou mínimo, a partir dos ajustes das variáveis)

(da Cruz, 2004). Mas como implementar essa representação usando-se o paradigma

da inspiração quântica? Para se responder essa questão é necessário responder ou-

tras duas questões:

– Como representar a superposição de estados, dado que neste tipo de problema

os genes podem assumir valores em um intervalo contínuo entre os limites das

variáveis?

– Como atualizar estes valores de modo a levar o algoritmo a convergir para um

valor ótimo ou sub-ótimo?

Para a primeira questão a resposta é simples: ao invés de se usar as probabi-

lidades de observação de um estado, define-se uma distribuição de probabilidades

para cada variável que permita sortear facilmente valores no universo de discurso

da variável. Para evitar um crescimento exponencial do armazenamento de infor-

mações, e reduzir o custo computacional, optou-se por usar um conjunto de pulsos

retangulares para se representar estas distribuições (distribuição de probabilidade

uniforme). Desta forma, há duas grandes vantagens: somenteé necessário arma-

zenar o centro e a largura de cada pulso; e simplifica-se o cálculo das funções de

distribuição cumulativa de probabilidades, que são necessárias para o sorteio dos

números aleatórios.

O procedimento para inicializar o algoritmo começa então com uma definição

de um valor N que indica quantos pulsos serão usados para representar a distribuição

de probabilidade para cada uma das variáveis. Feito isto, para cada pulso usado em

cada variável do problema, define-se:

– Centro igual ao ponto médio do domínio;

– Altura igual ao inverso do tamanho do domínio dividido por N.

Ao final deste processo, a soma dos N pulsos de cada uma das variáveis

terá área total igual a 1. Supondo, por exemplo, que se desejeinicializar uma

variável com universo de discurso em [-50,50] e utilizar 4 pulsos retangulares

para representar a distribuição de probabilidade para estavariável, cada pulso teria

largura igual a 100 e altura igual a 1/100/4 = 0,0025. Com a superposição, a forma

gráfica desta distribuição ficaria, após a inicialização, daseguinte forma:

Figura 3.3: Gráfico com a superposição de 4 pulsos retangulares, cada um comlargura 100 e altura 0,0025, representando a distribuição de probabilidade para umavariável

Esta curva representa, portanto, a superposição de todos osestados possíveis

para a variável em questão. Este conjunto de distribuições de probabilidade de cada

uma das variáveis (genes) do problema forma uma superposição Qi(t) para cada

uma das i variáveis do problema.

A partir desta distribuiçãoQi(t) sorteia-se um conjunto de n pontos que

formam a população P(t). Após o sorteio dos indivíduos que vão formar a população

P(t) é necessário atualizar a distribuição de probabilidade Qi(t) de modo a obter a

convergência para a solução ótima ou sub-ótima de maneira similar ao crossover

convencional dos algoritmos genéticos. O método utilizadoconsiste em sortear um

número m de indivíduos da população P(t) usando um processo de roleta idêntico

ao dos algoritmos genéticos convencionais e, em seguida, redefinir o ponto central

do primeiro pulso como o valor médio desses m indivíduos sorteados. Este processo

é repetido para cada um dos N pulsos que definem a distribuiçãoQi(t). O valor m é

dado por:

Além disso, em cada geração, a largura dos pulsos é reduzida de forma

simétrica em relação a seus centros. Esta redução é feita de forma exponencial,

de acordo com a fórmula:

σ = (u− l)(1− tT )2 − 1 (3-8)

Ondeσ é a largura do pulso, u é o limite superior do domínio da variável, l é

o limite inferior, t é a geração corrente do algoritmo, T é o total de gerações eλ é

um parâmetro que define a velocidade de decaimento da largurado pulso.

É importante notar que, à medida que os pulsos têm suas larguras diminuídas

e a posição de seus pontos centrais modificados, a soma deles deixa de ser um pulso

e começa a assumir as mais diversas formas. Um exemplo de uma forma que a soma

dos pulsos pode assumir é mostrado na figura a seguir, onde tem-se a soma de dois

pulsos: o primeiro no intervalo [-50,50], com altura 0,005 eo segundo no intervalo

[0,50] com altura 0,01.

Figura 3.4: Forma da superposição de 2 pulsos de distribuição de probabilidade apósalgumas gerações do algoritmo.

3.2Redes Neurais

Inspirada na estrutura e operação do cérebro humano, uma RedeNeural Ar-

tificial (RNA) é um modelo matemático não-linear usado para encontrar relacio-

namentos complexos entre a entrada e a saída de dados. Esse modelo é usado em

problemas da predição de séries temporais, reconhecimentode padrões e aproxima-

ção de funções. Três conceitos básicos caracterizam os diversos tipos de RNAs: o

modelo do neurônio artificial, sua estrutura de interconexão (topologia) e a regra de

aprendizado.

Assim como o sistema nervoso é composto por bilhões de neurônios, a

RNA também é formada por unidades elementares, denominadas neurônios artifi-

ciais ou processadores, que efetuam operações simples. Nasredes, esses neurônios

encontram-se interconectados, transmitindo seus resultados aos processadores vizi-

nhos. As RNAs são eficazes na elaboração de funções capazes de aproximar dados

não-lineares, incompletos, com ruído ou compostos por exemplos contraditórios,

sendo essa potencialidade de modelar sistemas não-lineares a principal vantagem

sobre outros métodos de interpolação. Na maioria dos casos,uma RNA é um sis-

tema adaptável que muda sua estrutura com base na informaçãoexterna ou interna

da rede.

3.2.1Estrutura de uma Rede

Neurônio artificial

O neurônio artificiali, tipicamente denominado de “elemento processador”, é

inspirado no neurônio biológico, possuindo um conjunto de entradasxm (dendritos)

e uma saídayi (axônio), conforme ilustrado na figura 3.5. As entradas são ponde-

radas por pesos sinápticoswim (sinapses), que determinam o efeito da entradaxm

sobre o processadori. Estas entradas ponderadas são somadas, fornecendo o poten-

cial, vi, do processador. A saída ou estado de ativaçãoyi do elemento processadori

é finalmente calculada através de uma função de ativaçãoφ(·). O estado de ativação

pode então ser definido pela equação 3-9.

yi = φ

xjwi j + θi

ondem é o número de entradas do neurônioi e θi é um termo de polarização do

neurônio (bias).

Figura 3.5: Representação gráfica de um neurônio artificial.

Função de ativação

A função de ativação é responsável por majorar ou minorar a informação

recebida por um neurônio antes de passá-la adiante. Qualquer função pode ser

utilizada para tal fim. Porém, a diferenciabilidade é uma característica importante

na teoria das redes neurais, possibilitando o seu uso em algoritmos de treinamento

baseados no método do gradiente. A tabela 3.1 apresenta algumas funções de

ativação usuais.

A função linear é geralmente utilizada quando a saída do neurônio pode

atingir qualquer valor, ou seja, não possui valores limites. Quando há muitas

entradas nesse neurônio, esta função pode produzir valoreselevados nos resultados.

É geralmente utilizada nos neurônios da camada de saída.

As funções sigmóides formam uma família de funções cujo gráfico tem a

forma de s. Tal forma é a mais comummente utilizada, sendo definida como uma

função estritamente crescente que apresenta na sua estrutura intervalos linear e não-

lineares. Esta função possibilita o mapeamento de dados comtal comportamento.

Um exemplo de função sigmóide é a função logística (tabela 3.1), em que os valores

de saída dos neurônios são unipolares e estão contidos no intervalo [0,1]. Nessa

função,λ é um parâmetro de suavização da curva. Variando-se o parâmetro λ,

obtém-se funções sigmóides com inclinações diferentes. Quandoλ → ∞, a função

tende a função degrau unitário.

Algumas vezes é desejável que a função se estenda ao intervalo [-1,1]. Nesse

caso, a tangente hiperbólica é utilizada (3.1). Essa funçãotambém pertence às

sigmóides, porém é bipolar, possibilitando o neurônio assumir valores de saída

negativos.

Nome Funçãoφ(v) Derivada∂φ/∂v

Logística 11+exp(−λv) λφ(v)(1− φ(v))

Tanh 21+exp(−λv) − 1 λ(1− φ(v)2)

Degrau

0 sev ≤ 0

1 sev > 0δ(v)

−1 sev ≤ 0

1 sev > 02δ(v)

Linearsaturada

−1 v ≤ −1/λ

λv −1/λ < v ≤ 1/λ

1 v > 1/λ

0 v ≤ −1/λ

λ −1/λ < v ≤ 1/λ

0 v > 1/λ

Linear v 1

Tabela 3.1: Funções de ativação e suas respectivas derivadas.

Topologia

As topologias das redes neurais podem ser divididas em duas classes: não

recorrentes e recorrentes. Redes não recorrentes são aquelas que não possuem

realimentação de suas saídas para suas entradas e por isso são ditas “sem memória”.

A estrutura dessas redes é em camadas, podendo ser formadas por uma camada

única ou múltiplas camadas. A figura 3.6 ilustra uma rede multi-camadas, em que os

neurônios são representados por círculos (nós) e as conexões por retas (arcos). Essas

redes contêm um conjunto de neurônios de entrada, uma camadade saída e uma ou

mais camadas escondidas. A entrada não é considerada uma camada da rede, pelo

fato de apenas distribuir os padrões para a camada seguinte (Wasserman, 1989).

A camada de saída contém os neurônios que fornecem o resultado da rede. As

camadas que não possuem ligações diretas nem com a entrada, nem com a saída são

denominadas camadas escondidas. No caso de redes não recorrentes não existem

conexões ligando um neurônio de uma camada a outro de uma camada anterior,

nem a um neurônio da mesma camada.

Figura 3.6: Exemplo de uma rede neural não recorrente.

As RNAs recorrentes são redes em que as saídas realimentam as entradas,

sendo suas saídas determinadas pelas entradas atuais e pelas saídas anteriores. As

redes recorrentes, quando organizadas em camadas, possueminterligações entre

neurônios da mesma camada e entre camadas não consecutivas,gerando intercone-

xões bem mais complexas que as redes neurais não recorrentes(figura 3.7).

As redes neurais recorrentes respondem a estímulos dinamicamente, isto é,

após aplicar uma nova entrada, a saída é calculada e então realimentada para

modificar a entrada. Para uma rede se tornar estável, este processo é repetido várias

vezes, produzindo pequenas mudanças nas saídas, até que estas tendam a ficar

constantes. Todavia, as redes neurais recorrentes não são necessariamente estáveis,

mesmo com entradas constantes. O fato de não se conseguir prever quais redes

seriam estáveis foi um problema que preocupou os pesquisadores até o início da

década de 80, quando Cohen e Grossberg provaram um teorema para definir quando

as redes neurais recorrentes são estáveis (Wasserman, 1989). Este teorema diz que,

para as RNAs recorrentes alcançarem um estado estável, é necessário que as funções

de ativação sejam monotônicas, hajam conexões simétricas,e um neurônio não

possa realimentar a si mesmo. Contribuições importantes também foram dadas por

John Hopfield (Hopfield, 1982), sendo que algumas configurações passaram a ser

chamadas de redes de Hopfield em sua homenagem, e por Hinton e Sejnowski, que

introduziram regras gerais para treinamento.

Figura 3.7: Exemplo de uma rede neural recorrente com duas entradas e duas saídas.

3.2.2Tratamento dos dados

Como as ordens de grandeza de cada entrada e saída podem ser distintas, é

necessário empregar algum tipo de normalização antes de executar o treinamento

da rede neural. Desta forma, o valor de uma variável não se torna mais significativo

que o de outra quando as escalas forem diferentes, ou seja, uma variável que assume

valores de 1 a 2500 não afetará mais o sistema que outra com valores entre 0 e 0,5.

A normalização linear consiste em transformar os dados de modo que se

encontrem em um determinado intervalo. Tal normalização é definida pela equação

3-10, ondex é o valor do dado real,y o dado normalizado e os índicesmaxe min

são seus valores máximos e mínimos, respectivamente.

f (x) = y = (ymax− ymin)(x− xmin)

(xmax− xmin)+ ymin (3-10)

Quando os dados se encontram concentrados em um subespaço dointervalo

admissível de uma variável, utiliza-se um método para dispersá-los. Um dos mé-

todos mais simples de se implementar é a normalização linearpor partes. Tal nor-

malização determina subintervalos a partir de um valor intermediário, assim, uma

parte dos dados é normalizada entre um dado intervalo [ymin; yint] e outra parte é

normalizada em outro intervalo [yint; ymax], conforme a equação 3-11.

f (x) = y =

(yint − ymin)(x−xmin)

(xint−xmin)+ ymin sex ≤ xint

(ymax− yint)(x−xint)

(xmax−xint)+ yint sex > xint

(3-11)

3.2.3Treinamento

O objetivo do treinamento de uma RNA é fazer com que a aplicaçãode um

conjunto de entradas produza um conjunto de saídas desejado. Cada conjunto de

entradas e saídas desejadas, ou alvo, é chamado de padrão de treinamento. O trei-

namento é realizado pela aplicação sequencial dos vetores de entrada e, em alguns

casos, também os de saída, enquanto os pesos da rede são ajustados de acordo com

um procedimento de treinamento pré-determinado. Durante otreinamento, os pesos

da rede gradualmente convergem para determinados valores,de modo que a apli-

cação dos vetores de entrada produza as saídas necessárias.Os procedimentos de

treinamento podem ser classificados de duas formas: supervisionado e não super-

visionado. Ambos usufruem de um conjunto de treinamento, entretanto o primeiro

necessita de valores alvo para as saídas, enquanto que o segundo não.

O conjunto de treinamento modifica os pesos da rede de forma a produzir

saídas que sejam consistentes, isto é, tanto a apresentaçãode um dos vetores de

treinamento, como a apresentação de um vetor que é suficientemente similar, irão

produzir o mesmo padrão nas saídas.

O treinamento supervisionado necessita de um par de vetorescomposto das

entradas e do vetor alvo que se deseja obter como as respectivas saídas. Juntos,

estes vetores são chamados de par de treinamento ou vetor de treinamento, sendo

que geralmente a rede é treinada com vários vetores de treinamento.

Existe uma grande variedade de algoritmos de treinamento, tanto para o

treinamento supervisionado, quanto para o não supervisionado. Entre estes, o mais

difundido é o algoritmo de retropropagação (backpropagation). A retropropagação

contém duas etapas. A primeira é o método com o qual a aplicação da regra-da-

cadeia obtém a derivada parcial da função de erro da rede em relação a cada um

de seus pesos. A segunda é o algoritmo de atualização dos pesos, que consiste

basicamente do gradiente decrescente.

Em suma, para a realização do treinamento supervisionado, épreciso que haja

um conjunto de padrões de entrada e suas respectivas saídas,além de uma função

de erro (função de custo) para medir o custo da diferença entre as saídas da rede e

os valores desejados. Tal treinamento é iniciado com a apresentação e propagação

de um padrão através da rede para obter as saídas. Uma vez calculadas, as saídas

são comparadas com os respectivos valores alvo e o erro é então calculado a partir

de alguma métrica. O erro então é utilizado para atualizar ospesos de acordo com

um algoritmo de minimização, conforme ilustrado na figura 3.8. Este processo de

treinamento é repetido até que o erro, para todos os vetores de treinamento, tenha

alcançado o nível especificado ou até que um número máximo de iterações seja

atingido. Cada iteração desse processo é conhecida como época.

Figura 3.8: Treinamento supervisionado de uma rede neural.(Adaptado de(Reed, 1998))

Propagação das entradas

Os próximos algoritmos serão explicados com base em uma redede exemplo

com multi-camada. Tal rede possui uma entrada deq nós, duas camadas escondidas

e um único neurônio de saída, conforme mostrado na figura 3.6.Os elementos

do vetor de pesosw estão ordenados por camadas (a partir da primeira camada

escondida) e em cada camada estão ordenados por neurônios, seguindo a ordem das

entradas de cada neurônio. Sendow(l)i j o peso sináptico do neurônioi da camadal−1

para o neurônioj na camadal. Paral = 1, a primeira camada escondida, o índicei

se refere ao nó de entrada, ao invés de um neurônio.

Em tal rede, a propagação do sinal em cada camadal pode ser definida como

y(l) = F(w, x) para uma entrada específicax = [x1, x2, . . . , xq]T e um respectivo

vetor de pesosw. As equações 3-12 demonstram como, ao se utilizar uma função

de ativaçãoφ(·), o sinal é propagado através de cada neurônioj camada a camada.

y(1)j = φ

xTw(1)j

y(2)j = φ

(y(1))Tw(2)j

y(3)j = φ

(y(2))Tw(3)j

(3-12)

Métricas de erro

A menos que a rede esteja perfeitamente treinada, as saídas da rede estarão

destoantes com os valores desejados. A significância dessasdiferenças é medida

por uma função de erroE. A soma dos erros quadráticos (SSE) é uma métrica

comumente utilizada

ES S E=∑

(tpi − ypi)2 (3-13)

onde,p indica o conjunto de padrões de treinamento,i os nós de saída,tpi e ypi

o valor alvo e o valor de saída da rede para o padrãop do nó i, respectivamente.

O erro quadrático médio (MSE) normaliza o SSE para o númeroP de padrões de

treinamento e asN saídas da rede, como segue:

EMS E =1

PNES S E (3-14)

As funções SSE e MSE têm a vantagem de serem facilmente diferenciáveis e

que seus custos dependem somente da magnitude do erro (Reed, 1998).

Na avaliação final da rede, o erro percentual médio absoluto (MAPE) é

outra métrica muito utilizada. Esta é definida na equação 3-15. O MAPE permite

uma melhor sensibilidade na análise dos resultados, pois representa a distância

percentual entre o valor obtido e o desejado.

EMAPE =1

tpi − ypi

(3-15)

Retropropagação do erro

Como dito anteriormente, a retropropagação é constituída deduas etapas: o

cálculo da derivada do erro e a atualização de pesos.

Na primeira etapa, geralmente utiliza-se o SSE como métricade erro, porém

qualquer função de erro que seja derivável pode ser utilizada. A derivada depende

da localização do neurônio, isto é, se pertence à camada de saída ou não. O

resultado final da utilização da regra da cadeia para a métrica SSE é apresentado

a seguir, sendo o desenvolvimento facilmente encontrado emdiversas referências

(Haykin94, Reed, 1998, Zurada, 1992). A derivada do erro podeser vista como o

somatório das derivadas do erro relativo a cada padrão de treinamento, conforme a

equação 3-16.∂E∂wi j

∂wi j(3-16)

Cada uma dessas derivadas pode ser representada como a equação 3-17, em

que o valor deδi muda de acordo com a localização do neurônio (equação 3-18).

∂wi j= δiyi (3-17)

−(tpi − ypi)φ′i para neurônios de saída

φ′i∑

k wkiδk para neurônios escondidos(3-18)

A segunda etapa do algoritmo da retropropagação é praticamente equivalente

ao gradiente decrescente. Por definição o gradiente deE indica a direção de maior

crescimento deE, sendo que para sua minimização é necessário caminhar na direção

contrária. A retropropagação atribui uma taxa de aprendizado η que determina o

passo do algoritmo. A equação 3-19 apresenta a variação dos pesos em função do

gradiente do erro.

∆wi j = −η∂E∂wi j

(3-19)

Algoritmos baseados na retropropagação

Existem diversos algoritmos que tiram proveito da forma em que o gradiente

do erro em função dos pesos é calculado segundo o método de retropropagação.

Tais algoritmos diferenciam-se pela maneira como atualizam os pesos da rede. A

primeira variação da retropropagação a se tornar popular foi o gradiente decrescente

com momento (equação 3-20). Nela, a última atualização de pesos é ponderada por

uma taxa de momentoµ, evitando mudanças bruscas na direção.

∆w(t) = −η∂E∂w

(t) + µ∆w(t − 1) (3-20)

Outros métodos que utilizam derivadas de segunda ordem são muito eficientes

sob certas condições. Enquanto os métodos de primeira ordemutilizam uma apro-

ximação linear da superfície de erro, os métodos de segunda ordem utilizam uma

aproximação quadrática. O algortimo de Newton é o mais conhecido para a minimi-

zação de funções, sua adaptação para atualizar os pesos é apresentada na equação

3-21.∆w(t) = −ηH−1∂E

∂w(t) (3-21)

ondeH é a matriz Hessiana. Como calcular a inversa da matriz Hessiana é custoso,

são utilizados métodos, conhecidos como Quasi-Newton, queaproximam esse va-

lor. Os dois métodos Quasi-Newton mais difundidos são o algoritmo de Davidon-

Fletcher-Powell (DFP) e Broyden-Fletcher-Goldfarb-Shanno (BFGS), sendo o se-

gundo mais recomendado (Reed, 1998).

O método de Levenberg-Marquadt (LM) varia entre o método do gradiente

decrescente e o de Newton. Esse método tira proveito da rápida convergência do

método de Newton quando próximo de um mínimo, evitando que esse divirja pela

utilização do gradiente. A direção de busca é uma combinaçãolinear da direção do

gradiente decrescenteg e do método de newton (H−1g), como segue:

∆w = −(H + λI )−1g (3-22)

onde, I é a matriz identidade e o parâmetroλ controla o compromisso entre o

gradiente e o método de Newton. O algoritmo começa com o valorde λ grande,

fazendo com que o a equação tenda ao gradiente, esse valor é decrementado a cada

iteração, tendendo ao método de Newton para a convergência final.

A Regularização Bayesiana (RB) minimiza uma combinação linear entre o

SSE e a magnitude dos pesos. Ela também modifica essa combinação linear a

fim de atingir uma boa qualidade de generalização da rede (Mackay, 1992). Essa

combinação linear é então utilizada como a função de custo noalgoritmo LM.

Validação

O treinamento de redes neurais pode causar um super treinamento (overfit-

ting). Esse termo é utilizado quando a rede se torna capaz de prever apenas o con-

junto de dados utilizados no treinamento, perdendo sua capacidade de prever dados

nunca apresentados para a rede (generalização). Para evitar esse super treinamento,

utiliza-se um conjunto de validação. Esse conjunto de padrões é propagado pela

rede a cada iteração do algoritmo de minimização. O valor do erro desse conjunto é

então monitorado, sendo que seu aumento indica que a rede está se tornando muito

especializada. Então, a rede que deve ser escolhida é aquelaem que o erro do con-

junto de validação é o menor, como ilustrado na figura 3.9, onde os círculos ()representam os dados de treinamento e as cruzes (+) os de validação.

Figura 3.9: Validação cruzada. Ilustração de dois momentosdistintos do treina-mento: generalização da rede (a) e supertreinamento (b).

Inicialização dos pesos

O valor final do treinamento de uma rede depende do ponto inicial, isto é, sua

configuração inicial de pesos. Isso devido aos algoritmos deminimização utilizados

dependerem desse ponto. Um exemplo desse problema pode ser visto na figura 3.10,

onde as curvas de nível representam a superfície do erro em função de duas variáveis

(pesos). Nessa figura, os dois círculos menores representamduas configurações de

pesos distintas, e a cada iteração do algoritmo de minimização, um novo ponto

() é obtido. Nota-se que em cada inicialização o ponto de mínimo encontrado é

distinto, isso porque a função de erro possui diversos mínimos locais. Para evitar

esse acontecimento, um experimento deve ser feito com diversas configurações

iniciais de peso, a fim de descobrir qual é a melhor rede.

Figura 3.10: Dependência entre o ponto inicial e o erro final obtido.

4Inferência e Otimização de Nanoestruturas

4.1Introdução

Conforme apresentado no capítulo 2, os pesquisadores participantes do

Workshop NanoFrontiers, em fevereiro de 2006, discutiram o desenvolvimento de

um grande banco de dados para o armazenamento das informações relativas à Nano-

ciência e Nanotecnologia (Schmidt, 2007). Este banco de dados seria acompanhado

por ferramentas matemáticas e computacionais capazes de manipular os dados, for-

necendo as respostas desejadas pelos especialistas. Todo este conjunto foi chamado

de “nanoinformática”.

O objetivo da nanoinformática é proporcionar aos pesquisadores a possibili-

dade de encontrar e usar dados relevantes às suas pesquisas científicas. Para ilustrar

está ideia, pode-se imaginar o seguinte exemplo fictício:

Imagine que um pesquisador pretenda crescer uma determinada estrutura

semicondutora para ser usada, por exemplo, em um novo sensor. O pesquisador

em questão possui todos os equipamentos necessários e tem uma vaga ideia de

como construir o dispositivo. Logo, o primeiro passo da pesquisa é procurar as

referências bibliográficas distribuídas em diversos artigos de revistas publicadas em

vários países. O pesquisador lerá uma grande parte destes artigos, colhendo algumas

informações. Aliando os dados obtidos nos artigos e o conhecimento e a experiência

do pesquisador, este decide quais parâmetros usar na síntese da nanoestrutura.

A nanoinformática visa proporcionar uma dinâmica maior na obtenção dos

dados usados neste tipo de pesquisa, evitando uma busca longa e, muitas vezes,

ineficiente dos dados desejados.

Contudo, mesmo que o pesquisador obtenha os dados desejados de maneira

rápida e eficiente, ele escolherá um conjunto de dados a ser usado na síntese dos

nanodispositivos através de uma heurística de “tentativa eerro”, baseada nos seus

conhecimentos e nos dados existentes na literatura. Esta alternativa quase sempre

produz bons resultados, mas não necessariamente os melhores.

O objetivo deste capítulo é descrever a utilização de algumas das técnicas de

Inteligência Computacional para o desenvolvimento de ferramentas capazes de re-

Capítulo 4. Inferência e Otimização de Nanoestruturas 59

solver o problema descrito acima. O primeiro objetivo é criar um sistema de inferên-

cia, capaz de prever as características da nanoestrutura sintetizada com relação aos

parâmetros usados na síntese. Este sistema permite que o pesquisador possa inves-

tigar como determinados parâmetros influenciam no crescimento da nanoestrutura

sem, necessariamente, realizar o experimento. Isto permite uma economia de tempo

e de recursos. O segundo objetivo é usar um sistema de otimização, juntamente com

o sistema de inferência mencionado, para encontrar o conjunto de parâmetros ideais

para a síntese da nanoestrutura desejada.

A seguir, os experimentos realizados serão descritos e discutidos.

4.2Pontos Quânticos - PQ

A síntese de poços quânticos no início da década de 70 pode serdefinida

como o ponto de partida para o estudo das nanoestruturas semicondutoras. Um

poço quântico é uma camada muito fina de semicondutor entre duas outras camadas

semicondutoras com “gap” de energia maior. A movimentação de elétrons em um

poço quântico só é permitida em duas dimensões quando a largura do poço é da

ordem do comprimento de onda da carga elétrica (Steiner, 2004).

Na década de 80, o foco das pesquisas em semicondutores se concentrou em

estruturas com dimensionalidade ainda mais reduzida: confinamento em uma di-

mensão (fios quânticos) (Petroff, 1982) e confinamento em zero dimensões (pontos

quânticos). Diferentemente dos poços quânticos e fios quânticos, os níveis de ener-

gia dos pontos quânticos são discretos. A figura 4.1 mostra asdensidades de estados

nos materiais semicondutores. De cima para baixo:bulk, poço quântico, fio quântico

e ponto quântico.

Dispositivos baseados em pontos quânticos têm mostrado um grande poten-

cial para superar os dispositivos utilizando poços quânticos no desenvolvimento de

fotodetectores de infravermelho baseados em transições ópticas entre bandas, de-

vido ao confinamento nas três dimensões que gera uma maior discretização dos

níveis de energia (Bimberg, 1999) (Ryzhii, 2004). Além disso,os pontos quânticos

propiciam a criação de lasers com propriedades diferenciadas (Steiner, 2004).

Diversas metodologias já foram usadas para criar estruturas com PQs. A cri-

ação de uma máscara posteriormente gravada na estrutura semicondutora foi um

dos primeiros métodos implementados (Reed, 1986). Os principais problemas deste

método são a baixa resolução lateral e os defeitos criados. Outra possibilidade, tam-

bém envolvendo o uso de máscaras, permite que a nucleação só ocorra em determi-

nadas posições, resultando em pirâmides tetraédricas ou hexagonais (Fukui, 1991)

(Tachibana, 2000) .

Provavelmente, os métodos mais usados para a formação de nanoestruturas

Figura 4.1: Densidade de estado nos materiais semicondutores. De cima para baixo:materialbulk, poço quântico, fio quântico e ponto quântico.

são aqueles que tiram proveito do fenômeno de auto-organização em superfícies

cristalinas. O relaxamento da tensão provocada na interface entre diferentes materi-

ais permite a formação dos pontos quânticos.

MBE e MOCVD são duas técnicas comumente usadas para o crescimento

de vetores uniformes de PQs em três dimensões (Steiner, 2004). Tanto os sistemas

com parâmetros de rede casados quanto aqueles descasados são usados para a

formação das nanoestruturas. No caso de sistemas com parâmetros de rede casados,

o crescimento é determinado pela relação entre as energias de duas superfícies

e a energia da interface entre elas (Grundmann, 2002). Se a soma da energia da

superfície da camada epitaxial (γ f ) com a energia da interface (γi) é menor que a

energia da superfície do substrato (γs), ou seja,γ f +γi < γs, o crescimento ocorre no

modo Frank-van der Merwe, mostrado na figura 4.2(a). Alterando o valor da soma

γ f + γi, resulta em uma transição da forma de crescimento para o modoVolmer-

Weber, onde ilhas 3D são formadas, como na figura 4.2(b).

No caso de parâmetros de rede descasados, tal como heteroestruturas

GaAs/InAs, somente as primeiras poucas monocamadas depositadasformam ca-

madas tensionadas com o parâmetro de rede igual àquele do substrato. Quando a

espessura crítica é excedida, a tensão no topo da camada permite a formação espon-

tânea de ilhas 3D aleatoriamente distribuídas. A fase de transição entre a estrutura

epitaxial e o arranjo aleatório de ilhas é chamada de transição Stranski-Krastanov

(Steiner, 2004). Este processo é mostrado na figura 4.2(c). Já a figura 4.3 mostra a

imagem real de um ponto quântico.

Figura 4.2: Esquemático de três formas de crescimento: Frank-van der Merwe (a),Volmer-Weber (b), Stranski-Krastanov (c).

Figura 4.3: Imagem de um ponto quântico. Créditos Maurício Pamplona

As amostras usadas neste trabalho contêm uma camada de pontos quânticos

de InAs automontados e aleatoriamente distribuídos. Tais PQs foram depositados

por técnicametalorganic vapor phase epitaxy(MOVPE) a 100 mbar no topo de

InP, InGaAs ou InGaAlAs, onde todas as ligas possuem parâmetros de rede seme-

lhantes ao substrato de InP. Tais estruturas foram sintetizadas para serem usadas no

desenvolvimento de fotodetectores de infravermelho (Souza, 2007). Normalmente,

os pontos quânticos para este tipo de aplicação são crescidos sobre substratos de

GaAs, devido aos custos reduzidos. Porém, o crescimento sobre um substrato de InP

permite uma integração com dispositivos óticos de alta velocidade (Souza, 2007).

A altura média e densidade dos pontos quânticos foram determinadas por um mi-

croscópio de força atômica (AFM). Difração de raios-X e fotoluminescência foram

usadas para determinar a composição das ligas.

A seguir, a inferência e a otimização dos pontos quânticos crescidos por

MOVPE serão discutidas.

Inferência

O controle do crescimento dos pontos quânticos é fundamental para o má-

ximo desempenho dos dispositivos baseados nestas nanoestruturas. O crescimento

de pontos quânticos com altura e dispersão bem definidas é essencial. A altura

dos pontos quânticos determina a diferença de energia entreos níveis permitidos

e, consequentemente, o comprimento de onda de emissão ou detecção. Também é

importante que todos os pontos quânticos crescidos no substrato tenham aproxima-

damente a mesma altura, limitando o comprimento de onda a um valor próximo do

desejado. No caso de fotodetectores, quanto maior a densidade dos pontos quânti-

cos melhor o funcionamento dos dispositivos, desde que os pontos tenham a altura

desejada. Porém, a escolha do conjunto de parâmetros ideaispara o crescimento dos

pontos quânticos desejados é um dos grandes obstáculos enfrentados pelos pesqui-

sadores.

A alternativa do uso de um método de “tentativa e erro” demanda uma quan-

tidade significativa de tempo e recursos. Logo, o desenvolvimento de um sistema

de inferência é extremamente valioso, diminuindo o número de experimentos e,

consequentemente, o custo de fabricação.

O uso de Redes Neurais Artificiais já foi proposto para melhorar o desempe-

nho do crescimento epitaxial, porém os autores não publicaram nenhum resultado

(Bland, 2002).

Neste trabalho uma Rede Neural Artificial do tipoMultiLayer Perceptron

(MLP) foi utilizada para inferir o resultado do crescimentode pontos quânticos.

Foram usados dados de dezenas de experimentos realizados nolaboratório de

semicondutores (LABSEM) da PUC-Rio. A tabela com os valores dosexperimentos

são mostrados no anexo B.

Os seis parâmetros de entrada, relacionados ao crescimentoem cada experi-

mento, usados como entradas pela Rede Neural são: o fluxo de índio no reator, a

temperatura de crescimento, o tempo de deposição, a espessura da camada sobre a

qual os PQs são crescidos e as concentrações de índio e alumínio na camada citada.

Os experimentos considerados usaram três materiais diferentes para a camada da

base (InP, InGaAs, InAlGaAs). Como saídas obtêm-se a altura média dos pontos

quânticos, o desvio padrão da altura e a densidade dos pontosquânticos. Obvia-

mente, outros parâmetros também são importantes para o crescimento dos pontos

quânticos, tais como a pressão e o tempo de aquecimento. Porém, na base de da-

dos utilizada, estes parâmetros são constantes, sendo desnecessário usá-los como

entrada para a rede neural.

Ao total três Redes Neurais diferentes foram criadas:

1. Rede para inferir altura média dos pontos quânticos, contendo 67 dados;

2. Rede para inferir a densidade dos pontos quânticos, contendo 61 dados;

3. Rede para inferir o desvio padrão da altura dos pontos quânticos, contendo

58 dados;

Para o caso 1 foi criada uma rede Perceptron de Múltiplas Camadas (MLP)

(Haykin, 1999) e os resultados são discutidos a seguir: estaRede Neural utilizou

os seis parâmetros de entrada previamente citados e contém três camadas distintas

(entrada, escondida e saída). Todos os parâmetros de entrada foram normalizados

de 0,1 a 0,9. A rede foi treinada com diferentes quantidades de neurônios na

camada escondida. Porém, a melhor configuração possui seis neurônios na camada

de entrada, a camada escondida possui onze neurônios e, finalmente, a camada de

saída possui apenas um neurônio. A arquitetura da rede é mostrada na figura 4.4.

Figura 4.4: Arquitetura da Rede Neural para inferir a altura média dos pontosquânticos.

Para avaliar a rede neural criada foi utilizado o erro médio absoluto percentual

(MAPE). Esta medida define o quanto os dados inferidos se aproximam dos dados

reais. Por exemplo, um MAPE igual a 5 corresponde a um erro de 5% na inferência

obtida pela rede. A fórmula do MAPE é apresentada na equação 4-1

∑nt=1

∣(st − s′t)/st

n(4-1)

onde,st é o valor desejado,s′t é o valor obtido pelo modelo en é o número de

elementos.

A figura 4.5 mostra a comparação entre os dados previstos pelaRede Neural

e os valores obtidos pela imagem fornecida por um AFM. Os valores previstos

pela rede neural estão destacados em vermelho e estão bem próximos aos dados

experimentais. Os dados usados para treinamento e validação da rede estão na

região branca. Os valores na região cinza foram usados para testar a rede após

o treinamento. Estes últimos valores não foram apresentados à rede durante o

treinamento ou validação. O erro médio percentual obtido pelo conjunto de teste

foi de apenas 8,3%, o que pode ser considerado um resultado excepcional devido

ao conjunto reduzido de dados usados para o treinamento da rede neural.

Figura 4.5: Comparação entre as medidas feitas por um AFM e as previsões obtidaspela RNA.

Devido à capacidade de generalização da Rede Neural, após a criação a sua

criação, esta pode ser usada para investigar a influência dosparâmetros de entrada

no crescimento dos pontos quânticos. Isto pode ser obtido variando dois parâmetros

de entrada e fixando os outros quatro. A figura 4.6 mostra a variação da altura média

dos pontos quânticos em razão do tempo de deposição e composição de alumínio.

Os demais parâmetros foram fixados com os valores apresentados na tabela 4.1.

Parâmetro ValorFluxo de In 60 sccm

Espessura da Base 500 nmTemperatura de Crescimento500oC

Composição de In 52,3%

Tabela 4.1: Valores fixados para gerar a figura 4.6.

Observe na figura 4.6 que quando a concentração de Al aumenta até 13%, há

uma clara tendência na redução da altura média dos PQs. A partir deste patamar,

a altura cresce continuamente. Este comportamento já foi observado experimen-

talmente e a altura mínima foi obtida quando a concentração de Al atingiu 16%

Figura 4.6: Variação da altura média dos pontos quânticos com relação ao tempo dedeposição e à composição de alumínio.

em uma liga de InGaAlAs crescida em InP (Borgstrom, 2003). Na mesma figura,

pode-se observar que a altura média dos pontos quânticos aumenta com o tempo

de deposição. Isto é esperado, já que o PQ tem mais tempo para crescer. A com-

paração com os resultados experimentais já publicados confirmam que os valores

obtidos neste trabalho são excelentes, mesmo usando um conjunto pequeno de da-

dos experimentais.

Para o caso 2, ou seja, a inferência da densidade dos pontos quânticos, também

foi criada uma rede MLP. Após a limpeza dos dados (eliminaçãode “outliers”,

tratamento de dados duplicados, eliminação de dados incompletos, etc.) foram

utilizadas as informações de 61 experimentos diferentes. Arede criada utilizou as

mesmas 6 informações de entrada. Contudo, devido à pouca quantidade de dados

diferentes, as entradas relacionadas ao fluxo de índio e espessura da camada foram

classificadas em 3 e 4 categorias diferentes, respectivamente. Os demais dados de

entrada continuam sendo normalizados entre 0,1 e 0,9. Diferentemente da rede

obtida no caso 1, a melhor rede encontrada para a inferência da densidade dos

pontos quânticos possui treze neurônios na camada escondida.

A figura 4.7 apresenta o resultado da inferência da densidadedos pontos

quânticos. Os dois primeiros gráficos são referentes aos conjuntos de treinamento e

validação, respectivamente. O último gráfico apresenta o resultado do conjunto de

teste, ou seja, o conjunto de dados que não foi apresentado à rede neural durante

a sua criação. Observe que o MAPE resultante foi de 21,47%. Claramente, o valor

obtido é bastante superior ao apresentado pela rede responsável pela inferência da

altura dos pontos quânticos. As principais razões para esteaumento significativo do

erro são: a redução do número de dados disponíveis e a características dos dados

experimentais.

Figura 4.7: Resultado da inferência da densidade de pontos quânticos. De cima parabaixo: conjuntos de treinamento, validação e teste.

Apesar do aumento do erro de previsão, o resultado obtido é satisfatório e

pode ser usado pelos especialistas na previsão da densidadedos pontos quânticos.

Outro dado importante apresentado no gráfico diz respeito aovalor da correlação

entre os dados experimentais e os dados previstos. Este dadomede o quão bem a

variação dos dados de saída é explicada pela Rede Neural, ou seja, a tendência de

aumento ou diminuição da densidade dos pontos quânticos. Valores de correlação

acima de 0,9 indicam uma boa concordância entre os dados experimentais e previs-

tos. Na figura 4.7 pode-se observar uma correlação de 0,94 para os dados de teste

e a figura mostra claramente que a rede neural é capaz de prevercom sucesso a

tendência na variação da densidade.

Finalmente, o caso 3 trata da inferência do desvio na altura dos pontos

quânticos. Esta rede possui uma configuração bastante semelhante à rede do caso 2.

Porém, possui apenas oito neurônios na camada escondida e 58dados experimentais

foram utilizados. O resultado da inferência pode ser observado na figura 4.8.

O MAPE do conjunto de teste da melhor rede encontrada é de 17,24% e a

correlação é igual a 0,9. Estes valores indicam que a rede neural criada é eficiente

para prever o comportamento do desvio de altura dos pontos quânticos.

Os resultados acima apresentam três redes neurais diferentes para inferir

diferentes propriedades da síntese de pontos quânticos. Todos os três resultados

são satisfatórios, porém a rede neural para a inferência da altura obteve os melhores

resultados. Apesar das outras duas redes apresentarem resultados inferiores, estes

Figura 4.8: Resultado da inferência do desvio da altura dos pontos quânticos. Decima para baixo: conjuntos de treinamento, validação e teste.

ainda podem ser considerados valiosos, auxiliando os especialistas na síntese de

novas nanoestruturas.

4.2.2Otimização

Após a criação, validação e teste da Rede Neural do caso 1, um Algoritmo

Genético (AG) é usado para encontrar o conjunto de parâmetros de entrada que

minimizam a altura média dos PQs. Neste caso, a RNA funciona como um simula-

dor e avalia os conjuntos de parâmetros gerados pelo AG. A figura 4.9 ilustra este

procedimento.

O cromossomo utilizado possui seis genes (um para cada parâmetro) e cada

um deles pode assumir valores entre 0,1 e 0,9, devido à normalização dos parâme-

tros para o treinamento da RNA. O critério de parada do AG foi atingir um total de

500 gerações, porém o algoritmo convergiu com 200 gerações.A figura 4.10 mostra

a curva de evolução do AG. A melhor configuração encontrada foi uma liga de In-

GaAlAs, cuja altura média dos PQs prevista foi de 4,5nm. O conjunto de parâmetros

ótimo que levou a tal resultado é mostrado na tabela 4.2.

4.3Nanocompósitos

Os materiais estruturados podem ser divididos em quatro categorias diferen-

tes: metais, polímeros, cerâmicos e compósitos (Gibson, 1994). Um compósito é

Figura 4.9: Procedimento de otimização dos parâmetros parasíntese de pontosquânticos.

01 27 53 79 105 131 157 183 209 235 261 287 313 339 365 391 417 443 469 495

Ciclos

Figura 4.10: Curva da evolução da otimização dos PQ.

Parâmetro ValorFluxo de In 60 sccm

Espessura da Base 1,5 nmTemperatura de Crescimento519,8oC

Tempo de deposição 2,4 sComposição de In 53,44%Composição de Al 21,79%

Tabela 4.2: Conjunto ótimo de parâmetros encontrado pelo AG.

composto de dois ou mais materiais individuais das outras três categorias. O obje-

tivo da formação de um compósito é obter uma combinação de propriedades que

não podem ser encontradas em nenhum material isoladamente,além de aproveitar

as melhores características dos materiais componentes. Alguns materiais que ocor-

rem naturalmente também são considerados compósitos, dentre eles podemos citar

a madeira e o osso (Callister, 1993).

Um material compósito, tal como será considerado neste trabalho, é um

material de múltiplas fases que é criado artificialmente e não ocorre naturalmente.

Além disso, as fases constituintes devem ser quimicamente dissimilares e separadas

por uma interface distinta. Logo, as ligas metálicas e os materiais cerâmicos

não se encaixam nesta definição porque suas múltiplas fases são formadas como

consequência de fenômenos naturais.

Ao projetar um material compósito, cientistas e engenheiros tem engenho-

samente combinado vários metais, cerâmicos e polímeros para produzir uma nova

geração de materiais extraordinários. Os compósitos têm sido criados para melhorar

a combinação de características mecânicas, tais como força, dureza e flexibilidade,

além de outras propriedades.

Muitos dos materiais poliméricos são formados por apenas duas fases. A pri-

meira é chamada de matriz, que é contínua e contorna a segundafase, frequen-

temente chamada de fase dispersa ou carga. As propriedades dos compósitos são

obtidas em função das propriedades dos materiais constituintes e suas concentra-

ções.

Um dos compósitos mais comuns é a fibra de vidro, onde fibras de vidro

puras e pequenas são misturadas a um material polimérico (normalmente um epóxi

ou poliéster). A fibra de vidro pura é relativamente forte e dura, mas quebradiça. Já

o polímero é dúctil, mas fraco e flexível. A fibra de vidro resultante da mistura dos

materiais é dura, forte, flexível e dúctil. Além disso, possui baixa densidade.

Outro material tecnologicamente importante é a fibra de carbono misturada

com polímero (CFRP). Este material é mais duro e forte que a fibrade vidro, porém

é mais caro. Os compósitos CFRP são usados em aviões, foguetes,carros, etc.

Quando a carga usada para a formação do compósito é constituída por par-

tículas na escala nanométrica, o material é conhecido como nanocompósito. Neste

caso, a porcentagem por massa da carga que deve ser inserido para a formação do

compósito é muito menor que a porcentagem necessária quandoutilizadas partí-

culas normais, em escala maior. Isto se deve, principalmente, a grande superfície

de área obtida pelas nanopartículas, como foi discutido no capítulo 2. Além disso,

as nanopartículas podem propiciar a formação de materiais com propriedades di-

ferenciadas. A adição de nanotubos em uma matriz polimérica, por exemplo, pode

aumentar significativamente a condutividade térmica e elétrica do material.

Em termos taxonômicos os nanocompósitos mantêm a mesma lógica de clas-

sificação dos compósitos tradicionais, podendo ser: esféricos, baculiformes ou la-

melares, tendo como exemplo a sílica, o nanotubo de carbono ea montemorilonita,

respectivamente.

Modelos numéricos e analíticos são ferramentas essenciaispara estudar o con-

trole de parâmetros responsáveis pelas propriedades de compósitos e nanocompó-

sitos. Muitos modelos existentes mostram que o módulo das partículas, a razão de

aspecto e a fração volumétrica são fatores que influenciam aspropriedades mecâni-

cas de compósitos e nanocompósitos (Fornes, 2003, Wang, 2004a, Wang, 2004b).

Porém, apesar dos vários trabalhos sobre as propriedades dos nanocompósitos, o

entendimento da relação entre o comportamento macroscópico e as propriedades

das nanoestruturas é uma questão ainda indefinida. Atualmente, diversos modelos

analíticos são baseados na regra de misturas (Pal, 2008). Tais modelos funcionam

para algumas combinações específicas de matrizes e cargas, mas não funcionam

corretamente quando a concentração de carga aumenta. Além disso, sabe-se que a

relação entre o volume de carga e as propriedades mecânicas de um nanocompósito

tem um comportamento não-linear.

A seguir a inferência e a otimização de nanocompósitos serãodescritas e

discutidas.

4.3.1Inferência

A inferência de nanocompósitos pode se feita de maneira semelhante ao já

descrito sobre a inferência de pontos quânticos. Neste caso, também foi usada uma

rede Perceptron de Múltiplas Camadas (MLP). O número de neurônios nas camadas

escondidas foi variado para obter a melhor configuração da rede. A melhor rede

apresenta 2 camadas escondidas, além das camadas de entradae saída. O número

de neurônios na primeira e segunda camadas escondidas é igual a oito e dois,

respectivamente. A figura 4.11 mostra a arquitetura da rede para este caso.

Os parâmetros de entrada utilizados para a inferência dos nanocompósitos

são: o tipo da matriz, o tipo da carga, a concentração em massada carga (%wt),

o diâmetro e a razão de aspecto da carga. Os dois primeiros parâmetros são quali-

tativos, enquanto os demais são quantitativos. Os parâmetros foram normalizados

conforme é mostrado na tabela 4.3. A concentração da carga e omódulo de Young

relativo foram normalizados de maneira diferente com o intuito de permitir uma

pequena extrapolação dos valores da base de dados.

Ao contrário do modelo sobre os pontos quânticos, cujos dados usados

foram obtidos de um único laboratório, os valores utilizados para a inferência

dos nanocompósitos foram obtidos de diversos trabalhos publicados na literatura.

Figura 4.11: Arquitetura da Rede Neural para inferir o módulode Young deNanocompósitos.

Propriedade NormalizaçãoClasse da Matriz [0, 1]Classe da Carga [0, 1]

Diâmetro da Carga [0, 1]Razão de Aspecto da Carga [0, 1]

Concentração da Carga [0, 0,9]Módulo de Young Relativo [0,1, 0,9]

Tabela 4.3: Normalização dos dados para a RNA.

Alguns dos parâmetros usados foram obtidos de gráficos e, consequentemente,

possuem um ruído associado. Tal ruído não é suficiente para levar a RNA a ter

um mau funcionamento. O apêndice B apresenta uma tabela com todos os dados

utilizados e suas respectivas origens.

A obtenção de dados na literatura não é uma tarefa trivial, devido às diferentes

abordagens nas diversas pesquisas. A propriedade escolhida para ser inferida neste

trabalho é o módulo de Young, por ser a mais encontrada na literatura. O módulo

de Young é um parâmetro mecânico que proporciona uma medida da rigidez de um

material sólido. O valor é obtido da razão entre a tensão exercida e a deformação

unitária do material, como mostrado na equação 4-2. A unidade de medida é o

Pascal.

E =Tensao

De f ormacao(4-2)

Os dados utilizados são muito heterogêneos, totalizando treze diferentes tipos

de matrizes e dezoito de cargas, conforme pode ser visto no apêndice B.

A figura 4.12 apresenta o resultado da melhor rede encontrada. O primeiro

gráfico corresponde ao conjunto de treinamento, o segundo aoconjunto de validação

e o terceiro ao conjunto de testes.

Figura 4.12: Comparação entre os valores da literatura e as previsões obtidas pelaRNA.

Os dados em vermelho são os previstos pela Rede Neural. É importante

ressaltar, mais uma vez, que o conjunto de teste não é apresentado à rede durante

a fase de treinamento. O MAPE obtido pelo conjunto de teste é de 3,93 % e a

correlação é igual a 0,999. Portanto, pode-se concluir que ocomportamento previsto

pela RNA é muito semelhante ao comportamento experimental. Além disso, os

últimos sete dados do conjunto de teste possuem uma combinação de matriz e carga

que nunca foi apresentada à rede. Contudo, a RNA criada foi capaz de inferir os

valores de uma combinação desconhecida com um erro muito pequeno. Isto permite

que os pesquisadores possam prever o comportamento de uma combinação de dois

materiais que ainda não foi realizado experimentalmente.

Finalmente, de posse de uma RNA bem treinada, pode-se ter ideia da variação

do módulo de Young relativo (E/Ec) em relação a qualquer parâmetro de entrada

usado na criação da rede. Por exemplo, a figura 4.13 apresentaa saída da rede para

uma combinação contendo poly(methyl methacrylate) (PMMA)com nanofibras

de carbono com razão de aspecto igual a 100. Neste caso, apenas o diâmetro e

a concentração da carga foram variados. A figura mostra que quanto menor a

partícula, menor a concentração de carga necessária para obter um alto valor do

módulo de Young relativo. Além disso, quando as partículas menores alcançam

altas concentrações o módulo de Young diminui. Isto pode serexplicado pela

agregação destas partículas, gerando partículas maiores e, portanto, agindo como

micro partículas e não mais como nanopartículas.

Figura 4.13: Inferância de um compósito de PMMA/CNF

A Rede Neural criada foi comparada a diferentes modelos apresentados na

literatura. Em (Pal, 2008), os autores usam quatro conjuntos diferentes de compó-

sitos para discutir seis modelos. Dois destes modelos são asregras de mistura de

Voigt e Reuss e os outros quatro modelos são descritos em função dos módulos

de cisalhamento e do material maciço dos compósitos. As figuras 4.14-4.17 apre-

sentam a comparação entre os seis modelos apresentados em (Pal, 2008) e a RNA

criada neste trabalho. Neste caso, o resultado da RNA é apresentado nas figuras

como modelo V.

Na figura 4.14, um nanocompósito de argila orgânica (bis(hydroxyl ethyl)-

(methyl)) com “nylon-6” (Fornes, 2003) é usado para comparar os modelos. Neste

caso, uma concentração muito baixa de carga (máximo de 3% de fração volumé-

trica) é usada. Como pode ser visto, neste intervalo de concentração a variabilidade

de dados é aproximadamente linear e o modelo III apresenta o melhor resultado.

A Figura 4.15 apresenta um compósito de montemorilonita comSBR (“Sty-

rene Butadiene Rubber”) (Zhang, 2004). Neste caso uma fração volumétrica maior

é considerada, apresentando um comportamento não linear. Claramente, a RNA é

superior aos outros 6 modelos apresentados por (Pal, 2008).

Figura 4.14: Comparação de Modelos para o compósito de argilaorgânica(bis(hydroxyl ethyl)-(methyl)) com “nylon-6”

Figura 4.15: Comparação de Modelos para o compósito de montemorilonita comSBR

Já nas figuras 4.16 e 4.17, compósitos de argila montemorilonita com matrizes

de NBR (“Nitrile Rubber”) (Zhang, 2004) e CNBR (“Carboxylated Acrylonitrile

Butadiene Rubber”) (Wu, 2004) são mostradas, respectivamente. Novamente, um

comportamento não linear é observado e a RNA é claramente superior aos outros

modelos apresentados por (Pal, 2008).

Figura 4.16: Comparação de Modelos para o compósito de montemorilonita comNBR

Os resultados descritos indicam que, em geral, a RNA é melhor que os mode-

los apresentados em (Pal, 2008) para inferir os resultados experimentais da variação

do módulo de Young. Os modelos em (Pal, 2008) apenas apresenta melhor resul-

tado para compósitos com baixa razão volumétrica de cargas.O pior desempenho

da RNA, neste caso, pode ter sido causado pela baixa quantidade de dados usados

em sua criação.

4.3.2Otimização

De posse da melhor RNA obtida, um AG foi usado para encontrar a melhor

configuração de modo a maximizar o módulo de Young relativo donanocompósito.

A tabela 4.4 apresenta o resultados da execução do AG.

No processo de evolução do AG, o melhor resultado utiliza a matriz EGlass-

PP juntamente com o nanotubo de carbono de parede dupla aminofuncionalizado.

O diâmetro obtido para essa partícula é próximo ao mínimo possível (2,52 nm).

A razão de aspecto da partícula obtida pelo AG é igual a 1065. Afração mássica

não foi a máxima possível (0,11), pois o seu aumento produz uma diminuição na

avaliação final do indivíduo.

Figura 4.17: Comparação de Modelos para o compósito de montemorilonita comCNBR

Parâmetro ValorMatriz EGlass-PPCarga nanotubo de carbono aminofuncionalizado

Fração mássica da Carga 0,11Diâmetro 2,62

Razão de Aspecto 1065Módulo Relativo 22,26

Tabela 4.4: Resultado obtido pelo AG para o melhor nanocompósito.

O resultado obtido propõe a criação de um novo nanocompósitos, já que a

combinação entre a matriz e a carga sugerida não existe no conjunto de dados

usado. Tal resultado deve ainda ser validado experimentalmente, mas já fornece

ao especialista uma boa sugestão de parâmetros para a criação de um bom material.

5Projeto Automático de Nanodispositivos

5.1Otimização de OLEDs Multicamadas

OLEDs (do inglês - Organic light emitting diodes) são constituídos por ma-

teriais orgânicos emissores de luz que, quando alimentadoscom corrente elétrica,

podem produzirdisplayscom alta qualidade. Um dos vários fatores que fazem dos

OLEDs um dispositivo superior à tecnologia LCD é o fato de que estes não re-

querem luz de fundo, permitindo assim operarem em regime de menor consumo

de potência, sem por isso perder qualidade de brilho e contraste. Além disso,

tais dispositivos mantém a clareza de visão praticamente sob qualquer ângulo.

Existem, porém, algumas desvantagens que têm limitado a eficiência de OLEDs.

Nas primeiras pesquisas, observou-se nos dispositivos mono-camadas que a mai-

oria dos portadores injetados a partir dos eletrodos difundiam-se para o eletrodo

oposto sem sofrer recombinação (Ma, 2002). Outra limitaçãotípica é a alta mobi-

lidade dos portadores de carga positiva quando comparados aos de carga negativa

(Ma, 2000, Werner, 2003). Isso é uma característica presente em materiais orgâni-

cos eletroluminescentes. Mais ainda, existe uma extensa barreira de energia criada

pela diferença entre a função trabalho do catodo metálico e omenor orbital mole-

cular ocupado (LUMO) (do inglês - Lowest Unocuppied Molecular Orbital) do se-

micondutor, inibindo a injeção de portadores de carga negativa. Essas desvantagens

resultam na formação da maioria dos pares elétron-buraco navizinhança do catodo,

suprimindo a emissão de luz (Malliaras, 1998, Koehler, 2000). Diversas metodolo-

gias foram propostas para evitar essas dificuldades, tais como estruturas multicama-

das alternadas, cada uma composta de moléculas portadoras de elétron ou buracos,

exclusivamente (Greenham, 1993). Outra proposta consisteem estruturas híbridas

com os materiais misturados em uma mesma camada única (Cao, 1999). Recente-

mente, uma nova e aprimorada proposta foi idealizada e pode ser considerada como

a combinação das duas técnicas anteriores. Nesse caso, um dispositivo multicamada

foi desenvolvido com uma concentração graduada na camada deemissão, apresen-

tando uma melhora na eficiência da eletroluminescência (Ma,2002).

Com base na última metodologia citada e em um trabalho prévio para mo-

Capítulo 5. Projeto Automático de Nanodispositivos 78

delar dispositivos monocamadas (Scott, 1997), os autores em (Gusso, 2004) apre-

sentaram um modelo analítico para otimizar o comportamentoelétrico na região

emissiva dos dispositivos OLED de multicamadas graduadas.O grande número de

possíveis configurações sugere que a busca empregando um algoritmo poderia ser

mais apropriada neste caso. O propósito desse trabalho é a utilização de algoritmos

evolucionários para encontrar as concentrações otimizadas para ETM e HTM em

cada camada graduada do dispositivo.

5.1.1O Modelo de OLED Multicamada

O modelo usado nesse trabalho foi apresentado em (Gusso, 2004) e é, de fato,

uma extensão do modelo proposto em (Scott, 1997). O modelo original foi desen-

volvido para descrever correntes bipolares em diodos orgânicos monocamadas. O

modelo estendido pretende descrever os dispositivos com multicamadas graduadas

através da aplicação do modelo original para cada monocamada. O modelo calcula

o valor da relaçãoV/J0,5, ondeV é a voltagem aplicada eJ é a densidade de cor-

rente do dispositivo. O modelo necessita também introduzircondições de contorno

em cada interface. Uma vez que a descrição dos modelos em suasformas analíticas

não fazem parte do objetivo dessa tese, esta não será aqui tratada em detalhe. Essa

seção focará na descrição de algumas considerações físicasfeitas em (Gusso, 2004).

Primeiramente, o modelo considera que a primeira e a última camadas são

compostas de puro ETM e HTM, respectivamente. Entretanto, estas duas cama-

das foram ignoradas nos cálculos e somente a região de camadas com concen-

tração graduadas é considerada, já que todas as recombinações elétron-buraco

vão ocorrer somente nessa área dos dispositivos. Nas regiões graduadas, a con-

centração de HTM, chamada der, aumenta da primeira para a última camada

(r = [HT M]/([ET M] + [HT M])). Com o intuito dos resultados teóricos serem

comparados com resultados experimentais, os seguintes valores para as mobilida-

des são usados (Gusso, 2004) (todos os valores emcm2/V.s) :

µn(Alq3) = 1x10−5; µp(Alq3) = 1x10−7

µn(NPB) = 1x10−7; µp(NPB) = 1x10−4

Neste caso,µn e µp são, respectivamente, a mobilidade de elétrons e buracos

do material puro indicado em parenteses. Entretanto, os valores da mobilidade

nas regiões graduadas (com mistura de materiais) não são facilmente obtidos. Na

literatura, os resultados para alguns materiais e métodos de mistura indicam que

µ ≈ r−n, onden pode assumir os valores: 0,8 ≤ n ≤ 2 (Gusso, 2004, Harima, 2000).

A espessura total da região graduada considerada neste trabalho é sempre

50nm, dividida igualmente por todas as camadas. De modo a comparar com os

resultados experimentais de (Ma, 2002), a espessura das camadas puras de ETM e

HTM são de 20nm e 30nm, respectivamente.

Nesse trabalho, o primeiro passo foi implementar o modelo proposto na

literatura de modo a validá-lo com as configurações calculadas em (Gusso, 2004).

A tabela 7.9 apresenta os valores obtidos em (Gusso, 2004) bem como os obtidos

nesse trabalho. As pequenas diferenças obtidas podem ser atribuídas à erros de

truncamento inerentes ao processo de solução numérica no método adotado.

n n’ Perfil de Concentração V/J0,5 V/J0,5 Diferença[Alq3]:[NPB] (Gusso, 2004) Este Trabalho %

1 1 10:1, 6:1, 1:1, 1:6, 1:10 22,8 23,18 1,672 2 2:1, 2:1, 1:1, 1:2, 1:2 18 17,97 0,17

1,5 1,5 3:1, 2:1, 1:1, 1:2, 1:3 20,3 21,51 5,961,5 2 3:1, 2:1, 1:1, 1:2, 1:3 19,3 20,25 4,921 2 7:2, 5:2, 3:2, 2:3, 1:2 20,9 21,89 4,73

Tabela 5.1: Validação do Modelo de concentração graduada. Os parâmetros n en’ são usadas para calcular a mobilidade na região graduada.O modelo calcula arelaçãoV/J0.5.

5.1.2A Otimização Evolucionária

Todos os dispositivos nesse trabalho foram otimizados por um Algoritmo

Genético (AG).

O objetivo do AG é minimizar o valor da razãoV/J0,5. Todos os dispositivos

otimizados nesse trabalho possuem cinco camadas internas,cada uma com 10nm de

espessura. A representação esquemática do dispositivo multi-camada é mostrado na

figura 5.1(a), com a região graduada representada em escala de cinza. Assim, uma

representação por AG foi desenvolvida para otimizar as concentrações de portadores

de elétrons e buracos em cada camada da região graduada. A figura 5.1(b) mostra a

representação esquemática do cromossomo usado na otimização dos dispositivos. O

primeiro gene, G1, do cromossomo representa a concentraçãode ETM na camada

L1. O segundo gene do cromossomo indica o quanto a concentração de ETM na

camada L2 é diminuída em relação a camada L1 e assim por diante. Cada gene no

cromossomo possui um domínio fixo.

Para evitar uma concentração de ETM perto de 100% na primeiracamada,

o valor máximo do primeiro gene foi fixado em 95. O limite inferior foi ajus-

tado para 50. Tais valores foram escolhidos em razão dos valores assumidos em

(Gusso, 2004). Para os outros genes, o domínio se encontra entre 0 e 40. A figura

5.2 mostra um exemplo de como um cromossomo é usado para criaruma solução

para o problema.

Figura 5.1: a)Representação esquemática de um dispositivo multicamada otimizado.A região graduada é representada em escala de cinza. b) A representação docromossomo.

Figura 5.2: Um exemplo de como criar uma solução para um cromossomo.

Uma vez que o domínio máximo para a primeira camada foi fixado em 95%,

o mesmo procedimento deve ser feito na última camada. Em outras palavras, a

concentração de ETM não pode ser inferior a 5%. De modo a respeitar esta restrição

e evitar soluções inválidas, o método GENOCOP, proposto por Michlewics, foi

aplicado (Michalewicz, 1996). Pode-se facilmente perceber que deseja-se otimizar

um problema com uma restrição linear da forma:

G1−G2−G3−G4−G5 ≥ 5 (5-1)

ondeGi é o valor do genei. O GENOCOP é um método aplicado juntamente com

o AG e fornece uma maneira de manipular restrições lineares.A ideia principal por

trás do método está na criação de operadores genéticos específicos, que garantem

manter todos os cromossomos dentro do espaço de soluções permitido.

Foram feitas otimizações para cinco combinações diferentes den e n′, de

modo a comparar com os resultados apresentados em (Gusso, 2004). Para cada

otimização foram usados os seguintes parâmetros:

– Número de gerações : 400;

– Tamanho da população : 150;

– GAP: 80%

– Taxa de cruzamento : [80% - 60%];

– Taxa de mutação uniforme : [5% - 10%];

– Taxa de mutação não uniforme : [8% - 30%];

O significado de cada parâmetro do AG pode ser facilmente encontrado em

(Michalewicz, 1996).

5.1.3Resultados e Discussões

Os resultados da otimização por AG são mostrados na Tabela 7.11. As concen-

trações otimizadas pelo AG minimizam a relaçãoV/J0,5 para todas as combinações

de n e n′, quando comparadas com os resultados apresentados em (Gusso, 2004).

Para a primeira e segunda configuração a melhora foi pequena,aproximadamente

1,5%. Entretanto, os perfis de concentração encontrados forambastante diferentes

daqueles apresentados em (Gusso, 2004), os quais são todos simétricos. Neste traba-

lho, somente para a primeira configuração otimizada pelo AG as concentrações são

praticamente simétricas. Para a segunda configuração, as duas primeiras camadas,

próxima do catodo, apresentaram concentração majoritáriade ETM, aproximada-

mente 70%, enquanto as outras três camadas apresentaram concentração majoritária

de HTM, aproximadamente 65%. Todas as outras configurações apresentaram com-

portamento similar à esta útima, com pequenas variações. A diferença é maior na

última configuração, onde a concentração de ETM nas duas primeiras camadas au-

menta para aproximadamente 80%. Para os últimos três casos,a melhoria na relação

V/J0,5 ficou em torno de 7%. Os experimentos também foram realizado usando-se

o Algoritmo Evolucionário com inspiração Quântica (AEIQ) eo Algoritmo de En-

xame de Partículas (PSO, do inglês - Particle Swarm Optimization). Em ambos os

casos os resultados foram semelhantes aos encontrados.

Contudo, quando um experimento é realizado, não é possível saber quais são

os valores reais den e n′. Por esse motivo, decidiu-se calcular a relaçãoV/J0,5 para

cada configuração den en′com todos os perfis de concentração, de modo a entender

n n’ Perfil de Concentração V/J0,5 V/J0,5 Melhoria[Alq3]:[NPB] anterior otimizado %

1 1 7,2:1, 7,2:1, 0,9:1, 0,1:1, 0,1:1 23,18 22,82 1,542 2 2,1:1, 2,1:1, 0,6:1, 0,6:1, 0,6:1 17,97 17,72 1,4

1,5 1,5 2,5:1, 2,5:1, 0,5:1, 0,4:1, 0,4:1 21,51 19,98 7,131,5 2 2,7:1, 2,7:1, 0,6:1, 0,6:1, 0,6:1 20,25 18,76 7,371 2 4:1, 4:1, 0,7;1, 0,6:1, 0,6:1 21,89 20,36 6,98

Tabela 5.2: Resultados da otimização por AG. Os valores da coluna “anterior” sereferem a (Gusso, 2004).

o comportamento e comparar qual o melhor modelo para uma combinação den en′

quaisquer.

A tabela 7.12 mostra o melhor perfil de concentração otimizado, juntamente

com os melhores perfis de concentração de (Gusso, 2004) e (Ma,2002). As concen-

trações em (Ma, 2002) foram usadas em um trabalho experimental. Pode ser visto

que a relaçãoV/J0,5 da melhor concentração otimizada nesse trabalho é aproxima-

damente 9,7% menor que a melhor relaçãoV/J0,5 da concentração experimental

obtida em (Ma, 2002).

n n’ Concentração[Alq3]:[NPB]

Otimizado (Gusso, 2004) (Ma, 2002)2,5:1, 2,5:1, 0,5:1, 0,4:1, 0,4:1 2:1, 2:1, 1:1, 1:2, 1:2 9:1, 7:1, 5:2, 1:1, 1:3

V/J0,5

1 1 23,33 23,97 24,862 2 17,91 17,98 20,65

1,5 1,5 19,98 20,36 22,321,5 2 18,91 19,13 21,271 2 20,68 21,13 22,50

Média 20,16 20,52 22,32

Tabela 5.3: Comparação entre melhor configuração otimizada por AG, melhorconfiguração de (Gusso, 2004) e melhor configuração de (Ma, 2002). Em negritoo melhor resultado para cada caso.

De modo a verificar a incerteza nos valores das mobilidades deHTM puro,

uma outra otimização foi realizada, considerandon en′iguais à 1,5 e oµn(NPB) =

5.10−8 cm2/V, tal como em (Gusso, 2004). O valor da relaçãoV/J0,5 calculada em

(Gusso, 2004) é igual à 23,50 com concentração ETM:HTM de [8 :1,4 : 1,2 :

1,1 : 1,1 : 1] . As concentrações otimizadas pelo AG fornecem um valorparaV/J0,5

igual à 22,76 e a concentração obtida é [6,4 : 16,4 : 15,4 : 10,86 : 10,86 : 1].

Nesse caso, a melhora foi de 5,9%.

Os resultados das simulações mostram que os dispositivos otimizados pelo

AG apresentam uma performance≈ 7% melhor que aqueles apresentados em

(Gusso, 2004). Com o objetivo de validar experimentalmente estes resultados, dois

dispositivos foram sintetizados no Laboratório de Dispositivos Orgânicos (LADOR)

do Inmetro. O primeiro dispositivos é aqueles otimizado pelo AG e mostrado na

tabela 7.12 e o segundo dispositivo é aquele da referência (Ma, 2002) e também

mostrado na tabela 7.12. Os resultados preliminares mostram que o dispositivo 1,

fabricado com parametros otimizados obtidos do modelo AG, tem um desempenho

muito melhor que o dispositivo 2, de (Ma, 2002). Os resultados das medidas são

mostrados na figura 7.11 que apresenta a eletroluminescência (EL) características

dos dois dispositivos.

Figura 5.3: Eficiência x Densidade de Corrente dos dispositivos 1 e 2

A eficiência de eletroluminescência máxima do dispositivo 1é em torno de

1.4 cd/A em 500mA/cm2 contra 0.14cd/A em 900mA/cm2 para o dispositivo

2. Embora o valor da eficiência do dispositivo 2 seja diferente daquele reportado

em (Ma, 2002), o ponto aqui não é seu valor absoluto, mas a comparação entre os

valores da configuração dos dois dispositivos graduados obtidos pelo mesmo arranjo

experimental.

Esta tese esta focada no resultados teóricos e os trabalhos experimentais não

serão discutidos a fundo. O apêndice D apresenta um resumo dos experimentos

realizados.

5.2Otimização de Circuitos de QCA Robustos

O grande avanço da indústria de eletrônica e computação nos últimos 60

anos é consequência da criação e miniaturização dos transistores. Porém, os dis-

positivos atuais estão próximos do limite físico de miniaturização devido aos di-

versos efeitos não encontrados em escalas maiores, tal comoa fuga de correntes

(VilelaNeto, 2007).

Uma possível alternativa aos atuais circuitos VLSI/CMOS é o paradigma in-

titulado Autômatos Celulares com Pontos Quânticos ( QCA - do inglês, Quantum-

Dots Cellular Automata) (Lent, 1994). A tecnologia QCA é formada por um con-

junto de células que, juntas e organizadas de uma forma determinada, são capazes

de realizar funções computacionais.

Uma das dificuldades que se encontra na construção de dispositivos basea-

dos em QCA é a ausência de metodologias que permitam um arranjoautomático e

eficiente das células nos circuitos. Tendo em vista a resolução deste problema, o tra-

balho realizado anteriormente, proposto pelo autor desta tese, apresenta um método

de construção de circuitos de QCA por Algoritmos Genéticos (VilelaNeto, 2007).

Porém, o trabalho anterior visou apenas sintetizar circuitos com a lógica

correta, além de conterem um número reduzido de células. Este trabalho visa

sintetizar dispositivos com o objetivo de serem mais resistentes às influências

externas e com isso menos suscetíveis às falhas. Levando isto em consideração,

utilizam-se Algoritmos Genéticos para descobrir a posiçãodas células que, além

de encontrar circuitos com a lógica correta e com poucas células, possam tornar os

sinais de saída o mais forte possível.

5.2.1Autômatos Celulares com Pontos Quânticos

A célula de um Autômato Celular com Pontos Quânticos é formadapor quatro

pontos, sendo que cada um destes representa um local onde a carga pode ou não

estar posicionada. Cada célula possui duas cargas livres quepodem tunelar para

quaisquer uns dos quatro pontos quânticos. As células são construídas de modo

que as cargas sejam proibidas de tunelar para o seu exterior,devido a uma grande

barreira de potencial. A figura 5.4 ilustra uma célula de QCA.

Figura 5.4: Uma célula de QCA. As cargas estão localizadas nospontos pretos.

Devido à interação Coulombiana, as cargas presentes em uma célula tendem

a se posicionar o mais distante possível umas das outras. Baseado nisto, percebe-se

que as cargas ocuparão pontos que se localizam em diagonais opostas, só sendo

possível obter dois estados estáveis na célula, conforme ilustrado na figura 5.5. Por

convenção, um deles representará o binário “0” e o outro o binário “1”.

Figura 5.5: Estados de polarização de uma célula de QCA.

A letra P na figura 5.5 indica a polarização da célula e corresponde à distri-

buição de probabilidade da localização das cargas em seu interior. Seu valor pode

variar no intervalo [-1,1]. Quanto mais próximo de um extremo este valor estiver,

mais sua configuração de carga se assemelha com a polarizaçãoilustrada na figura

Quando duas células são posicionadas próximas uma da outra,a polariza-

ção de uma interfere na polarização da outra. As células dispostas lado a lado

tendem a assumir polarizações semelhantes. Este comportamento pode ser visu-

alizado no gráfico da figura 5.6. A curva relaciona a polarização da célula 2, no

eixo horizontal, com a polarização da célula 1, no eixo vertical. Portanto, o po-

sicionamento das células em locais corretos leva à criação de circuitos lógicos

(Lent, 1994, VilelaNeto, 2006).

Figura 5.6: Interferência entre duas células de QCA lado a lado.

Circuitos de QCA possuem zonas declock, que tem por objetivo controlar

o fluxo de informação dentro do circuito. Este controle é realizado pela elevação

ou diminuição da barreira de potencial entre os pontos quânticos no interior das

células, de forma a permitir que as cargas tunelem ou não entre estes pontos.

O clock é dividido em quatro fases, a primeira delas é chamada deswitch.

Nesta fase a célula inicia despolarizada e a barreira de potencial no seu interior em

um nível baixo, sendo aumentada gradativamente de modo a permitir que as células

se polarizem de acordo com as polarizações de suas vizinhas.Quando a barreira

alcança o seu máximo passa-se para uma nova fase chamada dehold. Durante esta

fase, as cargas estão impossibilitadas de trocar suas posições dentro da célula, que

pode assim influenciar outras células sem ser modificada. Ao final desta fase, as

barreiras de potencial começam a diminuir gradativamente eas células começam a

se despolarizar, esta etapa é chamada derelease. Quando a barreira atinge seu menor

nível começa a fase chamadarelax, onde as células se mantêm despolarizadas e a

barreira no seu menor nível. O ciclo, então, recomeçará pelaetapa deswitch.

As células de um circuito de QCA podem ser divididas em zonasclock,

permitindo que um grupo de células possa realizar alguma operação que será então

usada como entrada por um outro grupo em uma zona declockdiferente.

Em circuitos eletrônicos não é incomum o cruzamento de sinais. Informações

processadas em determinados blocos podem servir para outros localizados fisica-

mente distantes. O transporte de informações não pode interferir no funcionamento

lógico do circuito. Na tecnologia QCA o transporte se torna muito crítico, devido

ao fato das células poderem interagir com toda sua vizinhança. Há atualmente duas

alternativas presentes na literatura para a implantação desta funcionalidade em cir-

cuitos QCA: célula rotacionadas e multicamadas. A primeira alternativa possibilita

a criação de circuitos em um plano, porém gera problemas de robustez ao circuito,

sendo mais suscetíveis a influências externas.

De forma a contornar este problema foi proposto a construçãode circuitos

com camadas de células sobrepostas, ou seja, multicamadas.Nesta técnica a infor-

mação é transportada por camadas superiores de forma que nãohá interferência

entre as camadas. Na figura 5.7 há um exemplo da utilização de multicamadas.

Figura 5.7: Circuito com multicamadas.

Há três camadas no circuito da figura 5.7 e deseja-se transportar a informação

da célula L1 até a célula L2. As duas células estão na camada mais inferior, chamada

de camada lógica, onde é realizada o processamento da informação. As demais

camadas no circuito servem unicamente para auxiliar no transporte da informação

de L1 até L2, sem que haja influência em outras células da camada lógica. Desta

forma é possível levar a informação de qualquer parte do circuito a outro local de

interesse sem prejudicar a funcionalidade do circuito ou diminuir a robustez. A

desvantagem que surge nesta técnica é o aumento da quantidade de células.

5.2.2Descrição do Problema

Conforme descrito na seção anterior, a representação dos bits “0” e “1” é feita

pelas polarizações das células em -1 e 1, respectivamente. Porém estes valores são

ideais, não sendo alcançados na realidade. Entretanto é importante que as células

de saída dos circuitos tenham as suas polarizações, quando atingirem um estado

estável, muito próximas dos valores absolutos -1 e 1. Quantomaior o módulo da

polarização da célula de saída maior a robustez do circuito,ou seja, menor será a

influência de fatores externos, tal como a temperatura.

O trabalho anterior desenvolveu uma metodologia para a síntese automática

de circuitos de QCA através de Algoritmos Genéticos. Além de encontrar circuitos

com a lógica desejada, a metodologia também minimiza a quantidade de células

nos circuitos. Porém, o trabalho não considerou a maximização da polarização da

célula de saída (VilelaNeto, 2007).

Neste trabalho é utilizada a metodologia de síntese automática de circuitos

de QCA proposta anteriormente, acrescida do objetivo de maximizar a polarização

da célula de saída. A figura 5.8 apresenta o diagrama do sistema de evolução de

circuitos de QCA. O módulo AG representa o Algoritmo Genético. Nele serão

realizadas as operações inerentes à evolução dos circuitos, conforme descrito em

(VilelaNeto, 2007).

Figura 5.8: A arquitetura do modelo de síntese automática.

Cada cromossomo, durante sua fase de avaliação, gerará um novo circuito

e, consequentemente, será simulado para que a partir dos resultados possa ser

feito o cálculo de sua aptidão. Os circuitos são simulados pelo QCADesigner

(Walus, 2004). De forma a permitir a comunicação entre o módulo AG e o simula-

dor, houve a necessidade da criação de um módulo, chamado de QCAInterface.

O QCAInterface é capaz de decodificar um cromossomo gerado pelo AG e

criar um arquivo de entrada para o simulador com a descrição do circuito. Este

módulo também é capaz de retirar amostras dos sinais geradospelo simulador e

organizá-las de forma que o AG possa calcular a aptidão. O módulo Simulador é

composto pela interfacebatchmodificada do QCADesigner, um simulador código-

aberto que permitiu adaptações segundo as necessidades do problema. Porém, o

núcleo responsável por toda a simulação permaneceu inalterado.

O simulador QCADesigner possui dois tipos de simulação,bistablee cohe-

rence vector. O primeiro é mais simples, porém tem menor custo computacional. O

segundo é mais preciso, mas com um grande custo computacional. Neste trabalho

utilizamos o métodobistable, devido ao grande número de simulações realizadas

pelo método de síntese evolucionária, sendo que após a evolução todos os circuitos

obtidos foram validados com o método de simulaçãocoherence vector.

Para que um circuito de QCA funcione com a lógica desejada é necessário

que todas as células sejam colocadas nas posições certas e alocadas às zonas de

clockscorretas. Tomando-se o cuidado de garantir as duas características citadas, a

interação coulombiana entre as células tratará as informações de entrada de forma

correta, gerando a saída desejada. Entretanto, o desenvolvimento de circuitos inova-

dores não é uma tarefa trivial, sendo necessário uma grande intuição e experiência

para criar circuitos corretos. Porém, mesmo que os circuitos tenham a lógica dese-

jada, o mesmo pode não ser o ideal, contendo muitas células e com uma robustez

pequena.

Neste trabalho os circuitos são evoluídos por meio de uma heurística coevo-

lutiva, com duas espécies distintas. Uma representa o posicionamento das células

dentro do circuito através de um cromossomo baseado em ordemcom restrição de

precedência e outra representa oclockde cada célula por um cromossomo binário.

Mais detalhes podem ser obtidos em (VilelaNeto, 2007).

A função de avaliação dos indivíduos é responsável por quantificar o quão

bom é o circuito representado por um determinado par de cromossomos. Esta, ao

contrário do trabalho anterior que só se preocupava com os níveis lógicos das células

de saída, levará em consideração o valor da polarização da célula de saída, de forma

a solucionar o problema de robustez. Para tal, em cada amostra do sinal de saída

aplica-se a equação 5-2, onde os parâmetros a e b são determinados de acordo com

o grau de polarização que se deseja obter. É através destes parâmetros que aumenta

ou diminuí-se a importância de um resultado estar mais pertoou longe do esperado.

Pn = a ∗ |On − Dn| + b (5-2)

ondePn representa o valor de aptidão da enésima amostra,On é a polarização obtida

da enésima amostra,Dn é a polarização desejada da enésima amostra ea e b são

constantes. Nota-se que o valor da constantea deve ser menor que zero para que os

resultados muito próximos do desejado obtenham altos valores de aptidão.

A aptidão de cada indivíduo é dada pela soma dos valores obtidos em cada

amostra, conforme a equação 5-3, sendo que para cada amostratodos os possíveis

valores lógicos são avaliados.

N(5-3)

ondeA é a aptidão do circuito,Pn é a aptidão obtida pela n-ésima amostra eN é o

número de amostras retiradas do sinal de saída.

Os parâmetros adotados em todos os experimentos deste trabalho foram a=

-0.5 e b= 1, escolhidos após alguns experimentos preliminares.

Um outro objetivo deste trabalho é sintetizar circuitos como menor número

de células possíveis, para isso é dado um bônus na avaliação dos circuitos que

apresentam todas suas saídas corretas, ou seja, possuem a lógica desejada. Este

bônus é dado pela equação 5-4 e varia com relação ao número de células no circuito.

Os parâmetros presentes nesta equação são determinados de forma empírica e são

dependentes de cada experimento.

B =cQ+ d (5-4)

ondeB é o valor do bônus,Q o número de células presente no circuito,c e d são

constantes determinadas empiricamente.

As células de entrada e saída de todos os circuitos evoluídossão determinadas

apriori com base em circuitos presentes na literatura.

5.2.3Resultados e Discussões

Experimento 1 - Multiplexador

Os parâmetros do AG deste experimento estão listados a seguir:

– Gerações= 300;

– Tamanho da população= 100;

– Taxa de crossover= [80%, 60%];

– Taxa de mutação= [10%, 30%];

– GAP= [60%, 20%];

– Experimentos= 8;

Os parâmetrosc e d da equação 5-4 foram definidos como 8,94 e -0,297,

respectivamente. A escolha desses valores foi determinadade forma que os circuitos

que possuíssem 15 células recebessem um bônus de 20% do valormáximo de

aptidão da equação 5-3. A escolha desses valores foi realizada de forma empírica,

determinando a pressão do bônus sobre os indivíduos.

A figura 5.9 exibe o circuito obtido neste trabalho e os circuitos propostos nos

demais trabalhos.

Figura 5.9: (A) Circuito sintetizado por especialista; (B) Circuito sintetizado em(VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho.

O dispositivo resultante contém 17 células enquanto um circuito sintetizado

por especialistas tem 21 células, sendo 20% ou quatro células menor. Esta é uma

redução significativa, supondo que o custo do circuito é diretamente proporcional a

quantidade de células. Em termos de polarização, o circuitoobtido pelo AG conse-

guiu superar ao presente na literatura por cerca de 1,47%. A diferença percentual

neste caso é baixa, mas deve-se ressaltar que ambos já estão com níveis muito altos

de polarização.

Em (VilelaNeto, 2007) conseguiu-se obter um circuito com três unidades de

células a menos que o circuito deste trabalho, mas a grande diferença está nos níveis

de polarização de saída. A do trabalho anterior é cerca de 28%inferior.

Experimento 2 - Porta OU de quatro entradas

O segundo circuito sintetizado foi uma porta OU de quatro entradas. Há

uma particularidade na lógica deste circuito, só existe umasaída com valor lógico

“0”, que ocorre justamente quando todas suas entradas também são “0”. Esta

peculiaridade dificulta a convergência do Algoritmo Genético, já que indivíduos

cujas saídas sejam o nível o lógico “1” para todas as possíveis combinações das

entradas terão o valor de aptidão muito próximo de um circuito que implemente a

lógica correta.

De forma a acelerar a convergência da técnica, é dado um peso maior ao acerto

da saída “0”, empiricamente foi escolhido um fator de 5.

– Gerações= 50;

– Tamanho da população= 100;

– Taxa de crossover= [90%, 80%];

– Taxa de mutação= [8%, 20%];

– GAP= [40%, 90%];

– Experimentos= 10;

Os demais parâmetros são os mesmo utilizados no experimento1.

A figura 5.10 apresenta o melhor circuito obtido, além dos outros circuitos

propostos na literatura.

Figura 5.10: (A) Circuito sintetizado por especialista; (B) Circuito sintetizado em(VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho.

Novamente o circuito evoluído teve uma quantidade de células inferior ao

de especialistas, dessa vez cerca de 17% ou três células e ambos com níveis de

polarização na saída praticamente idênticos, próximo de 100%. Com relação ao

trabalho anterior, o circuito obtido no presente trabalho émuito superior em termos

de robustez. O nível de polarização de saída é 31% superior, com um aumento

de apenas três unidades de células. Este aumento na confiabilidade talvez seja

determinante na viabilidade técnica do dispositivo, já quea polarização de 68,4%

do ideal obtida anteriormente pode ser muito baixa para que ocircuito tenha uma

boa imunidade a influências externas.

Neste trabalho procurou-se aprimorar a síntese automáticade circuitos basea-

dos em QCA desenvolvida anteriormente. A obtenção de dispositivos robustos é fa-

tor primordial no avanço da tecnologia QCA. Neste trabalho propôs-se uma técnica

que apresentou resultados superiores aos circuitos desenvolvidos por especialistas,

obtendo circuitos com menos células e nível de polarização de saída elevado.

A síntese evolucionária permite a exploração de diferentestipos de arranjos,

na maioria das vezes não convencionais ou intuitivos, permitindo que circuitos

alternativos sejam obtidos a partir de poucas informações fornecidas. Tal como

apresentado no trabalho anterior (VilelaNeto, 2007), os algoritmos evolucionários

são ferramentas poderosas para a síntese automática de circuitos de QCA. Este

trabalho demonstrou que estas ferramentas são eficientes nabusca por soluções

otimizadas, mesmo quando outros objetivos são levados em consideração. Neste

caso, a otimização da polarização da célula de saída.

6Otimização de Funções de Base

6.1Introdução

Historicamente, os cálculos quânticos para moléculas são realizados como

uma combinação linear de orbitais atômicos (LCAO - do inglês “Linear Combina-

tion of Atomic Orbitals”). Isto significa que os orbitais moleculares são formados

como uma combinação linear de orbitais atômicos:

cµiφµ (6-1)

ondeψi é o i-ésimo orbital molecular,cµi são os coeficientes da combinação linear,

φµ é oµ-ésimo orbital atômico en é o número de orbitais atômicos.

Resumidamente, orbitais atômicos são soluções da equação Hartree-Fock

para o átomo, ou seja, uma função de onda para um elétron no átomo. Posterior-

mente, o termo orbital atômico foi substituído por “funçõesde base” ou “contra-

ções”, quando apropriado. Os primeiros tipos de funções de base utilizados foram

os orbitais do tipo Slater (STO - do inglês, “Slater Type Orbital”) devido à suas

similaridades com os orbitais atômicos do átomo de hidrogênio. Os orbitais STO

são descritos pela equação 6-2 em razão das coordenadas esféricas:

φi (ζ,n, l,m, r, θ, φ) = Nrn−1e−ζrYlm (θ, φ) (6-2)

ondeN é uma constante de normalização,ζ é o expoente,r, θ eφ são as coordenadas

esféricas eYlm é a parte do momento angular. On, l e m são os números quânticos:

principal, momento angular e magnético, respectivamente.

Porém, funções deste tipo são computacionalmente muito caras para o cálculo

de integrais de dois elétrons. Por esta razão, os orbitais dotipo Gaussiana (GTO - do

inglês, “Gaussian Type Orbitals”) foram introduzidos. A forma das funções STO

pode ser aproximada por uma soma de funções GTO com diferentes expoentes

e coeficientes. Mesmo que se utilize 4 ou 5 funções GTO para representar uma

função STO, o cálculo das integrais de dois elétrons será muito mais rápido com

esta configuração do que usando a STO original. A GTO é expressa da seguinte

forma:

Capítulo 6. Otimização de Funções de Base 94

g (α, l,m,n, x, y, z) = Ne−αr2xlymzn (6-3)

ondeN é uma constante de normalização,α é o expoente,x, y e z são coordenadas

cartesianas.l, m e n não são números quânticos, mas sim expoentes integrais nas

coordenadas cartesianas.r2 = x2 + y2 + z2.

Alguns autores consideram impróprio chamar as funções gaussianas de orbi-

tais atômicos do tipo Gaussiana (GTO), já que elas não são realmente orbitais. Na

literatura recente, elas são frequentemente chamadas de primitivas gaussianas.

As primitivas gaussianas são normalmente obtidas a partir de cálculos quân-

ticos em átomos (ex.: “Hartree-Fock”). Frequentemente, os expoentes são variados

até a energia mínima do átomo ser obtida (Clementi, 1990). Em alguns casos, os

expoentes são otimizados individualmente. Em outros, os expoentes são relacio-

nados uns com os outros por alguma equação e os parâmetros desta equação são

otimizados (ex.: funções de base “even tempered” e “well-tempered”). As primi-

tivas derivadas destes cálculos descrevem átomos isoladose não podem descrever

com precisão as deformações dos orbitais atômicos devido à presença de outros

átomos na molécula. Funções de base para cálculos moleculares são normalmente

aumentadas com outras funções específicas.

Para cálculos moleculares, as primitivas gaussianas devemser contraídas, ou

seja, certa combinação linear destas funções vai ser usada com uma função de

base. O termo contração, neste caso, significa: uma combinação linear de primitivas

gaussianas para ser usada como função de base. Tal função de base terá seus

expoentes e coeficientes fixos e estas contrações são também chamadas de CGTO.

Para ilustrar esta situação, um exemplo da literatura será apresentado (Szabo, 1989).

Os expoentes e coeficientes da expansão gaussiana que minimizam a energia do

átomo de hidrogênio foram derivados por Huzinaga em 1965. Quatro gaussianas do

tipo s são usadas para representar o orbital 1s do hidrogênio da seguinte forma:

ψ1s = 0,50907N1e−0,123317r2

+ 0,47449N2e−0,453757r2

+ (6-4)

0,13424N3e−2,0130r2

+ 0,01906N4e−13,3615r2

ondeNi é uma constante de normalização para uma dada primitiva. No caso de

gaussianas do tipo s é igual(2α/π)3/4.

Estas primitivas são agrupadas em duas contrações. A primeira contração

contém apenas uma primitiva:

φ1 = N1e−0,123317r2

Já as outras três primitivas estão presentes na segunda contração:

φ2 = N[0,47449N2e−0,453757r2

+ 0,13424N3e−2,0130r2

+ 0,01906N4e−13,3615r2

] (6-6)

ondeN é uma constante de normalização para toda a contração.

Neste caso, 4 primitivas foram contraídas para 2 funções de base. Isto é

frequentemente denotado como uma contração (4s) → [2s]. Os coeficientes da

funçãoφ2 são então fixados em cálculos moleculares subsequentes.

Obviamente, os melhores resultados seriam obtidos se fossepermitido va-

riar todos os coeficientes da expansão gaussiana durante o cálculo molecular. Além

disso, o custo computacional para o cálculo de integrais em Hartree-Fock depende

da quarta potência do número de primitivas gaussianas. Porém, todos os passos

subsequentes dependem do número de funções de base, ou seja,o número de con-

trações. O espaço em disco necessário para armazenar os cálculos das integrais

também é proporcional ao número de funções de base. Portanto, se cada primitiva

corresponder a uma função de base o custo computacional aumenta consideravel-

mente.

Este trabalho visa à otimização dos expoentes das primitivas gaussianas,

logo os métodos de contração de funções de base não serão discutidos de maneira

aprofundada.

6.2Criando uma Função de Base

Não existe um método definitivo para gerar funções de base. Segundo Leach,

a construção de uma nova função de base é uma arte (Leach, 2001). Na verdade,

existem diversos métodos bem estabelecidos que resultaramem um grande número

de funções de base diferentes. Até porque, uma função de basepode ser muito boa

para determinadas propriedades e átomos, mas pode ser muitoruim para outros.

O desenvolvimento de uma função de base para cálculos moleculares é uma

tarefa que demanda muito tempo de processamento. O grande número de parâme-

tros (expoentes) a ser otimizado e a natureza não linear deste problema de otimi-

zação induz os pesquisadores a usarem as funções de base otimizadas para áto-

mos em moléculas e grandes sistemas (Gomes, 2006). Com o objetivo de resolver

o problema computacional, métodos alternativos foram desenvolvidos, eliminando

a necessidade de determinar todos os expoentes (Gomes, 2006) (Somorjai, 1968)

(Somorjai, 1969) (Bishop, 1970) (Mohallem, 1986).

A seguir algumas possibilidades de se criar funções de base serão mostradas

e os resultados obtidos neste trabalho serão discutidos.

Método da Coordenada Geradora Hartree-Fock - GCHF

O Método da Coordenada Geradora (MCG) foi introduzido por Griffin, Hill e

Wheeler nos anos 50 (Hill, 1953) (Griffin, 1957). Mohallem mostrou que a ver-

dadeira capacidade do método MCG é alcançada quando uma discretização é

aplicada com o propósito de se obter uma melhor integração numérica da equa-

ção GHW (Mohallem, 1986). O método MCG foi amplamente aplicado em fí-

sica nuclear (Wong, 1975) e posteriormente em sistemas atômicos e moleculares

(Lathouwers, 1978) (Chattopadhyayfs, 1981).

Em 1986, o método da coordenada geradora Hartree-Fock (GCHF)foi intro-

duzido como uma nova técnica para gerar funções de base do tipo gaussiana (GTF)

e do tipo Slater (STF). Este método tem se mostrado bastante eficiente na constru-

ção e adaptação de conjuntos de funções de base atômicas. O método GCHF já foi

usado com sucesso na geração de funções de bases gaussianas universais (UGBSs)

(Jorge, 1997) e funções de bases gaussianas adaptadas (AGBSs) (Jorge, 1999b) para

átomos leves e pesados.

No método GCHF, as funções de um elétron são escolhidas como uma

transformada integral (Mohallem, 1986), isto é:

ψi(1) =∫

φi(1,α) fi(α), i = 1, ...,n (6-7)

ondeφi são as funções geradoras (devem ser STF, GTF ou outro tipo de função),

fi são as funções de peso eα é a coordenada geradora. A existência das funções

peso é condição fundamental para o uso do MCG. A análise do comportamento das

funções peso pelo MCG permite ajustar os conjuntos de bases atômicas, de modo

a obter a melhor descrição dos elétrons. À exceção de alguns sistemas simples,

a expressão da função peso é desconhecida, o que inviabilizaa solução analítica

da transformada integral dada pela equação acima. O recurso, neste caso, é fazer

uma discretização numérica desta integral. A solução é realizada através da escolha

apropriada de um conjunto discreto de pontos no espaço da coordenada geradora,

representada por:

Ωk = Ωmin+ (k− 1)∆Ω, k = 1, ...,N (6-8)

onde o conjunto de discretização é definido pelos seguintes parâmetros: um valor

inicial (Ωmin), um incremento (∆Ω) e o número de primitivas usadas (N), para uma

dada simetria (s, p, d, ...). A busca da melhor representaçãoé obtida utilizando-se

a energia total do estado eletrônico fundamental como critério de minimização. As

coordenadas geradoras são obtidas pela seguinte função:

Ωk = lnαk/A, A > 1. (6-9)

Portanto, o método GCHF original usa apenas uma sequência aritmética de

pontos igualmente espaçados, como mostra a equação 6-8, para gerar as funções de

base (Mohallem, 1986). O conjunto de base gerado por este método é conhecido

como SOGBSs (do inglês,Single Optimized Gaussian Basis Set) (Jorge, 1999).

Com o intuito de aprimorar o método descrito anteriormente, foi proposto o

uso de duas ou três sequências aritméticas, gerando as funções de base DOGBSs

(double) e TOGBSs (triple), respectivamente (Jorge, 1999).

Nesta nova alternativa, as coordenadas geradoras são discretizadas, para cada

simetria s, p, d e f, em duas

Ωmin+ (k− 1)∆Ω, k = 1, ...,M

Ω1min+ (k− 1)∆Ω1, k = M + 1, ...,N

(6-10)

e três

Ωmin+ (k− 1)∆Ω, k = 1, ..., j

Ω1min+ (k− 1)∆Ω1, k = j + 1, ...,M

Ω2min+ (k− 1)∆Ω2, k = M + 1, ...,N

(6-11)

seqüências aritméticas independentes, respectivamente.

Observe que o número de parâmetros a ser otimizado para as equações 6-10 e

6-11 é, respectivamente, duas e três vezes maior do que o GCHF original. Também

é importante perceber que quando se utiliza estas duas últimas equações, os valores

deΩi não são mais igualmente espaçados.

6.4Expansão Polinomial

Uma alternativa para o procedimento de discretização apresentado an-

teriormente é o uso de expressões polinomiais para oΩk, proposto em

(Klobukowski, 1993) e (Klobukowski, 1994). A equação tem a seguinte forma:

pi,l(k− 1)i , j = 1, ....,Ml (6-12)

ondeN é igual a 4 eMl é o número de primitivas para a simetrial.

Se a equação 6-12 for truncada no segundo termo, ela se torna equivalente

à equação 6-8. Porém, um ponto negativo desta nova alternativa é o aumento do

número de parâmetros otimizados (cinco por simetria). Em (Gomes, 2006), tal

desvantagem é destacada por causar um impacto negativo na otimização de funções

de base de elementos pesados.

No trabalho??, alternativas aos esquemas de discretização propostos são

investigados, com o objetivo de melhorar a acurácia das funções de base, mantendo

o procedimento de otimização o mais simples possível. Para isto, foram sugeridas

diferentes expressões para a expansão polinomial deΩk, permitindo aumentar a

flexibilidade na descrição da distribuição dos expoentes. As expressões sugeridas

são mostradas abaixo:

Ωk = p0,l + p1,l( j − 1)+ p2,l( j − 1)3 + p3,l( j − 1)5 (6-13)

Ωk = p0,l + p1,l( j − 1)+ p2,l( j − 1)2 + p3,l( j − 1)4 (6-14)

Ωk = p0,l + p1,l( j − 1)+ p2,l( j − 1)2 + p3,l( j − 1)3 + p4,l( j − 1)5 (6-15)

onde j = 1, ...,Ml, Ml é o número de primitivas epk,l são os parâmetros a

serem otimizados para cada simetrial. Estas equações foram sugeridas com o

objetivo de aproximar ou melhorar os resultados obtidos em (Klobukowski, 1993)

e (Klobukowski, 1994).

Para estes casos, foram realizados cálculos para funções debase com um

número de primitivas gaussianas para a simetria p,Mp, igual o número de primitivas

para a simetria s menos 6, ou seja,Mp = Ms − 6. Estes valores foram escolhidos

baseados nos resultados obtidos em (Klobukowski, 1994).

6.5Detalhes Computacionais

Todos os parâmetros deste estudo foram otimizados utilizando a biblioteca

de algoritmos genéticos GACOM, do laboratório ICA da PUC-Rio. Para se obter

o valor da energia dos átomos durante a otimização, foi utilizado o programa

GAUSSIAN (G03). Para os átomos de camada fechada, a energia foi obtida através

de cálculos de Hartree-Fock restrito (RHF), já para átomos decamada aberta

foi usado o Hartree-Fock aberto restrito (ROHF), conforme usado na literatura

(Gomes, 2006) (Jorge, 1999).

6.6Resultados e Discussões

A primeira abordagem utilizada visa à otimização dos parâmetros do método

GCHF descrito anteriormente. Foram calculadas as energias HF dos átomos da

primeira linha da tabela periódica (Li - Ne) no estado fundamental. Para garantir

uma comparação justa, foram escolhidas funções de base do tipo gaussianas (GTF)

do mesmo tamanho daquelas apresentadas em (Jorge, 1999). Foram otimizados

os parâmetros das heurísticas SOGBSs, DOGBSs e TOGBSs, conforme descritas

anteriormente. Em todos os experimentos o valor da constante A foi considerado

igual a 6.

Foram otimizados os parâmetros apresentados em (Jorge, 1999), conside-

rando uma variação máxima de 100%. Portanto, os genes do cromossomo assumem

valores reais entre 0 e 2. Logo, os novos parâmetros do métodoGCHF são dados

por Pnovo = ∆g ∗ Pvelho, onde∆g é o valor do gene ePvelho é o valor original do

parâmetro.

A tabela 7.9 mostra o tamanho das funções otimizadas para cada átomo

da primeira linha da tabela periódica, além do tamanho do cromossomo de cada

experimento.

Átomo Tamanho da FunçãoSOGBSs DOGBSs TOGBSsLi(2S) 18s 2 4 6Be(1S) 18s 2 4 6B(2P) 20s11p 4 8 12C(3P) 20s11p 4 8 12N(4S) 20s11p 4 8 12O(3P) 20s11p 4 8 12F(2P) 20s11p 4 8 12Ne(1S) 20s11p 4 8 12

Tabela 6.1: A primeira coluna apresenta o átomo, juntamentecom a multiplicidadee termo de simetria. A segunda coluna apresenta o tamanho dasfunções de base. Asúltimas três colunas mostram o tamanho do cromossomo para cada experimento.

Conforme descrito anteriormente, nas heurísticas DOGBSs e TOGBSs duas

e três sequências aritméticas, respectivamente, são usadas para gerar os expoentes

das funções gaussianas. Neste trabalho, as sequências aritméticas foram divididas

como mostrado na tabela 6.2, exatamente como realizado em (Jorge, 1999).

Átomos Tamanho da FunçãoDOGBSs TOGBSsLi - Be 18s 13 - 5 13 - 3 - 2

B - Ne 20s11p15 - 5 15 - 3 - 28 - 3 8 - 2 - 1

Tabela 6.2: Tamanho das sequências aritméticas usadas paragerar os expoentes dasfunções gaussianas.

A tabela 7.10 apresenta os resultados obtidos. Para todos osátomos, ex-

ceto oxigênio e flúor, os valores apresentados são as diferenças em micro-hartree

(10−6hartree) para o estado fundamental destes átomos (Bunge,1992). A terceira

coluna apresenta as diferenças de energia obtidas pelo Gaussian (G03) usando os

parâmetros originais de (Jorge, 1999), a quarta coluna apresenta as diferenças de

energias obtidas pela otimização com o Algoritmo Genético e, por fim, a última

coluna apresenta as energias do estado fundamental (Bunge,1992).

Os valores em negrito na tabela 7.10 indicam a menor energia entre o método

com os parâmetros originais de (Jorge, 1999) e o método com osparâmetros

otimizados pelo Algoritmo Genético. O AG apresenta menor energia para todos

os casos, exceto para o átomo de flúor com a heurística SOGBSs. Observe que as

energias dos métodos usando a heurística SOGBSs são muito próximas, indicando

que os parâmetros originais da referência (Jorge, 1999) sãobem otimizados para

este caso. Já para o caso das heurísticas DOGBSs e TOGBSs, o Algoritmo Genético

obtém energias significativamente mais baixas, principalmente para o átomo de

neônio, o mais pesado de todos os testados.

Para cada um dos 24 experimentos foram executadas 5 rodadas do Algoritmo

Genético. Os valores apresentados na tabela 7.10 são os da melhor rodada de cada

um destes experimentos.

Também é importante observar que diferentemente do método proposto por

(Jorge, 1999), as energias das heurísticas DOGBSs e TOGBSs obtidas pelos parâ-

metros otimizados pelo Algoritmo Genético não apresentam uma diferença muito

grande. Isto ocorre devido à boa otimização dos parâmetros pelo AG para o caso do

DOGBSs, aproximando-se das energias obtidas pelos parâmetros ótimos da heu-

rística TOGBSs. Isto só não ocorre para o átomo de neônio, ondea energia da

heurística TOGBSs é significativamente menor que a energia obtida na heurística

DOGBSs.

A tabela 7.11 apresenta os cromossomos dos melhores indivíduos para cada

otimização do Algoritmo Genético. Para o mesmo experimento, os parâmetros

correspondentes aos orbitais s e p estão em linhas diferentes. Os átomos Li e Be

só possuem o orbital s e, consequentemente, apenas uma linhade cromossomo é

mostrada.

Observe na tabela 7.11 que os genes dos cromossomos referentes à heurística

SOGBSs são todos próximos de 1, confirmando que os parâmetros da referência

(Jorge, 1999) são ótimos. Já os cromossomos referentes à heurística TOGBSs não

apresentam um padrão definido, variando de átomo para átomo esimetria para

simetria.

O comportamento mais interessante ocorre nos cromossomos referentes à

heurística DOGBSs. Observe que os dois primeiros genes de cada orbital possuem

valores próximos de 1. O primeiro sempre um pouco maior e o segundo sempre

um pouco menor. Já os dois genes seguintes possuem valores maiores, sendo que o

terceiro gene sempre se aproxima do limite superior permitido. Este comportamento

sugere que o intervalo de valores escolhido para os genes ([0; 2]) talvez não seja

o mais adequado, já que o terceiro gene de cada orbital poderia assumir valores

maiores.

Para verificar o comportamento da otimização, um novo experimento com o

átomo de Ne (DOGBSs) foi realizado com os valores dos genes variando no inter-

valo [0; 4]. O melhor experimento apresentou um resultado de-128,547074 har-

trees, contra a energia -128,547068 hartrees encontrada anteriormente. O cromos-

somo desta nova solução é apresentado na tabela 7.12. Conforme esperado, observe

Átomo Heurística Originais Otimizados HF NuméricoLi(2S) SOGBSs 3,2 3,2 -7,432726927Li(2S) DOGBSs 2,8 1,4 -7,432726927Li(2S) TOGBSs 2,2 1,4 -7,432726927Be(1S) SOGBSs 6,4 6,4 -14,57302316Be(1S) DOGBSs 5,6 2,9 -14,57302316Be(1S) TOGBSs 4,3 2,8 -14,57302316B(2P) SOGBSs 4,4 4,4 -24,52906072B(2P) DOGBSs 3,9 2,8 -24,52906072B(2P) TOGBSs 3,2 2,7 -24,52906072C(3P) SOGBSs 6,8 6,8 -37,68861895C(3P) DOGBSs 5,8 4,0 -37,68861895C(3P) TOGBSs 4,2 3,8 -37,68861895N(4S) SOGBSs 11,7 11,7 -54,40093419N(4S) DOGBSs 10,0 7,0 -54,40093419N(4S) TOGBSs 7,2 7,0 -54,40093419O(3P) SOGBSs 20 19 -74,80939815O(3P) DOGBSs 17 12 -74,80939815O(3P) TOGBSs 12 11 -74,80939815F(2P) SOGBSs 31 33 -99,40934933F(2P) DOGBSs 27 19 -99,40934933F(2P) TOGBSs 19 18 -99,40934933Ne(1S) SOGBSs 46,4 46,3 -128,547098Ne(1S) DOGBSs 40,8 29,4 -128,547098Ne(1S) TOGBSs 29,0 22,3 -128,547098

Tabela 6.3: Diferença (micro-hartree) entre as energias obtidas e a energia do estadofundamental dos átomos da primeira linha da tabela periódica. A última colunamostra o estado fundamental de cada átomo.

que o terceiro gene de cada orbital ultrapassou o valor limite anteriormente definido

(2,0). Porém, estes genes não assumiram valores muito altos(próximo de 4,0), o que

poderia prejudicar o desempenho da função de base. Os outrosgenes apresentaram

comportamento semelhante aos experimentos anteriores.

Em todos os experimentos realizados, o Algoritmo Genético foi executado

com os seguintes parâmetros:

– Tamanho da População: 100

– Número de gerações: ver tabela 6.6

– Taxa inicial de crossover: 85%

– Taxa final de crossover: 60%

– Taxa inicial de mutação uniforme: 10%

– Taxa final de mutação uniforme: 40%

– Taxa inicial de mutação não uniforme: 10%

Átomo Heurística CromossomoLi(2S) SOGBSs 0,9992 1,0036Li(2S) DOGBSs 1,0142 0,9681 1,9964 1,2911Li(2S) TOGBSs 1,0112 0,9760 1,8732 1,2760 1,7070 1,1707Be(1S) SOGBSs 1,0006 1,0030Be(1S) DOGBSs 1,0063 0,9730 1,9921 1,2583Be(1S) TOGBSs 1,0064 0,9764 1,9090 1,2451 1,8410 1,1658

B(2P) SOGBSs1,0011 0,99830,9883 0,9963

B(2P) DOGBSs1.0030 0.9805 1.9949 1.19740.9955 0.9690 1.8859 1.3903

B(2P) TOGBSs1.0096 0.9839 1.7628 1.1563 1.1061 1.00790.9936 0.9706 1.4971 1.2232 0.9834 1.0036

C(3P) SOGBSs1,0022 0,99831,0042 1,0000

C(3P) DOGBSs1,0003 0,9813 1,9543 1,16071,0130 0,9720 1,7057 1,2555

C(3P) TOGBSs1,0051 0,9895 1,6602 1,1178 1,0479 1,00070,1579 1,2316 0,9805 0,9757 1,0028 0,9835

N(4S) SOGBSs0,9998 0,99821,0026 0,9965

N(4S) DOGBSs1,0064 0,9865 1,9206 1,13281,0166 0,9729 1,8286 1,2659

N(4S) TOGBSs1,0053 0,9903 1,6455 1,2515 1,5576 0,82100,6507 0,7172 0,9570 0,9719 0,4040 0,8354

O(3P) SOGBSs1,0033 0,99821,0190 1,0035

O(3P) DOGBSs1,0007 0,9852 1,8856 1,11091,0230 0,9804 1,8047 1,2406

O(4P) TOGBSs1.0158 0.9846 1.9785 1.1325 1.7692 1.06661.5556 1.0729 1.0726 0.9969 1.5160 1.0956

F(2P) SOGBSs1,0014 0,99801,0079 0,9999

F(2P) DOGBSs1,0048 0,9910 1,8218 1,08961,0169 0,9753 1,9035 1,2464

F(2P) TOGBSs1,0161 0,9850 1,9937 1,1184 1,2247 1,01100,5824 0,9766 0,9938 0,9874 1,0198 0,9957

Ne(1S) SOGBSs1,0038 0,99791,0080 1,0021

Ne(1S) DOGBSs0,9962 0,9855 1,9403 1,08451,0051 0,9767 1,8595 1,2129

Ne(1S) TOGBSs1,0118 0,9870 1,5760 1,1988 1,3917 0,79421,0284 0,9719 1,6937 0,1714 0,7286 0,9459

Tabela 6.4: Os cromossomos de todas as otimizações.

Átomo Heurística Cromossomo

Ne(1S) DOGBSs1.0189 0.96923 3.4360 1.22751.0154 0.9641 2.5523 1.3932

Tabela 6.5: O cromossomo da otimização do Ne. Genes variam de0 a 4.

– Taxa final de mutação não uniforme: 60%

– gap(Porcentagem da população substituída): 85%

Átomos Heurística Número de GeraçõesLi-Be SOGBSs 100Li-Be DOGBSs 300Li-Be TOGBSs 500B-Ne SOGBSs 150B-Ne DOGBSs 700B-Ne TOGBSs 900

Tabela 6.6: Número de Gerações nos experimentos.

Estes parâmetros foram escolhidos após a realização de alguns experimentos

preliminares.

A segunda alternativa realizada neste trabalho visa à otimização dos parâ-

metros da expansão polinomial. Porém, neste caso, os autores em (Gomes, 2006)

e (Klobukowski, 1994) não forneceram os valores dos parâmetros otimizados por

eles. Desta forma, este trabalho realizou a otimização paramétrica sem nenhuma

informação prévia. Além disso, o número de primitivas em cada uma das simetrias

também é otimizado. Por exemplo, uma função de base 12s 4p contém 16 primitivas

gaussianas. Contudo, esta distribuição entre as simetrias se p pode não ser a ótima.

Em (Gomes, 2006), os autores apresentam uma tabela comparativa dos re-

sultados dos modelos propostos com aqueles obtidos em (Klobukowski, 1994). Os

cálculos foram realizados para 12 diferentes tipos de átomos, sendo que para cada

átomo, 9 diferentes combinações de simetria foram testadas. Os resultados obtidos

em (Gomes, 2006) se aproximam daqueles apresentados em (Klobukowski, 1994),

porém são ligeiramente piores. Por esta razão, este trabalho está focado apenas na

otimização da expansão polinomial original proposta em (Klobukowski, 1994) A

tabela 6.7 apresenta as diferenças de energia para o estado fundamental, em micro-

hartree, para os átomos de C e Ne obtidos nos dois trabalhos.

Devido ao grande número de diferentes experimentos e o alto custo compu-

tacional associado, serão apresentados apenas os resultados obtidos para os átomos

de C e Ne. Para cada átomo, 5 diferentes quantidades de primitivas foram testadas.

As tabelas 6.8 e 6.9 apresentam os resultados para os átomos de C e Ne, respectiva-

mente.

Função de Base C Ne10s4p 5401 5514511s5p 1457 1387112s6p 428 372513s7p 140 107814s8p 52 34115s9p 20 11616s10p 8 4217s11p 4 1618s12p 2 7

Tabela 6.7: Diferenças de energia (micro-hartree) entre osresultados obtidos pelopolinômio sugerido em (Klobukowski, 1994) e o estado fundamental para os átomosde C e Ne.

Número de Primitivas FB ∆E original FB ∆E otimizado14 10s4p 5401 9s5p 364318 12s6p 428 12s6p 44022 14s8p 52 14s8p 5226 16s10p 8 16s10p 830 18s12p 2 19s11p 1

Tabela 6.8: Comparação dos resultados obtidos pelo polinômio sugerido em(Klobukowski, 1994) com aqueles otimizados neste trabalho. Todos para o átomode C.

Número de Primitivas FB ∆E original FB ∆E otimizado14 10s4p 55145 9s5p 2019618 12s6p 3725 11s7p 206522 14s8p 341 13s9p 27726 16s10p 42 16s10p 4230 18s12p 7 18s12p 6

Tabela 6.9: Comparação dos resultados obtidos pelo polinômio sugerido em(Klobukowski, 1994) com aqueles otimizados neste trabalho. Todos para o átomode Ne.

Nos resultados apresentados nas tabelas 6.8 e 6.9 as melhores funções de base

têm seus resultados destacados em negrito.

Pode-se observar, através dos resultados apresentados na tabela 6.8, que o

método de otimização usado encontrou melhores resultados para duas quantidades

de primitivas diferentes (14 e 30 primitivas). Em ambos os resultados a distribuição

das primitivas é diferente daquela apresentada em (Klobukowski, 1994). Para o

total de 14 primitivas gaussianas, o resultado encontrado diminuiu o número de

primitivas para a simetria s de uma unidade. O resultado paraeste caso teve uma

melhora de 32,52%. Já para o caso com um total de 30 primitivas, a otimização

aumentou o número de primitivas s de uma unidade. Neste caso,o número de

primitivas é muito grande e a energia muito próxima do estadofundamental. Por

outro lado, para as outras três configurações a distribuiçãodas primitivas ficou

exatamente como proposta em (Klobukowski, 1994), sendo quepara duas delas (22

e 26 primitivas) o resultado foi o mesmo. Para o caso de 18 primitivas, o resultado

obtido foi pior do que o proposto pela literatura.

Já para o átomo de Ne, a tabela 6.9 mostra que a distribuição das primitivas

encontradas diminuiu o número de gaussianas para a simetrias de uma unidade

para as três primeiras configurações (14, 18 e 22 primitivas). Para estas três confi-

gurações, a melhora obtida foi de 63,37%, 44,56% e 18,77%, respectivamente. Já

para as outras duas configurações, a distribuição de primitivas se manteve igual. O

resultado para o total de 26 primitivas foi igual ao anterior, enquanto que para 30

primitivas a energia diminuiu de 1 micro-hartree.

Neste caso, utilizou-se uma heurística co-evolucionária com três diferentes

espécies. Duas espécies foram usadas para otimizar os parâmetros das simetrias s

e p e uma espécie otimizou a distribuição das simetrias. Todas as espécies foram

otimizadas por um algoritmo evolucionário com inspiração quântica (AEIQ-R).

Cinco experimentos foram realizados para cada configuração.Apenas os melhores

resultados são apresentados. Os parâmetros utilizados pelo GA estão listados a

seguir:

– Tamanho da População Clássica: 100

– Tamanho da População Quântica: 2

– Número de Observações: 5

– Número de gerações: 600

– Taxa de crossover: 100%

– Taxa de mutação: 5%

Por fim, a última alternativa realizada visa otimizar diretamente cada um dos

expoentes, independente de uma função relacionada. Neste caso a quantidade de

parâmetros a serem otimizados é bem maior. Para um orbital com N expoentes, a

representação do cromossomo será definida da seguinte forma:

cromossomo= [α1 ∆2 ∆3 ... ∆N] (6-16)

ondeα1 é o expoente inicial, com valor no intervalo de 0 a 1 e∆i o fator de

multiplicação para o novo expoente, no intervalo [1.3 6]. Logo, o valor do i-ésimo

expoente é dado pela equação 6-17.

αi = αi−1 ∗ ∆i (6-17)

O valor de 1,3 é suficiente para evitar a dependência linear entre os expoentes,

enquanto que o valor máximo igual a 6 evita expoentes com valores extremamente

grandes.

Dois experimentos foram realizados para o átomo de neônio. Cinco experi-

mentos foram realizados para funções de base de tamanhos diferentes. Os resultados

são apresentados na tabela 6.10.

Tamanho da Função AG (Partridge, 1989) HF numérico (Bunge,1992)13s 8p -128,546677 -128,546677 -128,54709818s 13p -128,547094 -128,547094 -128,547098

Tabela 6.10: Resultados obtidos para o átomo de neônio.

Observe que os valores obtidos são iguais àqueles apresentados em

(Partridge, 1989). A obtenção de resultados idênticos sugere que os parâmetros

otimizados em (Partridge, 1989) são ótimos. Porém, os resultados obtidos anterior-

mente na literatura necessitam de um bom ponto de partida, obtidos normalmente

a partir de funções de base já otimizadas. Por outro lado, o AGnão necessita

de nenhuma informação preliminar e parte de uma solução totalmente aleató-

ria. Obviamente, a metodologia proposta neste trabalho é muito mais eficiente,

principalmente na otimização de funções de base totalmentenovas.

7Otimização de Agregados Atômicos e Moleculares

7.1Introdução

Agregados podem ser compostos por átomos ou moléculas. Estes agrega-

dos podem possuir entre algumas unidades e milhões de átomose moléculas

(Johnston, 2003). O interesse em agregados cresce, em parte, porque eles consti-

tuem uma nova classe de materiais que possuem propriedades diferentes quando

comparados às moléculas isoladas ou grandes pedaços de matéria. Por exemplo,

alguns metais (ex. paládio) não são magnéticos no estado sólido, mas apresentam

magnetismo quando formam agregados. Outra razão importante para este tipo es-

tudo é o entendimento da evolução das propriedades com o aumento gradual do

tamanho dos agregados (Johnston, 2003).

A teoria tem um papel muito importante no estudo dos agregados, já que

muitas das suas propriedades são difíceis de serem medidas experimentalmente

e dados de espectroscopia são geralmente interpretados em termos de modelos

teóricos.

Quando um cálculo empírico, semi-empírico ouab initio é usado para descre-

ver as ligações de um agregado, um dos primeiros objetivos é encontrar o arranjo

de átomos (ou íons ou moléculas) que corresponde à menor energia, ou seja, o mí-

nimo global (MG) na superfície de energia potencial (Doye, 2004). A importância

de encontrar o agregado que corresponde ao mínimo global se dá por este ser o can-

didato mais provável de ser formado, já que é o mais estável. Porém, dependendo

das condições do meio envolvido, estruturas meta-estáveisde baixa energia podem

ser formadas, sendo importante estudar não somente o agregado de menor energia,

como também aqueles de energia próxima.

Como o número de mínimos aumenta exponencialmente com o aumento do

agregado, encontrar o mínimo global é uma tarefa computacionalmente cara. Já

foi provado que métodos como simulação Monte Carlo (MC), Dinâmica Molecular

(MD) e Simulated Anneling(SA) possuem dificuldades para encontrar o mínimo

global com alguns tipos de interações (Johnston, 2003). Poresta razão, Algoritmos

Genéticos (AG) têm sido muito utilizados na otimização da geometria de agregados

Capítulo 7. Otimização de Agregados Atômicos e Moleculares 108

atômicos e moleculares.

7.2Histórico

A busca pelas geometrias de pequenos agregados depende muito da inicializa-

ção da estrutura. Nos últimos anos, Algoritmos Genéticos têm sido usados para en-

contrar o mínimo global e os mínimos locais de energia mais baixa (Johnston, 2003)

(Doye, 2004) (Alexandrova, 2004) (Alexandrova, 2005) (Bazterra, 2004). O uso de

Algoritmos Genéticos para a otimização da geometria de agregados teve início na

década de 90 por Hartke (Hartke, 1993) e Xiao e Willians (Xiao, 1993) para a otimi-

zação de pequenos agregados de silício e agregados moleculares, respectivamente.

Em ambos os casos, a geometria dos agregados era codificada por bits. Depois de

seu trabalho pioneiro, Hartke publicou o resultado da otimização da geometria por

Algoritmos Genéticos para outros agregados, tais como água(Hartke, 2003) e mer-

cúrio (Hartke, 2001).

Uma evolução importante para a otimização dos agregados porAlgoritmos

Genéticos foi introduzida por Zeiri, que passou a representar a estrutura do agre-

gado por genes reais (Zeiri, 1995). Esta metodologia permitiu representar a posição

dos elementos de forma contínua, removendo a necessidade decodificação e de-

codificação do cromossomo binário. Em seguida, Deaven e Ho desenvolveram um

algoritmo híbrido onde uma minimização local por gradienteé aplicada sempre que

uma nova estrutura é gerada pelo Algoritmo Genético (Deaven, 1995). A introdução

da minimização local transforma a curva do potencial de energia em uma superfície

de degraus, onde cada degrau corresponde a uma base de atração, como mostrado

na figura 7.1. Esta simplificação facilita consideravelmente a busca pelo mínimo

global, reduzindo o espaço de busca do Algoritmo Genético. Neste contexto, a uti-

lização da minimização local corresponde a uma evolução Lamarquiana, ao invés

da Darwiniana, já que os indivíduos agregam aos seus cromossomos características

que adquiriram pela minimização local, alterando parte do que foi herdado.

Outra melhoria introduzida por Deaven e Ho foi a introdução de um novo

operador tri-dimensional, chamado de corte e união (em inglês, "cut and splice")

(Deaven, 1995). Este operador dá um significado físico maiorao processo de cros-

sover. Neste caso, bons esquematas correspondem às regiõesdos agregados pais

que possuem energia local baixa. Deaven e Ho aplicaram este operador na otimi-

zação de agregados de carbono usando potenciais empíricos,permitindo encontrar

muitos mais mínimos de baixa energia que outros operadores (Johnston, 2003). Um

exemplo deste operador é mostrado na figura 7.2.

Geralmente, pelo alto poder computacional necessário, a otimização de

agregados é realizada com o auxílio de métodos empíricos ou semi-empíricos.

Figura 7.1: Simplificação da superfície de energia por degraus.

Figura 7.2: Exemplo do operador de crossover criado por Deaven e Ho.

Mais recentemente, Alexandrova e Boldyrev apresentaram a otimização de di-

versos agregados usando métodos quânticos, tais como DFT (Alexandrova, 2004)

(Alexandrova, 2005).

7.3Descrição do Problema

Neste trabalho, a otimização da geometria dos agregados foirealizada se-

guindo o fluxograma mostrado na figura 7.3.

Em cada ciclo do Algoritmo Genético, um conjunto de novos indivíduos

é criado para substituir os piores indivíduos da população.A porcentagem de

indivíduos substituídos é chamada deGAP. Como proposto por Deaven e Ho

(Deaven, 1995), todos os indivíduos criados são otimizadospara o mínimo local

mais próximo, usando-se um método de gradiente.

As características do Algoritmo Genético são descritas a seguir.

7.3.1Representação dos Indivíduos e Geração da População Inicial

Conforme já foi discutido, este trabalho visa à otimização dageometria de

agregados iônicos e moleculares. A representação do problema pelo cromossomo

deve ser diferente para cada um dos dois casos, conforme mostrado a seguir:

Figura 7.3: Fluxograma da otimização de agregados atômicose moleculares.

– Agregados Atômicos: três genes reais (x, y e z) representama posição de cada

átomo do agregado. Logo, o tamanho do cromossomo é igual a 3N,onde N é

o número total de átomos. A figura 7.4 mostra um exemplo de cromossomo

para um agregado com 3 átomos.

Figura 7.4: Cromossomo do agregado iônicos.

– Agregados Moleculares: neste caso são usados seis genes reais (x, y, z,

α, β, θ). Os três primeiros genes representam a posição do átomo base da

molécula e os outros três genes a orientação da molécula. Logo, o tamanho

do cromossomo é igual a 6N, onde N é o número total de moléculas. A figura

7.5 mostra um exemplo de cromossomo para um agregado com 3 moléculas.

Figura 7.5: Cromossomo do agregado molecular.

Conforme mostra o fluxograma da figura 7.3, o primeiro passo do Algoritmo

Genético é a geração da população inicial. O tamanho da população do Algoritmo

Genético,Npop, varia de acordo com o número de átomos ou moléculas e é defi-

nido pelo usuário. Para os estudos de casos apresentados neste trabalho, este valor

não ultrapassa 50. Os indivíduos da população inicial são gerados aleatoriamente,

respeitando um limite de máximo espaço, R, definido pelo usuário de acordo com

as distâncias inter-atômicas nos agregados. Todos os indivíduos gerados aleatori-

amente na primeira geração são, posteriormente, otimizados para o mínimo local

mais próximo.

7.3.2Avaliação e Seleção dos Genitores

A avaliação de cada um dos indivíduos é dada pela energia obtida por algum

cálculo de química computacional.

A seleção dos genitores usada neste trabalho é conhecida como roleta. Neste

caso, os indivíduos mais aptos têm uma probabilidade maior de serem escolhidos

para gerarem os novos indivíduos. Como o objetivo, neste trabalho, é minimizar a

energia, os indivíduos de menor energia devem ter uma probabilidade maior de

serem escolhidos. Portanto, com o intuito de auxiliar a evolução do Algoritmo

Genético, este trabalho usa um método de normalização linear, com os valores

variando entre 1 eNpop. A tabela 7.1 apresenta um exemplo simples de uma

população de 10 indivíduos. A segunda coluna mostra a avaliação original do

indivíduo, ou seja, a energia do agregado correspondente emuma unidade de

medida qualquer. A terceira coluna mostra a aptidão do indivíduo após a aplicação

de uma normalização linear de mínimo 5 e máximo 50. Os valoresdesta última

coluna são usados pela roleta para a seleção dos genitores. Logo, como era desejado,

um indivíduo de menor energia tem mais probabilidade de ser escolhido do que um

indivíduo de maior energia.

Indivíduo Avaliação Original Aptidão Normalizada1 -123,46 502 -123,42 453 -123,40 404 -123,36 355 -123,25 306 -123,18 257 -123,03 208 -122,42 159 -121,01 1010 -119,68 5

Tabela 7.1: Aptidão dos indivíduos.

7.3.3Operadores

Existem dois tipos principais de operadores genéticos responsáveis pela cria-

ção de novos indivíduos.

O operador decrossoveré usualmente aplicado para combinar o material

genético de dois genitores para a criação de novos indivíduos. Normalmente, o

operador proposto por Deaven e Ho (Deaven, 1995), corte e união, é utilizado com

sucesso. Um exemplo deste operador é mostrado na figura 7.2. Apesar do bom

desempenho apresentado por este operador, para agregados que apresentam mais

de um tipo de elemento pode ser extremamente difícil encontrar uma posição de

corte que mantenha o mesmo número de átomos de cada elemento no agregado.

Com o intuito de resolver este problema, este trabalho apresenta uma variação deste

operador combinada com a metodologia de um operador para problemas baseados

em ordem (Michalewicz, 1994).

O funcionamento do operador proposto é descrito a seguir: A figura 7.6

mostra a estrutura de dois agregados que poderiam ser usadospara gerar dois

novos indivíduos. Para aplicar o operador, é escolhido aleatoriamente o eixo onde

os agregados serão cortados e o ponto de corte usado. Suponhaque tenha sido

escolhido o eixo z e o ponto de corte 3, ou seja, os agregados serão cortados abaixo

do terceiro átomo de cima para baixo. Caso o procedimento do operador corte e

união fosse usado, os novos agregados gerados seriam iguaisaos mostrados na

figura 7.7. Observe que o agregado à esquerda possuiria 5 átomos do elemento azul

e 3 do elemento laranja. O inverso ocorreria com o outro agregado. Obviamente,

estes agregados são inválidos, já que o desejado é possuir quatro átomos de cada

elemento.

Figura 7.6: Dois agregados genitores.

Para resolver o problema descrito acima e sempre gerar indivíduos válidos,

o operador proposto enumera todos os átomos do agregado. Os átomos acima do

ponto de corte do agregado 1 (1, 2 e 3) são mantidos em suas posições originais e

os átomos abaixo da linha de corte (4, 5, 6, 7 e 8) completam o agregado com as

posições ocupadas no agregado 2. O outro filho é formado de maneira semelhante,

somente invertendo os agregados. A figura 7.8 mostra os novosindivíduos gerados.

Como pode ser visto, o novo operador não gera indivíduos inválidos. A única

Figura 7.7: Dois filhos inválidos.

desvantagem deste novo operador é a inserção de átomos em umaregião de mínimo

local, como ocorre na parte superior do filho 2 da figura 7.8.

Figura 7.8: Dois novos indivíduos gerados.

Com os objetivos de evitar a estagnação e manter a diversidadeda população,

um ou mais operadores de mutação são introduzidos no Algoritmo Genético.

Johnston apresentou uma diversidade de operadores para agregados atômicos, que

podem ser facilmente estendidos aos agregados moleculares(Johnston, 2003). Os

operadores são descritos a seguir:

– Deslocamento de átomo: A mutação ocorre pela alteração aleatória das coor-

denadas geométricas de alguns átomos do agregado;

– Torção: A mutação ocorre pela rotação, no eixo z, da metade superior do

agregado. O ângulo de rotação é escolhido aleatoriamente;

– Substituição de agregado: Um agregado completo é substituído por um novo

agregado gerado aleatoriamente. O novo agregado é gerado exatamente da

mesma forma que os agregados da população inicial;

– Troca de átomo: A mutação ocorre pela troca de pares de átomos de elementos

diferentes.

7.4Agregados de Li e F

7.4.1Agregados de (LiF )nLi+

Este experimento visa obter as geometrias mais estáveis para agregados de

(LiF )nLi+, onde n= 2 - 4. Os agregados otimizados são usados para explicar os re-

sultados experimentais realizados no laboratório Van der Graaf do Departamento de

Física da PUC-Rio, onde uma superfície de LiF policristalino ébombardeada por

fragmentos de fissão do252C f de≈ 60MeV, ocasionando a emissão de íons secun-

dários que são estudados por espectroscopia de massa. O espectro de íons positivos

é dominado pela série (LiF )nLi+, n = 0 - 7, aparecendo com uma abundância de

duas ordens de grandeza maior que a série (LiF )+n (Fernandez, 2009).

Na busca pela geometria dos agregados, as energias, usadas como aptidões

dos indivíduos do Algoritmo Genético, foram obtidas utilizando o método DFT

com o funcional híbrido B3LYP e a função de base 3-21G. Todos oscálculos foram

realizados usando o programa GAUSSIAN 03 (G03). Neste experimento, o objetivo

é encontrar o agregado de menor energia, além de outros de baixa energia. Portanto,

todas as estruturas que convergiram com sucesso para um mínimo local durante a

evolução foram guardadas em um banco de estruturas e posteriormente refinadas

usando-se uma função de base maior, 6-311++G(3df,3pd).

Nestes experimentos o tamanho da população inicial do AG variou entre

15 e 20 indivíduos, dependendo do número de átomos envolvidos. O número de

gerações foi sempre igual a 50. O operador de crossover utilizado foi o proposto

neste trabalho e descrito anteriormente e a mutação aplicada foi a de deslocamento

de átomos. O AG só foi aplicado em agregados com multiplicidade singlete. Para

multiplicidades de spin maiores diferentes rodadas dos AG são necessárias, como

descrito em (Alexandrova, 2004). Alguns cálculos isoladosforam realizados com

multiplicidade triplete, porém a energia sempre apresentou um valor maior. Por esta

razão, apenas os cálculos com multiplicidade singlete foram considerados.

Em todos os experimentos, o agregado de menor energia foi encontrado nas

primeiras cinco gerações. Comportamento semelhante foi observado nos trabalhos

(Alexandrova, 2004) e (Alexandrova, 2005). Esta rápida convergência se deve ao

fato da otimização tratar agregados com poucos átomos (um máximo de 9 átomos),

além do uso de um algoritmo de minimização local eficiente. Aolongo da evolução,

os operadores genéticos tiram proveito das estruturas maisestáveis para encontrar

outros isômeros de baixa energia.

Os resultados para os experimentos de n= 2 são mostrados na tabela 7.2

e para n= 3 na tabela 7.3. Os resultados para n= 4 são mostrados no apêndice

-222.4186509 -222.4045603 -222.3960408

Tabela 7.2: Estruturas dos aglomerados (LiF )2Li+.

-329.9832686 -329.966228 -329.9636088

-329.9631894 -329.96154 -329.9542264

-329.9477844 -329.9439183

Tabela 7.3: Estruturas dos aglomerados (LiF )3Li+.

C. As tabelas mostram as estruturas em ordem crescente de energia (em Hartree).

Todas as energias apresentadas foram corrigidas para a energia de ponto zero (do

inglêsZero Point Energy- ZPE) para obter a energia total (ET = SCF+ ZPE).

Experimentos com agregados maiores não foram realizados devido ao grande tempo

computacional necessário.

Observe que o agregado linear é o mais estável para n= 2. Para n= 3, a estru-

tura linear foi encontrada como a segunda mais estável. Uma estrutura tendendo à

cúbica é ligeiramente mais estável neste caso. Já para n= 4, o Algoritmo Genético

não foi capaz de encontrar uma estrutura linear. Esta estrutura foi simulada sepa-

radamente e a energia obtida foi igual a -437.5114563 Hartrees. Das 17 estruturas

encontradas para este caso, apenas quatro possuem energia maior que a energia do

agregado linear. O trabalho (Fernandez, 2009) mostra que asestruturas lineares são

cada vez menos estáveis à medida que tamanho do agregado aumenta.

Pode-se concluir que o Algoritmo Genético não foi capaz de encontrar o agre-

gado linear por dois motivos. O primeiro e mais importante é que o cubo de raio R

definido para inicializar a população é pequeno para acomodar o agregado linear.

Além disso, o agregado linear possui energia relativamentealta quando compa-

rado aos agregados mais estáveis, dificultando a sua formação pelos operadores

genéticos. Para contornar este problema, poder-se-ia usara estratégia adotada em

(Alexandrova, 2005), onde agregados lineares e planares são introduzidos já na po-

pulação inicial.

Apesar das estruturas mais estáveis encontradas neste trabalho serem iguais

àquelas apresentadas anteriormente na literatura, o uso doAG permitiu introduzir

uma grande quantidade de isômeros de baixa energia diferentes daqueles apresen-

tados para n= 3 e 4 (Haketa, 2002).

7.4.2Agregados de (LiF )n

Estes experimentos seguem o mesmo método descrito para os agregados de

(LiF )nLi+. A maior diferença é que estes agregados são neutros.

Tal como os agregados da seção anterior, neste caso foram otimizados agre-

gados para n= 2 - 4. Os resultados para n= 2 estão mostrados na tabela 7.4 e para

n= 3 na tabela 7.5. Os resultados para n= 4 são mostrados no apêndice C. Observe

que para este caso, o agregado linear não é o mais estável até mesmo para n= 2.

Novamente, este trabalho introduz agregados diferentes daqueles apresenta-

dos para n= 3 e 4 na literatura (Haketa, 2002).

-215.0392339 -214.993798

Tabela 7.4: Estruturas dos aglomerados (LiF )2.

-322.5999171 -322.5687344

Tabela 7.5: Estruturas dos aglomerados (LiF )3.

-315.021411 -315.004955 -314.994748

Tabela 7.6: Estruturas dos aglomerados (LiF )2F−.

-422.575126 -422.565739 -422.560808

-422.557149 -422.549052 -422.540097

-422.530358

Tabela 7.7: Estruturas dos aglomerados (LiF )3F−.

7.4.3Agregados de (LiF )nF−

Os mesmos experimentos foram realizados para os íons negativos (LiF )nF−.

Os resultados para n= 2 são apresentados na tabela 7.6 e para n= 3 na tabela 7.7.

Os resultados para n= 4 e 5 também são mostrado no apêndice C.

Tal como foi observado para os íons positivos, o agregado linear é o mais

estável para n= 2 e o segundo mais estável para n= 3. Para n= 4 e 5, os agregados

lineares não são tão estáveis, assim como havia sido observado com os agregados

positivos. Neste caso, o AG encontrou o agregado linear paran = 4 e este é o que

possui a nona menor energia. Por outro lado, o agregado linear não foi encontrado

para n= 5. Este agregado foi calculado separadamente e sua energia émaior do que

a dos 14 encontrados.

Os resultados deste trabalhos estão presentes em (Fernandez, 2009b) e fazem

parte da primeira investigação sobre os agregados de (LiF )nF−.

7.5Agregados de H2O

Agregados de água neutros têm sido extensivamente investigados por um

longo período de tempo por fornecerem um entendimento importante das propri-

edades de moléculas de água, inclusive através do uso de algoritmos evolutivos

(Guimarães, 2002) (Nguyen, 2008) (Bandow, 2006) (Silva, 2006). Grande parte dos

estudos concentra suas atenções na investigação das mudanças de estruturas e pro-

priedades de pequenos agregados de água com relação ao número de moléculas. Vá-

rios resultados de cálculosab initio mostram que o potencial intermolecular água-

água praticamente governa a estrutura dos agregados. Além disso, o interesse por

potenciais empíricos (mecânica molecular) tem crescido com o objetivo de descre-

ver as interações intermoleculares água-água de maneira mais precisa e com maior

rapidez (Fanourgakis, 2006) (Burnham, 2002).

Comparativamente com o número de trabalhos com agregados de água neu-

tros, o estudo de agregados de água iônicos ainda é escasso e poucos trabalhos são

encontrados na literatura (Vostrikov, 2006) (Kulkarni, 2008) (Likholyot, 2007).

Este trabalho tem como objetivo o estudo teórico da formaçãode agregados

de água iônicos a partir de experimentos semelhantes àqueles realizados com os

agregados de Li e F descritos na seção anterior. Este trabalho foi realizado em três

fases distintas, conforme apresentadas a seguir:

– Otimização de agregados de água neutros (H2O)n,n = [1,8];

– Obtenção dos agregados positivamente carregados (H2O)+n ,n = [1,8]

– Obtenção de agregados iônicos através da agregação de íonsaos agregados

neutros (H2O)nI ,n = [1,8] ondeI pode serH2O+, H3O+ ouOH−.

Cada uma das etapas serão descritas a seguir.

7.5.1Agregados de (H2O)n

Esta primeira etapa apresenta o uso de Algoritmos Genéticos(AG) para en-

contrar o mínimo global de energia de agregados de água usando o potencial em-

pírico TTM2.1-F. De fato, o método de busca e otimização AG jáfoi recentemente

utilizado para a otimização de agregados de água com o potencial TTM2.1-F para

n = 6 - 34 (Bandow, 2006).

Em seguida, os agregados obtidos por esta metodologia foramrecalculados

usando o método DFT B3LYP/6-311++G(2d,2p). O método e função de base

escolhidos foram baseados nos resultados apresentados em (Bryantsev, 2009), onde

vários níveis de teoria foram usados para o cálculo de agregados de água neutros

e ionizados. Os resultados obtidos nesta seção servem como base para a realização

das etapas seguintes.

O TTM2-F é um potencial de interação flexível e polarizável desenvolvido

por Burnham e Xantheas (Burnham, 2002). Apesar de o modelo ter sido apenas

parametrizado com dímeros de água, já foi mostrado que ele é capaz de reproduzir

as energias de ligação de agregados de água com grande concordância com os

cálculos em MP2 para n= 2 - 6 e n= 20 (Lagutschenkov, 2005). Neste trabalho

nós consideramos o potencial empírico TTM2.1-F, que é uma versão revisada

do modelo original e apresenta resultados que resolvem cálculos relacionados ao

momento de dipolo de água individuais e pequenas interaçõesintermoleculares

(Fanourgakis, 2006).

Os resultados obtidos neste trabalho concordam com os resultados apresen-

tados na literatura (Bandow, 2006) e são apresentados na tabela 7.8. Os agregados

mais estáveis para n= 3, 4 e 5 formam estruturas em anel.

A primeira estrutura interessante aparece para n= 6. Neste caso, o anel

não é a estrutura mais estável. A estrutura de menor energia encontrada é em

forma de gaiola com quatro anéis quaternários. Este resultado, juntamente com os

outros resultados da literatura, sugere que os anéis quádruplos e quíntuplos sejam

energeticamente mais favoráveis que os anéis sêxtuplos. O Agregado para n= 7 é

muito próximo do anterior, porém este apresenta três anéis quádruplos, um triplo

e um quíntuplo. Este último agregado é praticamente um cubo,com um vértice

faltando. Finalmente, o agregado para n= 8 forma um cubo perfeito, contendo seis

anéis quádruplos.

7.5.2Agregados de (H2O)+n

Nesta segunda etapa, os agregados de (H2O)n obtidos anteriormente serão

usados de base para a obtenção dos agregados positivos. Imagine que os agregados

neutros tenham se formado em um processo de bombardeamento semelhante ao

que foi descrito para os agregados de Li e F. Suponha agora que, durante o

bombardeamento, um agregado neutro e estável tenha sido atingido por um elétron

e este tenha arrancado um elétron do agregado, deixando-o com uma carga positiva,

conforme ilustrado na figura 7.9.

Os agregados obtidos a partir daqueles neutros e estáveis são mostrados na

tabela 7.9. É fácil perceber que a maioria dos agregados iônicos possui geometria

diferente dos agregados neutros originais. Para n= 2, um dos hidrogênios de uma

molécula parece migrar para a outra molécula, deixando a primeira com apenas um

-152,931994 -229,410557

-305,891845 -382,367790

-458,842485 -535,322505

-611,808416

Tabela 7.8: Estruturas dos aglomerados (H2O)n.

Figura 7.9: Formação de agregados de água positivos atravésda perda de umelétron.

átomo de hidrogênio. Para n= 3, as moléculas de água praticamente se mantém,

exceto por um átomo de hidrogênio que se distancia do átomo deoxigênio, mas

não o suficiente para migrar para outra molécula. Neste caso,a estrutura em anel é

desfeita e há um agregado com uma ligação de hidrogênio e duasmoléculas ligadas

por uma interação iônica. Já para o caso de n= 4, a estrutura é muito semelhante

àquela apresentada na tabela 7.8. Porém, esta estrutura encontrada não é um mínimo

verdadeiro, ou seja, é instável. Os diversos cálculos realizados não foram capazes de

encontrar um agregado estável para este caso. Pode-se considerar que este composto

é uma radical livre catiônico, que são comuns em espectroscopia de massa, apesar

de menos estáveis que os radicais livre aniônicos. Estes radicais costumam se

fragmentar em misturas de especies iônicas e radicais livres não carregados.

-152,535233 -229,039935

-305,492964 -381,981257

-458,513164 -535,002857

-611,485133

Tabela 7.9: Estruturas dos aglomerados (H2O)+n .

Já para n= 5, o agregado estável obtido é muito próximo da estrutura do

agregado neutro original. Porém, neste caso, o anel formadopelas moléculas está

um pouco fora do plano. Para n= 6, a estrutura neutra apresentada anteriormente se

transforma em uma estrutura mais aberta e, tal como ocorreu para n= 2, um átomo

de hidrogênio migra para uma outra molécula. Para n= 7, a estrutura neutra em

formato tendendo a um cubo se transforma em uma estrutura em anel com cindo

moléculas, tal como para n= 5, ligada a um agregado muito parecido com aquele

para n= 2 neutro mostrado na tabela 7.8. Finalmente, a estrutura do agregado neutro

em forma de cubo para n= 8 se transforma em uma estrutura muito diferente,

contendo um anel quádruplo, dois anéis quíntuplos e dois agregados idênticos

àqueles para n= 2 neutro.

É curioso observar que apenas para o agregado com quatro moléculas de

água não foi possível encontrar uma estrutura íônica estável. Este fato pode ter

ocorrido por duas razões: primeiro, as estruturas estáveispara o agregado iônico

com quatro são realmente muito diferentes da estrutura neutra, sendo impossível

obtê-la partindo-se da estrutura inicial. A outra possibilidade é a deficiência dos

métodos teóricos utilizados, não permitindo encontrar a solução exata. Para eliminar

esta hipótese, vários cálculos, em diferentes níveis de teoria, devem ser realizados

e seus resultados analisados.

A importância destes cálculos teóricos é fundamental para explicar a geome-

tria dos agregados de água formados experimentalmente. Nesta fase, este trabalho

visa explicar a formação de agregados a partir de agregados neutros estáveis, tal

como muitos devem se formar na natureza. A próxima fase mostra uma outra alter-

nativa para a formação de agregados iônicos.

7.5.3Agregados de (H2O)nI

Tal como foi feito para o caso anterior, os agregados neutrosserão usados

como base para encontrar novos agregados iônicos. Porém, neste caso vamos

considerar que um íon (positivo ou negativo) vai de encontrocom o agregado neutro,

mas sem energia suficiente para quebrá-lo, ou seja, o íon se ligará à superfície do

agregado. Após se adsorver na superfície deste, o novo agregado é relaxado como

um todo para encontrar a estrutura mais estável do composto iônico. Todo este

processo está ilustrado na figura 7.10.

Figura 7.10: Formação de agregados de água iônicos através da agregação demoléculas iônicas.

Contudo, os íons podem se aproximar da superfície do agregadocom diversas

orientações diferentes e em diferentes posições. Logo, como intuito de minimizar

a quantidade de cálculos e, principalmente, estudar as configurações com maior

probabilidade de ocorrer, um Algoritmo Genético foi usado para encontrar a confi-

guração mais estável para o íon na superfície do agregado.

O cromossomo que representa a solução do problema possui sete genes e está

ilustrado na figura 7.11. Os três primeiros genes (x, y e z) sãousados para definir

o vetor que parte do centroide do agregado e indica a posição do íon na superfície

deste. O quarto gene (r) indica qual a distância do átomo referência do íon (neste

caso o átomo marcado de preto na figura) com relação ao centroide. Por fim, os

três últimos genes (α, β e γ) são usados para definir a orientação do íon, ou seja, a

rotação deste. Estes genes representam os ângulos de Euler,que permitem a rotação

em uma esfera.

Figura 7.11: O cromossomo para encontrar a posição mais estável do íon nasuperfície do agregado e a figura ilustrativa do problema em 2D.

Os valores de x, y e z variam de 0 a 1. Os ângulosα e γ variam de−π a π e

β varia de 0 aπ. Já o valor de r varia de 0,5 a 7 Å paran ≤ 6 e de 1,5 a 9 Å, caso

contrário.

Por se tratar de um problema de otimização numérica, decidiu-se utilizar o

Algoritmo Evolutivo com Inspiração Quântica (AEIQ), já descrito anteriormente.

Os parâmetros do algoritmo usado são listados abaixo:

– Tamanho da População Clássica: 200

– Tamanho da População Quântica: 5

– Porcentagem de Observações: 5/200= 2,5%

– Intervalo de Variações (Gerações): 10

– Taxa de Crossover: 95

– Taxa de Mutação: 10

– Variação da Largura do Pulso: 10

– Gerações: 400

– Rodadas: 5

Os parâmetros acima dizem que 200 soluções são geradas aleatoriamente no

inicio da execução. A cada uma das 399 gerações seguintes, umindivíduo clássico

(solução para o problema) é gerado por cada indivíduo quântico (distribuição de

probabilidades), totalizando 5 indivíduos por geração. A cada um destes novos

indivíduos gerados há uma probabilidade de 95% da aplicaçãode crossover com

outro indivíduo já existente na população, tal como no AG clássico. A cada 10

gerações, a largura da função de distribuição é estreitada ou alargada em 10%,

dependendo da evolução do experimento. Se o algoritmo converge, os indivíuos

passam a sofrer mutações para poder explorar melhor o espaçode busca. O AG é

repetido 5 vezes de forma independente.

Como o número de moléculas de água nos agregados estudados variam de

2 a 8, três íons diferentes foram testados. Para cada uma destas configurações, 5

rodadas independentes do AG foram feitas, totalizando 105 execuções do AG para

obter os resultados descrito a seguir.

Os resultados obtidos pelo AG são posteriormente refinados utilizando o

mesmo método DFT B3LYP/6-311++G(2d,2p) utilizados nos cálculos anteriores.

Os três íons estudados neste trabalho são:H2O+, H3O+ eOH−. Os resultados

são apresentados abaixo.

Os resultados obtidos para estes agregados são apresentados na tabela 7.10

e estão ordenados por tamanho e energia. Cada agregado é identificado por uma

codificação definida como A-B, onde A indica o número de moléculas de água no

agregado antes da incorporação do íon e B o número sequencialdo agregado. Por

exemplo, o código 3-1 indica um íon incorporado em um agregado com 3 moléculas

de água e é o mais estável encontrado, enquanto o código 3-2 indica um agregado

com o mesmo número de molécula, mas com uma energia maior que ado composto

anterior.

Os aglomerados (H2O)nH2O+ obtidos nesta etapa podem ser comparados com

os agregados (H2O)+n+1 obtidos na etapa anterior, já que ambos possuem o mesmo

número de moléculas. A única diferença entre os agregados iônicos é a forma como

eles foram gerados.

O agregado para n= 2 obtido nesta etapa é igual àquele obtido para n= 3

na etapa anterior. É importante lembrar que a estrutura paran = 4 obtida na etapa

anterior não é estável. Já nesta etapa, foram obtidas duas estruturas para n= 3.

Observe que ambas as estruturas diferem bastante do anel quádruplo instável obtido

anteriormente. Já para n= 4 nesta etapa, foram obtidas três estruturas diferentes

e todas são bem mais estáveis que aquela obtida para n= 5 da etapa anterior. É

interessante observar que a estrutura menos estável desta etapa é bem parecida

com aquela da etapa anterior. Para n= 5, as duas estruturas obtidas também são

mais estáveis que aquela obtida para n= 6 do passo anterior. Ao contrário, a única

estrutura encontrada para n= 6 é menos estável que a estrutura obtida para n= 7

anteriormente. Para o caso de n= 7, duas estruturas foram obtidas, sendo que apenas

uma possui energia menor que aquela para n= 8 do caso anterior. Finalmente, para

n = 8 uma estrutura cúbica com uma molécula ligada por ponte de hidrogênio foi

obtida e não há como compará-la com os agregados da etapa anterior, já que esta

possui uma molécula de água a mais.

Um rápida observação nas estruturas obtidas indica que em alguns agregados

há a migração de um átomo de hidrogênio de uma molécula para outra, tal como

2-1 : -229,039935 3-1 : -305,528305 3-2 : -305,528149

4-1 : -382,020716 4-2 : -382,018126 4-3 : -382,014615

5-1 : -458,517760 5-2 : -458,510348 6-1 : -534,981337

7-1 : -611,485872 7-2 : -611, 481029 8-1 : -687,967533

Tabela 7.10: Estruturas dos aglomerados (H2O)nH2O+.

reportado na etapa anterior. Para todos os casos, exceto para n= 6, os agregados

formados pela incorporação de um íon aos agregados gerou estruturas mais estáveis

que aqueles formados pela perda de um elétron pelo agregado neutro.

Os resultados obtidos são apresentados tal como para o íon anterior e as

estruturas são mostradas na tabela 7.11.

A troca do íonH2O+ pelo íonH3O+ proporciona algumas mudanças interes-

santes nas estruturas dos agregados encontrados. Neste caso, todas as moléculas se

interagem por ligações de hidrogênio. Foi encontrada uma estrutura a menos para n

= 3 e 4. As geometrias para as estruturas com n< 7 são bem parecidas com aquelas

anteriores, com algumas variações.

2-1 : -229,751526 3-1 : -306,239206 4-1 : -382,723024

4-2 : -382,722868 5-1 : -459,206488 5-2 : -459,204543

6-1 : -535,707874 7-1 : -612,172460 7-2 : -612,169866

8-1 : -688,647709

Finalmente, os resultados para os agregados formados pela interação com o

OH− são apresentados na tabela 7.12. Tal como foi observado parao caso doH3O+,

as geometrias dos agregados formados mostram as moléculas interagindo através

de ligações de hidrogênio.

2-1 : -228,835011 3-1 : -305,326858 3-2 : -305,320523

4-1 : -381,813574 4-2 : -381,806637 5-1 : -458,300388

5-2 : -458,299321 5-3 : -458,293567 6-1 : -534,779925

6-2 : -534,777286 6-3 : -534,776742 6-4 : -534,775561

7-1 : -611,252050 8-1 : -687,731843

8Conclusões e Trabalhos Futuros

Este trabalho propôs investigar o apoio das técnicas de Inteligência Compu-

tacional no desenvolvimento da Nanociência e Nanotecnologia. Tal apoio é aqui

denominado de “Nanotecnologia Computacional Inteligente”. Vários estudos de

caso foram apresentados e propostos de forma a investigar o apoio das técnicas de

IC no projeto, caracterização, simulação e otimização de estruturas nanométricas e

subnanométricas. O uso de Redes Neurais Artificiais é apresentado para inferir as

características de nanoestruturas a partir dos parâmetrosde entrada para a síntese.

De posse destes sistemas de inferência, pode-se usar um Algoritmo Genético para

obter o conjunto de parâmetros ótimo para sintetizar a nanoestrutura desejada. Os

Algoritmos Genéticos são também usados, juntamente com simuladores de nano-

dispositivos, para encontrar as estruturas e parâmetros ótimos para a síntese dos

nanodispositivos desejados. Os cálculo de modelagem molecular dependem forte-

mente dos parâmetros usados. Os métodosab initio, utilizam funções gaussianas

para aproximar as funções de onda dos átomos. As funções gaussianas utilizadas

necessitam de expoentes otimizados para a boa representação destas funções de

onda. Por fim, os agregados atômicos e moleculares têm sido largamente estudados

e Algoritmos Genéticos são usados para a obtenção do isômerode menor energia e

outros isômeros de baixa energia. Neste trabalho foram otimizadas as estruturas de

agregados de Li e F, além de agregados deH2O.

Com relação à inferência e otimização de parâmetros para a síntese de na-

noestruturas, os resultados obtidos demonstram o grande potencial das técnicas de

Inteligência Computacional. Mesmo com uma base de dados pequena ou bastante

heterogênea, a Rede Neural Artificial foi capaz de inferir características muito se-

melhantes àquelas obtidas pelos resultados experimentais. Os erros obtidos para os

dois casos apresentados ficaram em torno de 10% e 4%, respectivamente. Apesar

dos resultados apresentados inferirem características específicas de pontos quânti-

cos e de nanocompósitos, as técnicas computacionais utilizadas podem ser facil-

mente estendidas para outras características destes materiais e, até mesmo, para in-

ferir propriedades de outros materiais, tais como, nanotubos, supramoléculas, den-

drímeros, etc. Os sistemas propostos e aplicados neste trabalho diminuem signi-

ficativamente o número de experimentos necessários nos laboratórios, já que eles

Capítulo 8. Conclusões e Trabalhos Futuros 129

podem ser usados para guiar a busca pelos parâmetros ótimos.Como consequência

da diminuição na quantidade de experimentos, há uma reduçãosignificativas nos

custos das pesquisas. Os resultados preliminares são bastante promissores, prin-

cipalmente para aplicações industriais, mostrando que as técnicas de Inteligência

Computacional podem ser parte fundamental da nanoinformática e, consequente-

mente, acelerar o desenvolvimento da Nanotecnologia. O desenvolvimento de fer-

ramentas de manipulação de dados, como mostrado neste trabalho, é fundamental

para o desenvolvimento da Nanoinformática. A única desvantagem da heurística

proposta é a dependência de dados experimentais confiáveis,em grande quantidade

e bem distribuídos. A inferência só pode ser realizada a partir de uma quantidade

de dados mínima e o sistema resultante é totalmente dependende da qualidade dos

dados usados.

Em uma outra alternativa estudada para o projeto de nanodispositivos, Algo-

ritmos Genéticos são aplicados juntamente simuladores dedicados. Estes simula-

dores são os responsáveis pela avaliação dos nanodispositivos propostos pelo AG,

indicando o quão bom é cada uma das soluções evoluídas. Dois diferentes projetos

foram realizados e, em ambos, os resultados obtidos foram surpreendentes, apresen-

tando estruturas inovadoras e mais eficientes que aquelas anteriormente propostas

na literatura. O uso de um sistema de projeto automático possibilita explorar todo

o espaço de busca permitido para a construção dos nanodispositivos e, consequen-

temente, não fica limitado às regras de projeto usadas por especialistas. Por esta

razão, muitas vezes os nanodispositivos obtidos apresentam estruturas e configura-

ções inimagináveis. Os resultados apresentados para os circuitos de QCA são um

exemplo disto. As estruturas obtidas possuem um grau de polarização das células de

saída semelhante àquelas propostas pelos especialista, porém aquelas obtidas pelo

sistema proposto possuem uma redução significativa no número de células. Por ou-

tro lado, as estruturas construídas pelos especialistas são muito mais amigáveis e

fáceis de serem entendidas. Contudo, é exatamente a liberdade de construção, sem

a preocupação do entendimento, que permite aos sistemas de projeto automático

encontrarem soluções inovadoras. A mesma observação pode ser feita sobre a oti-

mização dos OLEDs multicamadas, basta observar que as concentrações obtidas

pelo AG se diferenciam daquelas propostas pelos especialistas.

Com relação à otimização dos expoentes das funções de base, esta tese

propôs a otimização dos parâmetros do método GCHF. Os resultados obtidos

através da aplicação do Algoritmo Genético na otimização destes parâmetros foram

satisfatórios. As energias obtidas para a heurística SOGBS são semelhantes àquelas

descritas na literatura. Para este caso o AG converge rapidamente para o mesmo

valor em todos os experimentos realizados, indicando que o mínimo global é

obtido. Já para as heurísticas DOGBS e TOGBS, o AG é capaz de obter energias

inferiores àquelas apresentadas na literatura. Este trabalho também apresenta outras

alternativas para a otimização destes expoentes. Para o caso conhecido como

full-optimized, onde todos os expoentes são otimizados um a um, os resultados

preliminares igualaram aqueles descritos na literatura. Porém, o AG não é muito

dependente do ponto de otimização inicial, diferentementedo método anteriormente

proposto na literatura.

Este trabalho apresentou o uso de técnicas de Inteligência Computacional em

três propostas diferentes para a otimização de funções de base. Em todas elas, o uso

da computação evolutiva apresentou resultados iguais ou melhores do que aqueles

anteriormente propostos na literatura. O primeiro e o segundo casos apresentados

utilizam-se de uma equação para a geração dos expoentes das funções de base. Os

resultados obtidos nesta tese apresentam melhorias para ambos os casos. A segunda

alternativa, otimização dos parâmetros da expansão polinomial, também introdu-

ziu a otimização da distribuição das primitivas gaussianasentre as simetrias. Tal

distribuição nunca foi otimizada anteriormente na literatura, já que os especialistas

sempre se utilizam de seus conhecimentos e intuições. Apesar de não haver uma

distribuição radicalmente diferente do que foi apresentado anteriormente na litera-

tura, esta flexibilização permitiu uma diminuição significativa da energia. Por fim,

o terceiro e último caso propôs a otimização total dos expoentes. Claramente esta

é a alternativa que fornece os melhores resultados. Porém, ocusto computacional

para a otimização é extremamente alto, devido à grande quantidade de parâmetros.

Os resultados obtidos foram semelhantes ao já apresentadosna literatura, a meto-

dologia proposta neste trabalho não é dependente do ponto deotimização inicial,

diferentemente dos métodos anteriormente propostos na literatura.

Finalmente, este trabalho também apresentou o uso de Algoritmos Genético

na busca pela geometria de agregados atômicos e moleculares. Dois casos diferentes

foram estudados. O uso de AG na busca pela geometria de menor energia já

foi utilizado com sucesso em diferentes trabalhos. Porém, no primeiro caso deste

trabalho, o AG foi utilizado pela primeira vez para encontrar a estrutura de menor

energia e outros isômeros de baixa energia. Além disso, estetrabalho também

propôs um novo operador genético para combinar aglomeradosque possuam mais

de um tipo de átomos diferentes. No segundo caso apresentado, um AG semelhante

ao utilizado para os agregados de Li e F foi usado para obter osaglomerados

de (H2O)n neutros de menor energia. Contudo, este caso trata de um aglomerado

molecular e a representação genética se diferencia da representação do primeiro

caso, conforme já discutido anteriormente. Por fim, uma novaestratégia evolutiva,

utilizando um AEIQ, foi usada para encontrar aglomerados formados pela união

de aglomerados de (H2O)n neutros com diferentes íons positivos e um negativo.

Os resultados apresentaram estruturas inovadoras, diferentes daquelas apresentadas

anteriormente na literatura.

Apesar do uso de técnicas de Inteligência Computacional já ter sido realizada

pontualmente eu um ou outro projeto em Nanociência e Nanotecnologia, está tese

apresentou pela primeira vez uma avaliação mais ampla do apoio destas ferramentas

computacionais no desenvolvimento nanotecnológico. Os resultados obtidos neste

trabalho indicam que os métodos de Inteligência Computacional poderão ter um

impacto positivo no desenvolvimento da Nanociência e Nanotecnologia. Como

previsto na introdução deste trabalho, as técnicas de IC podem ser utilizadas na

caracterização, projeto, simulação e otimização de estruturas nanométricas e sub-

nanométricas.

O sucesso da aplicação destas técnicas nas mais diversas áreas da ciência e da

indústria é mais um fator de otimismo no desenvolvimento da Nanotecnologia. Con-

tudo, a Nanociência e a Nanotecnologia possuem um uma grandevantagem quando

comparadas às outras áreas onde a Inteligência Computacional foi aplicada com su-

cesso. Diferentemente das outras áreas, a Nanociência e a Nanotecnologia formam

um campo de pesquisa e desenvolvimento ainda pouco explorado e com um poten-

cial de crescimento enorme. Os nanodispositivos e as nanoestruturas obtidas com o

auxílio da IC certamente serão usadas em aplicações inovadoras, que transformarão

muito o estilo e qualidade de vida da sociedade. Como comparação podemos citar o

uso dos Algoritmos Genéticos no desenvolvimento de circuitos eletrônicos. Apesar

do sucesso deste tipo de aplicação, quando ela foi usada pelaprimeira vez a indústria

da eletrônica já estava consolidada. Logo, os circuitos eletrônicos revolucionários

criados pelos AGs não causaram grande impacto na sociedade eem grande parte

somente são aplicados em pesquisas avançadas, tal como explorações espaciais. Já

a indústria da Nanotecnologia ainda não está totalmente consolidada, na verdade

ela está em seus estágios iniciais, e a continuação das pesquisas apresentadas neste

trabalho pode ser um fator acelerador do desenvolvimento esperado.

8.1Trabalhos Futuros

Conforme já foi discutido anteriormente, este trabalho apresentou uma série

de projetos envolvendo a apoio da técnicas de Inteligência Computacional no de-

senvolvimento da Nanociência e Nanotecnologia. O sucesso dos resultados obtidos

credenciam a aplicação da IC em diversos outros projetos.

Com relação aos projetos realizados pode-se propor:

– Sistemas híbridos de inferência e otimização podem ser usados para o con-

trole da fabricação de outras nanoestruturas, tais como: nanotubos de car-

bono, nanotubos inorgânicos, filmes finos, nanocatalisadores, dendrímeros,

nanopartículas, nanofármacos, etc.

– O uso de simuladores de OLEDs mais completos, tal como alguns já dispo-

níveis comercialmente, possibilitarão a otimização não somente da concen-

tração dos portadores de carga, mas também da estrutura do nanodispositivo

como um todo, ou seja, o número de camadas, a espessura de cadauma delas,

os materiais usados, etc.

– Algoritmos Genéticos tradicionais ou com inspirações quânticas podem ser

usados para a otimização de funções de base para todos os átomos da tabela

periódica em diferentes níveis de teoria. Os mesmo algoritmos podem ser

usados para a otimização de parâmetros de campos de forças utilizados na

simulação de diversas nanoestruturas diferentes.

– Agregados de diferentes átomos ou moléculas podem ser explorados usando

os eficientes métodos de busca pela geometria mais estável.

Além das aplicações anteriormente citadas, acredita-se que novas metodolo-

gias inteligentes e sistema híbridos podem ser extremamente valiosos no desen-

volvimento da Nanociência e Nanotecnologia. Este trabalhoexplorou basicamente

as Redes Neurais Artificiais e os Algoritmos Evolutivos, mas muitas outras meto-

dologias existente ou ainda a serem propostas podem auxiliar no desenvolvimento

nanotecnológico. Dentre algumas outras ferramentas, pode-se citar:

– Programação Genética;

– Sistemas Fuzzy;

– Sistemas Neuro-Fuzzy;

– Sistemas Neuro-Genéticos;

– Agentes Inteligentes;

– Sistema Monte-Carlo-Fuzzy;

– Algoritmos com Inspiração Quântica.

Alguns projetos sugeridos são:

– Programação Genética para o desenvolvimento de “Experimentos Virtuais”,

tal como demostrados com Redes Neurais Artificiais;

– Programação Genética para a criação de funcionais de trocae correlação para

cálculos DFT;

– Agentes Inteligentes aplicados à simulação de sistemas deauto-montagem;

– Sistema Monte-Carlo-Fuzzy para avaliar a incerteza de posicionamento de

átomos em cálculos moleculares;

– O desenvolvimento de novos algoritmos inteligentes inspirados no comporta-

mento de nanoestruturas.

O número de aplicações e projetos é incontável e dependem basicamente do

conhecimento dos especialistas e das ferramentas computacionais.

Referências Bibliográficas

[AbsDaCruz, 2005] DA CRUZ, A. V. A.; BARBOSA, C. R. H.; PACHECO, M.

A. C. ; VELLASCO, M. B. R.. Quantum-inspired evolutionary algorithms

and its application to numerical optimization problems. In: ICONIP,

Berlin, Germany, 2005. Springer-Verlag. 2.7

[Alexandrova, 2004] ALEXANDROVA, A.; BOLDYREV, A.; FU, Y.; YANG, X.;

WANG, X. ; WANG, L.. Structure of the NaCl (x= 1–4) clusters via ab

initio genetic algorithm and photoelectron spectroscopy. The Journal of

Chemical Physics, 121:5709, 2004. 7.2, 7.2, 7.4.1

[Alexandrova, 2005] ALEXANDROVA, A.; BOLDYREV, A.. Search for the Li

n 0/(n) 5-7) Lowest-Energy Structures Using the ab Initio Gradient

Embedded Genetic Algorithm (GEGA). Elucidation of the Chemical

Bonding in the Lithium Clusters . J. Chem. Theory Comput, 1(4):566–

580, 2005. 7.2, 7.2, 7.4.1, 7.4.1

[Arkhipov, 2006] ARKHIPOV, A.; FREDDOLINO, P. ; SCHULTEN, K.. Stability

and Dynamics of Virus Capsids Described by Coarse-Grained Modeling.

Structure, 14(12):1767–1777, 2006. 2.3.1

[Back, 1996] BÄCK, T.. Evolutionary algorithms in theory and practice. Oxford

University Press New York, 1996. 3.1.1

[Bandow, 2006] BANDOW, B.; HARTKE, B.. Larger Water Clusters with Edges

and Corners on Their Way to Ice:# 160 Structural Trends Elucidated

with an Improved Parallel Evolutionary Algorithm . Journal of Physical

Chemistry A, 110(17):5809–5822, 2006. 7.5, 7.5.1

[Bazterra, 2004] BAZTERRA, V.; ONA, O.; CAPUTO, M.; FERRARO, M.; FU-

ENTEALBA, P. ; FACELLI, J.. Modified genetic algorithms to model

cluster structures in medium-size silicon clusters. Physical Review A,

69(5):53202, 2004. 7.2

[Bhushan, 2007] BHUSHAN, B.. Springer handbook of nanotechnology. Sprin-

ger, Berlin, 2007. 2.1, 2.1, 2.3.2, 2.4

[Bimberg, 1999] BIMBERG, D.; GRUNDMANN, M. ; LEDENTSOV, N.. Quan-

tum Dot Heterostructures. Wiley, 1999. 4.2

[Bishop, 1970] BISHOP, D.; SOMORJAI, R.. Integral-Transform Gaussian

Functions for Heliumlike Systems. Journal of Mathematical Physics,

11:1150, 1970. 6.2

[Bland, 2002] BLAND, S.. Future challenges for MOVPE–an industrial

perspective. Journal of Materials Science: Materials in Electronics,

13(11):679–682, 2002. 4.2.1

[Borgstrom, 2003] BORGSTROM, M.; PIRES, M.; BRYLLERT, T.; LANDI, S.;

SEIFERT, W. ; SOUZA, P.. InAs quantum dots grown on InAlGaAs

lattice matched to InP. Journal of Crystal Growth, 252(4):481–485, 2003.

[Bryantsev, 2009] BRYANTSEV, V.; DIALLO, M.; VAN DUIN, A. ; GODDARD III,

W.. Evaluation of B3LYP, X3LYP, and M06-Class Density Functionals

for Predicting the Binding Energies of Neutral, Protonated, and Depro-

tonated Water Clusters. Journal of Chemical Theory and Computation,

5:1016–1026, 2009. 7.5.1

[Bunge,1992] BUNGE, C.; BARRIENTOS, J.; BUNGE, A. ; COGORDAN, J..

Hartree-Fock and Roothaan-Hartree-Fock energies for the ground sta-

tes of He through Xe. Physical Review A, 46(7):3691–3696, 1992. 6.6,

[Burnham, 2002] BURNHAM, C.; XANTHEAS, S.. Development of transferable

interaction models for water. IV. A flexible, all-atom polarizable poten-

tial (TTM2-F) based on geometry dependent charges derived froman ab

initio monomer dipole moment surface. The Journal of Chemical Phy-

sics, 116:5115, 2002. 7.5, 7.5.1

[Callister, 1993] CALLISTER, W.. Materials science and engineering: an intro-

duction. John Wiley & Sons New York, 1993. 4.3

[Cao, 1999] CAO, Y.; PARKER, I.; YU, G.; ZHANG, C. ; HEEGER, A.. Improved

quantum efficiency for electroluminescence in semiconducting polymers.

Nature, 397:414–417, 1999. 5.1

[Chattopadhyayfs, 1981] CHATTOPADHYAYFS, P.; DREIZLERI, R. ; TRSICJ,

M.. Application of the generator coordinate method to one-and two-

electron atoms in an electric field. J. Phys. B: At. Mol. Phys, 14:3849–

3855, 1981. 6.3

[Chang, 1996] CHANG, C.; SZE, S.. ULSI technology. McGraw-Hill New York,

1996. D

[Chan, 2002] CHAN, C.; WU, J.; LI, J. ; CHEUNG, Y.. Polypropylene/calcium

carbonate nanocomposites. Polymer, 43(10):2981–2992, 2002. B

[Clementi, 1990] CLEMENTI, E.; CHAKRAVORTY, S.; CORONGIU, G. ; SON-

NAD, V.. Independent Electron Models: Hartree-Fock for Many-

Electron Atoms. MOTE CC-90 Modern Techniques in Computational

Chemistry (E. Clementi, Ed.), Escom, Leiden, p. 90–72199, 1990. 6.1

[Cohentannoudji, 1979] COHEN-TANNOUDJI, C.; DIU, B.; LALÖ, F. ; CRASE-

MANN, B.. Quantum Mechanics. American Journal of Physics, 47:662,

1979. 2.3.2

[Davis, 1991] DAVIS, L.; OTHERS. Handbook of genetic algorithms. Van

nostrand reinhold New York, 1991. 3.1.1

[Davis, 1991] A.V. ABS DA CRUZ, C.R. HALL BARBOSA, M. P.. Algoritmos

Evolucionários com Inspiração em Computação Quântica e sua Aplica-

ção em Problemas de Otimização Numérica.2004. 3.1.4, 3.1.4

[Deaven, 1995] DEAVEN, D.; HO, K.. Molecular Geometry Optimization with

a Genetic Algorithm. Physical Review Letters, 75(2):288–291, 1995. 7.2,

7.2, 7.3, 7.3.3

[Dowling, 2004] DOWLING, A.; CLIFT, R.; GROBERT, N. ; OTHERS. Nanosci-

ence and Nanotechnologies: Opportunities and Uncertainties. The Royal

Society and the Royal Academy of Engineering, 29, 2004. 2.1

[Doye, 2004] DOYE, J.; LEARY, R.; LOCATELLI, M. ; SCHOEN, F.. Global

Optimization of Morse Clusters by Potential Energy Transformations.

Informs Journal on Computing, 16(4):371–379, 2004. 7.1, 7.2

[Fagerstrom, 2002] FAGERSTROM, J.; FAXEN, T.; MUNGER, P.; YNNERMAN,

A.; DESPLAT, J.; DE ANGELIS, F.; MERCURI, F.; ROSI, M.; SGAMEL-

LOTTI, A.; TARANTELLI, F. ; OTHERS. High Performance Computing

Development for the Next Decade, and its Implications for Molecular

Modelling Applications. The ENACTS project, http://www. enacts. org.

[Fanourgakis, 2006] FANOURGAKIS, G.; XANTHEAS, S.. The flexible, polari-

zable, thole-type interaction potential for water (TTM2-F) revisited. J.

Phys. Chem. A, 110(11):4100–4106, 2006. 7.5, 7.5.1

[Fernandez, 2009] FERNANDEZ-LIMA, F.; VILELANETO, O.; PIMENTEL, A.;

PONCIANO, C.; PACHECO, M.; NASCIMENTO, M. ; SILVEIRA, E.. A

Theoretical and Experimental Study of Positive and Neutral LiF Clus-

ters Produced by Fast Ion Impact on a Polycrystalline LiF Target. The

Journal of Physical Chemistry A, 113(9):1813–1821, 2009. 1.3, 7.4.1,

[Fernandez, 2009b] FERNANDEZ-LIMA, F.; VILELANETO, O.; PIMENTEL, A.;

PONCIANO, M.; NASCIMENTO, M. ; SILVEIRA, E.. Theoretical and Ex-

perimental Study of Negative LiF Clusters Produced by Fast Ion Impact

on a Polycrystalline 7LiF Target. The Journal of Physical Chemistry A,

to appear, 2009. 7.4.3

[Fogel, 1966] FOGEL, L.. Author Artificial intelligence through simulated

evolution. New York: John Wiley & Sons, 1966., 1966. 3.1.1

[Foresman, 1996] FORESMAN, J.; FRISCH, A.. Exploring chemistry with

electronic structure methods. 1996. 2.3.1

[Fornes, 2003] FORNES, T.; PAUL, D.. Modeling properties of nylon 6/clay

nanocomposites using composite theories. Polymer, 44(17):4993–5013,

2003. 4.3, 4.3.1

[Fu, 2006] FU, J.; NAGUIB, H.. Effect of Nanoclay on the Mechanical Proper-

ties of PMMA /Clay Nanocomposite Foams. Journal of Cellular Plastics,

42(4):325, 2006. B

[Fukui, 1991] FUKUI, T.; ANDO, S.; TOKURA, Y. ; TORIYAMA, T.. GaAs te-

trahedral quantum dot structures fabricated using selective area meta-

lorganic chemical vapor deposition. Applied Physics Letters, 58:2018,

1991. 4.2

[G03] FRISCH, M. J.; TRUCKS, G. W.; SCHLEGEL, H. B.; SCUSERIA, G. E.;

ROBB, M. A.; CHEESEMAN, J. R.; MONTGOMERY, JR., J. A.; VRE-

VEN, T.; KUDIN, K. N.; BURANT, J. C.; MILLAM, J. M.; IYENGAR, S. S.;

TOMASI, J.; BARONE, V.; MENNUCCI, B.; COSSI, M.; SCALMANI, G.;

REGA, N.; PETERSSON, G. A.; NAKATSUJI, H.; HADA, M.; EHARA, M.;

TOYOTA, K.; FUKUDA, R.; HASEGAWA, J.; ISHIDA, M.; NAKAJIMA, T.;

HONDA, Y.; KITAO, O.; NAKAI, H.; KLENE, M.; LI, X.; KNOX, J. E.; HRAT-

CHIAN, H. P.; CROSS, J. B.; BAKKEN, V.; ADAMO, C.; JARAMILLO,

J.; GOMPERTS, R.; STRATMANN, R. E.; YAZYEV, O.; AUSTIN, A. J.;

CAMMI, R.; POMELLI, C.; OCHTERSKI, J. W.; AYALA, P. Y.; MORO-

KUMA, K.; VOTH, G. A.; SALVADOR, P.; DANNENBERG, J. J.; ZAKR-

ZEWSKI, V. G.; DAPPRICH, S.; DANIELS, A. D.; STRAIN, M. C.; FAR-

KAS, O.; MALICK, D. K.; RABUCK, A. D.; RAGHAVACHARI, K.; FORES-

MAN, J. B.; ORTIZ, J. V.; CUI, Q.; BABOUL, A. G.; CLIFFORD, S.; CIOS-

LOWSKI, J.; STEFANOV, B. B.; LIU, G.; LIASHENKO, A.; PISKORZ, P.;

KOMAROMI, I.; MARTIN, R. L.; FOX, D. J.; KEITH, T.; AL-LAHAM, M. A.;

PENG, C. Y.; NANAYAKKARA, A.; CHALLACOMBE, M.; GILL, P. M. W.;

JOHNSON, B.; CHEN, W.; WONG, M. W.; GONZALEZ, C. ; POPLE, J. A..

Gaussian 03, Revision C.02. Gaussian, Inc., Wallingford, CT, 2004. 6.5,

6.6, 7.4.1

[Gibson, 1994] GIBSON, R.. Principles of composite material mechanics.

McGraw-Hill, New York, 1994. 4.3

[Goasguen, 2005] GOASGUEN, S.; MADHAVAN, K.; MCLENNAN, M.;

LUNDSTORM, M. ; KLIMECK, G.. The NanoHUB: A Science Gateway

for the Computational Nanotechnology Community. Workshop on Sci-

ence Gateways: Common Community Interfaces to Grid Resources, GGF,

14, 2005. 2.5

[Gojny, 2004] GOJNY, F.; WICHMANN, M.; KÖPKE, U.; FIEDLER, B. ;

SCHULTE, K.. Carbon nanotube-reinforced epoxy-composites: enhan-

ced stiffness and fracture toughness at low nanotube content. Composi-

tes Science and Technology, 64(15):2363–2371, 2004. B

[Gojny, 2005] GOJNY, F.; WICHMANN, M.; FIEDLER, B. ; SCHULTE, K.. In-

fluence of different carbon nanotubes on the mechanical properties of

epoxy matrix composites–A comparative study. Composites Science

and Technology, 65(15-16):2300–2313, 2005. B

[Goldberg, 1989] GOLDBERG, D.. Genetic algorithms in search, optimization

and machine learning. Addison-Wesley Longman Publishing Co., Inc.

Boston, MA, USA, 1989. 3.1.1

[Gomes, 2006] GOMES, A.; CUSTODIO, R.. Polynomial expansion of basis

sets: Alternatives to fully optimized exponents. Journal of Molecular

Structure: THEOCHEM, 760(1-3):39–44, 2006. 6.2, 6.4, 6.5, 6.6

[Goodman, 1998] GOODMAN, J.. Chemical Applications of Molecular Mode-

ling. Royal Society of Chemistry, The, 2007. 2.3.4

[Greenham, 1993] GREENHAM, N.; MORATTI, S.; BRADLEY, D.; FRIEND, R.

; HOLMES, A.. Efficient light-emitting diodes based on polymers with

high electron affinities. 1993. 5.1

[Griffin, 1957] GRIFFIN, J.. Collective Motions in Nuclei by the Method of

Generator Coordinates. Physical Review, 108(2):311–327, 1957. 6.3

[Grundmann, 2002] GRUNDMANN, M.. Nano-Optoelectronics: Concepts, Phy-

sics, and Devices. Springer, 2002. 4.2

[Gu, 2006] GU, Y.; VANCOURT, T. ; HERBORDT, M.. Accelerating molecular

dynamics simulations with configurable circuits. Computers and Digital

Techniques, IEE Proceedings-, 153(3):189–195, 2006. 2.6

[Guimarães, 2002] GUIMARÃES, F.; BELCHIOR, J.; JOHNSTON, R. ; RO-

BERTS, C.. Global optimization analysis of water clusters (HO)(11? n?

13) through a genetic evolutionary approach. The Journal of Chemical

Physics, 116:8327, 2002. 7.5

[Gusso, 2004] GUSSO, A.; MA, D.; HÜMMELGEN, I. ; DA LUZ, M.. Modeling of

organic light-emitting diodes with graded concentration in the emissive

multilayer . Journal of Applied Physics, 95:2056, 2004. (document), 5.1,

5.1.1, 5.1.2, 5.1.2, 5.1.3, 5.2, 5.1.3, 5.3, 5.1.3

[Gusso, 2004] GUSSO, A.; MA, D.; HÜMMELGEN, I. ; DA LUZ, M.. Modeling of

organic light-emitting diodes with graded concentration in the emissive

multilayer . Journal of Applied Physics, 95:2056, 2004. 2.5

[Haketa, 2002] HAKETA, N.; YOKOYAMA, K.; TANAKA, H. ; KUDO, H.. Theore-

tical study on the geometric and electronic structure of thelithium-rich

LinFn- 1 (n= 2–5) clusters. Journal of Molecular Structure: THEOCHEM,

577(1):55–67, 2002. 7.4.1, 7.4.2

[Han, 2000] HAN, K.; KIM, J.. Genetic quantum algorithm and its application

to combinatorial optimization problem . In: PROCEEDINGS OF THE

2000 CONGRESS ON EVOLUTIONARY COMPUTATION, volumen 2, p.

1354–1360, 2000. 2.7

[Han, 2000] HAN, K.; KIM, J.. Genetic quantum algorithm and its application

to combinatorialoptimization problem . In: EVOLUTIONARY COMPU-

TATION, 2000. PROCEEDINGS OF THE 2000 CONGRESS ON, volu-

men 2, 2000. 3.1.4, 3.1.4, 3.1.4

[Han, 2002] HAN, K.; KIM, J.. Quantum-inspired evolutionary algorithm for a

class of combinatorial optimization. IEEE transactions on evolutionary

computation, 6(6):580–593, 2002. 3.1.4, 3.1.4, 3.1.4

[Hartke, 1993] HARTKE, B.. Global geometry optimization of clusters using

genetic algorithms. The Journal of Physical Chemistry, 97(39):9973–

9976, 1993. 7.2

[Harima, 2000] HARIMA, Y.; KUNUGI, Y.; YAMASHITA, K. ; SHIOTANI, M.. De-

termination of mobilities of charge carriers in electrochemically anion-

doped polythiophene film. Chemical Physics Letters, 317(3-5):310–314,

2000. 5.1.1

[Hartke, 2001] HARTKE, B.; FLAD, H. ; DOLG, M.. Structures of mercury

clusters in a quantum–empirical hybrid model. Physical Chemistry

Chemical Physics, 3(23):5121–5129, 2001. 7.2

[Hartke, 2003] HARTKE, B.. Size-dependent transition from all-surface to

interior-molecule structures in pure neutral water clusters. Physical

Chemistry Chemical Physics, 5(2):275–284, 2003. 7.2

[Haykin94] HAYKIN, S.. Neural Networks: A Comprehensive Foundation.

Prentice Hall PTR Upper Saddle River, NJ, USA, 2nd edition, 1994. 3.2.3

[Haykin, 1999] HAYKIN, S.. Neural Networks – A Comprehensive Foundation.

Prentice Hall, 2 edition, 1999. 4.2.1

[Hill, 1953] HILL, D.. Nuclear Constitution and the Interpretation of Fission

Phenomena. Physical Review, 89(5):1102–1145, 1953. 6.3

[Hohenberg, 1964] HOHENBERG, P.; KOHN, W.. Inhomogeneous Electron

Gas. Physical Review, 136:B864, 1964. 2.3.2

[Hong, 2005] HONG, Z.; ZHANG, P.; HE, C.; QIU, X.; LIU, A.; CHEN, L.;

CHEN, X. ; JING, X.. Nano-composite of poly (l-lactide) and surface

grafted hydroxyapatite: Mechanical properties and biocompatibility .

Biomaterials, 26(32):6296–6304, 2005. B

[Hopfield, 1982] HOPFIELD, J.. Neural networks and physical systems with

emergent collective computational abilities. Proceedings of the national

academy of sciences, 79(8):2554–2558, 1982. 3.2.1

[Hussain, 2007] HUSSAIN, F.; ROY, S.; NARASIMHAN, K.; VENGADASSA-

LAM, K. ; LU, H.. E-Glass Polypropylene Pultruded Nanocomposite: Ma-

nufacture, Characterization, Thermal and Mechanical Properties. Jour-

nal of Thermoplastic Composite Materials, 20(4):411, 2007. B

[Jo, 2008] JO, B.; PARK, S. ; KIM, D.. Mechanical properties of nano-MMT

reinforced polymer composite and polymer concrete. Construction and

Building Materials, 22(1):14–20, 2008. B

[Johnson, 2002] JOHNSON, S.; JOANNOPOULOS, J.. The MIT Photonic-

Bands Package. a href="http://ab-initio. mit. edu/mpb/» http://ab-initio. mit.

edu/mpb/</a. 2.5

[Johnston, 2003] JOHNSTON, R.. Evolving better nanoparticles: Genetic

algorithms for optimising cluster geometries. Dalton Transactions,

2003(22):4193–4207, 2003. 7.1, 7.2, 7.2, 7.3.3

[Jorge, 1997] JORGE, F.; DE CASTRO, E. ; DA SILVA, A.. Accurate uni-

versal Gaussian basis set for hydrogen through lanthanum generated

with the generator coordinate Hartree-Fock method. Chemical Physics,

216(3):317–321, 1997. 6.3

[Jorge, 1999b] JORGE, F.; MUNIZ, E.. Accurate adapted Gaussian basis sets

for the atoms from H through Xe. International Journal of Quantum

Chemistry, 71(4):307–312, 1999. 6.3

[Jorge, 1999] JORGE, F.; DE CASTRO, E.. Improved generator coordinate

Hartree–Fock method: application to first-row atoms. Chemical Physics

Letters, 302(5-6):454–460, 1999. 6.3, 6.5, 6.6, 6.6, 6.6, 6.6

[Kadau, 2006] KADAU, K.; GERMANN, T. ; LOMDAHL, P.. Molecular dynamics

comes of age: 320 billion atom simulation on BlueGene/L . Int. J. Mod.

Phys. C, 17:1755–1761, 2006. 2.3.1

[Klobukowski, 1993] KLOBUKOWSKI, M.. Comparison of generator formulas

for exponential parameters of Gaussian basis sets. Chemical Physics

Letters, 214, 2:166–174, 1993. 6.4, 6.4

[Klobukowski, 1994] KLOBUKOWSKI, M.. Systematic sequences of well-

balanced Gaussian basis sets. Canadian Journal of Chemistry,

72(7):1741–1752, 1994. (document), 6.4, 6.4, 6.6, 6.7, 6.8, 6.9, 6.6

[Koehler, 2000] KOEHLER, M.; DA LUZ, M. ; HUMMELGEN, I.. Bipolar tunnel-

ling injection into single-layer organic light emitting devices: analytical

solution using the regional approximation. Journal of Physics D: Applied

Physics, 33(17):2096–2107, 2000. 5.1

[Kohn, 1965] KOHN, W.; SHAM, L.. SELF-CONSISTENT EQUATIONS IN-

CLUDING EXCHANGE AND CORRELATION EFFECTS . Physical

Review, 1965. 2.3.2

[Koza, 1992] KOZA, J.. Genetic programming: on the programming of com-

puters by means of natural selection. MIT press, 1992. 3.1.1

[Kulkarni, 2008] KULKARNI, A.; GADRE, S. ; NAGASE, S.. Quantum chemical

and electrostatic studies of anionic water clusters,(H2O)n. Journal of

Molecular Structure: THEOCHEM, 851(1-3):213–219, 2008. 7.5

[Lagutschenkov, 2005] LAGUTSCHENKOV, A.; FANOURGAKIS, G.;

NIEDNER-SCHATTEBURG, G. ; XANTHEAS, S.. The spectrosco-

pic signature of the “all-surface” to “internally solvated ” structural

transition in water clusters in the n= 17–21 size regime. The Journal of

chemical physics, 122:194310, 2005. 7.5.1

[Lathouwers, 1978] LATHOUWERS, L.. Generator-coordinate theory of mole-

cular spectra. Physical Review A, 18(5):2150–2158, 1978. 6.3

[Leach, 2001] LEACH, A.. Molecular Modelling: Principles and Applications.

Prentice Hall, 2001. 2.3.2, 2.3.2, 2.3.2, 2.3.2, 2.3.2, 2.3.2, 2.3.4, 6.2

[Lent, 1994] LENT, C.; TOUGAW, P. ; POROD, W.. Logical devices implemen-

ted using quantum cellular automata. J. Appl. Phys, 75:1818–1825,

1994. 5.2, 5.2.1

[Likholyot, 2007] LIKHOLYOT, A.; LEMKE, K.; HOVEY, J. ; SEWARD, T.. Mass

spectrometric and quantum chemical determination of proton water

clustering equilibria . Geochimica et Cosmochimica Acta, 71(10):2436–

2447, 2007. 7.5

[Ma, 2000] MA, D.; HÜMMELGEN, I.; JING, X.; HONG, Z.; WANG, L.; ZHAO,

X.; WANG, F. ; KARASZ, F.. Charge transport in a blue-emitting alterna-

ting block copolymer with a small spacer to conjugated segment length

ratio . Journal of Applied Physics, 87:312, 2000. 5.1

[Ma, 2002] MA, D.; LEE, C.; LEE, S. ; HUNG, L.. Improved efficiency by a

graded emissive region in organic light-emitting diodes. Applied Physics

Letters, 80:3641, 2002. (document), 5.1, 5.1.1, 5.1.3, 5.3, 5.1.3, 5.1.3

[Mackay, 1992] MACKAY, D.. Bayesian interpolation. Neural computation,

4(3):415–447, 1992. 3.2.3

[Malliaras, 1998] MALLIARAS, G.; SCOTT, J.. The roles of injection and

mobility in organic light emitting diodes . Journal of Applied Physics,

83:5399, 1998. 5.1

[Mansoori, 2005] MANSOORI, G.. Principles of Nanotechnology: Molecular-

Based Study of Condensed Matter in Small Systems. World Scientific,

2005. 2.1

[Michalewicz, 1994] MICHALEWICZ, Z.. Genetic algorithms+ data structures

= evolution programs (2nd, extended ed.). Springer-Verlag New York,

Inc., New York, NY, USA, 1994. 3.1.2, 7.3.3

[Michalewicz, 1996] MICHALEWICZ, Z.. Genetic algorithms+ data structu-

res= evolution programs. Springer, 1996. 3.1.1

[Michalewicz, 1996] MICHALEWICZ, Z.. Genetic algorithms+ data structu-

res= evolution programs. Springer, 1996. 5.1.2, 5.1.2

[Mitchell, 1996] MITCHELL, M.. An introduction to genetic algorithms. Brad-

ford Books, 1996. 3.1.1

[Mohallem, 1986] MOHALLEM, J.; DREIZLER, R. ; TRSIC, M.. A Griffin-Hill-

Wheeler version of the Hartree-Fock equations. International Journal of

Quantum Chemistry, 30(s 20):45–55, 1986. 6.2, 6.3, 6.3

[Moore, 1995] MOORE, M.; NARAYANAN, A.. Quantum-inspired computing,

1995. 2.7

[Morgon, 2007] MORGON, N.; MORGON, N.; COUTINHO, K. ; COUTINHO, K..

Métodos de química teórica e modelagem molecular. Livraria da Física,

2007. 2.3.2, 2.3.2

[Nguyen, 2008] NGUYEN, Q.; ONG, Y.; SOH, H. ; KUO, J.. Multiscale Appro-

ach to Explore the Potential Energy Surface of Water Clusters (H2O)

nn? 8. The Journal of Physical Chemistry A, 112(28):6257–6261, 2008.

[Pal, 2008] PAL, R.. Mechanical properties of composites of randomly oriented

platelets. Composites Part A, 39(9):1496–1502, 2008. 4.3, 4.3.1, 4.3.1,

4.3.1, 4.3.1

[Partridge, 1989] PARTRIDGE, H.. Near Hartree–Fock quality GTO basis sets

for the first-and third-row atoms . The Journal of Chemical Physics,

90:1043, 1989. 6.6, 6.6

[Pauling, 1985] PAULING, L.; WILSON, E.. Introduction to Quantum Mecha-

nics. Dover Publications, 1985. 2.3.2

[Paul, 2006] PAUL, B.; FUJITA, S.; OKAJIMA, M. ; LEE, T.. Modeling and

analysis of circuit performance of ballistic CNFET. Proceedings of the

43rd annual conference on Design automation, p. 717–722, 2006. 2.6

[Petroff, 1982] PETROFF, P.; GOSSARD, A.; LOGAN, R. ; WIEGMANN, W..

Toward quantum well wires: Fabrication and optical propert ies. Applied

Physics Letters, 41:635, 1982. 4.2

[Poole, 2003] POOLE, C.; OWENS, F.. Introduction to Nanotechnology. Wiley-

Interscience, 2003. 1.1

[Potter, 2000] POTTER, M.; JONG, K.. Cooperative coevolution: An architec-

ture for evolving coadapted subcomponents. Evolutionary Computation,

8(1):1–29, 2000. 3.1.3

[Reed, 1986] REED, M.; BATE, R.; BRADSHAW, K.; DUNCAN, W.; FRENSLEY,

W.; LEE, J. ; SHIH, H.. Spatial quantization in GaAs–AlGaAs multiple

quantum dots. Journal of Vacuum Science & Technology B: Microelec-

tronics and Nanometer Structures, 4:358, 1986. 4.2

[Reed, 1998] REED, R.; MARKS, R.. Neural smithing: supervised learning in

feedforward artificial neural networks . MIT Press Cambridge, MA, USA,

1999. (document), 3.8, 3.2.3, 3.2.3, 3.2.3

[Ryzhii, 2004] RYZHII, V.; KHMYROVA, I.; RYZHII, M. ; MITIN, V.. Compari-

son of dark current, responsivity and detectivity in different intersub-

band infrared photodetectors. Semiconductor Science and Technology,

19(1):8–16, 2004. 4.2

[Schmidt, 2007] SCHMIDT, K.. Nanofrontiers: Visions for the Future of Nano-

technology. Washington, DC, Project on Emerging Nanotechnooogies.

Retrieved from http://www. nanotech project. org/reports, 2007. 2.4, 4.1

[Scott, 1997] SCOTT, J.; KARG, S. ; CARTER, S.. Bipolar charge and current

distributions in organic light-emitting diodes. Journal of Applied Physics,

82:1454, 1997. 5.1, 5.1.1

[Silva, 2006] DE ABREU E SILVA, E.; DUARTE, H. ; BELCHIOR, J.. An appro-

ach based on genetic algorithms and DFT for studying clusters:(H2O) n

(2? n? 13) cluster analysis. Chemical Physics, 323(2-3):553–562, 2006.

[Simpson, 1989] SIMPSON, J.; OTHERS. Oxford English Dictionary . Claren-

don Oxford, 1989. 2.3

[Singulani, 2008] SINGULANI, A.; VILELA NETO, O.; AURÉLIO PACHECO, M.;

VELLASCO, M.; PIRES, M. ; SOUZA, P.. Computational intelligence

applied to the growth of quantum dots. Journal of Crystal Growth,

310(23):5063–5065, 2008. 1.3

[Somorjai, 1968] SOMORJAI, R.. INTEGRAL TRANSFORM FUNCTIONS.

A NEW CLASS OF APPROXIMATE WAVE FUNCTIONS . 1968. 6.2

[Somorjai, 1969] SOMORJAI, R.. Integral transform functions. A simple non-

exponential orbital for the He series.Chemical Physics Letters, 3(6):395–

397, 1969. 6.2

[Souza, 2007] SOUZA, P. L.; LOPES, A. J.; GEBHARD, T.; UNTERRAINER, K.;

PIRES, M. P.; VILLAS-BOAS, J. M.; VIEIRA, G. S.; GUIMARAES, P. S. S.

; STUDART, N.. Quantum dot structures grown on al containing qua-

ternary material for infrared photodetection beyond 10 mu m. Applied

Physics Letters, 90(17):173510, 2007. 4.2

[Spector, 2004] SPECTOR, L.. Automatic Quantum Computer Programming

– A Genetic Programming Approach. Springer, 2004. 2.7

[Steiner, 2004] STEINER, T.. Semiconductor Nanostructures for Optoelectro-

nic Applications. Artech House, 2004. 4.2, 4.2

[Szabo, 1989] SZABO, A.; OSTLUND, N.. Modern quantum chemistry.

McGraw-Hill New York, 1989. 2.3.2, 6.1

[Tachibana, 2000] TACHIBANA, K.; SOMEYA, T.; ISHIDA, S. ; ARAKAWA, Y..

Selective growth of InGaN quantum dot structures and their micropho-

toluminescence at room temperature. Applied Physics Letters, 76:3212,

2000. 4.2

[Taniguchi, 1974] TANIGUCHI, N.; OTHERS. On the Basic Concept of Nanote-

chnology. Proc. Int. Conf. Prod. Eng, p. 18–23, 1974. 2.1

[Thio, 2002] THIO, Y.; ARGON, A.; COHEN, R. ; WEINBERG, M.. Toughening

of isotactic polypropylene with CaCO3 particles. Polymer, 43(13):3661–

3674, 2002. B

[Tjong, 2006] TJONG, S.. Structural and mechanical properties of polymer

nanocomposites. Materials Science & Engineering R, 53(3-4):73–197,

2006. B

[Ufimtsev, 2008] UFIMTSEV, I.; MARTÍNEZ, T.. Quantum Chemistry on

Graphical Processing Units. 1. Strategies for Two-ElectronIntegral Eva-

luation. J. Chem. Theory Comput, 4(2):222–231, 2008. 2.6

[Vianna, 2004] VIANNA, J.; CANUTO, S. ; FAZZIO, A.. Teoria Quântica de

Moléculas e Sólidos. Editora Livraria de Física, 2004. 2.3.2

[VilelaNeto, 2006] NETO, O. P. V.. Simulação e síntese automática de circuitos

de autômatos celulares com pontos quânticos através de técnicas inteli-

gentes. Master’s thesis, Pontifícia Universidade Católica do Rio de Ja-

neiro, 2006. 5.2.1

[VilelaNeto, 2007] NETO, O.; PACHECO, M. ; BARBOSA, C.. Neural Network

Simulation and Evolutionary Synthesis of QCA Circuits. IEEE TRAN-

SACTIONS ON COMPUTERS, p. 191–201, 2007. (document), 2.6, 5.2,

5.2.2, 5.2.2, 5.9, 5.2.3, 5.10, 5.2.3

[Vostrikov, 2006] VOSTRIKOV, A.; DROZDOV, S.; RUDNEV, V. ; KURKINA,

L.. Molecular dynamics study of neutral and charged water clusters.

Computational Materials Science, 35(3):254–260, 2006. 7.5

[Walus, 2002] WALUS, K.; VETTETH, A.; JULLIEN, G. ; DIMITROV, V.. Design

AND Simulation OF Quantum-Dot Cellular Automata . CMC Symp. on

Microelectronics Research and Development in Canada, Ottawa, June,

2002. 2.5

[Walus, 2004] WALUS, K.; DYSART, T.; JULLIEN, G. ; BUDIMAN, R.. QCADe-

signer: A rapid design and simulation tool for quantum-dot cellular au-

tomata. IEEE Transactions on Nanotechnology, 3(1):26–31, 2004. 5.2.2

[Wang, 2004a] WANG, J.; PYRZ, R.. Prediction of the overall moduli of laye-

red silicate-reinforced nanocomposites–part I: basic theory and formu-

las. Composites Science and Technology, 64(7-8):925–934, 2004. 4.3

[Wang, 2004b] WANG, J.; PYRZ, R.. Prediction of the overall moduli of laye-

red silicate-reinforced nanocomposites–part II: analyses. Composites

Science and Technology, 64(7-8):935–944, 2004. 4.3

[Wasserman, 1989] WASSERMAN, P.. Neural computing: theory and prac-

tice. Van Nostrand Reinhold Co. New York, NY, USA, 1989. 3.2.1, 3.2.1

[Webster, 2004] WEBSTER, T.; WAID, M.; MCKENZIE, J.; PRICE, R. ; EJIO-

FOR, J.. Nano-biotechnology: carbon nanofibres as improved neural

and orthopaedic implants. Nanotechnology, 15(1):48–54, 2004. B

[Werner, 2003] WERNER, A.; LI, F.; HARADA, K.; PFEIFFER, M.; FRITZ, T. ;

LEO, K.. Pyronin B as a donor for n-type doping of organic thin films.

Applied Physics Letters, 82:4495, 2003. 5.1

[Wong, 1975] WONG, C.. Generator-coordinate methods in nuclear physics.

Phys. Rep, 15(5), 1975. 6.3

[Wu, 2004] WU, Y.; JIA, Q.; YU, D. ; ZHANG, L.. Modeling Youngs modulus of

rubber–clay nanocomposites using composite theories. Polymer Testing,

23(8):903–909, 2004. 4.3.1

[Xiao, 1993] XIAO, Y.; WILLIAMS, D.. Genetic algorithm: a new approach to

the prediction of the structure of molecular clusters. Chemical Physics

Letters, 215(1-3):17–24, 1993. 7.2

[Zebulum, 2002] ZEBULUM, R.; PACHECO, M. ; VELLASCO, M.. Evolutionary

Electronics: Automatic Design of Electronic Circuits and Systems by

Genetic Algorithms. CRC Press, 2002. 1.1

[Zeiri, 1995] ZEIRI, Y.. Prediction of the lowest energy structure of clusters

using a genetic algorithm. Physical Review E, 51(4):2769–2772, 1995.

[Zeng, 2004] ZENG, J.; SALTYSIAK, B.; JOHNSON, W.; SCHIRALDI, D. ;

KUMAR, S.. Processing and properties of poly (methyl methacry-

late)/carbon nano fiber composites. Composites Part B, 35(2):173–178,

2004. B

[Zhang, 2004] ZHANG, Q.; YU, Z.; XIE, X. ; MAI, Y.. Crystallization and

impact energy of polypropylene/CaCO3 nanocomposites with nonionic

modifier. Polymer, 45(17):5985–5994, 2004. 4.3.1, 4.3.1, B

[Zurada, 1992] ZURADA, J.. Introduction to artificial neural systems. West

Publishing Co. St. Paul, MN, USA, 1992. 3.2.3

[da Cruz, 2004] DA CRUZ, A.; BARBOSA, C.; PACHECO, M. ; VELLASCO,

M.. Quantum-inspired evolutionary algorithms and its application to

numerical optimization problems. Lecture notes in computer science, p.

212–217, 2004. 3.1.4

ATabela com os Experimentos dos Pontos Quânticos

Apêndice

Tabelacom

xperimentos

ontosQ

uânticos150

Entradas Saídassample fluxo de In Esp. Base Temp. Cresc. T Cresc. % In % Al Densidade Altura Desvio Padrão

sccm nm oC s 108PQ/cm2 nm nm1 60 50 500 3 100 0 13 15.5 1.72 60 50 500 3 100 0 1.5 12.4 1.93 60 50 500 3 100 0 2.4 17 1.14 60 50 500 3 100 0 1.8 13.8 1.55 72 50 500 2.4 100 0 0.76 11.9 1.26 60 50 500 3.6 100 0 4.76 13.7 1.57 60 50 490 3 100 0 1.88 11.7 1.18 60 50 500 4.2 100 0 8.5 15.1 0.89 60 50 500 4.8 100 0 3.16 12.6 1.1

10 60 50 500 4.6 100 0 3.32 16.2 1.111 60 50 500 3.9 100 0 5 15.4 0.812 60 50 540 4.2 100 0 64.75 26.5 3.813 60 50 520 4.2 100 0 78.25 18.7 2.814 60 50 540 4.2 100 0 23.56 29.2 5.915 60 50 515 4.2 100 0 50 18.5 1.516 66 50 520 4.2 100 0 66.5 17 217 30 50 520 4.2 100 0 0.48 25 118 76 50 520 4.2 100 0 52.25 13.8 2.819 60 50 520 4.2 100 0 92.75 16.1 2.920 60 50 520 3.8 100 0 74.5 22.5 3.721 60 50 520 3.2 100 0 18.5 26.6 2.122 60 500 500 5 52.9 0 105 7.42 1.7123 60 500 500 5 49.1 0 39 10 1.5

Apêndice

Tabelacom

xperimentos

ontosQ

uânticos151

sccm nm oC s 108PQ/cm2 nm nm24 60 500 500 5 55.4 0 70.5 8.5 1.225 60 500 500 5 54.8 0 62 9.3 1.426 60 500 500 5 51.3 0 49 9.2 1.127 60 500 500 5 53.3 0 57.5 9.9 1.528 60 500 500 5.5 53 0 80 7.8 1.829 60 500 500 5.9 53.2 0 78.5 7.5 1.730 60 500 510 5.5 53 0 79 8 1.531 60 500 510 5.5 53 0 80 8.3 1.632 60 500 520 5.9 52.7 0 90 6 133 60 500 520 3.5 53.6 0 69 5.1 134 60 10 520 5.5 53.3 0 118 9.1 1.535 66 10 520 5.5 53.3 0 148 8.2 1.536 60 10 500 5.5 53.3 0 129 8.1 237 66 10 500 5.5 53.3 0 130 8.7 2.238 72 10 520 5.5 53.3 0 156 8.4 1.739 78 10 520 5.5 53.3 0 173 8.6 1.940 90 10 520 5.5 53.3 0 182 9 2.241 66 500 520 5.5 51.8 0 147 9.3 1.542 66 10 520 5.5 51.8 0 128 9.9 143 66 10 520 5.5 54.5 0 132 7.6 1.644 66 500 520 5.5 54.5 23.3 130 7.5 1.545 66 10 520 5.5 54.5 23 162 7.1 1.546 66 10 490 5.5 53.3 5.8 106.25 8.7 1.947 60 500 500 5 52.3 16.5 210 4.45 1.68

Apêndice

Tabelacom

xperimentos

ontosQ

uânticos152

sccm nm oC s 108PQ/cm2 nm nm48 60 500 500 5 50.2 29 91 6.85 2.0249 60 500 500 5 52 16.5 87 5.95 3.1850 60 500 500 5 53.4 16.5 138 5.5 1.9751 60 500 500 5 52.6 11.2 6.16 2.1152 60 500 500 5 53.4 14.5 67.5 7.7 1.753 60 500 500 5 53.4 19.3 75 8.6 1.854 66 500 520 5.5 52.8 19.3 89.5 7.49 1.6455 66 500 520 5.5 50.3 19.3 109.0 7.76 1.6956 66 500 520 5.5 52.5 19.3 100.0 7.66 1.5957 66 1.5 520 5.5 52.5 19.3 120.0 9.15 2.158 66 500 520 5.5 52.5 19.3 83.0 8.57 1.8159 66 1.5 500 5.5 52.5 19.3 54.3 4.09 1.3960 66 1.5 500 6.3 52.5 19.3 235.3 7.83 2.2561 66 1.5 500 5.9 52.5 16.5 192.0 7.86 2.4762 66 1.5 520 5.5 52.5 16.1 108.25 3.57 0.9463 66 500 520 5.5 53.7 16.1 138.8 8.93 1.9964 66 500 520 6.3 52.6 16.1 126.5 6.57 1.4965 69 1.5 500 6.3 52.3 18 111.75 11.7 1.1866 66 500 520 6.3 52.3 0 114.8 8.53 1.6167 66 500 520 6 52.3 29 113.0 9.06 4.03

BTabela com os Experimentos dos Nanocompósitos

Matrizes

– DGEBPA Diglicil éter de bisfenol A

– iPP Polipropileno isotático

– PA6 Poliamida 6 (nylon)

– PLLA Poli(L- Ácido Lático) (Poly-L-Lactide Acid)

– PMMA Polimetilmetacrilato

– PP Polipropileno

– PU Poliuretano

– UP Poliester não saturado (Unsaturated Polyester)

Cargas

– CB Carbono ativado (carbon black)

– CNF Nanofibra de carbono (carbon nanofiber)

– DWCNT Nanotubo de carbono de parede dupla (double wall carbonnano-

– MMT Montmorilonita

– MWCNT Nanotubo de carbono de paredes múltiplas (multiwall carbon na-

notube)

– SWCNT Nanotubo de carbono de parede única (singlewall carbonnanotube)

Apêndice B. Tabela com os Experimentos dos Nanocompósitos 154

Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPA) ReferênciaPU – – – – 0.004 (Webster, 2004)PU CNF 0.02 60 500 0.006 (Webster, 2004)PU CNF 0.1 60 500 0.022 (Webster, 2004)PU CNF 0.25 60 500 0.028 (Webster, 2004)PP – – – – 0.71 (Zhang, 2004)PP CaCO3 0.05 44 1 0.71 (Zhang, 2004)PP CaCO3 0.1 44 1 0.74 (Zhang, 2004)PP CaCO3 0.15 44 1 0.81 (Zhang, 2004)PP CaCO3 0.15 44 1 0.78 (Zhang, 2004)PP CaCO3 0.15 44 1 0.76 (Zhang, 2004)PP CaCO3 0.15 44 1 0.74 (Zhang, 2004)PP CaCO3 0.2 44 1 0.84 (Zhang, 2004)iPP – – – – 1.437 (Thio, 2002)iPP CaCO3 0.135068 160 1 1.691 (Thio, 2002)iPP CaCO3 0.247934 160 1 1.871 (Thio, 2002)iPP CaCO3 0.425868 160 1 1.973 (Thio, 2002)iPP CaCO3 0.559779 220 1 2.697 (Thio, 2002)iPP CaCO3 0.247934 370 1 1.682 (Thio, 2002)iPP CaCO3 0.372974 370 1 1.785 (Thio, 2002)iPP CaCO3 0.474052 370 1 2.44 (Thio, 2002)iPP CaCO3 0.559779 560 1 2.867 (Thio, 2002)PP – – – – 1.6 (Chan, 2002)PP CaCO3 0.137352 44 1 2.7 (Chan, 2002)PP CaCO3 0.137352 44 1 3 (Chan, 2002)PP CaCO3 0.137352 44 1 2.5 (Chan, 2002)PP CaCO3 0.242403 44 1 3 (Chan, 2002)PP CaCO3 0.242403 44 1 2.6 (Chan, 2002)PP CaCO3 0.242403 44 1 2.9 (Chan, 2002)PP CaCO3 0.324431 44 1 2.6 (Chan, 2002)

Tabela B.1: Dados retirados de tabelas disponíveis na literatura.

Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPa) ReferênciaPMMA – – – – 4.7 (Zeng, 2004)PMMA CNF (PR21PS) 0.05 200 100 8 (Zeng, 2004)PMMA CNF (PR21PS) 0.1 200 100 7.7 (Zeng, 2004)PMMA CNF (PR24PS) 0.05 100 100 7.5 (Zeng, 2004)PMMA CNF (PR24PS) 0.1 100 100 7.6 (Zeng, 2004)E–glass–PP – – – – 4.12 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.01 1 200 6.68 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.02 1 200 6.97 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.03 1 200 7.1 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.04 1 200 7.92 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.05 1 200 8.23 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.1 1 200 8.67 (Hussain, 2007)PMMA – – – – 1.35 (Fu, 2006)PMMA MMT (20A) 0.005 2.42 200 1.72 (Fu, 2006)PMMA MMT (20A) 0.01 2.42 200 1.48 (Fu, 2006)PMMA MMT (20A) 0.02 2.42 200 1.39 (Fu, 2006)PMMA MMT (20A) 0.005 2.42 200 1.28 (Fu, 2006)PMMA MMT (20A) 0.01 2.42 200 1.26 (Fu, 2006)PMMA MMT (20A) 0.02 2.42 200 1.24 (Fu, 2006)Epoxy – – – – 2.599 (Gojny, 2005)Epoxy CB 0.001 30 1 2.752 (Gojny, 2005)Epoxy CB 0.003 30 1 2.796 (Gojny, 2005)Epoxy CB 0.005 30 1 2.83 (Gojny, 2005)Epoxy SWCNT 0.0005 2 500 2.681 (Gojny, 2005)Epoxy SWCNT 0.001 2 500 2.691 (Gojny, 2005)Epoxy SWCNT 0.003 2 500 2.812 (Gojny, 2005)Epoxy DWCNT 0.001 2.8 500 2.785 (Gojny, 2005)Epoxy DWCNT 0.003 2.8 500 2.885 (Gojny, 2005)Epoxy DWCNT 0.005 2.8 500 2.79 (Gojny, 2005)Epoxy DWCNT–NH2 0.001 2.8 500 2.61 (Gojny, 2005)Epoxy DWCNT–NH2 0.003 2.8 500 2.944 (Gojny, 2005)Epoxy DWCNT–NH2 0.005 2.8 500 2.978 (Gojny, 2005)Epoxy MWCNT 0.001 15 3333.3 2.78 (Gojny, 2005)Epoxy MWCNT 0.003 15 3333.3 2.765 (Gojny, 2005)Epoxy MWCNT 0.005 15 3333.3 2.609 (Gojny, 2005)Epoxy MWCNT–NH2 0.001 15 3333.3 2.884 (Gojny, 2005)Epoxy MWCNT–NH2 0.003 15 3333.3 2.819 (Gojny, 2005)Epoxy MWCNT–NH2 0.005 15 3333.3 2.82 (Gojny, 2005)

Tabela B.2: Dados retirados de tabelas disponíveis na literatura. (continuação)

Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPA) ReferênciaEpoxy – – – – 3.282 (Gojny, 2004)Epoxy CB 0.1 30 1 3.297 (Gojny, 2004)Epoxy DWNT 0.1 2.8 2500 3.352 (Gojny, 2004)Epoxy DWNT–NH2 0.1 2.8 2500 3.496 (Gojny, 2004)Epoxy DWNT–NH2 1 2.8 2500 3.508 (Gojny, 2004)UP – – – – 2.994631 (Jo, 2008)UP MMT Na+ 0.02 1.17 100 3.087248 (Jo, 2008)UP MMT Na+ 0.05 1.17 100 3.515436 (Jo, 2008)UP MMT Na+ 0.08 1.17 100 3.230201 (Jo, 2008)UP MMT Na+ 0.1 1.17 100 2.851678 (Jo, 2008)UP MMT (25A) 0.02 1.85 100 3.189262 (Jo, 2008)UP MMT (25A) 0.05 1.85 100 3.655034 (Jo, 2008)UP MMT (25A) 0.08 1.85 100 3.332886 (Jo, 2008)UP MMT (25A) 0.1 1.85 100 3.097315 (Jo, 2008)UP MMT (30B) 0.02 1.86 100 2.844295 (Jo, 2008)UP MMT (30B) 0.05 1.86 100 4.033557 (Jo, 2008)UP MMT (30B) 0.08 1.86 100 3.515436 (Jo, 2008)UP MMT (30B) 0.1 1.86 100 3.148322 (Jo, 2008)PA6 – – – – 20.17752 (Tjong, 2006)PA6 SiO2 0.05 12 1 22.37711 (Tjong, 2006)PA6 SiO2 0.1 12 1 24.19246 (Tjong, 2006)PP – – – – 1.390909 (Tjong, 2006)PP SiO2 0.01 12 1 1.421818 (Tjong, 2006)PP SiO2 0.025 12 1 1.492727 (Tjong, 2006)PP SiO2 0.05 12 1 1.565455 (Tjong, 2006)PP SiO2 0.075 12 1 1.614545 (Tjong, 2006)PP SiO2 0.1 12 1 1.690909 (Tjong, 2006)PP SiO2 0.15 12 1 1.8 (Tjong, 2006)

Tabela B.3: Dados retirados de gráficos disponíveis na literatura.

Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPA) ReferênciaPLLA (moulded) – – – – 1.855 (Hong, 2005)PLLA (moulded) g-HAP 0.02 20 5 2.34 (Hong, 2005)PLLA (moulded) g-HAP 0.04 20 5 2.553 (Hong, 2005)PLLA (moulded) g-HAP 0.06 20 5 2.553 (Hong, 2005)PLLA (moulded) g-HAP 0.08 20 5 2.644 (Hong, 2005)PLLA (moulded) g-HAP 0.1 20 5 2.68 (Hong, 2005)PLLA (moulded) g-HAP 0.15 20 5 2.98 (Hong, 2005)PLLA (moulded) g-HAP 0.2 20 5 3.161 (Hong, 2005)PLLA (moulded) HAP 0.02 20 5 2.34 (Hong, 2005)PLLA (moulded) HAP 0.04 20 5 2.42 (Hong, 2005)PLLA (moulded) HAP 0.06 20 5 2.526 (Hong, 2005)PLLA (moulded) HAP 0.08 20 5 2.631 (Hong, 2005)PLLA (moulded) HAP 0.1 20 5 2.651 (Hong, 2005)PLLA (moulded) HAP 0.15 20 5 2.954 (Hong, 2005)PLLA (moulded) HAP 0.2 20 5 3.051 (Hong, 2005)PLLA (annealed) – – – – 3.064 (Hong, 2005)PLLA (annealed) HAP 0.02 20 5 3.257 (Hong, 2005)PLLA (annealed) HAP 0.04 20 5 3.201 (Hong, 2005)PLLA (annealed) HAP 0.06 20 5 3.311 (Hong, 2005)PLLA (annealed) HAP 0.08 20 5 3.533 (Hong, 2005)PLLA (annealed) HAP 0.1 20 5 3.617 (Hong, 2005)PLLA (annealed) HAP 0.15 20 5 3.641 (Hong, 2005)PLLA (annealed) HAP 0.2 20 5 3.851 (Hong, 2005)PLLA (annealed) g-HAP 0.02 20 5 3.233 (Hong, 2005)PLLA (annealed) g-HAP 0.04 20 5 3.286 (Hong, 2005)PLLA (annealed) g-HAP 0.06 20 5 3.365 (Hong, 2005)PLLA (annealed) g-HAP 0.08 20 5 3.557 (Hong, 2005)PLLA (annealed) g-HAP 0.1 20 5 3.514 (Hong, 2005)PLLA (annealed) g-HAP 0.15 20 5 3.832 (Hong, 2005)PLLA (annealed) g-HAP 0.2 20 5 3.988 (Hong, 2005)

Tabela B.4: Dados retirados de gráficos disponíveis na literatura. (continuação)

CResultados para os agregados de Li e F

Agregados de(LiF )4Li+

-437.5591057 -437.5363501 -437.5305583

-437.5252658 -437.5241856 -437.5221094

-437.521931 -437.5197022 -437.5194124

-437.5162035 -437.5151571 -437.5138115

-437.5132765 -437.5065181 -437.5024028

-437.5022807 -437.4875088

Tabela C.1: Estruturas dos aglomerados (LiF )4Li+.

Apêndice C. Resultados para os agregados de Li e F 159

Agregados de(LiF )4

-430.1630023 -430.1497364 -430.1442856

-430.1251002 -430.1237355

Tabela C.2: Estruturas dos aglomerados (LiF )4.

Agregados de(LiF )4F−

-530,148160 -530,128213 -530,116100

-530,114973 -530,113500 -530,112855

-530,111754 -530,109168 -530,107444

-530,106252 -530,096268 -530,093002

-530,086193 -530,082332

Tabela C.3: Estruturas dos aglomerados (LiF )4F−.

Agregados de(LiF )5F−

-637,703005 -637,702522 -637689894

-637,686801 -637,686789 -637,686729

-637,681344 -637,673634 -637,670310

-637,668581 -637,666413 -637,665640

-637,655340 -637,653673

Tabela C.4: Estruturas dos aglomerados (LiF )5F−.

DSíntese de OLEDs multicamadas

Dois M-OLEDs foram fabricados para verificar a validade experimental dos

resultados encontrados nas simulações. OAlq3 e o NPB foram usados tal como

fornecidos para fabricar os dispositivos OLEDs. Anodos pré-padronizados de óxido

de índio estanho (ITO) pré-depositados em substratos de vidro (com uma resistência

de 8 (Ω/quadrado) foram limpos por tratamento RCA(Chang, 1996), enxaguados

com água deionizada, seguido de sonicação em etanol por 10 minutos.

Depois da limpeza os substratos foram secados debaixo de nitrogênio. Ca-

madas orgânicas foram depositadas em substratos à temperatura ambiente por eva-

poração térmica de cadinhos de quartzo resistivamente aquecidos em sistema com

ambiente de alto vácuo, com uma pressão base em torno de 3.10−8torr ( 4.10−6Pa)

Os M-OLEDs foram montados usando-se uma heterojunção contendo uma

camada de puro NPB (30nm), uma região graduada com cinco camadas internas

co-depositadaNPB : Alq3 (10 nm de espessura cada) e uma pura camada de

Alq3 (20nm). A região graduada foi produzida por co-deposição depuro NPB e

Alq3 de duas fontes separadas. Finalmente, sem quebrar o vácuo, uma camada de

50nm de espessura de Mg:Ag (10:1) com uma camada protetora deprata (50nm),

usada como catodo, foi co-evaporada a partir de cadinhos em taxa de 0.5nm/s em

uma segunda câmara de vácuo. A espessura das camadas puras e arazão deNPB

paraAlq3 em cada camada interna foi precisamente controlada por software in situ

através de um monitor de cristal de quartzo. Os dispositivoseletroluminecentes

fabricados apresentaram área ativa em torno de 3mm2 foram operadas em voltagens,

com ITO como eletrodo positivo eMg : Ag/Ag como eletrodo negativo. Os

dispositivos foram transferidos diretamente do sistema dedeposição para uma

câmara manipuladora com atmosfera controlada deN2 e caracterizada dentro de

uma hora após fabricação. O comportamento IxV e as medidas debrilho foram

executadas usando-se um Keithlhey2400 calibrado e um Radiômetro/Fotômetro

fabricado por United Detector Technology (UDT-350).

Livros Grátis( http://www.livrosgratis.com.br )

Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas

Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo

Omar Paranaiba Vilela Neto Projeto, Otimização, Simulação...

Documents

Transcript of Omar Paranaiba Vilela Neto Projeto, Otimização, Simulação...

otimização de processos

Otimização Básica

Otimização sites - SEO

Qualidade, Processos e Otimização Industrial - cegoc.co.mz · Qualidade, Processos e Otimização Industrial Qualidade, Ambiente e Segurança Otimização Industrial Otimização

Otimização MySQL

4.9. TRATAMENTO DO CHORUME “IN NATURA” DO LIXÃO DE ... · 85 4.9. tratamento do chorume “in natura” do lixÃo de guaratinguetÁ-sp por ozonizaÇÃo catalÍtica homogÊnea

TRABALHO - OTIMIZAÇÃO COMBINATORIA

PARANAIBA NATAL 2018 ALTERADO - galaxcms.com.br · Sabonete Farnese Frag. 180g Ofertas válidas até 24/12/2018 ou enquanto durarem os estoques Reservamo-nos o direito de corrigir

TRABALHO DE OTIMIZAÇÃO

RELATÓRIO FINAL DA AVALIAÇÃO SAZONAL DE NUTRIÇÃO …³rio-da-Avalia... · 3.1. Desenho de Estudo ... 4.9 4.7 4.9 Foi usada a média do tamanho de agregados familiares da província,

OTIMIZAÇÃO COMBINATÓRIA

Otimização de Cortes

OTIMIZAÇÃO DOS PROCEDIMENTOS DE PREPARAÇÃO, … · requisitos para obtenção do Grau de Mestre em Ciências na Área de Tecnologia Nuclear – Aplicações. ... 4.9 Estudo in

Otimização da produção

SOFTWARES DE OTIMIZAÇÃO

Gestão da Qualidade Assistencial no SNS Cogestão de ... · Dor 110, 90% Anemia 117, 96% Delirium 45, 37% ... Hipertensão arterial 6, 4.9% Hiponatrémia 6, 4.9% 1122 doentes 256

Processamento de produtos de origem animal 4.9 Creme de ...

Artigo otimização estrutural

Elaboração de Projeto de Pesquisa Prof. Adriano Paranaiba.

OTIMIZAÇÃO ESTRUTURAL TOPOLOGICA.pptx