Post on 06-Jul-2020
Omar Paranaiba Vilela Neto
Projeto, Otimização, Simulação e Predição dePropriedades de Nanoestruturas através de
Técnicas da Inteligência Computacional:Nanotecnologia Computacional Inteligente
Tese de Doutorado
Tese apresentada ao Programa de Pós–graduação em Nan-otecnologia do Departamento de Engenharia Elétrica da PUC-Rio como requisito parcial para obtenção Do título de Doutorem Nanotecnologia
Orientador : Prof. Marco Aurélio C. PachecoCo–Orientador: Prof. André Silva Pimentel
Rio de JaneiroAgosto de 2009
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Omar Paranaiba Vilela Neto
Projeto, Otimização, Simulação e Predição dePropriedades de Nanoestruturas através de
Técnicas da Inteligência Computacional:Nanotecnologia Computacional Inteligente
Tese apresentada ao Programa de Pós–graduação em Nan-otecnologia do Departamento de Engenharia Elétrica do Cen-tro Técnico Científico da PUC-Rio como requisito parcial paraobtenção Do título de Doutor em Nanotecnologia. Aprovadapela Comissão Examinadora abaixo assinada.
Prof. Marco Aurélio C. PachecoOrientador
Departamento de Engenharia Elétrica — PUC-Rio
Prof. André Silva PimentelCo–Orientador
Departamento de Química — PUC-Rio
Rio de Janeiro, 26 de Agosto de 2009
Todos os direitos reservados. É proibida a reprodução totalouparcial do trabalho sem autorização da universidade, do autor edo orientador.
Omar Paranaiba Vilela Neto
Graduou-se em Engenharia de Computação na Pontifícia Univer-sidade Católica do Rio de Janeiro. Mestrado na área de Sistemasde Apoio à Decisão no Departamento de Engenharia Elétrica daPontifícia Universidade Católica do Rio de Janeiro.
Ficha CatalográficaVilela Neto, Omar Paranaiba
Projeto, Otimização, Simulação e Predição de Pro-priedades de Nanoestruturas através de Técnicas da In-teligência Computacional: Nanotecnologia ComputacionalInteligente / Omar Paranaiba Vilela Neto; orientador: MarcoAurélio C. Pacheco; co–orientador: André Silva Pimentel.— Rio de Janeiro : PUC-Rio, Departamento de EngenhariaElétrica, 2009.
v., 162 f: il. ; 29,7 cm
1. Tese (doutorado) - Pontifícia Universidade Católicado Rio de Janeiro, Departamento de Engenharia Elétrica.
Inclui referências bibliográficas.
1. Engenharia Elétrica – Tese.2. Nanociência. 3. Nanotecnologia. 4. Química Com-putacional. 5. Inteligência Computacional. 6. AlgoritmosGenéticos. 7. Redes Neurais Artificiais.I. Pontifícia Universidade Católica do Rio de Janeiro. De-partamento de Engenharia Elétrica. II. Título.
CDD: 510
Aos meus pais Paulo Antônio e Cora Alice e à minha esposa Adrissa
Agradecimentos
Ao CNPq, FAPERJ e à PUC-Rio pelos auxílios concedidos, sem os quais este
trabalho não poderia estar sendo realizado.
Aos meus orientadores Prof. Marco Aurélio C. Pacheco e Prof. André Silva
Pimentel pelos ensinamentos e parceria.
Aos professores Ênio da Silveira, Marco Cremona, José Robertod’Almeida,
Patrícia Lustoza e Marley Vellasco pelas discussões, conselhos e ajuda.
Aos meus grandes parceiros neste trabalho Anderson Pires Singulani, Lean-
dro Fontoura Cupertino e Iury Steiner Bezerra pelo trabalho emequipe.
Aos amigos André Vargas Abs da Cruz, Douglas Mota Dias, Bruno Melo,
Rafael Martinez, Renato “Barbosinha” de Oliveira e Eugênio da Silva pelo apoio e
incentivo.
Aos amigos do suporte Bernardo, Manuela, André e “Cardosinho”pelos
serviços e atenção prestada.
Aos demais amigos do ICA.
Aos funcionários da secretaria e da oficina que ajudaram sempre quando foi
necessário.
Ao meu sobrinho João Paulo e à minha irmã Lisa Paula pela torcida, confiança
e amor.
Resumo
Vilela Neto, Omar Paranaiba; ; .Projeto, Otimização, Simulação ePredição de Propriedades de Nanoestruturas através de Técnicasda Inteligência Computacional: Nanotecnologia Computacional In-teligente. Rio de Janeiro, 2009. 162p. Tese de Doutorado — Departa-mento de Engenharia Elétrica, Pontifícia Universidade Católica do Riode Janeiro.
Esta tese investiga o potencial das técnicas da Inteligência Computacional (Re-des Neurais e Algoritmos Genéticos) no apoio ao desenvolvimento da Nanociênciae Nanotecnologia. As aplicações da Inteligência Computacional (IC) investigadasenvolvem a simulação, a inferência, a otimização e a síntesede nanoestruturas e na-nodispositivos. O apoio dos sistemas de computação nesta área vem sendo denomi-nado “Nanotecnologia Computacional” ou “Nanociência Computacional”. O apoiomais comum é através do uso de simuladores dedicados a nanodispositivos específi-cos e dos métodos de modelagem molecular que usam teorias da mecânica clássicae quântica para imitar o comportamento de sistemas atômicose moleculares, sendopossível preverem características de nanoestruturas. Esta tese investiga a aplicaçãodas técnicas de Inteligência Computacional (IC) nas metodologias citadas acima etambém na predição de características de dispositivos a partir de dados experimen-tais. Neste caso, utilizam-se as Redes Neurais para construir sistemas de inferênciacapazes de relacionar um conjunto de parâmetros de entrada com as característicasfinais das nanoestruturas, permitindo aos pesquisadores prever o comportamento deoutras nanoestruturas ainda não realizadas experimentalmente. A partir dos siste-mas de inferência, Algoritmos Genéticos são então empregados com o intuito deencontrar o conjunto ótimo de parâmetros de entrada para a síntese de uma nano-estrutura desejada. Numa outra linha de investigação, os Algoritmos Genéticos sãousados para a otimização de funções de base para cálculos ab initio. Neste caso, sãootimizados os expoentes das funções gaussianas que compõemas funções de base,aprimorando alguns métodos propostos na literatura. Em outra abordagem, os mé-todos de computação evolutiva são aplicados na otimização de agregados atômicose moleculares, permitindo aos pesquisadores estudar teoricamente os agregados for-mados experimentalmente. Por fim, o uso da computação evolutiva, aliado ao usode simuladores, é aplicado na síntese automática de OLEDs e circuitos de Autô-matos Celulares com Pontos Quânticos (QCA), permitindo a obtenção de soluçõesinovadoras e de alta eficiência. Os sistemas híbridos de otimização e inferência sãoconcebidos para prever a altura, a densidade e o desvio padrão de pontos quânticosauto-organizáveis, apresentando erros percentuais muitobaixos, próximo a 10%. Omódulo de elasticidade de nanocompósitos também é previstopor um sistema seme-lhante e apresenta erros percentuais ainda menores, por volta de 4%, superando osmodelos analíticos propostos na literatura. Em ambos os casos os sistemas tornam-se ferramentas importantes para a área. Os Algoritmos Genéticos, juntamente com osoftware de modelagem molecular Gaussian03, otimizam os parâmetros de funçõesque geram expoentes de primitivas gaussianas de funções de base (para cálculoshartree-fock), obtendo energias menores do que aquelas apresentadas na literatura.Os Algoritmos Genéticos, em conjunto com algoritmos de otimização local pre-sentes no Gaussian03, também se mostram eficientes na busca pelas geometrias debaixa energia dos agregados atômicos de (LiF)nLi+, (LiF)n e (LiF)nF-, obtendouma série de novos isômeros ainda não propostos na literatura, principalmente para
n > 2. Uma metodologia semelhante é aplicada em um sistema inédito para enten-der a formação de agregados moleculares de H2O iônicos, partindo-se de agregadosneutros. Os resultados mostram como os agregados podem ser obtidos a partir dediferentes perspectivas, formando estruturas ainda não investigadas. Este trabalhotambém apresenta a síntese automática de circuitos de QCA robustos, ou seja, comalto grau de polarização das células de saída, minimizando ainterferência externaao circuito. Os circuitos obtidos apresentam grau de polarização semelhante àquelespropostos pelos especialistas, mas com uma importante redução na quantidade decélulas. Por fim, um sistema envolvendo Algoritmos Evolutivos e um modelo ana-lítico de OLEDs multicamadas otimizam as concentrações de materiais orgânicosem cada camada com o intuito de obter dispositivos mais eficientes. Os resultadosapresentam um dispositivo 9,7% melhor que uma solução sintetizada anteriormente,sendo estas comprovadas experimentalmente. Os resultadosda pesquisa permitemconstatar que a inédita integração das técnicas de Inteligência Computacional comNanotecnologia Computacional, aqui denominada “Nanotecnologia ComputacionalInteligente”, desponta como uma promissora alternativa para acelerar as pesquisasem Nanociência e o desenvolvimento de aplicações nanotecnológicas.
Palavras–chave
Nanociência. Nanotecnologia. Química Computacional. InteligênciaComputacional. Algoritmos Genéticos. Redes Neurais Artificiais.
Abstract
Vilela Neto, Omar Paranaiba; ; . . Rio de Janeiro, 2009. 162p. PhDThesis — Department of Engenharia Elétrica, Pontifícia UniversidadeCatólica do Rio de Janeiro.
Keywords
Sumário
1 Introdução 151.1 Motivação 151.2 Objetivos 171.3 Contribuições 171.4 Descrição do Trabalho 191.5 Organização do Trabalho 20
2 Nanotecnologia Computacional 212.1 Introdução 212.2 Taxonomia da Nanociência e Nanotecnologia 242.3 Modelagem Molecular 252.4 Nanoinformática 342.5 Simulação de Nanodispositivos 362.6 Computação de Alto Desempenho 362.7 Computação Inspirada na Nanotecnologia 37
3 Técnicas de Inteligência Computacional 393.1 Computação Evolucionária 393.2 Redes Neurais 47
4 Inferência e Otimização de Nanoestruturas 584.1 Introdução 584.2 Pontos Quânticos - PQ 594.3 Nanocompósitos 67
5 Projeto Automático de Nanodispositivos 775.1 Otimização de OLEDs Multicamadas 775.2 Otimização de Circuitos de QCA Robustos 84
6 Otimização de Funções de Base 936.1 Introdução 936.2 Criando uma Função de Base 956.3 Método da Coordenada Geradora Hartree-Fock - GCHF 966.4 Expansão Polinomial 976.5 Detalhes Computacionais 986.6 Resultados e Discussões 98
7 Otimização de Agregados Atômicos e Moleculares 1077.1 Introdução 1077.2 Histórico 1087.3 Descrição do Problema 1097.4 Agregados de Li e F 1147.5 Agregados de H2O 118
8 Conclusões e Trabalhos Futuros 128
8.1 Trabalhos Futuros 131
Referências Bibliográficas 134
A Tabela com os Experimentos dos Pontos Quânticos 149
B Tabela com os Experimentos dos Nanocompósitos 153
C Resultados para os agregados de Li e F 158
D Síntese de OLEDs multicamadas 162
Lista de figuras
1.1 Áreas de Atuação e desenvolvimento da Nanotecnologia. 16
2.1 Relação entre o planeta Terra, uma bola de futebol e um fulereno. 212.2 Ilustração de escalas abaixo de 1 metro. Destaque para a escala
nanométrica (1nm a 100nm). 222.3 Sub-divisões da Nanociência e Nanotecnologia. 242.4 Algumas das ferramentas usadas no desenvolvimento da Nano-
ciência e Nanotecnologia. 242.5 Taxonomia da Nanotecnologia. 25
3.1 Procedimento padrão do Algoritmo Genético. 403.2 Modelo co-evolucionário genérico. 433.3 Gráfico com a superposição de 4 pulsos retangulares, cada um
com largura 100 e altura 0,0025, representando a distribuição deprobabilidade para uma variável 45
3.4 Forma da superposição de 2 pulsos de distribuição de probabili-dade após algumas gerações do algoritmo. 46
3.5 Representação gráfica de um neurônio artificial. 483.6 Exemplo de uma rede neural não recorrente. 503.7 Exemplo de uma rede neural recorrente com duas entradas e
duas saídas. 513.8 Treinamento supervisionado de uma rede neural. (Adaptado de
(Reed, 1998)) 533.9 Validação cruzada. Ilustração de dois momentos distintos do
treinamento: generalização da rede (a) e supertreinamento (b). 563.10 Dependência entre o ponto inicial e o erro final obtido. 57
4.1 Densidade de estado nos materiais semicondutores. De cimapara baixo: material bulk, poço quântico, fio quântico e pontoquântico. 60
4.2 Esquemático de três formas de crescimento: Frank-van derMerwe (a), Volmer-Weber (b), Stranski-Krastanov (c). 61
4.3 Imagem de um ponto quântico. Créditos Maurício Pamplona 614.4 Arquitetura da Rede Neural para inferir a altura média dos pontos
quânticos. 634.5 Comparação entre as medidas feitas por um AFM e as previsões
obtidas pela RNA. 644.6 Variação da altura média dos pontos quânticos com relação ao
tempo de deposição e à composição de alumínio. 654.7 Resultado da inferência da densidade de pontos quânticos. De
cima para baixo: conjuntos de treinamento, validação e teste. 664.8 Resultado da inferência do desvio da altura dos pontos quânti-
cos. De cima para baixo: conjuntos de treinamento, validação eteste. 67
4.9 Procedimento de otimização dos parâmetros para síntese depontos quânticos. 68
4.10 Curva da evolução da otimização dos PQ. 684.11 Arquitetura da Rede Neural para inferir o módulo de Young de
Nanocompósitos. 714.12 Comparação entre os valores da literatura e as previsões obtidas
pela RNA. 724.13 Inferância de um compósito de PMMA/CNF 734.14 Comparação de Modelos para o compósito de argila orgânica
(bis(hydroxyl ethyl)-(methyl)) com “nylon-6” 744.15 Comparação de Modelos para o compósito de montemorilonita
com SBR 744.16 Comparação de Modelos para o compósito de montemorilonita
com NBR 754.17 Comparação de Modelos para o compósito de montemorilonita
com CNBR 76
5.1 a)Representação esquemática de um dispositivo multicamadaotimizado. A região graduada é representada em escala decinza. b) A representação do cromossomo. 80
5.2 Um exemplo de como criar uma solução para um cromossomo. 805.3 Eficiência x Densidade de Corrente dos dispositivos 1 e 2 835.4 Uma célula de QCA. As cargas estão localizadas nos pontos
pretos. 845.5 Estados de polarização de uma célula de QCA. 855.6 Interferência entre duas células de QCA lado a lado. 855.7 Circuito com multicamadas. 865.8 A arquitetura do modelo de síntese automática. 875.9 (A) Circuito sintetizado por especialista; (B) Circuito sintetizado
em (VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho. 905.10 (A) Circuito sintetizado por especialista; (B) Circuito sintetizado
em (VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho. 91
7.1 Simplificação da superfície de energia por degraus. 1097.2 Exemplo do operador de crossover criado por Deaven e Ho. 1097.3 Fluxograma da otimização de agregados atômicos e moleculares. 1107.4 Cromossomo do agregado iônicos. 1107.5 Cromossomo do agregado molecular. 1107.6 Dois agregados genitores. 1127.7 Dois filhos inválidos. 1137.8 Dois novos indivíduos gerados. 1137.9 Formação de agregados de água positivos através da perda de
um elétron. 1207.10 Formação de agregados de água iônicos através da agregação
de moléculas iônicas. 1227.11 O cromossomo para encontrar a posição mais estável do íon na
superfície do agregado e a figura ilustrativa do problema em 2D. 123
Lista de tabelas
3.1 Funções de ativação e suas respectivas derivadas. 49
4.1 Valores fixados para gerar a figura 4.6. 644.2 Conjunto ótimo de parâmetros encontrado pelo AG. 684.3 Normalização dos dados para a RNA. 714.4 Resultado obtido pelo AG para o melhor nanocompósito. 76
5.1 Validação do Modelo de concentração graduada. Os parâmetrosn e n’ são usadas para calcular a mobilidade na região graduada.O modelo calcula a relação V/J0.5. 79
5.2 Resultados da otimização por AG. Os valores da coluna “ante-rior” se referem a (Gusso, 2004). 82
5.3 Comparação entre melhor configuração otimizada por AG, me-lhor configuração de (Gusso, 2004) e melhor configuração de(Ma, 2002). Em negrito o melhor resultado para cada caso. 82
6.1 A primeira coluna apresenta o átomo, juntamente com a mul-tiplicidade e termo de simetria. A segunda coluna apresenta otamanho das funções de base. As últimas três colunas mostramo tamanho do cromossomo para cada experimento. 99
6.2 Tamanho das sequências aritméticas usadas para gerar os ex-poentes das funções gaussianas. 99
6.3 Diferença (micro-hartree) entre as energias obtidas e a energiado estado fundamental dos átomos da primeira linha da tabelaperiódica. A última coluna mostra o estado fundamental de cadaátomo. 101
6.4 Os cromossomos de todas as otimizações. 1026.5 O cromossomo da otimização do Ne. Genes variam de 0 a 4. 1036.6 Número de Gerações nos experimentos. 1036.7 Diferenças de energia (micro-hartree) entre os resultados obti-
dos pelo polinômio sugerido em (Klobukowski, 1994) e o estadofundamental para os átomos de C e Ne. 104
6.8 Comparação dos resultados obtidos pelo polinômio sugeridoem (Klobukowski, 1994) com aqueles otimizados neste trabalho.Todos para o átomo de C. 104
6.9 Comparação dos resultados obtidos pelo polinômio sugeridoem (Klobukowski, 1994) com aqueles otimizados neste trabalho.Todos para o átomo de Ne. 104
6.10 Resultados obtidos para o átomo de neônio. 106
7.1 Aptidão dos indivíduos. 1117.2 Estruturas dos aglomerados (LiF )2Li+. 1157.3 Estruturas dos aglomerados (LiF )3Li+. 1157.4 Estruturas dos aglomerados (LiF )2. 1167.5 Estruturas dos aglomerados (LiF )3. 116
Lista de tabelas 14
7.6 Estruturas dos aglomerados (LiF )2F−. 1177.7 Estruturas dos aglomerados (LiF )3F−. 1177.8 Estruturas dos aglomerados (H2O)n. 1207.9 Estruturas dos aglomerados (H2O)+n . 1217.10 Estruturas dos aglomerados (H2O)nH2O+. 1257.11 Estruturas dos aglomerados (H2O)nH3O+. 1267.12 Estruturas dos aglomerados (H2O)nH3O+. 127
B.1 Dados retirados de tabelas disponíveis na literatura. 154B.2 Dados retirados de tabelas disponíveis na literatura. (continuação)155B.3 Dados retirados de gráficos disponíveis na literatura. 156B.4 Dados retirados de gráficos disponíveis na literatura. (continuação)157
C.1 Estruturas dos aglomerados (LiF )4Li+. 158C.2 Estruturas dos aglomerados (LiF )4. 159C.3 Estruturas dos aglomerados (LiF )4F−. 160C.4 Estruturas dos aglomerados (LiF )5F−. 161
1Introdução
1.1Motivação
A Nanociência e a Nanotecnologia têm sido vistas com um grande potencial
para propiciar benefícios em diversas áreas, tais como o desenvolvimento de novos
medicamentos, despoluição da água e do ar, aperfeiçoamentodas tecnologias de
comunicação e informação, produção eficiente de energia, desenvolvimento de
materiais mais leves e resistentes etc.
A Nanotecnologia e a Nanociência são áreas genuinamente interdisciplina-
res. Elas têm possibilitado a colaboração entre pesquisadores de áreas diferentes,
permitindo a troca de informações, ferramentas e técnicas.Um entendimento da
química e física da matéria e de processos na escala nanométrica é relevante para
todas as disciplinas científica, desde a química e a física até a biologia, medicina,
engenharia e ciência dos materiais. A figura 1.1 ilustra algumas áreas de atuação da
Nanotecnologia e algumas de suas aplicações.
Esta área do conhecimento lida com estruturas da matéria quepossuem di-
mensões da ordem de um bilionésimo do metro. Não é fácil determinar quando o
ser humano tirou proveito de materiais na escala nanométrica pela primeira vez.
Sabe-se que no século IV antes de cristo os romanos fabricavam vidros usando me-
tais na escala nanométrica. Por exemplo, a grande variedadede diferentes e bonitas
cores nos vitrais das catedrais medievais é devido à presença de nanopartículas,
como ouro e prata, no vidro fabricado (Poole, 2003).
Porém, foi somente nos últimos anos que ferramentas sofisticadas foram de-
senvolvidas para investigar e manipular a matéria na escalananométrica, propici-
ando um avanço nas pesquisas e um aumento significativo no número de descober-
tas e desenvolvimentos tecnológicos. Dois marcos deste novo avanço científico e
tecnológico foram as invenções do microscópio de tunelamento (scanning tunne-
ling microscope - STM) em 1982 e o microscópio de força atômica (atomic force
microscope - AFM) em 1986. Estas ferramentas utilizam uma ponta nanométrica
para produzir imagens de uma superfície com resolução atômica, além de serem ca-
pazes de manipular átomos e moléculas, possibilitando a criação de nanoestruturas
Capítulo 1. Introdução 16
Figura 1.1: Áreas de Atuação e desenvolvimento da Nanotecnologia.
rudimentares.
Aliado a este desenvolvimento da Nanotecnologia e da Nanociência vem o
desenvolvimento de modelos computacionais de sistemas químicos e físicos, que
permitem aos pesquisadores a simulação de possíveis nanomateriais, dispositivos e
aplicações. O apoio dos sistemas de computação recebe o nomede “Nanotecnologia
Computacional”. Alguns desses sistemas de apoio à Nanotecnologia utilizam técni-
cas de Inteligência Computacional, o que poder-se-ia chamarde “Nanotecnologia
Computacional Inteligente”. Porém, o uso de técnicas de Inteligência Computaci-
onal no desenvolvimento e auxílio da Nanotecnologia e da Nanociência pode ser
mais explorado, até mesmo pelo fato de se poder considerar a Nanotecnologia e a
Nanociência como áreas novas e ainda pouco exploradas.
A Inteligência Computacional fornece uma variedade de técnicas inspira-
das na natureza, tais como Algoritmos Genéticos (AG), Redes Neurais Artificiais
(RNA) e Sistemas Fuzzy, empregadas no desenvolvimento de sistemas inteligen-
tes. Hardware Evolucionário (EHW), por exemplo, se refere à síntese automática e
à otimização de circuitos eletrônicos, utilizando sistemas reconfiguráveis controla-
dos por Algoritmos Genéticos. EHW pode ser adaptada e, consequentemente, apli-
cada no desenvolvimento de nanodispositivos. No caso dos circuitos eletrônicos,
Capítulo 1. Introdução 17
os processos de síntese automática e otimização consideramum espaço de busca
composto por todos os possíveis circuitos que podem ser implementados com os
dispositivos disponíveis. Circuitos são continuamente simulados e avaliados a fim
de encontrar um circuito otimizado que implemente a lógica desejada. EHW já
foi aplicado com sucesso na síntese automática de circuitosconvencionais e não
convencionais (Zebulum, 2002), em diferentes aplicações (digital, analógico, VLSI
CMOS, etc.). Redes Neurais Artificiais, por outro lado, são inspiradas na estrutura
e comportamento do cérebro humano e têm sido usadas em uma variedade de pro-
blemas. As RNA podem, por exemplo, serem usadas na classificação de padrões,
previsão de séries temporais e aproximação de funções, abstraindo informações de
grandes bases de dados.
A combinação destas técnicas inteligentes com a Nanociência e a Nanotec-
nologia pode ser fundamental para acelerar o desenvolvimento de aplicações na-
notecnológicas revolucionárias. Dentre os possíveis benefícios causados por essas
técnicas podemos citar a síntese automática de nanoestruturas e nanodispositivos
inimagináveis, a inferência de propriedades de novos materiais baseado em experi-
mentos anteriores, a simulação mais eficientes de nanodispositivos, etc.
1.2Objetivos
Este trabalho tem como objetivo principal investigar o papel da Inteligência
Computacional no desenvolvimento da Nanotecnologia e Nanociência. As aplica-
ções de Inteligência Computacional na Nanotecnologia e Nanociência são investi-
gadas em três diferentes processos: caracterização, projeto e simulação. Em carac-
terização, o objetivo é investigar o uso de técnicas de inferência no desenvolvimento
de um sistema de previsão do comportamento de nanodispositivos em função dos
parâmetros utilizados na síntese. Já o projeto pode ser dividido em dois subproje-
tos distintos. O primeiro visa, em conjunto com o sistema de inferência já descrito,
obter os parâmetros ótimos para a síntese de nanodispositivos. O segundo projeto
pretende projetar novas estruturas com o auxílio de simuladores, através da otimi-
zação dos parâmetros e da estrutura. Por fim, a respeito da simulação, o objetivo
é investigar como a Inteligência Computacional pode aumentar a eficiência dos re-
sultados e auxiliar os pesquisadores a obterem resultados semelhantes aos obtidos
experimentalmente.
1.3Contribuições
Em função dos objetivos apresentados acima, este trabalho se concentrou na
investigação do papel da Inteligência Computacional no apoio ao desenvolvimento
Capítulo 1. Introdução 18
da Nanociência e Nanotecnologia. Diferentes estudos foramrealizados e as contri-
buições fornecidas por este trabalho estão listadas a seguir:
– Sistema de Inferência de Nanoestruturas: esta tese propôs e desenvolveu
um sistema de inferência capaz de caracterizar as propriedades de diferentes
nanoestruturas antes mesmo de sua produção. Tal sistema é aqui denominado
“Experimento Virtual”. Tal caracterização só pode ser realizada devido ao
desenvolvimento de um sistema computacional que, a partir de experimentos
anteriormente realizados, aprende a relacionar os parâmetros de síntese das
nanoestruturas com as propriedades de saída. Neste trabalho, dois estudos
de casos diferentes são apresentados e ambos apresentam bons resultados.
Um estudo foi publicado no Journal of Crystal Growth (Singulani, 2008), um
dos mais renomados meios de circulação na área de crescimento no meio
acadêmico, e o outro foi recentemente submetido a uma importante revista
científica na área de compósitos.
– Projeto Automático de Nanodispositivos: neste caso, utiliza-se Algoritmos
Genéticos para o projeto automático de nanodispositivos, otimizando a es-
trutura de modo a encontrar soluções inovadoras e otimizadas. Dois tipos de
nanodispositivos diferentes foram automaticamente projetados neste trabalho.
Circuitos de Autômatos Celulares com Pontos Quânticos (QCA) robustos e
LEDs orgânicos emissores de luz. Ambos apresentaram soluções inovadoras
e inimagináveis.
– Otimização de Parâmetros para Simulação: os Algoritmos Genéticos, jun-
tamente com o software de modelagem molecular Gaussian03, otimizam os
parâmetros de funções que geram expoentes de primitivas gaussianas de fun-
ções de base para cálculos hartree-fock, obtendo energias menores do que
aquelas apresentadas nas referencias. Estes resultados serão em breve subme-
tidos para publicação.
– Otimização de Agregados Atômicos e Moleculares: novamente os Algorit-
mos Genéticos, em conjunto com algoritmos de otimização local presentes no
Gaussian03, se mostram eficientes na busca pelas geometriasde baixa energia
dos agregados atômicos de (LiF)nLi+, (LiF)n e (LiF)nF-, obtendo uma série
de novos isômeros ainda não propostos na literatura, principalmente para n>
2; Os resultados obtidos para os agregados neutros e positivos foram recen-
temente publicados no Journal of Physical Chemistry A (Fernandez, 2009).
Já os resultados para os agregados negativos já foram aceitos e serão publica-
dos em breve na mesma revista. Além disso,Uma metodologia semelhante é
aplicada em um sistema inédito para entender a formação de agregados mo-
leculares de H2O iônicos, partindo-se de agregados neutros. Os resultados
Capítulo 1. Introdução 19
mostram como os agregados podem ser obtidos a partir de diferentes pers-
pectivas, formando estruturas ainda não investigadas na área científica. Os
resultados obtidos estão sendo compilados em um artigo que será em breve
submetido a uma importante revista científica.
1.4Descrição do Trabalho
Este trabalho foi desenvolvido em 8 etapas descritas a seguir:
– Um estudo sobre Nanociência e Nanotecnologia.Para isso realizou-se
uma pesquisa bibliográfica sobre Nanociência e Nanotecnologia. Nesta etapa
estudaram-se os aspectos históricos, os fundamentos, bem como o desenvol-
vimento da Nanotecnologia até os dias atuais.
– Um estudo das técnicas de Inteligência Computacional.O estudo resultou
na escolha das técnicas utilizadas nas aplicações desenvolvidas neste trabalho.
– Um estudo sobre Nanotecnologia Computacional.Realizou-se uma pes-
quisa bibliográfica com o objetivo de verificar a situação atual do apoio com-
putacional à Nanociência e Nanotecnologia. Fez-se um estudo sobre modela-
gem molecular a fim de conhecer e utilizar os métodos computacionais.
– Inferência de Nanodispositivos.Esta etapa pode ser dividida em três sub-
etapas. A primeira é a obtenção de dados a partir de experimentos realizados
por especialistas. A segunda é a escolha do modelo de inferência utilizado. E
por fim a realização dos experimentos e validação dos resultados.
– Inferência e Otimização de Nanodispositivos.Esta etapa utiliza-se do sis-
tema de inferência descrito anteriormente. Os parâmetros de entrada do sis-
tema de inferência são otimizados por um Algoritmo Genéticocom o objetivo
de sintetizar nanodispositivos com características pré-determinadas.
– Otimização de Nanodispositivos.Esta etapa visa à utilização de um Algo-
ritmo Genético, juntamente com um simulador de nanodispositivo, para pro-
jetar automaticamente o nanodispositivo de maior eficiência.
– Otimização de Parâmetros de Simulação.Aqui, pretende-se otimizar pa-
râmetros usados em sistemas de modelagem molecular, aplicados tanto para
cálculos de dispositivos nanométricos quanto para cálculode sistema sub-
nanométricos. Pretende-se otimizar as funções de base de modelosab initio.
– Otimização da Geometria Molecular.Nesta etapa foram usados sistemas
evolutivos para a otimização da geometria molecular e buscade conformações
de agregados atômicos e moleculares.
Capítulo 1. Introdução 20
1.5Organização do Trabalho
Esta tese está dividida em 7 capítulos adicionais, descritos a seguir:
O capítulo 2 discute o apoio computacional à Nanociência e Nanotecnologia,
classificando e discutindo cada uma das linhas importantes.
O capítulo 3 introduz e descreve resumidamente as principais técnicas de
Inteligência Computacional usadas neste trabalho.
O capítulo 4 discute a utilização de técnicas de Inteligência Computacional
no projeto e otimização de dispositivos nanoestruturados.Duas aplicações são
apresentadas: Pontos Quânticos e Nanocompósitos.
O capítulo 5 apresenta o projeto automático de nanodispoditivos através
da otimização das estruturas e dos parâmetros envolvidos. Duas aplicações são
apresentadas: Os circuitos de QCA e os OLEDs multicamadas.
O capítulo 6 apresenta e discute a otimização de funções de base utilizadas
em cálculos de modelagem molecularab initio.
O capítulo 7 apresenta o uso da computação evolutiva na otimização da
geometria de agregados atômicos e moleculares. Os casos estudados e os novos
operadores propostos serão apresentados e discutidos.
E, finalmente, o capítulo 8 conclui o trabalho e apresenta as sugestões de
trabalhos futuros.
2Nanotecnologia Computacional
2.1Introdução
O prefixo “nano” vem do grego e significa anão. Este prefixo também é usado
para determinar um bilionésimo de uma determinada unidade de medida. Logo, um
nanômetro é igual a um bilionésimo de um metro (1nm= 10−9m). Para se ter uma
ideia da dimensão nanométrica, a figura 7.9 mostra a relação entre uma estrutura
nanométrica, uma bola de futebol e o planeta Terra.
Figura 2.1: Relação entre o planeta Terra, uma bola de futebole um fulereno.
Observe que a relação entre o fulereno e a bola de futebol é aproximadamente
a mesma entre a bola e o planeta Terra. Este exemplo mostra o quão pequeno são as
estruturas nanométricas.
Há muitas discussões sobre qual o tamanho de um material paraque este seja
considerado uma nanoestrutura. Neste trabalho vamos usar adefinição dada em
(Bhushan, 2007) que considera uma nanoestrutura aquela que tenha pelo menos
uma dimensão entre 1nm e 100nm. Obviamente, muitas estruturas que não se
encaixam na dimensão pré-determinada, mas estão próximas desta, podem ser
consideradas como nanoestruturas. A figura 7.10 apresenta outra comparação entre
diferentes dimensões, com destaque para a dimensão nanométrica.
Apesar da palavra “Nanotecnologia” ser usada por mais de 20 anos (foi usada
pela primeira vez em 1974 pelo pesquisador japonês Norio Taniguchi para descrever
a fabricação precisa de materiais na escala nanométrica (Taniguchi, 1974)), existem
diversas definições na literatura. Um trabalho de pesquisa realizado pelaThe Royal
Societye pelaThe Royal Academy of Engineeringem 2004 definem a Nanociência
e a Nanotecnologia de forma concisa (Dowling, 2004):
Capítulo 2. Nanotecnologia Computacional 22
Figura 2.2: Ilustração de escalas abaixo de 1 metro. Destaque para a escala nano-métrica (1nm a 100nm).
Nanociência: é o estudo dos fenômenos e manipulação de materiais em
escalas atômicas, moleculares e macromoleculares, onde aspropriedades diferem
significativamente daqueles em maior escala.
Nanotecnologia: é o projeto, caracterização, produção e aplicação de estrutu-
ras, dispositivos e sistemas controlando a forma e o tamanhona escala nanométrica.
O fator chave para o desenvolvimento de novos e aperfeiçoados materiais,
desde o aço no século 19 até os materiais dos dias atuais, tem sido a habilidade de
controlar a matéria em escalas cada vez menor. As propriedades dos materiais, tais
como as tintas e os chips de computadores, são determinadas por sua estrutura na
escala nano ou micro. Com o aumento do conhecimento e controlena escala nano,
haverá grande potencial no desenvolvimento de materiais com novas características,
funções e aplicações.
Segundo (Mansoori, 2005), a principais razões pelas quais as nanoestruturas
são tão importantes são:
– Com a redução do tamanho até a nanoescala, os efeitos quânticos começam e
dominar. As propriedades dos elétrons na matéria são influenciadas pelas va-
riações na nanoescala. É possível variar as propriedades micro e macroscópi-
cas da matéria alterando a configuração nanométrica dos materiais. Portanto,
é possível alterar o transporte de cargas, os efeitos magnéticos, a temperatura
de fusão e outras características sem mudar a composição química do material
usado.
Capítulo 2. Nanotecnologia Computacional 23
– Uma característica fundamental das entidades biológicasé a organização
sistemática da matéria na nanoescala. O desenvolvimento daNanociência
e da Nanotecnologia permitirá inserir nanoestruturas feitas pelo homem no
interior de células vivas. Também permitirá criar novos materiais usando as
características de automontagem da natureza. Certamente, acombinação da
matéria viva com a ciência dos materiais existente hoje propiciará avanços
tecnológicos ainda inimagináveis.
– Componentes na escala nano possuem uma razão superfície porvolume muito
maior que os materiais em maior escala. Por exemplo, uma partícula de 30
nm possui 5% dos seus átomos na superfície, uma partícula de 10 nm, 20%
dos átomos e uma de 3 nm já possui 50% dos seus átomos na superfície.
Isto os torna ideais para muitas aplicações, tais como: materiais compósitos,
catalisadores,drug delivery, e armazenamento de energia (ex. hidrogênio e
gás natural).
– Sistemas macroscópicos feitos a partir de nanoestruturaspodem ter uma
densidade muito maior do que aqueles feitos a partir de microestruturas.
Assim, é possível criar novos conceitos de dispositivos eletrônicos, circuitos
menores e mais rápidos, funções lógicas mais complexas e umaredução
significativa no consumo de energia.
Aliado aos desenvolvimentos citados, um novo e emergente campo de pes-
quisa vem ganhando força nos últimos anos. Trata-se da Nanotecnologia Computa-
cional, ou seja, o uso de técnicas computacionais no desenvolvimento da Nanociên-
cia e Nanotecnologia.
A precisão dos métodos de teoria quântica e atômica aumentoumuito nos úl-
timos anos, chegando ao ponto em que simulações podem ser usadas para prever o
comportamento da matéria sob algumas condições. Aliado a isso, o aumento do po-
der computacional e das técnicas de visualização 3D tornaram tais simulações ainda
mais rápidas e precisas. Mais recentemente, principalmente devido ao massivo uso
da internet, verifica-se um grande aumento na quantidade de informações científi-
cas (revistas, artigos, sites, etc.) disponíveis. Tudo isso contribuí significativamente
para o aumento da importância da Nanotecnologia Computacional.
A Nanotecnologia Computacional (ou Nanociência Computacional
(Bhushan, 2007)) surge como uma ferramenta de engenharia fundamental para
o projeto de novos nanodispositivos, tais como outros métodos computacionais
foram e são usados para os projetos da atual geração de sistemas de engenharia (ex:
automóveis, navios, aviões, microdispositivos e circuitos integrados).
Capítulo 2. Nanotecnologia Computacional 24
2.2Taxonomia da Nanociência e Nanotecnologia
Nesta tese é proposta uma subdivisão da Nanociência e Nanotecnologia em
suas diversas subáreas.
Em um nível mais alto, a Nanotecnologia e a Nanociência serãodividas em
três subgrupos: aplicações, estruturas e ferramentas, conforme ilustrado na figura
2.3.
Figura 2.3: Sub-divisões da Nanociência e Nanotecnologia.
As aplicações englobam tudo que já foi produzido ou espera-se produzir com
a Nanotecnologia. Já as estruturas englobam todas as nanoestruturas mais utilizadas
no desenvolvimento dos nanodispositivos, tais como: pontos quânticos, nanotubos,
dendrímeros, etc.
Já a subárea de ferramentas pode ser dividida em três subseções: caracteriza-
ção, manipulação e computacional, vide figura 2.4.
Figura 2.4: Algumas das ferramentas usadas no desenvolvimento da Nanociência eNanotecnologia.
Nesta tese o foco principal é na Nanotecnologia Computacional Inteligente.
Portanto, o ramo das ferramentas computacionais apresentado anteriormente será
desmembrado nas diversas áreas da Nanotecnologia Computacional. A figura 2.5
apresenta a taxonomia proposta neste trabalho.
Capítulo 2. Nanotecnologia Computacional 25
Figura 2.5: Taxonomia da Nanotecnologia.
As subdivisões da Nanotecnologia Computacional, propostasneste trabalho,
serão descritas nas próximas seções.
2.3Modelagem Molecular
Segundo (Simpson, 1989), “modelo” é uma descrição simplificada ou ideali-
zada de um sistema ou processo, geralmente em termos matemáticos, criado para
facilitar cálculos ou previsões. Portando, Modelagem Molecular refere-se a méto-
dos e técnicas para imitar o comportamento de moléculas ou sistemas moleculares.
Técnicas computacionais revolucionaram a modelagem molecular, já que muitos
cálculos seriam impossíveis sem o uso de computadores.
Neste capítulo faremos uma breve descrição dos métodos e técnicas mais
tradicionais, dando mais destaque aos métodos mais usados neste trabalho (Hartree-
Focke Teoria do Funcional da Densidade (DFT)). Discutiremos a respeito da teoria,
tempo computacional e tamanho dos sistemas modelados ou simulados.
2.3.1Mecânica Molecular
A Mecânica Molecular usa as leis da física clássica para descrever as estrutu-
ras e propriedades de moléculas. Métodos de Mecânica Molecular estão disponíveis
em muitos programas de computadores, incluído MM3, HyperChem, Quanta, Sybyl
e Alchemy (Foresman, 1996).
Os métodos de Mecânica Molecular, diferentemente dos métodos quânticos,
descritos mais a frente, não tratam explicitamente os elétrons em um sistema
molecular. Ao contrário, a computação é realizada baseada na interação entre os
núcleos. Os efeitos eletrônicos estão geralmente implícitos nos campos de força,
através dos parâmetros.
Estas aproximações tornam os métodos de Mecânica Molecularcomputaci-
onalmente muito baratos e permite que eles sejam usados parasistemas grandes,
contendo muitos milhares de átomos (Kadau, 2006) (Arkhipov, 2006). Porém, as
aproximações também geraram várias limitações, dentre as quais podemos citar:
– Cada campo de força obtém bons resultados somente para um conjunto
Capítulo 2. Nanotecnologia Computacional 26
limitado de moléculas, relacionados às aquelas que foram parametrizadas.
Nenhum campo de força pode ser usado para todos os sistemas moleculares.
– Desconsiderar os elétrons significa que os métodos de Mecânica Molecular
não podem tratar problemas químicos onde os efeitos eletrônicos são predo-
minantes. Por exemplo, eles não podem ser usados para descrever processos
que envolvem a formação ou quebra de ligações químicas.
2.3.2Métodos Quânticos - ab initio
Obviamente, os métodos quânticos usam as leis da mecânica quântica ao invés
das leis da física clássica como base para os cálculos. A Mecânica quântica diz que
a energia e outras propriedades relacionadas a uma moléculadevem ser obtidas
resolvendo a equação de Schrödinger.
Porém, a solução exata para a equação de Schrödinger não é computacio-
nalmente viável, exceto para sistemas muito simples. Logo,métodos de química
quântica são caracterizados pelas suas várias aproximações matemáticas.
A equação de Schrödinger ( 5-4 ) descreve a função de onda de uma partícula:(
−~2
2m∇2 + V(~r)
)
ψ(~r , t) = i~∂ψ
∂t(~r , t) (2-1)
Nesta equação,ψ é a função de onda,mé a massa da partícula,~ é a constante
de Planck dividida por 2π e V é o potencial de campo onde a partícula está se
movendo. O produto deψ com seu complexo conjugado (ψ ∗ ψ, frequentemente
escrito como|ψ|2) é interpretado como a distribuição de probabilidade da partícula.
A equação de Schrödinger para uma coleção de partículas, como uma molé-
cula, é muito similar. Neste caso,ψ deve ser uma função com as coordenadas de
todas as partículas, além do tempo t.
Os problemas que serão descritos aqui são independentes do tempo e pode-se
escrever a equação de Schrödinger como na equação 2-2.
Hψ(~r) = Eψ(~r) (2-2)
ondeE é a energia do sistema eH é o operado Hamiltoniano. Detalhes sobre a mecâ-
nica quântica podem ser encontrados na literatura (Bhushan,2007) (Pauling, 1985)
(Cohentannoudji, 1979).
Teoria Hartree-Fock (HF)
Conforme já dissemos, a solução exata da equação de Schrödinger não é
possível para a maioria dos sistemas. Porém, um número de simplificações e
aproximações permite encontrar soluções aproximadas paraum grande conjunto
de moléculas.
Capítulo 2. Nanotecnologia Computacional 27
A aproximação de Born-Oppenheimer é a primeira de um conjuntode outras
aproximações usadas para simplificar a equação de Schrödinger (Leach, 2001). Ela
simplifica o problema da molécula separando os movimentos dos núcleos e dos elé-
trons. Esta aproximação é possível porque a massa de um núcleo típico é milhares
de vezes maior que a massa de um elétron. O núcleo se move vagarosamente se
comparado com o elétron e este reage de forma instantânea as mudanças de posição
do núcleo. Logo, a distribuição eletrônica em um sistema molecular depende das
posições dos núcleos e não de suas velocidades. Ou seja, o núcleo parece fixo para
os elétrons e a movimentação eletrônica pode ser descrita como ocorrendo em um
campo de núcleos fixos. Assim, considerando esta aproximação, a função de onda
da molécula pode ser escrita da seguinte forma:
Ψtot(ncleos,eltrons) = Ψ(eltrons)Ψ(ncleos) (2-3)
Logo, a energia total do sistema é dada pela soma da energia nuclear (repulsão
eletrostática entre os núcleos) e a energia eletrônica.
Segundo o princípio da anti-simetria, quando trocarmos qualquer par de
elétrons a densidade eletrônica de se manter a mesma, mas a função de onda deve
trocar de sinal. Isto se deve ao fato dos elétrons serem indistinguíveis. Portanto, a
forma funcional da função de onda de sistema polieletrônicos deve respeitar este
princípio. Um determinante é a maneira mais simples de escrever a forma funcional
permitida da função de onda, respeitando o princípio da anti-simetria. Está forma é
chamada de determinante de Slater 2-4 (Leach, 2001).
Ψel(1,2, ...,n) =1√
N!
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
χ1(1) χ2(1) ... χN(1)
χ1(2) χ2(2) ... χN(1)
. . ... .
. . ... .
. . ... .
χ1(N) χ2(N) ... χN(N)
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
∣
(2-4)
Cada linha é formada pela representação de todas as possíveiscombinações
do elétron i com todas as combinações orbital-spin. O fator multiplicativo é neces-
sário para a normalização.
Esta formulação não é apenas um truque matemático para formar funções de
onda anti-simétricas. A mecânica quântica especifica que a localização do elétron
não é determinística, mas sim uma densidade de probabilidade, podendo estar em
qualquer lugar. Este determinante mistura todos os orbitais atômicos possíveis com
todos os átomos do sistema molecular para formar a função de onda.
O operador HamiltonianoH para um sistema de N-elétrons pode ser escrito
da seguinte forma:
Capítulo 2. Nanotecnologia Computacional 28
H =
−12
N∑
i=1
∇2i −
1r1A− 1
r1B− · · · + 1
r12+
1r13+ · · ·
(2-5)
onde os elétrons são identificados por números (1, 2, ...) e osnúcleos pelas letras (A,
B, ...),∇ corresponde à energia cinética er representa a distância entre dois elétrons
ou entre um elétron e um núcleo.
Como a teoria Hartree-Fock já é bem descrita na literatura (Leach, 2001,
Szabo, 1989), esta tese não se prenderá em detalhes e apresentará a expressão
da energia de uma forma concisa, demonstrando os três tipos de interação que
contribuem para a energia eletrônica total do sistema.
A primeira contribuição vem da energia cinética e potencialde cada elétron
se movendo no campo formado pelos núcleos. Para N elétrons emN orbitais
moleculares esta contribuição pode ser escrita da seguinteforma:
Ecoretotal =
N∑
i=1
∫
dτ1χi(1)
−12∇2
i −M
∑
A=1
ZA
r iA
χi(1) =N
∑
i=1
Hcoreii (2-6)
A segunda contribuição da energia vem da repulsão eletrostática entre pares
de elétrons. A interação depende da distância elétron-elétron e é calculada da
seguinte forma:
Ji j =
∫ ∫
dτ1dτ2χi(1)χ j(2)
(
1r12
)
χi(1)χ j(2) (2-7)
O símboloJi j é frequentemente usado para representar a interação Coulom-
biana entre elétrons. A contribuição total da interação Coulombiana para a energia
eletrônica do sistema é obtida através de um somatório dubloenvolvendo todos os
elétrons, tal como mostrado na equação 6-8.
ECoulombtotal =
N∑
i=1
N∑
j=i+1
Ji j (2-8)
Por fim, a última contribuição para a energia é a interação de troca. Esta
interação aparece porque a movimentação dos elétrons com spins paralelos são
correlatados. Elétrons com o mesmo spin tendem a se “evitar”e sentem uma
pequena repulsão, dando origem a uma pequena energia. A interação de troca é
expressa da seguinte forma:
Ki j =
∫ ∫
dτ1dτ2χi(1)χ j(2)
(
1r12
)
χi(2)χ j(1) (2-9)
A contribuição total é dada pela equação 6-10.
ETrocatotal =
N∑
i=1
N∑
j′=i+1
Ki j (2-10)
O apóstofro emj′ indica que o somatório é somente para os elétrons com o
mesmo spin que o elétroni.
Capítulo 2. Nanotecnologia Computacional 29
A próxima aproximação envolve a expressão do orbital molecular como uma
combinação linear dos orbitais atômicos (LCAO). Logo, um orbital molecular é
definido pela equação 2-11.
φi =
N∑
µ=1
cµiχµ (2-11)
ondecµi são conhecidos como coeficientes de expansão do orbital molecular. Os
orbitais atômicos, por sua vez, são formados pela combinação linear de funções
gaussianas (ou funções de Slater) e podem ser definidos pela equação 2-12
χµ =∑
p
dµpgp (2-12)
ondedµp são constantes em uma função de base definida.
Toda esta construção resulta na seguinte expansão para os orbitais molecula-
res:
φi =∑
µ
cµiχµ =∑
µ
cµi(∑
p
dµpgp) (2-13)
O problema agora é como encontrar o conjunto de coeficientescµi que formam
a função de onda. A teoria Hartree-Fock aproveita o princípio variacional que
diz que a energia obtida através de uma função de onda aproximada será sempre
maior que a energia da função de onda correta. Em outras palavras, o problema se
transformou em encontrar o conjunto de coeficientes que minimizam a energia da
função de onda resultante.
Durante os cálculos, assume-se que cada elétron se move em umcampo
“fixo” formado pelos núcleos e os outros elétrons. Este fato tem uma implicação
muito importante, pois a solução encontrada quando calculada a equação para
um elétron vai naturalmente afetar a solução para outros elétrons no sistema. A
estratégia geral para este problema é conhecida como “campoauto-consistente”
(SCF - do inglês, self-consistent field). Uma maneira para resolver este problema é
a seguinte. Primeiramente um conjunto de soluções para o problema Hartree-Fock
é fornecido. Os cálculos são realizados e as equações Hartree-Fock fornecem um
segundo conjunto de soluções, que são usadas na próxima interação. O processo é
repetido, minimizando a energia, até que os resultados paratodos os elétrons não
são mais alterados.
O método mais tradicional para resolver este problema é a equação de
Roothaan-Hall (Leach, 2001).
Teoria do Funcional de Densidade (DFT)
A Teoria do Funcional da Densidade (DFT, do inglês -Density Functional
Theory) tornou-se, nas últimas décadas, um importante método parao estudo de es-
Capítulo 2. Nanotecnologia Computacional 30
trutura eletrônica de sólidos e moléculas (Morgon, 2007).Parte do atrativo do DFT
está no fato de que sistemas, de tamanho moderado a grande (Ntomos≥ 20), podem
ser estudados, com uma precisão química aceitável, a um custo computacional me-
nor do que os métodos correlacionados tradicionais, como a teoria da pertubação e
coupled cluster(Morgon, 2007, Leach, 2001). O desenvolvimento de funcionais de
troca e correlação mais precisos e de algoritmos eficientes de integração numérica
tem impulsionado o desenvolvimento desse método.
A densidade eletrônica,ρ(r), foi usada pela primeira vez como variável básica
na descrição de um sistema eletrônico no início do século XX por Drude, que
aplicou a teoria dos gases a um metal, considerando-o como umgás homogêneo de
elétrons, para desenvolver a sua teoria sob condução térmica e elétrica. Mais tarde,
o modelo de Thomas-Fermi utilizou-se de argumentos estatísticos para aproximar
a distribuição de um gás de elétrons e desenvolver o funcional da energia. Esse
modelo foi aperfeiçoado para incluir a energia de troca paraum gás de elétrons
desenvolvido por Dirac. O funcional de energia (E) de Thomas-Fermi-Dirac é dado
por:
E[ρ] = CF
∫
ρ(r)5/3dr +∫
ρ(r)ν(r)dr
+12
∫ ∫
ρ(r1)ρ(r2)|r1 − r2|
dr1dr2 −Cx
∫
ρ(r)4/3dr, (2-14)
ondeCF =310(3π2)2/3 eCx =
34(3
π)1/3.
Na equação 6-11 os quatro termos da direita, correspondem à energia cinética,
ao potencial externo, ao potencial de Coulomb e à energia de troca, respectivamente.
ρ e r são a densidade eletrônica e as coordenadas, respectivamente. Entretanto,
são muito simples para reproduzir a estrutura quântica de camadas dos átomos ou
ligações químicas.
O uso da densidade eletrônica,ρ(r), como variável básica foi legitimada com
a publicação de dois teoremas por Hohenber e Kohn em 1964 (Hohenberg, 1964),
que fornecem os fundamentos da DFT. Em 1965, Kohn e Sham estabeleceram uma
forma de contornar o problema de se encontrar o funcional da energia cinética
exato que permite realizar os cálculos DFT (Kohn, 1965). O desenvolvimento
computacional dos cálculos de DFT leva a equações matemáticas semelhantes às
equações Hartree-Fock-Roothan.
Teoremas de Hohemberg e Kohn
A energia total de um sistema eletrônico molecular é dado por:
Eo =
∫
Ψ(r1, r2, ..., rn)∗HBOΨ(r1, r2, ..., rn)dr1dr2...drN = 〈Ψ |HBO|Ψ〉 (2-15)
Capítulo 2. Nanotecnologia Computacional 31
ondeΨ(r1, r2, ..., rn) é a solução do estado fundamental do Hamiltoniano eHBO
é o Hamiltoniano de um sistema eletrônico molecular na aproximação de Born-
Oppenheimer.
Neste caso, o potencial externo (relacionado aos elétrons devido às cargas
dos núcleos) pode ser separado em um funcional trivial da densidade eletrônica e a
energia total vai ser escrita da seguinte forma:
Eo =⟨
Ψ∣
∣
∣T + Ve
∣
∣
∣Ψ⟩
+
∫
ρ(r)ν(r)dr (2-16)
ondeν(r) é o potencial externo.
Logo, percebe-se que o número de elétrons,N, e o potencial externo em que
estes se movem definem completamente o sistema de muitos elétrons, ou seja, o
Hamiltoniano do sistema.
Primeiro Teorema:
O primeiro teorema de Hohemberg-Kohn (HK) estabelece que o potencial
externo é um funcional único deρ(r) além de uma constante aditiva. Em outras
palavras, demonstra que a densidade eletrônica de um sistema determina o potencial
externo e o número de elétron, N, e consequentemente, o Hamiltoniano do sistema.
Como a energia do sistema é calculada mediante a resolução da equação de
Schrödinger,HBOΨ = EΨ, a energia de um sistema eletrônico é determinada pela
densidade eletrônicaρ(r), ou seja:
E = Eν[p] (2-17)
ondeν explicita a dependência com o potencial externoν(r).
Segundo Teorema:
O segundo teorema estabelece que, havendo qualquer aproximação da densi-
dade eletrônica, ˜ρ(r), de modo que ˜ρ(r) ≥ 0 e∫
ρ(r)dr = N, a energia total será
sempre maior ou igual a energia exata do sistema, ou seja,E[ρ] ≥ E[ρ] = Eo.
Pode-se, então, definir um funcional universal
F[ρ] =⟨
Ψ∣
∣
∣T + Ve
∣
∣
∣Ψ⟩
, (2-18)
poisT eVe aplicam-se universalmente a todos os sistemas eletrônicos.
É preciso observar que ˜ρ(r) define seu próprio ˜ν(r) e, consequentemente, o
HamiltonianoH e Ψ(r1, r2, ..., rN). A funçãoΨ(r1, r2, ..., rN), por sua vez, pode ser
usada como uma função tentativa para o sistema com o potencial externoν(r). De
acordo com o princípio variacional, tem-se
Eo = Eν[ρ] = F[ρ] +∫
ρ(r)νrdr ≤ Eν[ρ] = F[ρ] +∫
ρ(r)νrdr (2-19)
Os dois teoremas de HK mostram como se pode determinar o estado fun-
damental de um sistema com um dado potencial externo, usando-se a densidade
Capítulo 2. Nanotecnologia Computacional 32
eletrônica tridimensional como variável básica, em vez de se utilizar a função de
onda de N-elétrons, que é muito mais complexa. A prova de cadaum dos teoremas
é apresentada em (Vianna, 2004).
Equações de Kohn-Sham
Kohn e Sham reescreveram a equação 4-1, tornando explícita arepulsão
elétron-elétron de Coulomb e definindo uma nova função universalG[ρ]:
Eν[ρ] = G[ρ] +12
∫ ∫
ρ(r1)ρ(r2)|r1 − r2|
dr1dr2 +
∫
ρ(r)ν(r)dr, (2-20)
ondeG[ρ] é dado por:
G[ρ] = Ts[ρ] + EXC[ρ] (2-21)
e Ts[ρ] é o funcional da energia cinética de um sistema de elétrons que não
interagem e tem a mesma densidade eletrônica de um sistema deelétrons que
interagem. Dessa forma,EXC[ρ] inclui não só o termo de interação elétron-elétron
não clássica (troca e correlação), mas também a parte residual da energia cinética,
T[ρ] − Ts[ρ], em queT[ρ] é a energia cinética exata para o sistema de elétrons que
interagem.
De acordo com Kohn e Sham, é possível utilizar um sistema de referência
de elétrons que não interagem com um Hamiltoniano que tenha um potencial local
efetivo,νe f(r).
KKS = −12∇2 + νe f(r). (2-22)
O operador Hamiltoniano,HKS, realmente descreve um sistema de elétrons
que não interagem. Para se obter a função de onda,ΨKS, do estado fundamental
desse sistema de referência de elétrons que não interagem, descrito pelo Hamiltoni-
ano anterior, deve-se utilizar a mesma aproximação empregada no método Hartree-
Fock.
Como o potencial efetivo,νe f(r), depende da densidade eletrônica,ρ(r), as
equações de Kohn-Sham são resolvidas por meio de um procedimento autoconsis-
tente (KS-SCF).
No esquema Kohn-Sham, a densidade eletrônica exata do estado fundamental
de um sistema de elétrons que interagem é gerada a partir da solução de um
problema auxiliar do sistema de elétrons que não interagem.As equações KS, assim
como as equações de Hartree-Fock, geram equações de um elétron que descrevem
sistemas de muitos elétrons. As equações KS, em princípio, são exatas, uma vez que
incorporam totalmente os efeitos da correlação eletrônica(troca e correlação) e as
soluções delas equivalem, formalmente, à resolução exata do problema variacional
da DFT.
O esquema KS permite calcular a densidade eletrônica do estado fundamental.
Todas as outras propriedades do sistema podem, igualmente,ser calculadas, desde
Capítulo 2. Nanotecnologia Computacional 33
que os funcionais da densidade eletrônica sejam devidamente conhecidos.
Funcionais de troca-correlação (XC)
Embora os teoremas de Hohembeg e kohn estabeleçam que existeum funcio-
nal da densidade eletrônica, este é completamente desconhecido. Entre os pesquisa-
dores que têm trabalhado no desenvolvimento de funcionais de XC, há um consenso
de que vários desses funcionais devem ser adequados para cálculos de determinadas
propriedades e de que, dificilmente, haverá um funcional de XC no futuro próximo.
Assim, um funcional de XC deve ser utilizado em função das propriedades que se
deseja calcular. Na prática, os diferentes funcionais de XCe forma como foram
desenvolvidos caracterizam os vários métodos DFT conhecidos.
A procura por melhores funcionais de XC baseia-se, normalmente, na intuição
física ou matemática ou, ainda, simplesmente por meio de tentativa e erro. No
entanto são conhecidas algumas restrições e propriedades que um funcional de XC
razoável deve satisfazer. Existem diversos funcionais diferentes na literatura e os
principais podem ser vistos em (Morgon, 2007, Leach, 2001).
Métodos Pós-Hartree-Fock
A literatura apresenta uma grande quantidade de métodos quesurgiram para
corrigir as limitações dos métodos HF. Normalmente estes métodos apresentam
resultados melhores, mas são computacionalmente mais caros. Como exemplo
podemos citar: CI, CC, Full CI, MP2, MP3, MP4, etc.
2.3.3Métodos Semi-Empíricos
Quando as ideias dos cálculos de orbitais molecularesab initio surgiram pela
primeira vez, ficou claro que o número de operações aritméticas necessárias para
investigar sistemas simples era muito grande. Aproximações drásticas eram então
necessárias. Uma alternativa foi ignorar os elétrons, exceto os de valência. Com
estas aproximações, os cálculos dos orbitais se tornaram possíveis com a ajuda de
parâmetros, que substituam os cálculos necessários.
Sem dúvida, a grande vantagem dos métodos semi-empíricos sobre os mé-
todosab initio é a rapidez do cálculo, permitindo o estudo de moléculas maiores.
Existe uma outra vantagem embutida. Como os métodos são geralmente parametri-
zados a partir de dados experimentais, alguns efeitos de correlação eletrônica estão
embutidos nos cálculos. Porém, isto também pode ser uma desvantagem, pois não
se sabe quais efeitos estão contemplados, dificultando a melhoria destes cálculos.
2.3.4
Capítulo 2. Nanotecnologia Computacional 34
Dinâmica Molecular
Até o momento, os métodos descritos tratam as moléculas e os sistemas
moleculares de forma estática. Porém, muitas vezes é importante saber como as
moléculas interagem entre sí de forma dinâmica, ou seja, em movimento. O método
que calcula a dinâmica entre as moléculas é conhecido como dinâmica molecular
(Goodman, 1998) (Leach, 2001).
O movimento de um dos átomos em uma molécula é influenciado pelos
átomos ao seu redor, que são afetados, por outro lado, pelo átomo em questão. Este
tipo de equação, contendo equações diferenciais, têm sido estudada em detalhes.
Em geral, estas equações não podem ser resolvidas analiticamente, mas soluções
aproximadas podem ser encontradas facilmente por métodos computacionais.
Uma simulação de dinâmica molecular se inicia, dando aos átomos em uma
molécula alguma energia cinética. Isto faz com que a molécula se mova e é
possível saber como é esse movimento resolvendo as equaçõesde movimento do
Newton. Isto é feito analisando a energia da molécula e usando esta informação
para predizer o que acontecerá em um curto período de tempo a frente. Este
cálculo é computacionalmente caro, sendo necessário muitopoder computacional
para predizer o movimento de uma molécula em poucos picossegundos. Apesar de
prever o comportamento por um tempo muito curto, as informações obtidas podem
ser muito relevantes para o entendimento de um processo químico.
2.4Nanoinformática
Nanoinformática pode ser definida como um banco de dados dinâmico para
armazenar, manipular e recuperar informações relevantes àNanociência e à Nano-
tecnologia (Bhushan, 2007) (Schmidt, 2007).
A sociedade atual está saturada de informações. A invenção epopularização
da internet possibilita a pesquisa sobre qualquer tema em questão de minutos. Ali-
ado a isto, as novas ferramentas de caracterização permitemque os cientistas obte-
nham novos dados a todo momento, compartilhando-os com seuscolaboradores ao
redor do mundo. Manipular a informação, organizá-la, padronizá-la, compartilhá-la,
analisá-la e até mesmo visualizá-la já tem se tornado parte importante das atividades
científicas atuais.
Os cientistas têm usado diversas estratégias para manipular a grande quanti-
dade de dados disponíveis nos dias de hoje. Algumas áreas, como a astronomia, há
muito tempo já utilizam profissionais especializados na manipulação de seus dados
(Schmidt, 2007). Mais recentemente, os biólogos criaram umgrande banco de da-
dos e ferramentas matemáticas e computacionais complexas para manipular e dar
sentido a grande quantidade de dados obtidas dos processos de sequenciamentos
Capítulo 2. Nanotecnologia Computacional 35
do genoma humano e de outras espécies. Esta iniciativa deu origem a uma nova
e importantíssima área de pesquisa, chamada Bioinformática, e também a base de
dados importantes, tais como ainternational Protein Information Resource(PIR) e
aBioBricks Foundation’s Registry of Standard Biological Parts.
Atualmente, os cientistas envolvidos em Nanociência e Nanotecnologia já
começam a imaginar a criação de uma “nanoinformática”, ondeeles poderão
manipular a informação armazenada sobre o nanomundo. Este tema foi discutido
recentemente no NanoFrontiers Workshop (Schmidt, 2007). Obviamente que a
comunidade científica, massivamente interdisciplinar, sebeneficiará do uso desta
base de dados padronizada e das ferramentas de manipulação desenvolvidas.
Os participantes do NanoFrontiers Workshop fizeram afirmações e questio-
namentos bastante interessantes sobre o surgimento da nanoinformática. Alguns
cientistas a veem como uma fronteira entre os pioneiros cientistas da Nanotecnolo-
gia e a nova era do desenvolvimento nanotecnológico acelerado pelo conhecimento
contido em bases de dados. Por outro lado, alguns cientistassão mais céticos sobre
o desenvolvimento de tais ferramentas e como elas poderão ajudar no desenvolvi-
mento da nanociência.
Pode-se destacar três pontos chaves da nanoinformática:
– Base de Dados: no seu nível mais básico a nanoinformática compreende uma
rede de base de dados para auxiliar os pesquisadores em questões práticas. As
teorias e respostas para estas questões já podem estar disponíveis, o problema
é ter acesso a elas. Tais informações em Nanociência e Nanotecnologia estão
geralmente disponíveis em jornais de diferentes assuntos eem diferentes
países. A nanoinformática poderá unificar os dados similares e criar fácil
acesso a eles.
– Ferramentas: uma grande quantidade de dados pode não ser muito útil quando
não há ferramentas de manipulação eficientes. Usar e manipular os dados em
um nível aceitável requer o uso de ferramentas computacionais complexas.
Também poderá ser necessário o desenvolvimento de novos simuladores e
ferramentas inteligentes para integrar diferentes tipos de dados. A Inteligên-
cia Computacional terá um papel importantíssimo no desenvolvimento das
ferramentas eficientes de manipulação de dados, tal como será discutido no
próximo capítulo.
– Colaborações: a nanoinformática facilitará a colaboraçãode cientistas ao
redor do mundo. Estes poderão compartilhar informações, ferramentas e
até instrumentos remotamente. Isto possibilitaria a formação de grandes
laboratórios virtuais.
Capítulo 2. Nanotecnologia Computacional 36
2.5Simulação de Nanodispositivos
Além dos métodos de modelagem molecular discutidos anteriormente, exis-
tem métodos de simulação desenvolvidos exclusivamente para determinadas nano-
estruturas ou nanodispositivos. Neste caso, o pesquisadorestá preocupado apenas
com o comportamento do dispositivo estudado e um conjunto deequações matemá-
ticas podem fornecer as respostas desejadas.
Um exemplo de simulador de nanoestruturas pode ser encontrado em
(Gusso, 2004), onde os autores utilizam um conjunto de equações para modelar o
transporte de carga em LEDs orgânicos de múltiplas camadas.Os resultados obtidos
pelo simulador desenvolvido foram validados por experimentos realizados previa-
mente.
O simulador de autômatos celulares com pontos quânticos (Quantum Dot
Celular Automata- QCA) desenvolvido na universidade de Calgary é outro exemplo
de simulação de nanodispositivos (Walus, 2002).
Mais um exemplo de simulador de nanoestruturas é o desenvolvido por John-
son para simulações de cristais fotônicos (Johnson, 2002).O programa calcula as
estruturas de banda e os modos eletromagnéticos de estruturas dielétrica periódi-
cas. Este simulador pode ser usado também para a simulação deguias de ondas e
sistemas ressonantes.
Além dos exemplos citados acima, existem uma grande variedade de outros
simuladores de nanoestrutura e nanodispositivos na literatura. O site nanoHUB.org
fornece um conjunto de simuladores de diferentes tipos (Goasguen, 2005). Muitos
deste simuladores podem ser usadoson-line e outros podem ser obtidos no site e
executados nos computadores pessoais.
2.6Computação de Alto Desempenho
O uso de ferramentas computacionais no desenvolvimento da Nanociência
e Nanotecnologia só é viável graças ao grande avanço computacional obtido nos
últimos anos. Grande parte das simulações, principalmenteaquelas envolvendo
modelagem molecular, necessitam de um grande poder de processamento. A seguir
vamos citar algumas alternativas para amenizar este problema.
A alternativa mais tradicional para cálculos computacionais longos é o uso de
aglomerados (oucluster) de computadores. Este consiste de um grupo de compu-
tadores que trabalham juntos e que podem ser vistos como um único computador.
Os componentes de um aglomerado de computadores são normalmente conectados
uns aos outros por uma rede local e rápida. Estes aglomeradossão projetados para
melhorar o desempenho de computadores individuais.
Capítulo 2. Nanotecnologia Computacional 37
Mais recentemente, pesquisadores têm demonstrado a possibilidade de imple-
mentar simulações em hardware dedicados. As plataformas digitais reconfiguráveis
(FPGAs) estão sendo utilizadas com este propósito (Fagerstrom, 2002) (Gu, 2006).
Tais plataformas já são utilizadas com sucesso em problemasde processamento de
sinais e comunicação. O artigo de (Gu, 2006) mostra que a implementação de um
código de dinâmica molecular simples em FPGA foi capaz de acelerar o tempo de
processamento de 31 a 88 vezes.
Na última década surgiu a necessidade do desenvolvimento deplacas gráficas
de alto desempenho para o uso em videogames. Esta demanda foiobtida através
de novas arquiteturas de hardware nas unidades de processamento gráfico (GPUs),
tais como aquelas encontradas no Sony PlayStation 3 e nVidiaGeForce 8800
GTX. Recentemente, (Ufimtsev, 2008) demonstrou o uso de GPUs no cálculo das
integrais de repulsão de dois elétrons, obtendo uma aceleração de mais de 130 vezes
quando comparado ao cálculo realizado em uma CPU AMD Opterom tradicional.
No mesmo trabalho, os autores realizaram o cálculo da matrizde Coulomb para
uma molécula de DNA em 19,8 segundos contra 1600 segundos necessários pelo
AMD Opteron.
O desenvolvimento da Nanotecnologia permitirá a criação denovas arqui-
teturas de processadores, os quais serão muito mais rápidosdo que os existentes
atualmente. No caminho contrário, tal avanço auxiliará o desenvolvimento dos si-
muladores de nanoestruturas, permitindo um grande avanço tecnológico. Dentre as
novas arquiteturas e paradigmas computacionais obtidos pela Nanotecnologia po-
demos destacar os transistores de nanotubos de carbono (Paul, 2006) e os autômatos
celulares com pontos quânticos (VilelaNeto, 2007).
2.7Computação Inspirada na Nanotecnologia
O próximo capítulo apresentará os métodos de Inteligência Computacional
que são inspirados na natureza. Logo, pode-se considerar que a Nanotecnologia e
a Nanociência venham a inspirar o desenvolvimento de novas técnicas de Inteli-
gência Computacional. A Nanociência explora uma natureza diferente daquela com
a qual estamos acostumados, com novas características e leis. À medida que estas
pesquisas se desenvolvem novas descobertas são feitas, podendo inspirar os pesqui-
sadores a criar novos sistemas de computação que sejam úteisno desenvolvimento
de problemas do dia a dia.
Até o momento, não se conhece nenhum algoritmo que tenha sidodesen-
volvido a partir do comportamento de algum sistema ou estrutura nanométricos.
Porém, a mecânica quântica já inspirou o desenvolvimento não só de um conjunto
de algoritmos, como também de uma nova forma de computação.
Capítulo 2. Nanotecnologia Computacional 38
Um computador quântico é um dispositivo que faz uso direto decertos fenô-
menos da mecânica quântica para realizar operações com dados. Estes fenômenos
permitem construir, em teoria, computadores que obedecem novas leis mais per-
missivas de complexidade computacional (Spector, 2004). Otermo "computação
quântica"é, portanto, usado para descrever processos computacionais que se ba-
seiam nestes fenômenos específicos e que são, assim, capazesde diminuir o esforço
e a complexidade para se resolver determinados problemas.
Devido à grande dificuldade de implementação de um computador quântico,
(Moore, 1995) propôs uma nova abordagem. O objetivo desta nova abordagem é
criar algoritmos clássicos (capazes, portanto, de serem executados em computa-
dores clássicos) que tirem proveito dos paradigmas da física quântica, de forma a
melhorar o desempenho dos mesmos na resolução de problemas.
Com relação aos métodos de Inteligência Computacional, (Han,2000) propôs
um algoritmo evolutivo com inspiração quântica usando representação binária.
Neste modelo, o algoritmo evolutivo proposto é também caracterizado por um
cromossomo, uma função de avaliação e uma dinâmica populacional. Porém, neste
caso, os genes do cromossomo simulam osq-bits dos computadores quânticos. Já
o trabalho de (AbsDaCruz, 2005) estende o algoritmo evolutivo com inspiração
quântica para a solução de problemas numéricos.
3Técnicas de Inteligência Computacional
Inteligência computacional é um ramo da ciência da computação que utiliza
algoritmos e técnicas que imitam algumas habilidades cognitivas, como reconhe-
cimento, aprendizado e evolução, para criar programas, de alguma forma, inteli-
gentes. Dentre os algoritmos mais conhecidos, tem-se: Computação Evolucionária,
Redes Neurais Artificiais e Lógica Fuzzy. Neste trabalho, as técnicas utilizadas fo-
ram a Computação Evolucionária e as Redes Neurais Artificiais que são descritas a
seguir.
3.1Computação Evolucionária
Esta seção resume os principais conceitos sobre os algoritmos evolucionários.
Primeiramente, é feita uma breve explicação sobre o princípio de funcionamento
de um Algoritmo Genético (AG), descrevendo suas partes principais. Em seguida,
a co-evolução é descrita. Por fim, uma alteração do AG é apresentada através do
Algoritmo Genético com Inspiração Quântica (AGIQ).
3.1.1Algoritmos Genéticos
Essencialmente, Algoritmos Genéticos são métodos de buscae otimização
que têm sua inspiração nos conceitos da teoria de seleção natural das espécies
proposta por Darwin (Mitchell, 1996, Koza, 1992, Goldberg,1989, Back, 1996,
Fogel, 1966). Os sistemas desenvolvidos a partir deste princípio são utilizados para
procurar soluções de problemas complexos ou com espaço de soluções (espaço
de busca) muito grande, o que os tornam problemas de difícil modelagem e
solução quando se aplicam métodos de otimização convencionais, ou programação
matemática.
Estes algoritmos são baseados nos processos genéticos de organismos bio-
lógicos para procurar soluções ótimas ou sub-ótimas. Para tanto, procede-se da se-
guinte maneira: codifica-se cada possível solução de um problema em uma estrutura
chamada de “cromossomo”, que é composta por uma cadeia de bits ou caracteres.
Estes cromossomos representam indivíduos, que são evoluídos ao longo de várias
Capítulo 3. Técnicas de Inteligência Computacional 40
gerações, de forma similar aos seres vivos, de acordo com os princípios de sele-
ção natural e sobrevivência dos mais aptos, descritos pela primeira vez por Charles
Darwin em seu livroA Origem das Espécies. Emulando estes processos, os Algo-
ritmos Genéticos são capazes de “evoluir” soluções de problemas do mundo real.
Os cromossomos são então submetidos a um processo evolucionário que en-
volve avaliação, seleção, cruzamento e mutação. Após vários ciclos de evolução a
população deverá conter indivíduos mais aptos. Os AGs utilizam uma analogia di-
reta deste fenômeno de evolução na natureza, onde cada indivíduo representa uma
possível solução para um problema dado. A cada indivíduo atribui-se um valor de
adaptação: sua aptidão, que indica o quanto a solução representada por este indi-
víduo é boa em relação às outras soluções da população, cujo análogo em progra-
mação matemática é o resultado da função objetivo. Desta maneira, o termo Popu-
lação refere-se ao conjunto de todas as soluções com as quaistrabalha o sistema.
Aos indivíduos mais adaptados é dada a oportunidade de se reproduzir mediante
cruzamentos com outros indivíduos da população, produzindo descendentes com
características de ambas as partes. A mutação também tem um papel significativo,
ao introduzir na população novos indivíduos gerados de maneira aleatória.
O processo de evolução começa com a criação aleatória dos indivíduos que
formarão a população inicial. A partir de um processo de seleção baseado na apti-
dão de cada indivíduo, são escolhidos indivíduos para a fasede reprodução, que cria
novas soluções utilizando-se para isto um conjunto de operadores genéticos. Deste
modo, a aptidão do indivíduo determina o seu grau de sobrevivência e, assim, a pos-
sibilidade de que o cromossomo possa fazer parte das gerações seguintes. O proce-
dimento básico de um algoritmo genético é resumido na Figura3.1 (Davis, 1991).
Figura 3.1: Procedimento padrão do Algoritmo Genético.
Para determinar o final da evolução pode-se fixar o número de gerações, o
número de indivíduos criados, ou ainda condicionar o algoritmo à obtenção de uma
Capítulo 3. Técnicas de Inteligência Computacional 41
solução satisfatória, isto é, quando se atingir um ponto ótimo. Outras condições
para a parada incluem o tempo de processamento e o grau de similaridade entre
os elementos numa população (convergência). As seções seguintes apresentam em
mais detalhes cada um dos componentes de um algoritmo genético.
Representação
A solução de um problema pode ser representada por um conjunto de parâ-
metros (genes), unidos para formar uma cadeia de valores (cromossomo); a este
processo chama-se codificação. As soluções (cromossomos) são codificadas atra-
vés de uma sequência formada por caracteres de um sistema alfabético. Original-
mente, utilizou-se o alfabeto binário (0, 1). Porém, novos modelos de AGs co-
dificam as soluções com outros alfabetos, como por exemplo com números reais
(Michalewicz, 1996). Assim, a representação é um aspecto fundamental na mode-
lagem de um AG para a solução de um problema. Ela define a estrutura do cromos-
somo, com os respectivos genes que o compõem, de maneira que este seja capaz de
descrever todo o espaço de busca relevante do problema. A decodificação do cro-
mossomo consiste basicamente na construção da solução realdo problema a partir
do cromossomo. Isto é, o processo de decodificação constrói asolução para que esta
seja avaliada pelo problema.
Avaliação
A avaliação é a ligação entre o AG e o problema a ser solucionado. Ela é
feita através de uma função que melhor representa o problemae tem por objetivo
oferecer uma medida de aptidão de cada indivíduo na população corrente, que irá
dirigir o processo de busca. Dado um cromossomo, a função de avaliação consiste
em associar um valor numérico, o qual supõe-se proporcionalà “utilidade” ou
“habilidade” do indivíduo representado em solucionar o problema em questão.
Muitas vezes a avaliação é realizada por um simulador ou um código externo ao
AG.
3.1.2Operadores
Operadores genéticos são algoritmos que modificam os genes possibilitando
a evolução da solução. Existem duas classes de operadores: cruzamento e muta-
ção. A geração de novos cromossomos pode ser realizada tantopelo cruzamento
quanto pela mutação, ou ainda pelos dois simultaneamente. Os operadores de muta-
ção são responsáveis pela divergência das soluções, explorando o espaço de busca;
enquanto que os operadores de cruzamento fazem com que as soluções se com-
binem, tirando proveito de um determinado subespaço de busca. Esses operadores
Capítulo 3. Técnicas de Inteligência Computacional 42
variam de acordo com a representação utilizada. Neste trabalho, grande parte dos
experimentos utilizam a representação real e os operadoresrelacionados serão des-
critos a seguir. Alguns estudos de casos fazem uso de outros tipos de operadores,
estes serão descritos no momento adequado. Outros operadores podem ser encon-
trados na literatura (Michalewicz, 1994).
O operador real mais usual é o cruzamento aritmético. Este consiste de uma
combinação linear entre dois genes, conforme mostrado na equação 3-1.
vf = f (vp1, vp2) = α · vp1 + (1− α) · vp2 (3-1)
ondeα ∈ [0,1] é uma variável aleatória evf é o valor do gene do filho, gerado em
função dos valores dos genes dos paisvp1 evp2.
Entre as mutações, os dois tipos mais comuns são a mutação uniforme e a
não uniforme. A uniforme explora todo o espaço de busca igualmente, equação 3-2,
sendo independente dos pais.
vf = α · (vmax− vmin) + vmin (3-2)
ondevmax e vmin são, respectivamente, os valores máximo e mínimo que tal gene
pode assumir, ou seja, as restrições de limite desse gene.
Já a mutação não uniforme, faz com que os genes sorteados no espaço se
concentrem em torno do gene do pai, em função do número de gerações decorrido
e de umbit aleatório.
vf = f (vp1) =
vp1 + ∆(t, vmax− vp1) se o bit for 0
vp1 − ∆(t, vp1 − vmin) se o bit for 1(3-3)
∆(t, y) = y ·(
1− α(1− tT )b
)
(3-4)
ondet é a geração atual eT o número máximo de iterações do algoritmo. Por fim,b
é um parâmetro que determina o grau de dependência de acordo com o número da
geração.
3.1.3Co-evolução
Para se aplicar algoritmos evolucionários com sucesso em problemas com
complexidade cada vez maior, torna-se necessário introduzir noções explícitas de
modularidade nas soluções para que elas disponham de oportunidades razoáveis de
evoluir na forma de subcomponentes co-adaptados (Potter, 2000).
Existem duas razões principais pelas quais algoritmos evolucionários con-
vencionais não são totalmente adequados para resolver estetipo de problema. Em
primeiro lugar, os algoritmos genéticos convencionais impedem, a longo prazo, a
preservação de certos componentes da solução pois, por estarem codificados por
Capítulo 3. Técnicas de Inteligência Computacional 43
completo em um indivíduo, eles são avaliados como um todo e apenas os subcom-
ponentes que pertencem a indivíduos com avaliações altas serão preservados. Em
segundo lugar, o fato da representação estar relacionada a uma solução completa e
por não haver interações entre os membros da população, não existe pressão evo-
lucionária para a ocorrência de co-adaptação, ou seja, não existe pressão para a
adaptação de um subcomponente dada a ocorrência de uma mudança em outro sub-
componente (Potter, 2000).
No entanto, a decomposição do problema tem um aspecto importante que
deve ser levado em conta e que está relacionado com a evoluçãode subcompo-
nentes interdependentes. Se for possível decompor o problema em subcomponentes
independentes, cada um deles pode evoluir sem haver necessidade de se preocupar
com os outros. Pode-se visualizar isto imaginando que cada subcomponente evolui
no seu próprio espaço de busca, desacoplado do espaço de busca dos outros com-
ponentes.
O modelo co-evolucionário cooperativo genérico (Potter, 2000) é mostrado na
figura 3.2.
Figura 3.2: Modelo co-evolucionário genérico.
Apesar de serem mostradas apenas duas espécies neste modelo, o mesmo
pode ser usado para n espécies diferentes. Cada espécie evolui em sua própria
população (pois como já foi mencionado, elas são isoladas geneticamente) e se
adaptam ao ambiente através de repetidas aplicações do algoritmo evolucionário.
Para se calcular a aptidão dos indivíduos de uma determinadaespécie, deve-se
submetê-lo ao modelo do domínio (que contém a função de avaliação) juntamente
com um ou mais colaboradores de cada uma das outras espécies (de modo a formar
a solução completa).
3.1.4
Capítulo 3. Técnicas de Inteligência Computacional 44
Algoritmo Genético com Inspiração em Computação Quântica
A computação quântica é uma área recente de pesquisa, que utiliza fenômenos
quânticos para resolver problemas de complexidade exponencial em um tempo
aceitável. O uso de sistemas clássicos inspirados nesses fenômenos pode produzir
um ganho substancial em relação ao tempo de processamento e,eventualmente,
em relação à qualidade da solução e tem mostrado bons resultados em problemas
benchmark(Han, 2000, Han, 2002, Davis, 1991).
Algoritmos Genéticos com Inspiração Quântica
Os algoritmos evolucionários com inspiração quântica são baseados nos
conceitos de bits quânticos, ou “qubits”, e na superposiçãode estados da mecânica
quântica (Han, 2000, Han, 2002, Davis, 1991). O estado de um bit quântico pode
ser representado por:
|φ >= α|0 > +β|1 > (3-5)
ondeα eβ são números complexos que especificam as amplitudes de probabi-
lidade dos estados correspondentes.|α2| dá a probabilidade do qubit estar no estado
0 quando observado e|β2|, por sua vez, dá a probabilidade do qubit estar no estado
1 quando observado. A normalização das amplitudes garante que
|α2| + |β2| = 1 (3-6)
O algoritmo evolucionário com representação binária (Han,2000, Han, 2002)
funciona bem somente quando esta representação é a mais adequada para o pro-
blema específico. No entanto, em alguns casos, a representação por números re-
ais é mais eficiente (no caso de otimização de funções, por exemplo, onde se de-
seja encontrar um valor máximo, ou mínimo, a partir dos ajustes das variáveis)
(da Cruz, 2004). Mas como implementar essa representação usando-se o paradigma
da inspiração quântica? Para se responder essa questão é necessário responder ou-
tras duas questões:
– Como representar a superposição de estados, dado que neste tipo de problema
os genes podem assumir valores em um intervalo contínuo entre os limites das
variáveis?
– Como atualizar estes valores de modo a levar o algoritmo a convergir para um
valor ótimo ou sub-ótimo?
Para a primeira questão a resposta é simples: ao invés de se usar as probabi-
lidades de observação de um estado, define-se uma distribuição de probabilidades
para cada variável que permita sortear facilmente valores no universo de discurso
Capítulo 3. Técnicas de Inteligência Computacional 45
da variável. Para evitar um crescimento exponencial do armazenamento de infor-
mações, e reduzir o custo computacional, optou-se por usar um conjunto de pulsos
retangulares para se representar estas distribuições (distribuição de probabilidade
uniforme). Desta forma, há duas grandes vantagens: somenteé necessário arma-
zenar o centro e a largura de cada pulso; e simplifica-se o cálculo das funções de
distribuição cumulativa de probabilidades, que são necessárias para o sorteio dos
números aleatórios.
O procedimento para inicializar o algoritmo começa então com uma definição
de um valor N que indica quantos pulsos serão usados para representar a distribuição
de probabilidade para cada uma das variáveis. Feito isto, para cada pulso usado em
cada variável do problema, define-se:
– Centro igual ao ponto médio do domínio;
– Altura igual ao inverso do tamanho do domínio dividido por N.
Ao final deste processo, a soma dos N pulsos de cada uma das variáveis
terá área total igual a 1. Supondo, por exemplo, que se desejeinicializar uma
variável com universo de discurso em [-50,50] e utilizar 4 pulsos retangulares
para representar a distribuição de probabilidade para estavariável, cada pulso teria
largura igual a 100 e altura igual a 1/100/4 = 0,0025. Com a superposição, a forma
gráfica desta distribuição ficaria, após a inicialização, daseguinte forma:
Figura 3.3: Gráfico com a superposição de 4 pulsos retangulares, cada um comlargura 100 e altura 0,0025, representando a distribuição de probabilidade para umavariável
Esta curva representa, portanto, a superposição de todos osestados possíveis
para a variável em questão. Este conjunto de distribuições de probabilidade de cada
uma das variáveis (genes) do problema forma uma superposição Qi(t) para cada
uma das i variáveis do problema.
Capítulo 3. Técnicas de Inteligência Computacional 46
A partir desta distribuiçãoQi(t) sorteia-se um conjunto de n pontos que
formam a população P(t). Após o sorteio dos indivíduos que vão formar a população
P(t) é necessário atualizar a distribuição de probabilidade Qi(t) de modo a obter a
convergência para a solução ótima ou sub-ótima de maneira similar ao crossover
convencional dos algoritmos genéticos. O método utilizadoconsiste em sortear um
número m de indivíduos da população P(t) usando um processo de roleta idêntico
ao dos algoritmos genéticos convencionais e, em seguida, redefinir o ponto central
do primeiro pulso como o valor médio desses m indivíduos sorteados. Este processo
é repetido para cada um dos N pulsos que definem a distribuiçãoQi(t). O valor m é
dado por:
m=nN
(3-7)
Além disso, em cada geração, a largura dos pulsos é reduzida de forma
simétrica em relação a seus centros. Esta redução é feita de forma exponencial,
de acordo com a fórmula:
σ = (u− l)(1− tT )2 − 1 (3-8)
Ondeσ é a largura do pulso, u é o limite superior do domínio da variável, l é
o limite inferior, t é a geração corrente do algoritmo, T é o total de gerações eλ é
um parâmetro que define a velocidade de decaimento da largurado pulso.
É importante notar que, à medida que os pulsos têm suas larguras diminuídas
e a posição de seus pontos centrais modificados, a soma deles deixa de ser um pulso
e começa a assumir as mais diversas formas. Um exemplo de uma forma que a soma
dos pulsos pode assumir é mostrado na figura a seguir, onde tem-se a soma de dois
pulsos: o primeiro no intervalo [-50,50], com altura 0,005 eo segundo no intervalo
[0,50] com altura 0,01.
Figura 3.4: Forma da superposição de 2 pulsos de distribuição de probabilidade apósalgumas gerações do algoritmo.
Capítulo 3. Técnicas de Inteligência Computacional 47
3.2Redes Neurais
Inspirada na estrutura e operação do cérebro humano, uma RedeNeural Ar-
tificial (RNA) é um modelo matemático não-linear usado para encontrar relacio-
namentos complexos entre a entrada e a saída de dados. Esse modelo é usado em
problemas da predição de séries temporais, reconhecimentode padrões e aproxima-
ção de funções. Três conceitos básicos caracterizam os diversos tipos de RNAs: o
modelo do neurônio artificial, sua estrutura de interconexão (topologia) e a regra de
aprendizado.
Assim como o sistema nervoso é composto por bilhões de neurônios, a
RNA também é formada por unidades elementares, denominadas neurônios artifi-
ciais ou processadores, que efetuam operações simples. Nasredes, esses neurônios
encontram-se interconectados, transmitindo seus resultados aos processadores vizi-
nhos. As RNAs são eficazes na elaboração de funções capazes de aproximar dados
não-lineares, incompletos, com ruído ou compostos por exemplos contraditórios,
sendo essa potencialidade de modelar sistemas não-lineares a principal vantagem
sobre outros métodos de interpolação. Na maioria dos casos,uma RNA é um sis-
tema adaptável que muda sua estrutura com base na informaçãoexterna ou interna
da rede.
3.2.1Estrutura de uma Rede
Neurônio artificial
O neurônio artificiali, tipicamente denominado de “elemento processador”, é
inspirado no neurônio biológico, possuindo um conjunto de entradasxm (dendritos)
e uma saídayi (axônio), conforme ilustrado na figura 3.5. As entradas são ponde-
radas por pesos sinápticoswim (sinapses), que determinam o efeito da entradaxm
sobre o processadori. Estas entradas ponderadas são somadas, fornecendo o poten-
cial, vi, do processador. A saída ou estado de ativaçãoyi do elemento processadori
é finalmente calculada através de uma função de ativaçãoφ(·). O estado de ativação
pode então ser definido pela equação 3-9.
yi = φ
m∑
j=1
xjwi j + θi
(3-9)
ondem é o número de entradas do neurônioi e θi é um termo de polarização do
neurônio (bias).
Capítulo 3. Técnicas de Inteligência Computacional 48
Figura 3.5: Representação gráfica de um neurônio artificial.
Função de ativação
A função de ativação é responsável por majorar ou minorar a informação
recebida por um neurônio antes de passá-la adiante. Qualquer função pode ser
utilizada para tal fim. Porém, a diferenciabilidade é uma característica importante
na teoria das redes neurais, possibilitando o seu uso em algoritmos de treinamento
baseados no método do gradiente. A tabela 3.1 apresenta algumas funções de
ativação usuais.
A função linear é geralmente utilizada quando a saída do neurônio pode
atingir qualquer valor, ou seja, não possui valores limites. Quando há muitas
entradas nesse neurônio, esta função pode produzir valoreselevados nos resultados.
É geralmente utilizada nos neurônios da camada de saída.
As funções sigmóides formam uma família de funções cujo gráfico tem a
forma de s. Tal forma é a mais comummente utilizada, sendo definida como uma
função estritamente crescente que apresenta na sua estrutura intervalos linear e não-
lineares. Esta função possibilita o mapeamento de dados comtal comportamento.
Um exemplo de função sigmóide é a função logística (tabela 3.1), em que os valores
de saída dos neurônios são unipolares e estão contidos no intervalo [0,1]. Nessa
função,λ é um parâmetro de suavização da curva. Variando-se o parâmetro λ,
obtém-se funções sigmóides com inclinações diferentes. Quandoλ → ∞, a função
tende a função degrau unitário.
Algumas vezes é desejável que a função se estenda ao intervalo [-1,1]. Nesse
caso, a tangente hiperbólica é utilizada (3.1). Essa funçãotambém pertence às
sigmóides, porém é bipolar, possibilitando o neurônio assumir valores de saída
negativos.
Capítulo 3. Técnicas de Inteligência Computacional 49
Nome Funçãoφ(v) Derivada∂φ/∂v
Logística 11+exp(−λv) λφ(v)(1− φ(v))
Tanh 21+exp(−λv) − 1 λ(1− φ(v)2)
Degrau
0 sev ≤ 0
1 sev > 0δ(v)
Sinal
−1 sev ≤ 0
1 sev > 02δ(v)
Linearsaturada
−1 v ≤ −1/λ
λv −1/λ < v ≤ 1/λ
1 v > 1/λ
0 v ≤ −1/λ
λ −1/λ < v ≤ 1/λ
0 v > 1/λ
Linear v 1
Tabela 3.1: Funções de ativação e suas respectivas derivadas.
Topologia
As topologias das redes neurais podem ser divididas em duas classes: não
recorrentes e recorrentes. Redes não recorrentes são aquelas que não possuem
realimentação de suas saídas para suas entradas e por isso são ditas “sem memória”.
A estrutura dessas redes é em camadas, podendo ser formadas por uma camada
única ou múltiplas camadas. A figura 3.6 ilustra uma rede multi-camadas, em que os
neurônios são representados por círculos (nós) e as conexões por retas (arcos). Essas
redes contêm um conjunto de neurônios de entrada, uma camadade saída e uma ou
Capítulo 3. Técnicas de Inteligência Computacional 50
mais camadas escondidas. A entrada não é considerada uma camada da rede, pelo
fato de apenas distribuir os padrões para a camada seguinte (Wasserman, 1989).
A camada de saída contém os neurônios que fornecem o resultado da rede. As
camadas que não possuem ligações diretas nem com a entrada, nem com a saída são
denominadas camadas escondidas. No caso de redes não recorrentes não existem
conexões ligando um neurônio de uma camada a outro de uma camada anterior,
nem a um neurônio da mesma camada.
Figura 3.6: Exemplo de uma rede neural não recorrente.
As RNAs recorrentes são redes em que as saídas realimentam as entradas,
sendo suas saídas determinadas pelas entradas atuais e pelas saídas anteriores. As
redes recorrentes, quando organizadas em camadas, possueminterligações entre
neurônios da mesma camada e entre camadas não consecutivas,gerando intercone-
xões bem mais complexas que as redes neurais não recorrentes(figura 3.7).
As redes neurais recorrentes respondem a estímulos dinamicamente, isto é,
após aplicar uma nova entrada, a saída é calculada e então realimentada para
modificar a entrada. Para uma rede se tornar estável, este processo é repetido várias
vezes, produzindo pequenas mudanças nas saídas, até que estas tendam a ficar
constantes. Todavia, as redes neurais recorrentes não são necessariamente estáveis,
mesmo com entradas constantes. O fato de não se conseguir prever quais redes
seriam estáveis foi um problema que preocupou os pesquisadores até o início da
década de 80, quando Cohen e Grossberg provaram um teorema para definir quando
as redes neurais recorrentes são estáveis (Wasserman, 1989). Este teorema diz que,
para as RNAs recorrentes alcançarem um estado estável, é necessário que as funções
de ativação sejam monotônicas, hajam conexões simétricas,e um neurônio não
possa realimentar a si mesmo. Contribuições importantes também foram dadas por
John Hopfield (Hopfield, 1982), sendo que algumas configurações passaram a ser
chamadas de redes de Hopfield em sua homenagem, e por Hinton e Sejnowski, que
introduziram regras gerais para treinamento.
Capítulo 3. Técnicas de Inteligência Computacional 51
Figura 3.7: Exemplo de uma rede neural recorrente com duas entradas e duas saídas.
3.2.2Tratamento dos dados
Como as ordens de grandeza de cada entrada e saída podem ser distintas, é
necessário empregar algum tipo de normalização antes de executar o treinamento
da rede neural. Desta forma, o valor de uma variável não se torna mais significativo
que o de outra quando as escalas forem diferentes, ou seja, uma variável que assume
valores de 1 a 2500 não afetará mais o sistema que outra com valores entre 0 e 0,5.
A normalização linear consiste em transformar os dados de modo que se
encontrem em um determinado intervalo. Tal normalização é definida pela equação
3-10, ondex é o valor do dado real,y o dado normalizado e os índicesmaxe min
são seus valores máximos e mínimos, respectivamente.
f (x) = y = (ymax− ymin)(x− xmin)
(xmax− xmin)+ ymin (3-10)
Quando os dados se encontram concentrados em um subespaço dointervalo
admissível de uma variável, utiliza-se um método para dispersá-los. Um dos mé-
todos mais simples de se implementar é a normalização linearpor partes. Tal nor-
malização determina subintervalos a partir de um valor intermediário, assim, uma
parte dos dados é normalizada entre um dado intervalo [ymin; yint] e outra parte é
normalizada em outro intervalo [yint; ymax], conforme a equação 3-11.
Capítulo 3. Técnicas de Inteligência Computacional 52
f (x) = y =
(yint − ymin)(x−xmin)
(xint−xmin)+ ymin sex ≤ xint
(ymax− yint)(x−xint)
(xmax−xint)+ yint sex > xint
(3-11)
3.2.3Treinamento
O objetivo do treinamento de uma RNA é fazer com que a aplicaçãode um
conjunto de entradas produza um conjunto de saídas desejado. Cada conjunto de
entradas e saídas desejadas, ou alvo, é chamado de padrão de treinamento. O trei-
namento é realizado pela aplicação sequencial dos vetores de entrada e, em alguns
casos, também os de saída, enquanto os pesos da rede são ajustados de acordo com
um procedimento de treinamento pré-determinado. Durante otreinamento, os pesos
da rede gradualmente convergem para determinados valores,de modo que a apli-
cação dos vetores de entrada produza as saídas necessárias.Os procedimentos de
treinamento podem ser classificados de duas formas: supervisionado e não super-
visionado. Ambos usufruem de um conjunto de treinamento, entretanto o primeiro
necessita de valores alvo para as saídas, enquanto que o segundo não.
O conjunto de treinamento modifica os pesos da rede de forma a produzir
saídas que sejam consistentes, isto é, tanto a apresentaçãode um dos vetores de
treinamento, como a apresentação de um vetor que é suficientemente similar, irão
produzir o mesmo padrão nas saídas.
O treinamento supervisionado necessita de um par de vetorescomposto das
entradas e do vetor alvo que se deseja obter como as respectivas saídas. Juntos,
estes vetores são chamados de par de treinamento ou vetor de treinamento, sendo
que geralmente a rede é treinada com vários vetores de treinamento.
Existe uma grande variedade de algoritmos de treinamento, tanto para o
treinamento supervisionado, quanto para o não supervisionado. Entre estes, o mais
difundido é o algoritmo de retropropagação (backpropagation). A retropropagação
contém duas etapas. A primeira é o método com o qual a aplicação da regra-da-
cadeia obtém a derivada parcial da função de erro da rede em relação a cada um
de seus pesos. A segunda é o algoritmo de atualização dos pesos, que consiste
basicamente do gradiente decrescente.
Em suma, para a realização do treinamento supervisionado, épreciso que haja
um conjunto de padrões de entrada e suas respectivas saídas,além de uma função
de erro (função de custo) para medir o custo da diferença entre as saídas da rede e
os valores desejados. Tal treinamento é iniciado com a apresentação e propagação
de um padrão através da rede para obter as saídas. Uma vez calculadas, as saídas
são comparadas com os respectivos valores alvo e o erro é então calculado a partir
de alguma métrica. O erro então é utilizado para atualizar ospesos de acordo com
Capítulo 3. Técnicas de Inteligência Computacional 53
um algoritmo de minimização, conforme ilustrado na figura 3.8. Este processo de
treinamento é repetido até que o erro, para todos os vetores de treinamento, tenha
alcançado o nível especificado ou até que um número máximo de iterações seja
atingido. Cada iteração desse processo é conhecida como época.
Figura 3.8: Treinamento supervisionado de uma rede neural.(Adaptado de(Reed, 1998))
Propagação das entradas
Os próximos algoritmos serão explicados com base em uma redede exemplo
com multi-camada. Tal rede possui uma entrada deq nós, duas camadas escondidas
e um único neurônio de saída, conforme mostrado na figura 3.6.Os elementos
do vetor de pesosw estão ordenados por camadas (a partir da primeira camada
escondida) e em cada camada estão ordenados por neurônios, seguindo a ordem das
entradas de cada neurônio. Sendow(l)i j o peso sináptico do neurônioi da camadal−1
para o neurônioj na camadal. Paral = 1, a primeira camada escondida, o índicei
se refere ao nó de entrada, ao invés de um neurônio.
Em tal rede, a propagação do sinal em cada camadal pode ser definida como
y(l) = F(w, x) para uma entrada específicax = [x1, x2, . . . , xq]T e um respectivo
vetor de pesosw. As equações 3-12 demonstram como, ao se utilizar uma função
de ativaçãoφ(·), o sinal é propagado através de cada neurônioj camada a camada.
y(1)j = φ
(
xTw(1)j
)
y(2)j = φ
(
(y(1))Tw(2)j
)
y(3)j = φ
(
(y(2))Tw(3)j
)
(3-12)
Capítulo 3. Técnicas de Inteligência Computacional 54
Métricas de erro
A menos que a rede esteja perfeitamente treinada, as saídas da rede estarão
destoantes com os valores desejados. A significância dessasdiferenças é medida
por uma função de erroE. A soma dos erros quadráticos (SSE) é uma métrica
comumente utilizada
ES S E=∑
p
∑
i
(tpi − ypi)2 (3-13)
onde,p indica o conjunto de padrões de treinamento,i os nós de saída,tpi e ypi
o valor alvo e o valor de saída da rede para o padrãop do nó i, respectivamente.
O erro quadrático médio (MSE) normaliza o SSE para o númeroP de padrões de
treinamento e asN saídas da rede, como segue:
EMS E =1
PNES S E (3-14)
As funções SSE e MSE têm a vantagem de serem facilmente diferenciáveis e
que seus custos dependem somente da magnitude do erro (Reed, 1998).
Na avaliação final da rede, o erro percentual médio absoluto (MAPE) é
outra métrica muito utilizada. Esta é definida na equação 3-15. O MAPE permite
uma melhor sensibilidade na análise dos resultados, pois representa a distância
percentual entre o valor obtido e o desejado.
EMAPE =1
NP
∑
p
∑
i
∣
∣
∣
∣
∣
∣
tpi − ypi
tpi
∣
∣
∣
∣
∣
∣
(3-15)
Retropropagação do erro
Como dito anteriormente, a retropropagação é constituída deduas etapas: o
cálculo da derivada do erro e a atualização de pesos.
Na primeira etapa, geralmente utiliza-se o SSE como métricade erro, porém
qualquer função de erro que seja derivável pode ser utilizada. A derivada depende
da localização do neurônio, isto é, se pertence à camada de saída ou não. O
resultado final da utilização da regra da cadeia para a métrica SSE é apresentado
a seguir, sendo o desenvolvimento facilmente encontrado emdiversas referências
(Haykin94, Reed, 1998, Zurada, 1992). A derivada do erro podeser vista como o
somatório das derivadas do erro relativo a cada padrão de treinamento, conforme a
equação 3-16.∂E∂wi j
=∑
p
∂Ep
∂wi j(3-16)
Cada uma dessas derivadas pode ser representada como a equação 3-17, em
que o valor deδi muda de acordo com a localização do neurônio (equação 3-18).
Capítulo 3. Técnicas de Inteligência Computacional 55
∂Ep
∂wi j= δiyi (3-17)
δi =
−(tpi − ypi)φ′i para neurônios de saída
φ′i∑
k wkiδk para neurônios escondidos(3-18)
A segunda etapa do algoritmo da retropropagação é praticamente equivalente
ao gradiente decrescente. Por definição o gradiente deE indica a direção de maior
crescimento deE, sendo que para sua minimização é necessário caminhar na direção
contrária. A retropropagação atribui uma taxa de aprendizado η que determina o
passo do algoritmo. A equação 3-19 apresenta a variação dos pesos em função do
gradiente do erro.
∆wi j = −η∂E∂wi j
(3-19)
Algoritmos baseados na retropropagação
Existem diversos algoritmos que tiram proveito da forma em que o gradiente
do erro em função dos pesos é calculado segundo o método de retropropagação.
Tais algoritmos diferenciam-se pela maneira como atualizam os pesos da rede. A
primeira variação da retropropagação a se tornar popular foi o gradiente decrescente
com momento (equação 3-20). Nela, a última atualização de pesos é ponderada por
uma taxa de momentoµ, evitando mudanças bruscas na direção.
∆w(t) = −η∂E∂w
(t) + µ∆w(t − 1) (3-20)
Outros métodos que utilizam derivadas de segunda ordem são muito eficientes
sob certas condições. Enquanto os métodos de primeira ordemutilizam uma apro-
ximação linear da superfície de erro, os métodos de segunda ordem utilizam uma
aproximação quadrática. O algortimo de Newton é o mais conhecido para a minimi-
zação de funções, sua adaptação para atualizar os pesos é apresentada na equação
3-21.∆w(t) = −ηH−1∂E
∂w(t) (3-21)
ondeH é a matriz Hessiana. Como calcular a inversa da matriz Hessiana é custoso,
são utilizados métodos, conhecidos como Quasi-Newton, queaproximam esse va-
lor. Os dois métodos Quasi-Newton mais difundidos são o algoritmo de Davidon-
Fletcher-Powell (DFP) e Broyden-Fletcher-Goldfarb-Shanno (BFGS), sendo o se-
gundo mais recomendado (Reed, 1998).
O método de Levenberg-Marquadt (LM) varia entre o método do gradiente
decrescente e o de Newton. Esse método tira proveito da rápida convergência do
método de Newton quando próximo de um mínimo, evitando que esse divirja pela
utilização do gradiente. A direção de busca é uma combinaçãolinear da direção do
Capítulo 3. Técnicas de Inteligência Computacional 56
gradiente decrescenteg e do método de newton (H−1g), como segue:
∆w = −(H + λI )−1g (3-22)
onde, I é a matriz identidade e o parâmetroλ controla o compromisso entre o
gradiente e o método de Newton. O algoritmo começa com o valorde λ grande,
fazendo com que o a equação tenda ao gradiente, esse valor é decrementado a cada
iteração, tendendo ao método de Newton para a convergência final.
A Regularização Bayesiana (RB) minimiza uma combinação linear entre o
SSE e a magnitude dos pesos. Ela também modifica essa combinação linear a
fim de atingir uma boa qualidade de generalização da rede (Mackay, 1992). Essa
combinação linear é então utilizada como a função de custo noalgoritmo LM.
Validação
O treinamento de redes neurais pode causar um super treinamento (overfit-
ting). Esse termo é utilizado quando a rede se torna capaz de prever apenas o con-
junto de dados utilizados no treinamento, perdendo sua capacidade de prever dados
nunca apresentados para a rede (generalização). Para evitar esse super treinamento,
utiliza-se um conjunto de validação. Esse conjunto de padrões é propagado pela
rede a cada iteração do algoritmo de minimização. O valor do erro desse conjunto é
então monitorado, sendo que seu aumento indica que a rede está se tornando muito
especializada. Então, a rede que deve ser escolhida é aquelaem que o erro do con-
junto de validação é o menor, como ilustrado na figura 3.9, onde os círculos ()representam os dados de treinamento e as cruzes (+) os de validação.
Figura 3.9: Validação cruzada. Ilustração de dois momentosdistintos do treina-mento: generalização da rede (a) e supertreinamento (b).
Inicialização dos pesos
O valor final do treinamento de uma rede depende do ponto inicial, isto é, sua
configuração inicial de pesos. Isso devido aos algoritmos deminimização utilizados
Capítulo 3. Técnicas de Inteligência Computacional 57
dependerem desse ponto. Um exemplo desse problema pode ser visto na figura 3.10,
onde as curvas de nível representam a superfície do erro em função de duas variáveis
(pesos). Nessa figura, os dois círculos menores representamduas configurações de
pesos distintas, e a cada iteração do algoritmo de minimização, um novo ponto
() é obtido. Nota-se que em cada inicialização o ponto de mínimo encontrado é
distinto, isso porque a função de erro possui diversos mínimos locais. Para evitar
esse acontecimento, um experimento deve ser feito com diversas configurações
iniciais de peso, a fim de descobrir qual é a melhor rede.
Figura 3.10: Dependência entre o ponto inicial e o erro final obtido.
4Inferência e Otimização de Nanoestruturas
4.1Introdução
Conforme apresentado no capítulo 2, os pesquisadores participantes do
Workshop NanoFrontiers, em fevereiro de 2006, discutiram o desenvolvimento de
um grande banco de dados para o armazenamento das informações relativas à Nano-
ciência e Nanotecnologia (Schmidt, 2007). Este banco de dados seria acompanhado
por ferramentas matemáticas e computacionais capazes de manipular os dados, for-
necendo as respostas desejadas pelos especialistas. Todo este conjunto foi chamado
de “nanoinformática”.
O objetivo da nanoinformática é proporcionar aos pesquisadores a possibili-
dade de encontrar e usar dados relevantes às suas pesquisas científicas. Para ilustrar
está ideia, pode-se imaginar o seguinte exemplo fictício:
Imagine que um pesquisador pretenda crescer uma determinada estrutura
semicondutora para ser usada, por exemplo, em um novo sensor. O pesquisador
em questão possui todos os equipamentos necessários e tem uma vaga ideia de
como construir o dispositivo. Logo, o primeiro passo da pesquisa é procurar as
referências bibliográficas distribuídas em diversos artigos de revistas publicadas em
vários países. O pesquisador lerá uma grande parte destes artigos, colhendo algumas
informações. Aliando os dados obtidos nos artigos e o conhecimento e a experiência
do pesquisador, este decide quais parâmetros usar na síntese da nanoestrutura.
A nanoinformática visa proporcionar uma dinâmica maior na obtenção dos
dados usados neste tipo de pesquisa, evitando uma busca longa e, muitas vezes,
ineficiente dos dados desejados.
Contudo, mesmo que o pesquisador obtenha os dados desejados de maneira
rápida e eficiente, ele escolherá um conjunto de dados a ser usado na síntese dos
nanodispositivos através de uma heurística de “tentativa eerro”, baseada nos seus
conhecimentos e nos dados existentes na literatura. Esta alternativa quase sempre
produz bons resultados, mas não necessariamente os melhores.
O objetivo deste capítulo é descrever a utilização de algumas das técnicas de
Inteligência Computacional para o desenvolvimento de ferramentas capazes de re-
Capítulo 4. Inferência e Otimização de Nanoestruturas 59
solver o problema descrito acima. O primeiro objetivo é criar um sistema de inferên-
cia, capaz de prever as características da nanoestrutura sintetizada com relação aos
parâmetros usados na síntese. Este sistema permite que o pesquisador possa inves-
tigar como determinados parâmetros influenciam no crescimento da nanoestrutura
sem, necessariamente, realizar o experimento. Isto permite uma economia de tempo
e de recursos. O segundo objetivo é usar um sistema de otimização, juntamente com
o sistema de inferência mencionado, para encontrar o conjunto de parâmetros ideais
para a síntese da nanoestrutura desejada.
A seguir, os experimentos realizados serão descritos e discutidos.
4.2Pontos Quânticos - PQ
A síntese de poços quânticos no início da década de 70 pode serdefinida
como o ponto de partida para o estudo das nanoestruturas semicondutoras. Um
poço quântico é uma camada muito fina de semicondutor entre duas outras camadas
semicondutoras com “gap” de energia maior. A movimentação de elétrons em um
poço quântico só é permitida em duas dimensões quando a largura do poço é da
ordem do comprimento de onda da carga elétrica (Steiner, 2004).
Na década de 80, o foco das pesquisas em semicondutores se concentrou em
estruturas com dimensionalidade ainda mais reduzida: confinamento em uma di-
mensão (fios quânticos) (Petroff, 1982) e confinamento em zero dimensões (pontos
quânticos). Diferentemente dos poços quânticos e fios quânticos, os níveis de ener-
gia dos pontos quânticos são discretos. A figura 4.1 mostra asdensidades de estados
nos materiais semicondutores. De cima para baixo:bulk, poço quântico, fio quântico
e ponto quântico.
Dispositivos baseados em pontos quânticos têm mostrado um grande poten-
cial para superar os dispositivos utilizando poços quânticos no desenvolvimento de
fotodetectores de infravermelho baseados em transições ópticas entre bandas, de-
vido ao confinamento nas três dimensões que gera uma maior discretização dos
níveis de energia (Bimberg, 1999) (Ryzhii, 2004). Além disso,os pontos quânticos
propiciam a criação de lasers com propriedades diferenciadas (Steiner, 2004).
Diversas metodologias já foram usadas para criar estruturas com PQs. A cri-
ação de uma máscara posteriormente gravada na estrutura semicondutora foi um
dos primeiros métodos implementados (Reed, 1986). Os principais problemas deste
método são a baixa resolução lateral e os defeitos criados. Outra possibilidade, tam-
bém envolvendo o uso de máscaras, permite que a nucleação só ocorra em determi-
nadas posições, resultando em pirâmides tetraédricas ou hexagonais (Fukui, 1991)
(Tachibana, 2000) .
Provavelmente, os métodos mais usados para a formação de nanoestruturas
Capítulo 4. Inferência e Otimização de Nanoestruturas 60
Figura 4.1: Densidade de estado nos materiais semicondutores. De cima para baixo:materialbulk, poço quântico, fio quântico e ponto quântico.
são aqueles que tiram proveito do fenômeno de auto-organização em superfícies
cristalinas. O relaxamento da tensão provocada na interface entre diferentes materi-
ais permite a formação dos pontos quânticos.
MBE e MOCVD são duas técnicas comumente usadas para o crescimento
de vetores uniformes de PQs em três dimensões (Steiner, 2004). Tanto os sistemas
com parâmetros de rede casados quanto aqueles descasados são usados para a
formação das nanoestruturas. No caso de sistemas com parâmetros de rede casados,
o crescimento é determinado pela relação entre as energias de duas superfícies
e a energia da interface entre elas (Grundmann, 2002). Se a soma da energia da
superfície da camada epitaxial (γ f ) com a energia da interface (γi) é menor que a
energia da superfície do substrato (γs), ou seja,γ f +γi < γs, o crescimento ocorre no
modo Frank-van der Merwe, mostrado na figura 4.2(a). Alterando o valor da soma
γ f + γi, resulta em uma transição da forma de crescimento para o modoVolmer-
Weber, onde ilhas 3D são formadas, como na figura 4.2(b).
No caso de parâmetros de rede descasados, tal como heteroestruturas
GaAs/InAs, somente as primeiras poucas monocamadas depositadasformam ca-
madas tensionadas com o parâmetro de rede igual àquele do substrato. Quando a
espessura crítica é excedida, a tensão no topo da camada permite a formação espon-
tânea de ilhas 3D aleatoriamente distribuídas. A fase de transição entre a estrutura
epitaxial e o arranjo aleatório de ilhas é chamada de transição Stranski-Krastanov
(Steiner, 2004). Este processo é mostrado na figura 4.2(c). Já a figura 4.3 mostra a
Capítulo 4. Inferência e Otimização de Nanoestruturas 61
imagem real de um ponto quântico.
Figura 4.2: Esquemático de três formas de crescimento: Frank-van der Merwe (a),Volmer-Weber (b), Stranski-Krastanov (c).
Figura 4.3: Imagem de um ponto quântico. Créditos Maurício Pamplona
As amostras usadas neste trabalho contêm uma camada de pontos quânticos
de InAs automontados e aleatoriamente distribuídos. Tais PQs foram depositados
por técnicametalorganic vapor phase epitaxy(MOVPE) a 100 mbar no topo de
InP, InGaAs ou InGaAlAs, onde todas as ligas possuem parâmetros de rede seme-
lhantes ao substrato de InP. Tais estruturas foram sintetizadas para serem usadas no
desenvolvimento de fotodetectores de infravermelho (Souza, 2007). Normalmente,
os pontos quânticos para este tipo de aplicação são crescidos sobre substratos de
GaAs, devido aos custos reduzidos. Porém, o crescimento sobre um substrato de InP
permite uma integração com dispositivos óticos de alta velocidade (Souza, 2007).
A altura média e densidade dos pontos quânticos foram determinadas por um mi-
croscópio de força atômica (AFM). Difração de raios-X e fotoluminescência foram
usadas para determinar a composição das ligas.
A seguir, a inferência e a otimização dos pontos quânticos crescidos por
MOVPE serão discutidas.
4.2.1
Capítulo 4. Inferência e Otimização de Nanoestruturas 62
Inferência
O controle do crescimento dos pontos quânticos é fundamental para o má-
ximo desempenho dos dispositivos baseados nestas nanoestruturas. O crescimento
de pontos quânticos com altura e dispersão bem definidas é essencial. A altura
dos pontos quânticos determina a diferença de energia entreos níveis permitidos
e, consequentemente, o comprimento de onda de emissão ou detecção. Também é
importante que todos os pontos quânticos crescidos no substrato tenham aproxima-
damente a mesma altura, limitando o comprimento de onda a um valor próximo do
desejado. No caso de fotodetectores, quanto maior a densidade dos pontos quânti-
cos melhor o funcionamento dos dispositivos, desde que os pontos tenham a altura
desejada. Porém, a escolha do conjunto de parâmetros ideaispara o crescimento dos
pontos quânticos desejados é um dos grandes obstáculos enfrentados pelos pesqui-
sadores.
A alternativa do uso de um método de “tentativa e erro” demanda uma quan-
tidade significativa de tempo e recursos. Logo, o desenvolvimento de um sistema
de inferência é extremamente valioso, diminuindo o número de experimentos e,
consequentemente, o custo de fabricação.
O uso de Redes Neurais Artificiais já foi proposto para melhorar o desempe-
nho do crescimento epitaxial, porém os autores não publicaram nenhum resultado
(Bland, 2002).
Neste trabalho uma Rede Neural Artificial do tipoMultiLayer Perceptron
(MLP) foi utilizada para inferir o resultado do crescimentode pontos quânticos.
Foram usados dados de dezenas de experimentos realizados nolaboratório de
semicondutores (LABSEM) da PUC-Rio. A tabela com os valores dosexperimentos
são mostrados no anexo B.
Os seis parâmetros de entrada, relacionados ao crescimentoem cada experi-
mento, usados como entradas pela Rede Neural são: o fluxo de índio no reator, a
temperatura de crescimento, o tempo de deposição, a espessura da camada sobre a
qual os PQs são crescidos e as concentrações de índio e alumínio na camada citada.
Os experimentos considerados usaram três materiais diferentes para a camada da
base (InP, InGaAs, InAlGaAs). Como saídas obtêm-se a altura média dos pontos
quânticos, o desvio padrão da altura e a densidade dos pontosquânticos. Obvia-
mente, outros parâmetros também são importantes para o crescimento dos pontos
quânticos, tais como a pressão e o tempo de aquecimento. Porém, na base de da-
dos utilizada, estes parâmetros são constantes, sendo desnecessário usá-los como
entrada para a rede neural.
Ao total três Redes Neurais diferentes foram criadas:
1. Rede para inferir altura média dos pontos quânticos, contendo 67 dados;
Capítulo 4. Inferência e Otimização de Nanoestruturas 63
2. Rede para inferir a densidade dos pontos quânticos, contendo 61 dados;
3. Rede para inferir o desvio padrão da altura dos pontos quânticos, contendo
58 dados;
Para o caso 1 foi criada uma rede Perceptron de Múltiplas Camadas (MLP)
(Haykin, 1999) e os resultados são discutidos a seguir: estaRede Neural utilizou
os seis parâmetros de entrada previamente citados e contém três camadas distintas
(entrada, escondida e saída). Todos os parâmetros de entrada foram normalizados
de 0,1 a 0,9. A rede foi treinada com diferentes quantidades de neurônios na
camada escondida. Porém, a melhor configuração possui seis neurônios na camada
de entrada, a camada escondida possui onze neurônios e, finalmente, a camada de
saída possui apenas um neurônio. A arquitetura da rede é mostrada na figura 4.4.
Figura 4.4: Arquitetura da Rede Neural para inferir a altura média dos pontosquânticos.
Para avaliar a rede neural criada foi utilizado o erro médio absoluto percentual
(MAPE). Esta medida define o quanto os dados inferidos se aproximam dos dados
reais. Por exemplo, um MAPE igual a 5 corresponde a um erro de 5% na inferência
obtida pela rede. A fórmula do MAPE é apresentada na equação 4-1
MAPE=
∑nt=1
∣
∣
∣(st − s′t)/st
∣
∣
∣
n(4-1)
onde,st é o valor desejado,s′t é o valor obtido pelo modelo en é o número de
elementos.
A figura 4.5 mostra a comparação entre os dados previstos pelaRede Neural
e os valores obtidos pela imagem fornecida por um AFM. Os valores previstos
Capítulo 4. Inferência e Otimização de Nanoestruturas 64
pela rede neural estão destacados em vermelho e estão bem próximos aos dados
experimentais. Os dados usados para treinamento e validação da rede estão na
região branca. Os valores na região cinza foram usados para testar a rede após
o treinamento. Estes últimos valores não foram apresentados à rede durante o
treinamento ou validação. O erro médio percentual obtido pelo conjunto de teste
foi de apenas 8,3%, o que pode ser considerado um resultado excepcional devido
ao conjunto reduzido de dados usados para o treinamento da rede neural.
Figura 4.5: Comparação entre as medidas feitas por um AFM e as previsões obtidaspela RNA.
Devido à capacidade de generalização da Rede Neural, após a criação a sua
criação, esta pode ser usada para investigar a influência dosparâmetros de entrada
no crescimento dos pontos quânticos. Isto pode ser obtido variando dois parâmetros
de entrada e fixando os outros quatro. A figura 4.6 mostra a variação da altura média
dos pontos quânticos em razão do tempo de deposição e composição de alumínio.
Os demais parâmetros foram fixados com os valores apresentados na tabela 4.1.
Parâmetro ValorFluxo de In 60 sccm
Espessura da Base 500 nmTemperatura de Crescimento500oC
Composição de In 52,3%
Tabela 4.1: Valores fixados para gerar a figura 4.6.
Observe na figura 4.6 que quando a concentração de Al aumenta até 13%, há
uma clara tendência na redução da altura média dos PQs. A partir deste patamar,
a altura cresce continuamente. Este comportamento já foi observado experimen-
talmente e a altura mínima foi obtida quando a concentração de Al atingiu 16%
Capítulo 4. Inferência e Otimização de Nanoestruturas 65
Figura 4.6: Variação da altura média dos pontos quânticos com relação ao tempo dedeposição e à composição de alumínio.
em uma liga de InGaAlAs crescida em InP (Borgstrom, 2003). Na mesma figura,
pode-se observar que a altura média dos pontos quânticos aumenta com o tempo
de deposição. Isto é esperado, já que o PQ tem mais tempo para crescer. A com-
paração com os resultados experimentais já publicados confirmam que os valores
obtidos neste trabalho são excelentes, mesmo usando um conjunto pequeno de da-
dos experimentais.
Para o caso 2, ou seja, a inferência da densidade dos pontos quânticos, também
foi criada uma rede MLP. Após a limpeza dos dados (eliminaçãode “outliers”,
tratamento de dados duplicados, eliminação de dados incompletos, etc.) foram
utilizadas as informações de 61 experimentos diferentes. Arede criada utilizou as
mesmas 6 informações de entrada. Contudo, devido à pouca quantidade de dados
diferentes, as entradas relacionadas ao fluxo de índio e espessura da camada foram
classificadas em 3 e 4 categorias diferentes, respectivamente. Os demais dados de
entrada continuam sendo normalizados entre 0,1 e 0,9. Diferentemente da rede
obtida no caso 1, a melhor rede encontrada para a inferência da densidade dos
pontos quânticos possui treze neurônios na camada escondida.
A figura 4.7 apresenta o resultado da inferência da densidadedos pontos
quânticos. Os dois primeiros gráficos são referentes aos conjuntos de treinamento e
validação, respectivamente. O último gráfico apresenta o resultado do conjunto de
teste, ou seja, o conjunto de dados que não foi apresentado à rede neural durante
a sua criação. Observe que o MAPE resultante foi de 21,47%. Claramente, o valor
obtido é bastante superior ao apresentado pela rede responsável pela inferência da
altura dos pontos quânticos. As principais razões para esteaumento significativo do
erro são: a redução do número de dados disponíveis e a características dos dados
experimentais.
Capítulo 4. Inferência e Otimização de Nanoestruturas 66
Figura 4.7: Resultado da inferência da densidade de pontos quânticos. De cima parabaixo: conjuntos de treinamento, validação e teste.
Apesar do aumento do erro de previsão, o resultado obtido é satisfatório e
pode ser usado pelos especialistas na previsão da densidadedos pontos quânticos.
Outro dado importante apresentado no gráfico diz respeito aovalor da correlação
entre os dados experimentais e os dados previstos. Este dadomede o quão bem a
variação dos dados de saída é explicada pela Rede Neural, ou seja, a tendência de
aumento ou diminuição da densidade dos pontos quânticos. Valores de correlação
acima de 0,9 indicam uma boa concordância entre os dados experimentais e previs-
tos. Na figura 4.7 pode-se observar uma correlação de 0,94 para os dados de teste
e a figura mostra claramente que a rede neural é capaz de prevercom sucesso a
tendência na variação da densidade.
Finalmente, o caso 3 trata da inferência do desvio na altura dos pontos
quânticos. Esta rede possui uma configuração bastante semelhante à rede do caso 2.
Porém, possui apenas oito neurônios na camada escondida e 58dados experimentais
foram utilizados. O resultado da inferência pode ser observado na figura 4.8.
O MAPE do conjunto de teste da melhor rede encontrada é de 17,24% e a
correlação é igual a 0,9. Estes valores indicam que a rede neural criada é eficiente
para prever o comportamento do desvio de altura dos pontos quânticos.
Os resultados acima apresentam três redes neurais diferentes para inferir
diferentes propriedades da síntese de pontos quânticos. Todos os três resultados
são satisfatórios, porém a rede neural para a inferência da altura obteve os melhores
resultados. Apesar das outras duas redes apresentarem resultados inferiores, estes
Capítulo 4. Inferência e Otimização de Nanoestruturas 67
Figura 4.8: Resultado da inferência do desvio da altura dos pontos quânticos. Decima para baixo: conjuntos de treinamento, validação e teste.
ainda podem ser considerados valiosos, auxiliando os especialistas na síntese de
novas nanoestruturas.
4.2.2Otimização
Após a criação, validação e teste da Rede Neural do caso 1, um Algoritmo
Genético (AG) é usado para encontrar o conjunto de parâmetros de entrada que
minimizam a altura média dos PQs. Neste caso, a RNA funciona como um simula-
dor e avalia os conjuntos de parâmetros gerados pelo AG. A figura 4.9 ilustra este
procedimento.
O cromossomo utilizado possui seis genes (um para cada parâmetro) e cada
um deles pode assumir valores entre 0,1 e 0,9, devido à normalização dos parâme-
tros para o treinamento da RNA. O critério de parada do AG foi atingir um total de
500 gerações, porém o algoritmo convergiu com 200 gerações.A figura 4.10 mostra
a curva de evolução do AG. A melhor configuração encontrada foi uma liga de In-
GaAlAs, cuja altura média dos PQs prevista foi de 4,5nm. O conjunto de parâmetros
ótimo que levou a tal resultado é mostrado na tabela 4.2.
4.3Nanocompósitos
Os materiais estruturados podem ser divididos em quatro categorias diferen-
tes: metais, polímeros, cerâmicos e compósitos (Gibson, 1994). Um compósito é
Capítulo 4. Inferência e Otimização de Nanoestruturas 68
Figura 4.9: Procedimento de otimização dos parâmetros parasíntese de pontosquânticos.
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
01 27 53 79 105 131 157 183 209 235 261 287 313 339 365 391 417 443 469 495
Altu
ra N
orm
aliza
da
Ciclos
Figura 4.10: Curva da evolução da otimização dos PQ.
Parâmetro ValorFluxo de In 60 sccm
Espessura da Base 1,5 nmTemperatura de Crescimento519,8oC
Tempo de deposição 2,4 sComposição de In 53,44%Composição de Al 21,79%
Tabela 4.2: Conjunto ótimo de parâmetros encontrado pelo AG.
Capítulo 4. Inferência e Otimização de Nanoestruturas 69
composto de dois ou mais materiais individuais das outras três categorias. O obje-
tivo da formação de um compósito é obter uma combinação de propriedades que
não podem ser encontradas em nenhum material isoladamente,além de aproveitar
as melhores características dos materiais componentes. Alguns materiais que ocor-
rem naturalmente também são considerados compósitos, dentre eles podemos citar
a madeira e o osso (Callister, 1993).
Um material compósito, tal como será considerado neste trabalho, é um
material de múltiplas fases que é criado artificialmente e não ocorre naturalmente.
Além disso, as fases constituintes devem ser quimicamente dissimilares e separadas
por uma interface distinta. Logo, as ligas metálicas e os materiais cerâmicos
não se encaixam nesta definição porque suas múltiplas fases são formadas como
consequência de fenômenos naturais.
Ao projetar um material compósito, cientistas e engenheiros tem engenho-
samente combinado vários metais, cerâmicos e polímeros para produzir uma nova
geração de materiais extraordinários. Os compósitos têm sido criados para melhorar
a combinação de características mecânicas, tais como força, dureza e flexibilidade,
além de outras propriedades.
Muitos dos materiais poliméricos são formados por apenas duas fases. A pri-
meira é chamada de matriz, que é contínua e contorna a segundafase, frequen-
temente chamada de fase dispersa ou carga. As propriedades dos compósitos são
obtidas em função das propriedades dos materiais constituintes e suas concentra-
ções.
Um dos compósitos mais comuns é a fibra de vidro, onde fibras de vidro
puras e pequenas são misturadas a um material polimérico (normalmente um epóxi
ou poliéster). A fibra de vidro pura é relativamente forte e dura, mas quebradiça. Já
o polímero é dúctil, mas fraco e flexível. A fibra de vidro resultante da mistura dos
materiais é dura, forte, flexível e dúctil. Além disso, possui baixa densidade.
Outro material tecnologicamente importante é a fibra de carbono misturada
com polímero (CFRP). Este material é mais duro e forte que a fibrade vidro, porém
é mais caro. Os compósitos CFRP são usados em aviões, foguetes,carros, etc.
Quando a carga usada para a formação do compósito é constituída por par-
tículas na escala nanométrica, o material é conhecido como nanocompósito. Neste
caso, a porcentagem por massa da carga que deve ser inserido para a formação do
compósito é muito menor que a porcentagem necessária quandoutilizadas partí-
culas normais, em escala maior. Isto se deve, principalmente, a grande superfície
de área obtida pelas nanopartículas, como foi discutido no capítulo 2. Além disso,
as nanopartículas podem propiciar a formação de materiais com propriedades di-
ferenciadas. A adição de nanotubos em uma matriz polimérica, por exemplo, pode
aumentar significativamente a condutividade térmica e elétrica do material.
Capítulo 4. Inferência e Otimização de Nanoestruturas 70
Em termos taxonômicos os nanocompósitos mantêm a mesma lógica de clas-
sificação dos compósitos tradicionais, podendo ser: esféricos, baculiformes ou la-
melares, tendo como exemplo a sílica, o nanotubo de carbono ea montemorilonita,
respectivamente.
Modelos numéricos e analíticos são ferramentas essenciaispara estudar o con-
trole de parâmetros responsáveis pelas propriedades de compósitos e nanocompó-
sitos. Muitos modelos existentes mostram que o módulo das partículas, a razão de
aspecto e a fração volumétrica são fatores que influenciam aspropriedades mecâni-
cas de compósitos e nanocompósitos (Fornes, 2003, Wang, 2004a, Wang, 2004b).
Porém, apesar dos vários trabalhos sobre as propriedades dos nanocompósitos, o
entendimento da relação entre o comportamento macroscópico e as propriedades
das nanoestruturas é uma questão ainda indefinida. Atualmente, diversos modelos
analíticos são baseados na regra de misturas (Pal, 2008). Tais modelos funcionam
para algumas combinações específicas de matrizes e cargas, mas não funcionam
corretamente quando a concentração de carga aumenta. Além disso, sabe-se que a
relação entre o volume de carga e as propriedades mecânicas de um nanocompósito
tem um comportamento não-linear.
A seguir a inferência e a otimização de nanocompósitos serãodescritas e
discutidas.
4.3.1Inferência
A inferência de nanocompósitos pode se feita de maneira semelhante ao já
descrito sobre a inferência de pontos quânticos. Neste caso, também foi usada uma
rede Perceptron de Múltiplas Camadas (MLP). O número de neurônios nas camadas
escondidas foi variado para obter a melhor configuração da rede. A melhor rede
apresenta 2 camadas escondidas, além das camadas de entradae saída. O número
de neurônios na primeira e segunda camadas escondidas é igual a oito e dois,
respectivamente. A figura 4.11 mostra a arquitetura da rede para este caso.
Os parâmetros de entrada utilizados para a inferência dos nanocompósitos
são: o tipo da matriz, o tipo da carga, a concentração em massada carga (%wt),
o diâmetro e a razão de aspecto da carga. Os dois primeiros parâmetros são quali-
tativos, enquanto os demais são quantitativos. Os parâmetros foram normalizados
conforme é mostrado na tabela 4.3. A concentração da carga e omódulo de Young
relativo foram normalizados de maneira diferente com o intuito de permitir uma
pequena extrapolação dos valores da base de dados.
Ao contrário do modelo sobre os pontos quânticos, cujos dados usados
foram obtidos de um único laboratório, os valores utilizados para a inferência
dos nanocompósitos foram obtidos de diversos trabalhos publicados na literatura.
Capítulo 4. Inferência e Otimização de Nanoestruturas 71
Figura 4.11: Arquitetura da Rede Neural para inferir o módulode Young deNanocompósitos.
Propriedade NormalizaçãoClasse da Matriz [0, 1]Classe da Carga [0, 1]
Diâmetro da Carga [0, 1]Razão de Aspecto da Carga [0, 1]
Concentração da Carga [0, 0,9]Módulo de Young Relativo [0,1, 0,9]
Tabela 4.3: Normalização dos dados para a RNA.
Alguns dos parâmetros usados foram obtidos de gráficos e, consequentemente,
possuem um ruído associado. Tal ruído não é suficiente para levar a RNA a ter
um mau funcionamento. O apêndice B apresenta uma tabela com todos os dados
utilizados e suas respectivas origens.
A obtenção de dados na literatura não é uma tarefa trivial, devido às diferentes
abordagens nas diversas pesquisas. A propriedade escolhida para ser inferida neste
trabalho é o módulo de Young, por ser a mais encontrada na literatura. O módulo
de Young é um parâmetro mecânico que proporciona uma medida da rigidez de um
material sólido. O valor é obtido da razão entre a tensão exercida e a deformação
unitária do material, como mostrado na equação 4-2. A unidade de medida é o
Pascal.
E =Tensao
De f ormacao(4-2)
Os dados utilizados são muito heterogêneos, totalizando treze diferentes tipos
de matrizes e dezoito de cargas, conforme pode ser visto no apêndice B.
A figura 4.12 apresenta o resultado da melhor rede encontrada. O primeiro
Capítulo 4. Inferência e Otimização de Nanoestruturas 72
gráfico corresponde ao conjunto de treinamento, o segundo aoconjunto de validação
e o terceiro ao conjunto de testes.
Figura 4.12: Comparação entre os valores da literatura e as previsões obtidas pelaRNA.
Os dados em vermelho são os previstos pela Rede Neural. É importante
ressaltar, mais uma vez, que o conjunto de teste não é apresentado à rede durante
a fase de treinamento. O MAPE obtido pelo conjunto de teste é de 3,93 % e a
correlação é igual a 0,999. Portanto, pode-se concluir que ocomportamento previsto
pela RNA é muito semelhante ao comportamento experimental. Além disso, os
últimos sete dados do conjunto de teste possuem uma combinação de matriz e carga
que nunca foi apresentada à rede. Contudo, a RNA criada foi capaz de inferir os
valores de uma combinação desconhecida com um erro muito pequeno. Isto permite
que os pesquisadores possam prever o comportamento de uma combinação de dois
materiais que ainda não foi realizado experimentalmente.
Finalmente, de posse de uma RNA bem treinada, pode-se ter ideia da variação
do módulo de Young relativo (E/Ec) em relação a qualquer parâmetro de entrada
usado na criação da rede. Por exemplo, a figura 4.13 apresentaa saída da rede para
uma combinação contendo poly(methyl methacrylate) (PMMA)com nanofibras
Capítulo 4. Inferência e Otimização de Nanoestruturas 73
de carbono com razão de aspecto igual a 100. Neste caso, apenas o diâmetro e
a concentração da carga foram variados. A figura mostra que quanto menor a
partícula, menor a concentração de carga necessária para obter um alto valor do
módulo de Young relativo. Além disso, quando as partículas menores alcançam
altas concentrações o módulo de Young diminui. Isto pode serexplicado pela
agregação destas partículas, gerando partículas maiores e, portanto, agindo como
micro partículas e não mais como nanopartículas.
Figura 4.13: Inferância de um compósito de PMMA/CNF
A Rede Neural criada foi comparada a diferentes modelos apresentados na
literatura. Em (Pal, 2008), os autores usam quatro conjuntos diferentes de compó-
sitos para discutir seis modelos. Dois destes modelos são asregras de mistura de
Voigt e Reuss e os outros quatro modelos são descritos em função dos módulos
de cisalhamento e do material maciço dos compósitos. As figuras 4.14-4.17 apre-
sentam a comparação entre os seis modelos apresentados em (Pal, 2008) e a RNA
criada neste trabalho. Neste caso, o resultado da RNA é apresentado nas figuras
como modelo V.
Na figura 4.14, um nanocompósito de argila orgânica (bis(hydroxyl ethyl)-
(methyl)) com “nylon-6” (Fornes, 2003) é usado para comparar os modelos. Neste
caso, uma concentração muito baixa de carga (máximo de 3% de fração volumé-
trica) é usada. Como pode ser visto, neste intervalo de concentração a variabilidade
de dados é aproximadamente linear e o modelo III apresenta o melhor resultado.
A Figura 4.15 apresenta um compósito de montemorilonita comSBR (“Sty-
rene Butadiene Rubber”) (Zhang, 2004). Neste caso uma fração volumétrica maior
é considerada, apresentando um comportamento não linear. Claramente, a RNA é
superior aos outros 6 modelos apresentados por (Pal, 2008).
Capítulo 4. Inferência e Otimização de Nanoestruturas 74
Figura 4.14: Comparação de Modelos para o compósito de argilaorgânica(bis(hydroxyl ethyl)-(methyl)) com “nylon-6”
Figura 4.15: Comparação de Modelos para o compósito de montemorilonita comSBR
Capítulo 4. Inferência e Otimização de Nanoestruturas 75
Já nas figuras 4.16 e 4.17, compósitos de argila montemorilonita com matrizes
de NBR (“Nitrile Rubber”) (Zhang, 2004) e CNBR (“Carboxylated Acrylonitrile
Butadiene Rubber”) (Wu, 2004) são mostradas, respectivamente. Novamente, um
comportamento não linear é observado e a RNA é claramente superior aos outros
modelos apresentados por (Pal, 2008).
Figura 4.16: Comparação de Modelos para o compósito de montemorilonita comNBR
Os resultados descritos indicam que, em geral, a RNA é melhor que os mode-
los apresentados em (Pal, 2008) para inferir os resultados experimentais da variação
do módulo de Young. Os modelos em (Pal, 2008) apenas apresenta melhor resul-
tado para compósitos com baixa razão volumétrica de cargas.O pior desempenho
da RNA, neste caso, pode ter sido causado pela baixa quantidade de dados usados
em sua criação.
4.3.2Otimização
De posse da melhor RNA obtida, um AG foi usado para encontrar a melhor
configuração de modo a maximizar o módulo de Young relativo donanocompósito.
A tabela 4.4 apresenta o resultados da execução do AG.
No processo de evolução do AG, o melhor resultado utiliza a matriz EGlass-
PP juntamente com o nanotubo de carbono de parede dupla aminofuncionalizado.
O diâmetro obtido para essa partícula é próximo ao mínimo possível (2,52 nm).
A razão de aspecto da partícula obtida pelo AG é igual a 1065. Afração mássica
não foi a máxima possível (0,11), pois o seu aumento produz uma diminuição na
avaliação final do indivíduo.
Capítulo 4. Inferência e Otimização de Nanoestruturas 76
Figura 4.17: Comparação de Modelos para o compósito de montemorilonita comCNBR
Parâmetro ValorMatriz EGlass-PPCarga nanotubo de carbono aminofuncionalizado
Fração mássica da Carga 0,11Diâmetro 2,62
Razão de Aspecto 1065Módulo Relativo 22,26
Tabela 4.4: Resultado obtido pelo AG para o melhor nanocompósito.
O resultado obtido propõe a criação de um novo nanocompósitos, já que a
combinação entre a matriz e a carga sugerida não existe no conjunto de dados
usado. Tal resultado deve ainda ser validado experimentalmente, mas já fornece
ao especialista uma boa sugestão de parâmetros para a criação de um bom material.
5Projeto Automático de Nanodispositivos
5.1Otimização de OLEDs Multicamadas
OLEDs (do inglês - Organic light emitting diodes) são constituídos por ma-
teriais orgânicos emissores de luz que, quando alimentadoscom corrente elétrica,
podem produzirdisplayscom alta qualidade. Um dos vários fatores que fazem dos
OLEDs um dispositivo superior à tecnologia LCD é o fato de que estes não re-
querem luz de fundo, permitindo assim operarem em regime de menor consumo
de potência, sem por isso perder qualidade de brilho e contraste. Além disso,
tais dispositivos mantém a clareza de visão praticamente sob qualquer ângulo.
Existem, porém, algumas desvantagens que têm limitado a eficiência de OLEDs.
Nas primeiras pesquisas, observou-se nos dispositivos mono-camadas que a mai-
oria dos portadores injetados a partir dos eletrodos difundiam-se para o eletrodo
oposto sem sofrer recombinação (Ma, 2002). Outra limitaçãotípica é a alta mobi-
lidade dos portadores de carga positiva quando comparados aos de carga negativa
(Ma, 2000, Werner, 2003). Isso é uma característica presente em materiais orgâni-
cos eletroluminescentes. Mais ainda, existe uma extensa barreira de energia criada
pela diferença entre a função trabalho do catodo metálico e omenor orbital mole-
cular ocupado (LUMO) (do inglês - Lowest Unocuppied Molecular Orbital) do se-
micondutor, inibindo a injeção de portadores de carga negativa. Essas desvantagens
resultam na formação da maioria dos pares elétron-buraco navizinhança do catodo,
suprimindo a emissão de luz (Malliaras, 1998, Koehler, 2000). Diversas metodolo-
gias foram propostas para evitar essas dificuldades, tais como estruturas multicama-
das alternadas, cada uma composta de moléculas portadoras de elétron ou buracos,
exclusivamente (Greenham, 1993). Outra proposta consisteem estruturas híbridas
com os materiais misturados em uma mesma camada única (Cao, 1999). Recente-
mente, uma nova e aprimorada proposta foi idealizada e pode ser considerada como
a combinação das duas técnicas anteriores. Nesse caso, um dispositivo multicamada
foi desenvolvido com uma concentração graduada na camada deemissão, apresen-
tando uma melhora na eficiência da eletroluminescência (Ma,2002).
Com base na última metodologia citada e em um trabalho prévio para mo-
Capítulo 5. Projeto Automático de Nanodispositivos 78
delar dispositivos monocamadas (Scott, 1997), os autores em (Gusso, 2004) apre-
sentaram um modelo analítico para otimizar o comportamentoelétrico na região
emissiva dos dispositivos OLED de multicamadas graduadas.O grande número de
possíveis configurações sugere que a busca empregando um algoritmo poderia ser
mais apropriada neste caso. O propósito desse trabalho é a utilização de algoritmos
evolucionários para encontrar as concentrações otimizadas para ETM e HTM em
cada camada graduada do dispositivo.
5.1.1O Modelo de OLED Multicamada
O modelo usado nesse trabalho foi apresentado em (Gusso, 2004) e é, de fato,
uma extensão do modelo proposto em (Scott, 1997). O modelo original foi desen-
volvido para descrever correntes bipolares em diodos orgânicos monocamadas. O
modelo estendido pretende descrever os dispositivos com multicamadas graduadas
através da aplicação do modelo original para cada monocamada. O modelo calcula
o valor da relaçãoV/J0,5, ondeV é a voltagem aplicada eJ é a densidade de cor-
rente do dispositivo. O modelo necessita também introduzircondições de contorno
em cada interface. Uma vez que a descrição dos modelos em suasformas analíticas
não fazem parte do objetivo dessa tese, esta não será aqui tratada em detalhe. Essa
seção focará na descrição de algumas considerações físicasfeitas em (Gusso, 2004).
Primeiramente, o modelo considera que a primeira e a última camadas são
compostas de puro ETM e HTM, respectivamente. Entretanto, estas duas cama-
das foram ignoradas nos cálculos e somente a região de camadas com concen-
tração graduadas é considerada, já que todas as recombinações elétron-buraco
vão ocorrer somente nessa área dos dispositivos. Nas regiões graduadas, a con-
centração de HTM, chamada der, aumenta da primeira para a última camada
(r = [HT M]/([ET M] + [HT M])). Com o intuito dos resultados teóricos serem
comparados com resultados experimentais, os seguintes valores para as mobilida-
des são usados (Gusso, 2004) (todos os valores emcm2/V.s) :
µn(Alq3) = 1x10−5; µp(Alq3) = 1x10−7
µn(NPB) = 1x10−7; µp(NPB) = 1x10−4
Neste caso,µn e µp são, respectivamente, a mobilidade de elétrons e buracos
do material puro indicado em parenteses. Entretanto, os valores da mobilidade
nas regiões graduadas (com mistura de materiais) não são facilmente obtidos. Na
literatura, os resultados para alguns materiais e métodos de mistura indicam que
µ ≈ r−n, onden pode assumir os valores: 0,8 ≤ n ≤ 2 (Gusso, 2004, Harima, 2000).
A espessura total da região graduada considerada neste trabalho é sempre
50nm, dividida igualmente por todas as camadas. De modo a comparar com os
resultados experimentais de (Ma, 2002), a espessura das camadas puras de ETM e
Capítulo 5. Projeto Automático de Nanodispositivos 79
HTM são de 20nm e 30nm, respectivamente.
Nesse trabalho, o primeiro passo foi implementar o modelo proposto na
literatura de modo a validá-lo com as configurações calculadas em (Gusso, 2004).
A tabela 7.9 apresenta os valores obtidos em (Gusso, 2004) bem como os obtidos
nesse trabalho. As pequenas diferenças obtidas podem ser atribuídas à erros de
truncamento inerentes ao processo de solução numérica no método adotado.
n n’ Perfil de Concentração V/J0,5 V/J0,5 Diferença[Alq3]:[NPB] (Gusso, 2004) Este Trabalho %
1 1 10:1, 6:1, 1:1, 1:6, 1:10 22,8 23,18 1,672 2 2:1, 2:1, 1:1, 1:2, 1:2 18 17,97 0,17
1,5 1,5 3:1, 2:1, 1:1, 1:2, 1:3 20,3 21,51 5,961,5 2 3:1, 2:1, 1:1, 1:2, 1:3 19,3 20,25 4,921 2 7:2, 5:2, 3:2, 2:3, 1:2 20,9 21,89 4,73
Tabela 5.1: Validação do Modelo de concentração graduada. Os parâmetros n en’ são usadas para calcular a mobilidade na região graduada.O modelo calcula arelaçãoV/J0.5.
5.1.2A Otimização Evolucionária
Todos os dispositivos nesse trabalho foram otimizados por um Algoritmo
Genético (AG).
O objetivo do AG é minimizar o valor da razãoV/J0,5. Todos os dispositivos
otimizados nesse trabalho possuem cinco camadas internas,cada uma com 10nm de
espessura. A representação esquemática do dispositivo multi-camada é mostrado na
figura 5.1(a), com a região graduada representada em escala de cinza. Assim, uma
representação por AG foi desenvolvida para otimizar as concentrações de portadores
de elétrons e buracos em cada camada da região graduada. A figura 5.1(b) mostra a
representação esquemática do cromossomo usado na otimização dos dispositivos. O
primeiro gene, G1, do cromossomo representa a concentraçãode ETM na camada
L1. O segundo gene do cromossomo indica o quanto a concentração de ETM na
camada L2 é diminuída em relação a camada L1 e assim por diante. Cada gene no
cromossomo possui um domínio fixo.
Para evitar uma concentração de ETM perto de 100% na primeiracamada,
o valor máximo do primeiro gene foi fixado em 95. O limite inferior foi ajus-
tado para 50. Tais valores foram escolhidos em razão dos valores assumidos em
(Gusso, 2004). Para os outros genes, o domínio se encontra entre 0 e 40. A figura
5.2 mostra um exemplo de como um cromossomo é usado para criaruma solução
para o problema.
Capítulo 5. Projeto Automático de Nanodispositivos 80
Figura 5.1: a)Representação esquemática de um dispositivo multicamada otimizado.A região graduada é representada em escala de cinza. b) A representação docromossomo.
Figura 5.2: Um exemplo de como criar uma solução para um cromossomo.
Uma vez que o domínio máximo para a primeira camada foi fixado em 95%,
o mesmo procedimento deve ser feito na última camada. Em outras palavras, a
concentração de ETM não pode ser inferior a 5%. De modo a respeitar esta restrição
e evitar soluções inválidas, o método GENOCOP, proposto por Michlewics, foi
aplicado (Michalewicz, 1996). Pode-se facilmente perceber que deseja-se otimizar
um problema com uma restrição linear da forma:
G1−G2−G3−G4−G5 ≥ 5 (5-1)
ondeGi é o valor do genei. O GENOCOP é um método aplicado juntamente com
o AG e fornece uma maneira de manipular restrições lineares.A ideia principal por
Capítulo 5. Projeto Automático de Nanodispositivos 81
trás do método está na criação de operadores genéticos específicos, que garantem
manter todos os cromossomos dentro do espaço de soluções permitido.
Foram feitas otimizações para cinco combinações diferentes den e n′, de
modo a comparar com os resultados apresentados em (Gusso, 2004). Para cada
otimização foram usados os seguintes parâmetros:
– Número de gerações : 400;
– Tamanho da população : 150;
– GAP: 80%
– Taxa de cruzamento : [80% - 60%];
– Taxa de mutação uniforme : [5% - 10%];
– Taxa de mutação não uniforme : [8% - 30%];
O significado de cada parâmetro do AG pode ser facilmente encontrado em
(Michalewicz, 1996).
5.1.3Resultados e Discussões
Os resultados da otimização por AG são mostrados na Tabela 7.11. As concen-
trações otimizadas pelo AG minimizam a relaçãoV/J0,5 para todas as combinações
de n e n′, quando comparadas com os resultados apresentados em (Gusso, 2004).
Para a primeira e segunda configuração a melhora foi pequena,aproximadamente
1,5%. Entretanto, os perfis de concentração encontrados forambastante diferentes
daqueles apresentados em (Gusso, 2004), os quais são todos simétricos. Neste traba-
lho, somente para a primeira configuração otimizada pelo AG as concentrações são
praticamente simétricas. Para a segunda configuração, as duas primeiras camadas,
próxima do catodo, apresentaram concentração majoritáriade ETM, aproximada-
mente 70%, enquanto as outras três camadas apresentaram concentração majoritária
de HTM, aproximadamente 65%. Todas as outras configurações apresentaram com-
portamento similar à esta útima, com pequenas variações. A diferença é maior na
última configuração, onde a concentração de ETM nas duas primeiras camadas au-
menta para aproximadamente 80%. Para os últimos três casos,a melhoria na relação
V/J0,5 ficou em torno de 7%. Os experimentos também foram realizado usando-se
o Algoritmo Evolucionário com inspiração Quântica (AEIQ) eo Algoritmo de En-
xame de Partículas (PSO, do inglês - Particle Swarm Optimization). Em ambos os
casos os resultados foram semelhantes aos encontrados.
Contudo, quando um experimento é realizado, não é possível saber quais são
os valores reais den e n′. Por esse motivo, decidiu-se calcular a relaçãoV/J0,5 para
cada configuração den en′com todos os perfis de concentração, de modo a entender
Capítulo 5. Projeto Automático de Nanodispositivos 82
n n’ Perfil de Concentração V/J0,5 V/J0,5 Melhoria[Alq3]:[NPB] anterior otimizado %
1 1 7,2:1, 7,2:1, 0,9:1, 0,1:1, 0,1:1 23,18 22,82 1,542 2 2,1:1, 2,1:1, 0,6:1, 0,6:1, 0,6:1 17,97 17,72 1,4
1,5 1,5 2,5:1, 2,5:1, 0,5:1, 0,4:1, 0,4:1 21,51 19,98 7,131,5 2 2,7:1, 2,7:1, 0,6:1, 0,6:1, 0,6:1 20,25 18,76 7,371 2 4:1, 4:1, 0,7;1, 0,6:1, 0,6:1 21,89 20,36 6,98
Tabela 5.2: Resultados da otimização por AG. Os valores da coluna “anterior” sereferem a (Gusso, 2004).
o comportamento e comparar qual o melhor modelo para uma combinação den en′
quaisquer.
A tabela 7.12 mostra o melhor perfil de concentração otimizado, juntamente
com os melhores perfis de concentração de (Gusso, 2004) e (Ma,2002). As concen-
trações em (Ma, 2002) foram usadas em um trabalho experimental. Pode ser visto
que a relaçãoV/J0,5 da melhor concentração otimizada nesse trabalho é aproxima-
damente 9,7% menor que a melhor relaçãoV/J0,5 da concentração experimental
obtida em (Ma, 2002).
n n’ Concentração[Alq3]:[NPB]
Otimizado (Gusso, 2004) (Ma, 2002)2,5:1, 2,5:1, 0,5:1, 0,4:1, 0,4:1 2:1, 2:1, 1:1, 1:2, 1:2 9:1, 7:1, 5:2, 1:1, 1:3
V/J0,5
1 1 23,33 23,97 24,862 2 17,91 17,98 20,65
1,5 1,5 19,98 20,36 22,321,5 2 18,91 19,13 21,271 2 20,68 21,13 22,50
Média 20,16 20,52 22,32
Tabela 5.3: Comparação entre melhor configuração otimizada por AG, melhorconfiguração de (Gusso, 2004) e melhor configuração de (Ma, 2002). Em negritoo melhor resultado para cada caso.
De modo a verificar a incerteza nos valores das mobilidades deHTM puro,
uma outra otimização foi realizada, considerandon en′iguais à 1,5 e oµn(NPB) =
5.10−8 cm2/V, tal como em (Gusso, 2004). O valor da relaçãoV/J0,5 calculada em
(Gusso, 2004) é igual à 23,50 com concentração ETM:HTM de [8 :1,4 : 1,2 :
1,1 : 1,1 : 1] . As concentrações otimizadas pelo AG fornecem um valorparaV/J0,5
igual à 22,76 e a concentração obtida é [6,4 : 16,4 : 15,4 : 10,86 : 10,86 : 1].
Capítulo 5. Projeto Automático de Nanodispositivos 83
Nesse caso, a melhora foi de 5,9%.
Os resultados das simulações mostram que os dispositivos otimizados pelo
AG apresentam uma performance≈ 7% melhor que aqueles apresentados em
(Gusso, 2004). Com o objetivo de validar experimentalmente estes resultados, dois
dispositivos foram sintetizados no Laboratório de Dispositivos Orgânicos (LADOR)
do Inmetro. O primeiro dispositivos é aqueles otimizado pelo AG e mostrado na
tabela 7.12 e o segundo dispositivo é aquele da referência (Ma, 2002) e também
mostrado na tabela 7.12. Os resultados preliminares mostram que o dispositivo 1,
fabricado com parametros otimizados obtidos do modelo AG, tem um desempenho
muito melhor que o dispositivo 2, de (Ma, 2002). Os resultados das medidas são
mostrados na figura 7.11 que apresenta a eletroluminescência (EL) características
dos dois dispositivos.
Figura 5.3: Eficiência x Densidade de Corrente dos dispositivos 1 e 2
A eficiência de eletroluminescência máxima do dispositivo 1é em torno de
1.4 cd/A em 500mA/cm2 contra 0.14cd/A em 900mA/cm2 para o dispositivo
2. Embora o valor da eficiência do dispositivo 2 seja diferente daquele reportado
em (Ma, 2002), o ponto aqui não é seu valor absoluto, mas a comparação entre os
valores da configuração dos dois dispositivos graduados obtidos pelo mesmo arranjo
experimental.
Esta tese esta focada no resultados teóricos e os trabalhos experimentais não
serão discutidos a fundo. O apêndice D apresenta um resumo dos experimentos
realizados.
Capítulo 5. Projeto Automático de Nanodispositivos 84
5.2Otimização de Circuitos de QCA Robustos
O grande avanço da indústria de eletrônica e computação nos últimos 60
anos é consequência da criação e miniaturização dos transistores. Porém, os dis-
positivos atuais estão próximos do limite físico de miniaturização devido aos di-
versos efeitos não encontrados em escalas maiores, tal comoa fuga de correntes
(VilelaNeto, 2007).
Uma possível alternativa aos atuais circuitos VLSI/CMOS é o paradigma in-
titulado Autômatos Celulares com Pontos Quânticos ( QCA - do inglês, Quantum-
Dots Cellular Automata) (Lent, 1994). A tecnologia QCA é formada por um con-
junto de células que, juntas e organizadas de uma forma determinada, são capazes
de realizar funções computacionais.
Uma das dificuldades que se encontra na construção de dispositivos basea-
dos em QCA é a ausência de metodologias que permitam um arranjoautomático e
eficiente das células nos circuitos. Tendo em vista a resolução deste problema, o tra-
balho realizado anteriormente, proposto pelo autor desta tese, apresenta um método
de construção de circuitos de QCA por Algoritmos Genéticos (VilelaNeto, 2007).
Porém, o trabalho anterior visou apenas sintetizar circuitos com a lógica
correta, além de conterem um número reduzido de células. Este trabalho visa
sintetizar dispositivos com o objetivo de serem mais resistentes às influências
externas e com isso menos suscetíveis às falhas. Levando isto em consideração,
utilizam-se Algoritmos Genéticos para descobrir a posiçãodas células que, além
de encontrar circuitos com a lógica correta e com poucas células, possam tornar os
sinais de saída o mais forte possível.
5.2.1Autômatos Celulares com Pontos Quânticos
A célula de um Autômato Celular com Pontos Quânticos é formadapor quatro
pontos, sendo que cada um destes representa um local onde a carga pode ou não
estar posicionada. Cada célula possui duas cargas livres quepodem tunelar para
quaisquer uns dos quatro pontos quânticos. As células são construídas de modo
que as cargas sejam proibidas de tunelar para o seu exterior,devido a uma grande
barreira de potencial. A figura 5.4 ilustra uma célula de QCA.
Figura 5.4: Uma célula de QCA. As cargas estão localizadas nospontos pretos.
Capítulo 5. Projeto Automático de Nanodispositivos 85
Devido à interação Coulombiana, as cargas presentes em uma célula tendem
a se posicionar o mais distante possível umas das outras. Baseado nisto, percebe-se
que as cargas ocuparão pontos que se localizam em diagonais opostas, só sendo
possível obter dois estados estáveis na célula, conforme ilustrado na figura 5.5. Por
convenção, um deles representará o binário “0” e o outro o binário “1”.
Figura 5.5: Estados de polarização de uma célula de QCA.
A letra P na figura 5.5 indica a polarização da célula e corresponde à distri-
buição de probabilidade da localização das cargas em seu interior. Seu valor pode
variar no intervalo [-1,1]. Quanto mais próximo de um extremo este valor estiver,
mais sua configuração de carga se assemelha com a polarizaçãoilustrada na figura
5.5.
Quando duas células são posicionadas próximas uma da outra,a polariza-
ção de uma interfere na polarização da outra. As células dispostas lado a lado
tendem a assumir polarizações semelhantes. Este comportamento pode ser visu-
alizado no gráfico da figura 5.6. A curva relaciona a polarização da célula 2, no
eixo horizontal, com a polarização da célula 1, no eixo vertical. Portanto, o po-
sicionamento das células em locais corretos leva à criação de circuitos lógicos
(Lent, 1994, VilelaNeto, 2006).
Figura 5.6: Interferência entre duas células de QCA lado a lado.
Circuitos de QCA possuem zonas declock, que tem por objetivo controlar
o fluxo de informação dentro do circuito. Este controle é realizado pela elevação
ou diminuição da barreira de potencial entre os pontos quânticos no interior das
células, de forma a permitir que as cargas tunelem ou não entre estes pontos.
Capítulo 5. Projeto Automático de Nanodispositivos 86
O clock é dividido em quatro fases, a primeira delas é chamada deswitch.
Nesta fase a célula inicia despolarizada e a barreira de potencial no seu interior em
um nível baixo, sendo aumentada gradativamente de modo a permitir que as células
se polarizem de acordo com as polarizações de suas vizinhas.Quando a barreira
alcança o seu máximo passa-se para uma nova fase chamada dehold. Durante esta
fase, as cargas estão impossibilitadas de trocar suas posições dentro da célula, que
pode assim influenciar outras células sem ser modificada. Ao final desta fase, as
barreiras de potencial começam a diminuir gradativamente eas células começam a
se despolarizar, esta etapa é chamada derelease. Quando a barreira atinge seu menor
nível começa a fase chamadarelax, onde as células se mantêm despolarizadas e a
barreira no seu menor nível. O ciclo, então, recomeçará pelaetapa deswitch.
As células de um circuito de QCA podem ser divididas em zonasclock,
permitindo que um grupo de células possa realizar alguma operação que será então
usada como entrada por um outro grupo em uma zona declockdiferente.
Em circuitos eletrônicos não é incomum o cruzamento de sinais. Informações
processadas em determinados blocos podem servir para outros localizados fisica-
mente distantes. O transporte de informações não pode interferir no funcionamento
lógico do circuito. Na tecnologia QCA o transporte se torna muito crítico, devido
ao fato das células poderem interagir com toda sua vizinhança. Há atualmente duas
alternativas presentes na literatura para a implantação desta funcionalidade em cir-
cuitos QCA: célula rotacionadas e multicamadas. A primeira alternativa possibilita
a criação de circuitos em um plano, porém gera problemas de robustez ao circuito,
sendo mais suscetíveis a influências externas.
De forma a contornar este problema foi proposto a construçãode circuitos
com camadas de células sobrepostas, ou seja, multicamadas.Nesta técnica a infor-
mação é transportada por camadas superiores de forma que nãohá interferência
entre as camadas. Na figura 5.7 há um exemplo da utilização de multicamadas.
Figura 5.7: Circuito com multicamadas.
Há três camadas no circuito da figura 5.7 e deseja-se transportar a informação
da célula L1 até a célula L2. As duas células estão na camada mais inferior, chamada
de camada lógica, onde é realizada o processamento da informação. As demais
camadas no circuito servem unicamente para auxiliar no transporte da informação
Capítulo 5. Projeto Automático de Nanodispositivos 87
de L1 até L2, sem que haja influência em outras células da camada lógica. Desta
forma é possível levar a informação de qualquer parte do circuito a outro local de
interesse sem prejudicar a funcionalidade do circuito ou diminuir a robustez. A
desvantagem que surge nesta técnica é o aumento da quantidade de células.
5.2.2Descrição do Problema
Conforme descrito na seção anterior, a representação dos bits “0” e “1” é feita
pelas polarizações das células em -1 e 1, respectivamente. Porém estes valores são
ideais, não sendo alcançados na realidade. Entretanto é importante que as células
de saída dos circuitos tenham as suas polarizações, quando atingirem um estado
estável, muito próximas dos valores absolutos -1 e 1. Quantomaior o módulo da
polarização da célula de saída maior a robustez do circuito,ou seja, menor será a
influência de fatores externos, tal como a temperatura.
O trabalho anterior desenvolveu uma metodologia para a síntese automática
de circuitos de QCA através de Algoritmos Genéticos. Além de encontrar circuitos
com a lógica desejada, a metodologia também minimiza a quantidade de células
nos circuitos. Porém, o trabalho não considerou a maximização da polarização da
célula de saída (VilelaNeto, 2007).
Neste trabalho é utilizada a metodologia de síntese automática de circuitos
de QCA proposta anteriormente, acrescida do objetivo de maximizar a polarização
da célula de saída. A figura 5.8 apresenta o diagrama do sistema de evolução de
circuitos de QCA. O módulo AG representa o Algoritmo Genético. Nele serão
realizadas as operações inerentes à evolução dos circuitos, conforme descrito em
(VilelaNeto, 2007).
Figura 5.8: A arquitetura do modelo de síntese automática.
Cada cromossomo, durante sua fase de avaliação, gerará um novo circuito
e, consequentemente, será simulado para que a partir dos resultados possa ser
feito o cálculo de sua aptidão. Os circuitos são simulados pelo QCADesigner
(Walus, 2004). De forma a permitir a comunicação entre o módulo AG e o simula-
dor, houve a necessidade da criação de um módulo, chamado de QCAInterface.
O QCAInterface é capaz de decodificar um cromossomo gerado pelo AG e
criar um arquivo de entrada para o simulador com a descrição do circuito. Este
Capítulo 5. Projeto Automático de Nanodispositivos 88
módulo também é capaz de retirar amostras dos sinais geradospelo simulador e
organizá-las de forma que o AG possa calcular a aptidão. O módulo Simulador é
composto pela interfacebatchmodificada do QCADesigner, um simulador código-
aberto que permitiu adaptações segundo as necessidades do problema. Porém, o
núcleo responsável por toda a simulação permaneceu inalterado.
O simulador QCADesigner possui dois tipos de simulação,bistablee cohe-
rence vector. O primeiro é mais simples, porém tem menor custo computacional. O
segundo é mais preciso, mas com um grande custo computacional. Neste trabalho
utilizamos o métodobistable, devido ao grande número de simulações realizadas
pelo método de síntese evolucionária, sendo que após a evolução todos os circuitos
obtidos foram validados com o método de simulaçãocoherence vector.
Para que um circuito de QCA funcione com a lógica desejada é necessário
que todas as células sejam colocadas nas posições certas e alocadas às zonas de
clockscorretas. Tomando-se o cuidado de garantir as duas características citadas, a
interação coulombiana entre as células tratará as informações de entrada de forma
correta, gerando a saída desejada. Entretanto, o desenvolvimento de circuitos inova-
dores não é uma tarefa trivial, sendo necessário uma grande intuição e experiência
para criar circuitos corretos. Porém, mesmo que os circuitos tenham a lógica dese-
jada, o mesmo pode não ser o ideal, contendo muitas células e com uma robustez
pequena.
Neste trabalho os circuitos são evoluídos por meio de uma heurística coevo-
lutiva, com duas espécies distintas. Uma representa o posicionamento das células
dentro do circuito através de um cromossomo baseado em ordemcom restrição de
precedência e outra representa oclockde cada célula por um cromossomo binário.
Mais detalhes podem ser obtidos em (VilelaNeto, 2007).
A função de avaliação dos indivíduos é responsável por quantificar o quão
bom é o circuito representado por um determinado par de cromossomos. Esta, ao
contrário do trabalho anterior que só se preocupava com os níveis lógicos das células
de saída, levará em consideração o valor da polarização da célula de saída, de forma
a solucionar o problema de robustez. Para tal, em cada amostra do sinal de saída
aplica-se a equação 5-2, onde os parâmetros a e b são determinados de acordo com
o grau de polarização que se deseja obter. É através destes parâmetros que aumenta
ou diminuí-se a importância de um resultado estar mais pertoou longe do esperado.
Pn = a ∗ |On − Dn| + b (5-2)
ondePn representa o valor de aptidão da enésima amostra,On é a polarização obtida
da enésima amostra,Dn é a polarização desejada da enésima amostra ea e b são
constantes. Nota-se que o valor da constantea deve ser menor que zero para que os
resultados muito próximos do desejado obtenham altos valores de aptidão.
Capítulo 5. Projeto Automático de Nanodispositivos 89
A aptidão de cada indivíduo é dada pela soma dos valores obtidos em cada
amostra, conforme a equação 5-3, sendo que para cada amostratodos os possíveis
valores lógicos são avaliados.
A =
N∑
i=0
Pn
N(5-3)
ondeA é a aptidão do circuito,Pn é a aptidão obtida pela n-ésima amostra eN é o
número de amostras retiradas do sinal de saída.
Os parâmetros adotados em todos os experimentos deste trabalho foram a=
-0.5 e b= 1, escolhidos após alguns experimentos preliminares.
Um outro objetivo deste trabalho é sintetizar circuitos como menor número
de células possíveis, para isso é dado um bônus na avaliação dos circuitos que
apresentam todas suas saídas corretas, ou seja, possuem a lógica desejada. Este
bônus é dado pela equação 5-4 e varia com relação ao número de células no circuito.
Os parâmetros presentes nesta equação são determinados de forma empírica e são
dependentes de cada experimento.
B =cQ+ d (5-4)
ondeB é o valor do bônus,Q o número de células presente no circuito,c e d são
constantes determinadas empiricamente.
As células de entrada e saída de todos os circuitos evoluídossão determinadas
apriori com base em circuitos presentes na literatura.
5.2.3Resultados e Discussões
Experimento 1 - Multiplexador
Os parâmetros do AG deste experimento estão listados a seguir:
– Gerações= 300;
– Tamanho da população= 100;
– Taxa de crossover= [80%, 60%];
– Taxa de mutação= [10%, 30%];
– GAP= [60%, 20%];
– Experimentos= 8;
Os parâmetrosc e d da equação 5-4 foram definidos como 8,94 e -0,297,
respectivamente. A escolha desses valores foi determinadade forma que os circuitos
que possuíssem 15 células recebessem um bônus de 20% do valormáximo de
Capítulo 5. Projeto Automático de Nanodispositivos 90
aptidão da equação 5-3. A escolha desses valores foi realizada de forma empírica,
determinando a pressão do bônus sobre os indivíduos.
A figura 5.9 exibe o circuito obtido neste trabalho e os circuitos propostos nos
demais trabalhos.
Figura 5.9: (A) Circuito sintetizado por especialista; (B) Circuito sintetizado em(VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho.
O dispositivo resultante contém 17 células enquanto um circuito sintetizado
por especialistas tem 21 células, sendo 20% ou quatro células menor. Esta é uma
redução significativa, supondo que o custo do circuito é diretamente proporcional a
quantidade de células. Em termos de polarização, o circuitoobtido pelo AG conse-
guiu superar ao presente na literatura por cerca de 1,47%. A diferença percentual
neste caso é baixa, mas deve-se ressaltar que ambos já estão com níveis muito altos
de polarização.
Em (VilelaNeto, 2007) conseguiu-se obter um circuito com três unidades de
células a menos que o circuito deste trabalho, mas a grande diferença está nos níveis
de polarização de saída. A do trabalho anterior é cerca de 28%inferior.
Experimento 2 - Porta OU de quatro entradas
O segundo circuito sintetizado foi uma porta OU de quatro entradas. Há
uma particularidade na lógica deste circuito, só existe umasaída com valor lógico
“0”, que ocorre justamente quando todas suas entradas também são “0”. Esta
peculiaridade dificulta a convergência do Algoritmo Genético, já que indivíduos
cujas saídas sejam o nível o lógico “1” para todas as possíveis combinações das
entradas terão o valor de aptidão muito próximo de um circuito que implemente a
lógica correta.
Capítulo 5. Projeto Automático de Nanodispositivos 91
De forma a acelerar a convergência da técnica, é dado um peso maior ao acerto
da saída “0”, empiricamente foi escolhido um fator de 5.
– Gerações= 50;
– Tamanho da população= 100;
– Taxa de crossover= [90%, 80%];
– Taxa de mutação= [8%, 20%];
– GAP= [40%, 90%];
– Experimentos= 10;
Os demais parâmetros são os mesmo utilizados no experimento1.
A figura 5.10 apresenta o melhor circuito obtido, além dos outros circuitos
propostos na literatura.
Figura 5.10: (A) Circuito sintetizado por especialista; (B) Circuito sintetizado em(VilelaNeto, 2007); (C) Circuito sintetizado neste trabalho.
Novamente o circuito evoluído teve uma quantidade de células inferior ao
de especialistas, dessa vez cerca de 17% ou três células e ambos com níveis de
polarização na saída praticamente idênticos, próximo de 100%. Com relação ao
trabalho anterior, o circuito obtido no presente trabalho émuito superior em termos
de robustez. O nível de polarização de saída é 31% superior, com um aumento
de apenas três unidades de células. Este aumento na confiabilidade talvez seja
determinante na viabilidade técnica do dispositivo, já quea polarização de 68,4%
do ideal obtida anteriormente pode ser muito baixa para que ocircuito tenha uma
boa imunidade a influências externas.
Capítulo 5. Projeto Automático de Nanodispositivos 92
Neste trabalho procurou-se aprimorar a síntese automáticade circuitos basea-
dos em QCA desenvolvida anteriormente. A obtenção de dispositivos robustos é fa-
tor primordial no avanço da tecnologia QCA. Neste trabalho propôs-se uma técnica
que apresentou resultados superiores aos circuitos desenvolvidos por especialistas,
obtendo circuitos com menos células e nível de polarização de saída elevado.
A síntese evolucionária permite a exploração de diferentestipos de arranjos,
na maioria das vezes não convencionais ou intuitivos, permitindo que circuitos
alternativos sejam obtidos a partir de poucas informações fornecidas. Tal como
apresentado no trabalho anterior (VilelaNeto, 2007), os algoritmos evolucionários
são ferramentas poderosas para a síntese automática de circuitos de QCA. Este
trabalho demonstrou que estas ferramentas são eficientes nabusca por soluções
otimizadas, mesmo quando outros objetivos são levados em consideração. Neste
caso, a otimização da polarização da célula de saída.
6Otimização de Funções de Base
6.1Introdução
Historicamente, os cálculos quânticos para moléculas são realizados como
uma combinação linear de orbitais atômicos (LCAO - do inglês “Linear Combina-
tion of Atomic Orbitals”). Isto significa que os orbitais moleculares são formados
como uma combinação linear de orbitais atômicos:
ψi =
n∑
µ=1
cµiφµ (6-1)
ondeψi é o i-ésimo orbital molecular,cµi são os coeficientes da combinação linear,
φµ é oµ-ésimo orbital atômico en é o número de orbitais atômicos.
Resumidamente, orbitais atômicos são soluções da equação Hartree-Fock
para o átomo, ou seja, uma função de onda para um elétron no átomo. Posterior-
mente, o termo orbital atômico foi substituído por “funçõesde base” ou “contra-
ções”, quando apropriado. Os primeiros tipos de funções de base utilizados foram
os orbitais do tipo Slater (STO - do inglês, “Slater Type Orbital”) devido à suas
similaridades com os orbitais atômicos do átomo de hidrogênio. Os orbitais STO
são descritos pela equação 6-2 em razão das coordenadas esféricas:
φi (ζ,n, l,m, r, θ, φ) = Nrn−1e−ζrYlm (θ, φ) (6-2)
ondeN é uma constante de normalização,ζ é o expoente,r, θ eφ são as coordenadas
esféricas eYlm é a parte do momento angular. On, l e m são os números quânticos:
principal, momento angular e magnético, respectivamente.
Porém, funções deste tipo são computacionalmente muito caras para o cálculo
de integrais de dois elétrons. Por esta razão, os orbitais dotipo Gaussiana (GTO - do
inglês, “Gaussian Type Orbitals”) foram introduzidos. A forma das funções STO
pode ser aproximada por uma soma de funções GTO com diferentes expoentes
e coeficientes. Mesmo que se utilize 4 ou 5 funções GTO para representar uma
função STO, o cálculo das integrais de dois elétrons será muito mais rápido com
esta configuração do que usando a STO original. A GTO é expressa da seguinte
forma:
Capítulo 6. Otimização de Funções de Base 94
g (α, l,m,n, x, y, z) = Ne−αr2xlymzn (6-3)
ondeN é uma constante de normalização,α é o expoente,x, y e z são coordenadas
cartesianas.l, m e n não são números quânticos, mas sim expoentes integrais nas
coordenadas cartesianas.r2 = x2 + y2 + z2.
Alguns autores consideram impróprio chamar as funções gaussianas de orbi-
tais atômicos do tipo Gaussiana (GTO), já que elas não são realmente orbitais. Na
literatura recente, elas são frequentemente chamadas de primitivas gaussianas.
As primitivas gaussianas são normalmente obtidas a partir de cálculos quân-
ticos em átomos (ex.: “Hartree-Fock”). Frequentemente, os expoentes são variados
até a energia mínima do átomo ser obtida (Clementi, 1990). Em alguns casos, os
expoentes são otimizados individualmente. Em outros, os expoentes são relacio-
nados uns com os outros por alguma equação e os parâmetros desta equação são
otimizados (ex.: funções de base “even tempered” e “well-tempered”). As primi-
tivas derivadas destes cálculos descrevem átomos isoladose não podem descrever
com precisão as deformações dos orbitais atômicos devido à presença de outros
átomos na molécula. Funções de base para cálculos moleculares são normalmente
aumentadas com outras funções específicas.
Para cálculos moleculares, as primitivas gaussianas devemser contraídas, ou
seja, certa combinação linear destas funções vai ser usada com uma função de
base. O termo contração, neste caso, significa: uma combinação linear de primitivas
gaussianas para ser usada como função de base. Tal função de base terá seus
expoentes e coeficientes fixos e estas contrações são também chamadas de CGTO.
Para ilustrar esta situação, um exemplo da literatura será apresentado (Szabo, 1989).
Os expoentes e coeficientes da expansão gaussiana que minimizam a energia do
átomo de hidrogênio foram derivados por Huzinaga em 1965. Quatro gaussianas do
tipo s são usadas para representar o orbital 1s do hidrogênio da seguinte forma:
ψ1s = 0,50907N1e−0,123317r2
+ 0,47449N2e−0,453757r2
+ (6-4)
0,13424N3e−2,0130r2
+ 0,01906N4e−13,3615r2
ondeNi é uma constante de normalização para uma dada primitiva. No caso de
gaussianas do tipo s é igual(2α/π)3/4.
Estas primitivas são agrupadas em duas contrações. A primeira contração
contém apenas uma primitiva:
φ1 = N1e−0,123317r2
(6-5)
Já as outras três primitivas estão presentes na segunda contração:
Capítulo 6. Otimização de Funções de Base 95
φ2 = N[0,47449N2e−0,453757r2
+ 0,13424N3e−2,0130r2
+ 0,01906N4e−13,3615r2
] (6-6)
ondeN é uma constante de normalização para toda a contração.
Neste caso, 4 primitivas foram contraídas para 2 funções de base. Isto é
frequentemente denotado como uma contração (4s) → [2s]. Os coeficientes da
funçãoφ2 são então fixados em cálculos moleculares subsequentes.
Obviamente, os melhores resultados seriam obtidos se fossepermitido va-
riar todos os coeficientes da expansão gaussiana durante o cálculo molecular. Além
disso, o custo computacional para o cálculo de integrais em Hartree-Fock depende
da quarta potência do número de primitivas gaussianas. Porém, todos os passos
subsequentes dependem do número de funções de base, ou seja,o número de con-
trações. O espaço em disco necessário para armazenar os cálculos das integrais
também é proporcional ao número de funções de base. Portanto, se cada primitiva
corresponder a uma função de base o custo computacional aumenta consideravel-
mente.
Este trabalho visa à otimização dos expoentes das primitivas gaussianas,
logo os métodos de contração de funções de base não serão discutidos de maneira
aprofundada.
6.2Criando uma Função de Base
Não existe um método definitivo para gerar funções de base. Segundo Leach,
a construção de uma nova função de base é uma arte (Leach, 2001). Na verdade,
existem diversos métodos bem estabelecidos que resultaramem um grande número
de funções de base diferentes. Até porque, uma função de basepode ser muito boa
para determinadas propriedades e átomos, mas pode ser muitoruim para outros.
O desenvolvimento de uma função de base para cálculos moleculares é uma
tarefa que demanda muito tempo de processamento. O grande número de parâme-
tros (expoentes) a ser otimizado e a natureza não linear deste problema de otimi-
zação induz os pesquisadores a usarem as funções de base otimizadas para áto-
mos em moléculas e grandes sistemas (Gomes, 2006). Com o objetivo de resolver
o problema computacional, métodos alternativos foram desenvolvidos, eliminando
a necessidade de determinar todos os expoentes (Gomes, 2006) (Somorjai, 1968)
(Somorjai, 1969) (Bishop, 1970) (Mohallem, 1986).
A seguir algumas possibilidades de se criar funções de base serão mostradas
e os resultados obtidos neste trabalho serão discutidos.
6.3
Capítulo 6. Otimização de Funções de Base 96
Método da Coordenada Geradora Hartree-Fock - GCHF
O Método da Coordenada Geradora (MCG) foi introduzido por Griffin, Hill e
Wheeler nos anos 50 (Hill, 1953) (Griffin, 1957). Mohallem mostrou que a ver-
dadeira capacidade do método MCG é alcançada quando uma discretização é
aplicada com o propósito de se obter uma melhor integração numérica da equa-
ção GHW (Mohallem, 1986). O método MCG foi amplamente aplicado em fí-
sica nuclear (Wong, 1975) e posteriormente em sistemas atômicos e moleculares
(Lathouwers, 1978) (Chattopadhyayfs, 1981).
Em 1986, o método da coordenada geradora Hartree-Fock (GCHF)foi intro-
duzido como uma nova técnica para gerar funções de base do tipo gaussiana (GTF)
e do tipo Slater (STF). Este método tem se mostrado bastante eficiente na constru-
ção e adaptação de conjuntos de funções de base atômicas. O método GCHF já foi
usado com sucesso na geração de funções de bases gaussianas universais (UGBSs)
(Jorge, 1997) e funções de bases gaussianas adaptadas (AGBSs) (Jorge, 1999b) para
átomos leves e pesados.
No método GCHF, as funções de um elétron são escolhidas como uma
transformada integral (Mohallem, 1986), isto é:
ψi(1) =∫
φi(1,α) fi(α), i = 1, ...,n (6-7)
ondeφi são as funções geradoras (devem ser STF, GTF ou outro tipo de função),
fi são as funções de peso eα é a coordenada geradora. A existência das funções
peso é condição fundamental para o uso do MCG. A análise do comportamento das
funções peso pelo MCG permite ajustar os conjuntos de bases atômicas, de modo
a obter a melhor descrição dos elétrons. À exceção de alguns sistemas simples,
a expressão da função peso é desconhecida, o que inviabilizaa solução analítica
da transformada integral dada pela equação acima. O recurso, neste caso, é fazer
uma discretização numérica desta integral. A solução é realizada através da escolha
apropriada de um conjunto discreto de pontos no espaço da coordenada geradora,
representada por:
Ωk = Ωmin+ (k− 1)∆Ω, k = 1, ...,N (6-8)
onde o conjunto de discretização é definido pelos seguintes parâmetros: um valor
inicial (Ωmin), um incremento (∆Ω) e o número de primitivas usadas (N), para uma
dada simetria (s, p, d, ...). A busca da melhor representaçãoé obtida utilizando-se
a energia total do estado eletrônico fundamental como critério de minimização. As
coordenadas geradoras são obtidas pela seguinte função:
Ωk = lnαk/A, A > 1. (6-9)
Portanto, o método GCHF original usa apenas uma sequência aritmética de
Capítulo 6. Otimização de Funções de Base 97
pontos igualmente espaçados, como mostra a equação 6-8, para gerar as funções de
base (Mohallem, 1986). O conjunto de base gerado por este método é conhecido
como SOGBSs (do inglês,Single Optimized Gaussian Basis Set) (Jorge, 1999).
Com o intuito de aprimorar o método descrito anteriormente, foi proposto o
uso de duas ou três sequências aritméticas, gerando as funções de base DOGBSs
(double) e TOGBSs (triple), respectivamente (Jorge, 1999).
Nesta nova alternativa, as coordenadas geradoras são discretizadas, para cada
simetria s, p, d e f, em duas
Ωk =
Ωmin+ (k− 1)∆Ω, k = 1, ...,M
Ω1min+ (k− 1)∆Ω1, k = M + 1, ...,N
(6-10)
e três
Ωk =
Ωmin+ (k− 1)∆Ω, k = 1, ..., j
Ω1min+ (k− 1)∆Ω1, k = j + 1, ...,M
Ω2min+ (k− 1)∆Ω2, k = M + 1, ...,N
(6-11)
seqüências aritméticas independentes, respectivamente.
Observe que o número de parâmetros a ser otimizado para as equações 6-10 e
6-11 é, respectivamente, duas e três vezes maior do que o GCHF original. Também
é importante perceber que quando se utiliza estas duas últimas equações, os valores
deΩi não são mais igualmente espaçados.
6.4Expansão Polinomial
Uma alternativa para o procedimento de discretização apresentado an-
teriormente é o uso de expressões polinomiais para oΩk, proposto em
(Klobukowski, 1993) e (Klobukowski, 1994). A equação tem a seguinte forma:
Ωk =
N∑
i=0
pi,l(k− 1)i , j = 1, ....,Ml (6-12)
ondeN é igual a 4 eMl é o número de primitivas para a simetrial.
Se a equação 6-12 for truncada no segundo termo, ela se torna equivalente
à equação 6-8. Porém, um ponto negativo desta nova alternativa é o aumento do
número de parâmetros otimizados (cinco por simetria). Em (Gomes, 2006), tal
desvantagem é destacada por causar um impacto negativo na otimização de funções
de base de elementos pesados.
No trabalho??, alternativas aos esquemas de discretização propostos são
investigados, com o objetivo de melhorar a acurácia das funções de base, mantendo
o procedimento de otimização o mais simples possível. Para isto, foram sugeridas
diferentes expressões para a expansão polinomial deΩk, permitindo aumentar a
Capítulo 6. Otimização de Funções de Base 98
flexibilidade na descrição da distribuição dos expoentes. As expressões sugeridas
são mostradas abaixo:
Ωk = p0,l + p1,l( j − 1)+ p2,l( j − 1)3 + p3,l( j − 1)5 (6-13)
Ωk = p0,l + p1,l( j − 1)+ p2,l( j − 1)2 + p3,l( j − 1)4 (6-14)
Ωk = p0,l + p1,l( j − 1)+ p2,l( j − 1)2 + p3,l( j − 1)3 + p4,l( j − 1)5 (6-15)
onde j = 1, ...,Ml, Ml é o número de primitivas epk,l são os parâmetros a
serem otimizados para cada simetrial. Estas equações foram sugeridas com o
objetivo de aproximar ou melhorar os resultados obtidos em (Klobukowski, 1993)
e (Klobukowski, 1994).
Para estes casos, foram realizados cálculos para funções debase com um
número de primitivas gaussianas para a simetria p,Mp, igual o número de primitivas
para a simetria s menos 6, ou seja,Mp = Ms − 6. Estes valores foram escolhidos
baseados nos resultados obtidos em (Klobukowski, 1994).
6.5Detalhes Computacionais
Todos os parâmetros deste estudo foram otimizados utilizando a biblioteca
de algoritmos genéticos GACOM, do laboratório ICA da PUC-Rio. Para se obter
o valor da energia dos átomos durante a otimização, foi utilizado o programa
GAUSSIAN (G03). Para os átomos de camada fechada, a energia foi obtida através
de cálculos de Hartree-Fock restrito (RHF), já para átomos decamada aberta
foi usado o Hartree-Fock aberto restrito (ROHF), conforme usado na literatura
(Gomes, 2006) (Jorge, 1999).
6.6Resultados e Discussões
A primeira abordagem utilizada visa à otimização dos parâmetros do método
GCHF descrito anteriormente. Foram calculadas as energias HF dos átomos da
primeira linha da tabela periódica (Li - Ne) no estado fundamental. Para garantir
uma comparação justa, foram escolhidas funções de base do tipo gaussianas (GTF)
do mesmo tamanho daquelas apresentadas em (Jorge, 1999). Foram otimizados
os parâmetros das heurísticas SOGBSs, DOGBSs e TOGBSs, conforme descritas
anteriormente. Em todos os experimentos o valor da constante A foi considerado
igual a 6.
Foram otimizados os parâmetros apresentados em (Jorge, 1999), conside-
rando uma variação máxima de 100%. Portanto, os genes do cromossomo assumem
Capítulo 6. Otimização de Funções de Base 99
valores reais entre 0 e 2. Logo, os novos parâmetros do métodoGCHF são dados
por Pnovo = ∆g ∗ Pvelho, onde∆g é o valor do gene ePvelho é o valor original do
parâmetro.
A tabela 7.9 mostra o tamanho das funções otimizadas para cada átomo
da primeira linha da tabela periódica, além do tamanho do cromossomo de cada
experimento.
Átomo Tamanho da FunçãoSOGBSs DOGBSs TOGBSsLi(2S) 18s 2 4 6Be(1S) 18s 2 4 6B(2P) 20s11p 4 8 12C(3P) 20s11p 4 8 12N(4S) 20s11p 4 8 12O(3P) 20s11p 4 8 12F(2P) 20s11p 4 8 12Ne(1S) 20s11p 4 8 12
Tabela 6.1: A primeira coluna apresenta o átomo, juntamentecom a multiplicidadee termo de simetria. A segunda coluna apresenta o tamanho dasfunções de base. Asúltimas três colunas mostram o tamanho do cromossomo para cada experimento.
Conforme descrito anteriormente, nas heurísticas DOGBSs e TOGBSs duas
e três sequências aritméticas, respectivamente, são usadas para gerar os expoentes
das funções gaussianas. Neste trabalho, as sequências aritméticas foram divididas
como mostrado na tabela 6.2, exatamente como realizado em (Jorge, 1999).
Átomos Tamanho da FunçãoDOGBSs TOGBSsLi - Be 18s 13 - 5 13 - 3 - 2
B - Ne 20s11p15 - 5 15 - 3 - 28 - 3 8 - 2 - 1
Tabela 6.2: Tamanho das sequências aritméticas usadas paragerar os expoentes dasfunções gaussianas.
A tabela 7.10 apresenta os resultados obtidos. Para todos osátomos, ex-
ceto oxigênio e flúor, os valores apresentados são as diferenças em micro-hartree
(10−6hartree) para o estado fundamental destes átomos (Bunge,1992). A terceira
coluna apresenta as diferenças de energia obtidas pelo Gaussian (G03) usando os
parâmetros originais de (Jorge, 1999), a quarta coluna apresenta as diferenças de
energias obtidas pela otimização com o Algoritmo Genético e, por fim, a última
coluna apresenta as energias do estado fundamental (Bunge,1992).
Os valores em negrito na tabela 7.10 indicam a menor energia entre o método
com os parâmetros originais de (Jorge, 1999) e o método com osparâmetros
otimizados pelo Algoritmo Genético. O AG apresenta menor energia para todos
os casos, exceto para o átomo de flúor com a heurística SOGBSs. Observe que as
Capítulo 6. Otimização de Funções de Base 100
energias dos métodos usando a heurística SOGBSs são muito próximas, indicando
que os parâmetros originais da referência (Jorge, 1999) sãobem otimizados para
este caso. Já para o caso das heurísticas DOGBSs e TOGBSs, o Algoritmo Genético
obtém energias significativamente mais baixas, principalmente para o átomo de
neônio, o mais pesado de todos os testados.
Para cada um dos 24 experimentos foram executadas 5 rodadas do Algoritmo
Genético. Os valores apresentados na tabela 7.10 são os da melhor rodada de cada
um destes experimentos.
Também é importante observar que diferentemente do método proposto por
(Jorge, 1999), as energias das heurísticas DOGBSs e TOGBSs obtidas pelos parâ-
metros otimizados pelo Algoritmo Genético não apresentam uma diferença muito
grande. Isto ocorre devido à boa otimização dos parâmetros pelo AG para o caso do
DOGBSs, aproximando-se das energias obtidas pelos parâmetros ótimos da heu-
rística TOGBSs. Isto só não ocorre para o átomo de neônio, ondea energia da
heurística TOGBSs é significativamente menor que a energia obtida na heurística
DOGBSs.
A tabela 7.11 apresenta os cromossomos dos melhores indivíduos para cada
otimização do Algoritmo Genético. Para o mesmo experimento, os parâmetros
correspondentes aos orbitais s e p estão em linhas diferentes. Os átomos Li e Be
só possuem o orbital s e, consequentemente, apenas uma linhade cromossomo é
mostrada.
Observe na tabela 7.11 que os genes dos cromossomos referentes à heurística
SOGBSs são todos próximos de 1, confirmando que os parâmetros da referência
(Jorge, 1999) são ótimos. Já os cromossomos referentes à heurística TOGBSs não
apresentam um padrão definido, variando de átomo para átomo esimetria para
simetria.
O comportamento mais interessante ocorre nos cromossomos referentes à
heurística DOGBSs. Observe que os dois primeiros genes de cada orbital possuem
valores próximos de 1. O primeiro sempre um pouco maior e o segundo sempre
um pouco menor. Já os dois genes seguintes possuem valores maiores, sendo que o
terceiro gene sempre se aproxima do limite superior permitido. Este comportamento
sugere que o intervalo de valores escolhido para os genes ([0; 2]) talvez não seja
o mais adequado, já que o terceiro gene de cada orbital poderia assumir valores
maiores.
Para verificar o comportamento da otimização, um novo experimento com o
átomo de Ne (DOGBSs) foi realizado com os valores dos genes variando no inter-
valo [0; 4]. O melhor experimento apresentou um resultado de-128,547074 har-
trees, contra a energia -128,547068 hartrees encontrada anteriormente. O cromos-
somo desta nova solução é apresentado na tabela 7.12. Conforme esperado, observe
Capítulo 6. Otimização de Funções de Base 101
Átomo Heurística Originais Otimizados HF NuméricoLi(2S) SOGBSs 3,2 3,2 -7,432726927Li(2S) DOGBSs 2,8 1,4 -7,432726927Li(2S) TOGBSs 2,2 1,4 -7,432726927Be(1S) SOGBSs 6,4 6,4 -14,57302316Be(1S) DOGBSs 5,6 2,9 -14,57302316Be(1S) TOGBSs 4,3 2,8 -14,57302316B(2P) SOGBSs 4,4 4,4 -24,52906072B(2P) DOGBSs 3,9 2,8 -24,52906072B(2P) TOGBSs 3,2 2,7 -24,52906072C(3P) SOGBSs 6,8 6,8 -37,68861895C(3P) DOGBSs 5,8 4,0 -37,68861895C(3P) TOGBSs 4,2 3,8 -37,68861895N(4S) SOGBSs 11,7 11,7 -54,40093419N(4S) DOGBSs 10,0 7,0 -54,40093419N(4S) TOGBSs 7,2 7,0 -54,40093419O(3P) SOGBSs 20 19 -74,80939815O(3P) DOGBSs 17 12 -74,80939815O(3P) TOGBSs 12 11 -74,80939815F(2P) SOGBSs 31 33 -99,40934933F(2P) DOGBSs 27 19 -99,40934933F(2P) TOGBSs 19 18 -99,40934933Ne(1S) SOGBSs 46,4 46,3 -128,547098Ne(1S) DOGBSs 40,8 29,4 -128,547098Ne(1S) TOGBSs 29,0 22,3 -128,547098
Tabela 6.3: Diferença (micro-hartree) entre as energias obtidas e a energia do estadofundamental dos átomos da primeira linha da tabela periódica. A última colunamostra o estado fundamental de cada átomo.
que o terceiro gene de cada orbital ultrapassou o valor limite anteriormente definido
(2,0). Porém, estes genes não assumiram valores muito altos(próximo de 4,0), o que
poderia prejudicar o desempenho da função de base. Os outrosgenes apresentaram
comportamento semelhante aos experimentos anteriores.
Em todos os experimentos realizados, o Algoritmo Genético foi executado
com os seguintes parâmetros:
– Tamanho da População: 100
– Número de gerações: ver tabela 6.6
– Taxa inicial de crossover: 85%
– Taxa final de crossover: 60%
– Taxa inicial de mutação uniforme: 10%
– Taxa final de mutação uniforme: 40%
– Taxa inicial de mutação não uniforme: 10%
Capítulo 6. Otimização de Funções de Base 102
Átomo Heurística CromossomoLi(2S) SOGBSs 0,9992 1,0036Li(2S) DOGBSs 1,0142 0,9681 1,9964 1,2911Li(2S) TOGBSs 1,0112 0,9760 1,8732 1,2760 1,7070 1,1707Be(1S) SOGBSs 1,0006 1,0030Be(1S) DOGBSs 1,0063 0,9730 1,9921 1,2583Be(1S) TOGBSs 1,0064 0,9764 1,9090 1,2451 1,8410 1,1658
B(2P) SOGBSs1,0011 0,99830,9883 0,9963
B(2P) DOGBSs1.0030 0.9805 1.9949 1.19740.9955 0.9690 1.8859 1.3903
B(2P) TOGBSs1.0096 0.9839 1.7628 1.1563 1.1061 1.00790.9936 0.9706 1.4971 1.2232 0.9834 1.0036
C(3P) SOGBSs1,0022 0,99831,0042 1,0000
C(3P) DOGBSs1,0003 0,9813 1,9543 1,16071,0130 0,9720 1,7057 1,2555
C(3P) TOGBSs1,0051 0,9895 1,6602 1,1178 1,0479 1,00070,1579 1,2316 0,9805 0,9757 1,0028 0,9835
N(4S) SOGBSs0,9998 0,99821,0026 0,9965
N(4S) DOGBSs1,0064 0,9865 1,9206 1,13281,0166 0,9729 1,8286 1,2659
N(4S) TOGBSs1,0053 0,9903 1,6455 1,2515 1,5576 0,82100,6507 0,7172 0,9570 0,9719 0,4040 0,8354
O(3P) SOGBSs1,0033 0,99821,0190 1,0035
O(3P) DOGBSs1,0007 0,9852 1,8856 1,11091,0230 0,9804 1,8047 1,2406
O(4P) TOGBSs1.0158 0.9846 1.9785 1.1325 1.7692 1.06661.5556 1.0729 1.0726 0.9969 1.5160 1.0956
F(2P) SOGBSs1,0014 0,99801,0079 0,9999
F(2P) DOGBSs1,0048 0,9910 1,8218 1,08961,0169 0,9753 1,9035 1,2464
F(2P) TOGBSs1,0161 0,9850 1,9937 1,1184 1,2247 1,01100,5824 0,9766 0,9938 0,9874 1,0198 0,9957
Ne(1S) SOGBSs1,0038 0,99791,0080 1,0021
Ne(1S) DOGBSs0,9962 0,9855 1,9403 1,08451,0051 0,9767 1,8595 1,2129
Ne(1S) TOGBSs1,0118 0,9870 1,5760 1,1988 1,3917 0,79421,0284 0,9719 1,6937 0,1714 0,7286 0,9459
Tabela 6.4: Os cromossomos de todas as otimizações.
Capítulo 6. Otimização de Funções de Base 103
Átomo Heurística Cromossomo
Ne(1S) DOGBSs1.0189 0.96923 3.4360 1.22751.0154 0.9641 2.5523 1.3932
Tabela 6.5: O cromossomo da otimização do Ne. Genes variam de0 a 4.
– Taxa final de mutação não uniforme: 60%
– gap(Porcentagem da população substituída): 85%
Átomos Heurística Número de GeraçõesLi-Be SOGBSs 100Li-Be DOGBSs 300Li-Be TOGBSs 500B-Ne SOGBSs 150B-Ne DOGBSs 700B-Ne TOGBSs 900
Tabela 6.6: Número de Gerações nos experimentos.
Estes parâmetros foram escolhidos após a realização de alguns experimentos
preliminares.
A segunda alternativa realizada neste trabalho visa à otimização dos parâ-
metros da expansão polinomial. Porém, neste caso, os autores em (Gomes, 2006)
e (Klobukowski, 1994) não forneceram os valores dos parâmetros otimizados por
eles. Desta forma, este trabalho realizou a otimização paramétrica sem nenhuma
informação prévia. Além disso, o número de primitivas em cada uma das simetrias
também é otimizado. Por exemplo, uma função de base 12s 4p contém 16 primitivas
gaussianas. Contudo, esta distribuição entre as simetrias se p pode não ser a ótima.
Em (Gomes, 2006), os autores apresentam uma tabela comparativa dos re-
sultados dos modelos propostos com aqueles obtidos em (Klobukowski, 1994). Os
cálculos foram realizados para 12 diferentes tipos de átomos, sendo que para cada
átomo, 9 diferentes combinações de simetria foram testadas. Os resultados obtidos
em (Gomes, 2006) se aproximam daqueles apresentados em (Klobukowski, 1994),
porém são ligeiramente piores. Por esta razão, este trabalho está focado apenas na
otimização da expansão polinomial original proposta em (Klobukowski, 1994) A
tabela 6.7 apresenta as diferenças de energia para o estado fundamental, em micro-
hartree, para os átomos de C e Ne obtidos nos dois trabalhos.
Devido ao grande número de diferentes experimentos e o alto custo compu-
tacional associado, serão apresentados apenas os resultados obtidos para os átomos
de C e Ne. Para cada átomo, 5 diferentes quantidades de primitivas foram testadas.
As tabelas 6.8 e 6.9 apresentam os resultados para os átomos de C e Ne, respectiva-
mente.
Capítulo 6. Otimização de Funções de Base 104
Função de Base C Ne10s4p 5401 5514511s5p 1457 1387112s6p 428 372513s7p 140 107814s8p 52 34115s9p 20 11616s10p 8 4217s11p 4 1618s12p 2 7
Tabela 6.7: Diferenças de energia (micro-hartree) entre osresultados obtidos pelopolinômio sugerido em (Klobukowski, 1994) e o estado fundamental para os átomosde C e Ne.
Número de Primitivas FB ∆E original FB ∆E otimizado14 10s4p 5401 9s5p 364318 12s6p 428 12s6p 44022 14s8p 52 14s8p 5226 16s10p 8 16s10p 830 18s12p 2 19s11p 1
Tabela 6.8: Comparação dos resultados obtidos pelo polinômio sugerido em(Klobukowski, 1994) com aqueles otimizados neste trabalho. Todos para o átomode C.
Número de Primitivas FB ∆E original FB ∆E otimizado14 10s4p 55145 9s5p 2019618 12s6p 3725 11s7p 206522 14s8p 341 13s9p 27726 16s10p 42 16s10p 4230 18s12p 7 18s12p 6
Tabela 6.9: Comparação dos resultados obtidos pelo polinômio sugerido em(Klobukowski, 1994) com aqueles otimizados neste trabalho. Todos para o átomode Ne.
Capítulo 6. Otimização de Funções de Base 105
Nos resultados apresentados nas tabelas 6.8 e 6.9 as melhores funções de base
têm seus resultados destacados em negrito.
Pode-se observar, através dos resultados apresentados na tabela 6.8, que o
método de otimização usado encontrou melhores resultados para duas quantidades
de primitivas diferentes (14 e 30 primitivas). Em ambos os resultados a distribuição
das primitivas é diferente daquela apresentada em (Klobukowski, 1994). Para o
total de 14 primitivas gaussianas, o resultado encontrado diminuiu o número de
primitivas para a simetria s de uma unidade. O resultado paraeste caso teve uma
melhora de 32,52%. Já para o caso com um total de 30 primitivas, a otimização
aumentou o número de primitivas s de uma unidade. Neste caso,o número de
primitivas é muito grande e a energia muito próxima do estadofundamental. Por
outro lado, para as outras três configurações a distribuiçãodas primitivas ficou
exatamente como proposta em (Klobukowski, 1994), sendo quepara duas delas (22
e 26 primitivas) o resultado foi o mesmo. Para o caso de 18 primitivas, o resultado
obtido foi pior do que o proposto pela literatura.
Já para o átomo de Ne, a tabela 6.9 mostra que a distribuição das primitivas
encontradas diminuiu o número de gaussianas para a simetrias de uma unidade
para as três primeiras configurações (14, 18 e 22 primitivas). Para estas três confi-
gurações, a melhora obtida foi de 63,37%, 44,56% e 18,77%, respectivamente. Já
para as outras duas configurações, a distribuição de primitivas se manteve igual. O
resultado para o total de 26 primitivas foi igual ao anterior, enquanto que para 30
primitivas a energia diminuiu de 1 micro-hartree.
Neste caso, utilizou-se uma heurística co-evolucionária com três diferentes
espécies. Duas espécies foram usadas para otimizar os parâmetros das simetrias s
e p e uma espécie otimizou a distribuição das simetrias. Todas as espécies foram
otimizadas por um algoritmo evolucionário com inspiração quântica (AEIQ-R).
Cinco experimentos foram realizados para cada configuração.Apenas os melhores
resultados são apresentados. Os parâmetros utilizados pelo GA estão listados a
seguir:
– Tamanho da População Clássica: 100
– Tamanho da População Quântica: 2
– Número de Observações: 5
– Número de gerações: 600
– Taxa de crossover: 100%
– Taxa de mutação: 5%
Por fim, a última alternativa realizada visa otimizar diretamente cada um dos
expoentes, independente de uma função relacionada. Neste caso a quantidade de
Capítulo 6. Otimização de Funções de Base 106
parâmetros a serem otimizados é bem maior. Para um orbital com N expoentes, a
representação do cromossomo será definida da seguinte forma:
cromossomo= [α1 ∆2 ∆3 ... ∆N] (6-16)
ondeα1 é o expoente inicial, com valor no intervalo de 0 a 1 e∆i o fator de
multiplicação para o novo expoente, no intervalo [1.3 6]. Logo, o valor do i-ésimo
expoente é dado pela equação 6-17.
αi = αi−1 ∗ ∆i (6-17)
O valor de 1,3 é suficiente para evitar a dependência linear entre os expoentes,
enquanto que o valor máximo igual a 6 evita expoentes com valores extremamente
grandes.
Dois experimentos foram realizados para o átomo de neônio. Cinco experi-
mentos foram realizados para funções de base de tamanhos diferentes. Os resultados
são apresentados na tabela 6.10.
Tamanho da Função AG (Partridge, 1989) HF numérico (Bunge,1992)13s 8p -128,546677 -128,546677 -128,54709818s 13p -128,547094 -128,547094 -128,547098
Tabela 6.10: Resultados obtidos para o átomo de neônio.
Observe que os valores obtidos são iguais àqueles apresentados em
(Partridge, 1989). A obtenção de resultados idênticos sugere que os parâmetros
otimizados em (Partridge, 1989) são ótimos. Porém, os resultados obtidos anterior-
mente na literatura necessitam de um bom ponto de partida, obtidos normalmente
a partir de funções de base já otimizadas. Por outro lado, o AGnão necessita
de nenhuma informação preliminar e parte de uma solução totalmente aleató-
ria. Obviamente, a metodologia proposta neste trabalho é muito mais eficiente,
principalmente na otimização de funções de base totalmentenovas.
7Otimização de Agregados Atômicos e Moleculares
7.1Introdução
Agregados podem ser compostos por átomos ou moléculas. Estes agrega-
dos podem possuir entre algumas unidades e milhões de átomose moléculas
(Johnston, 2003). O interesse em agregados cresce, em parte, porque eles consti-
tuem uma nova classe de materiais que possuem propriedades diferentes quando
comparados às moléculas isoladas ou grandes pedaços de matéria. Por exemplo,
alguns metais (ex. paládio) não são magnéticos no estado sólido, mas apresentam
magnetismo quando formam agregados. Outra razão importante para este tipo es-
tudo é o entendimento da evolução das propriedades com o aumento gradual do
tamanho dos agregados (Johnston, 2003).
A teoria tem um papel muito importante no estudo dos agregados, já que
muitas das suas propriedades são difíceis de serem medidas experimentalmente
e dados de espectroscopia são geralmente interpretados em termos de modelos
teóricos.
Quando um cálculo empírico, semi-empírico ouab initio é usado para descre-
ver as ligações de um agregado, um dos primeiros objetivos é encontrar o arranjo
de átomos (ou íons ou moléculas) que corresponde à menor energia, ou seja, o mí-
nimo global (MG) na superfície de energia potencial (Doye, 2004). A importância
de encontrar o agregado que corresponde ao mínimo global se dá por este ser o can-
didato mais provável de ser formado, já que é o mais estável. Porém, dependendo
das condições do meio envolvido, estruturas meta-estáveisde baixa energia podem
ser formadas, sendo importante estudar não somente o agregado de menor energia,
como também aqueles de energia próxima.
Como o número de mínimos aumenta exponencialmente com o aumento do
agregado, encontrar o mínimo global é uma tarefa computacionalmente cara. Já
foi provado que métodos como simulação Monte Carlo (MC), Dinâmica Molecular
(MD) e Simulated Anneling(SA) possuem dificuldades para encontrar o mínimo
global com alguns tipos de interações (Johnston, 2003). Poresta razão, Algoritmos
Genéticos (AG) têm sido muito utilizados na otimização da geometria de agregados
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 108
atômicos e moleculares.
7.2Histórico
A busca pelas geometrias de pequenos agregados depende muito da inicializa-
ção da estrutura. Nos últimos anos, Algoritmos Genéticos têm sido usados para en-
contrar o mínimo global e os mínimos locais de energia mais baixa (Johnston, 2003)
(Doye, 2004) (Alexandrova, 2004) (Alexandrova, 2005) (Bazterra, 2004). O uso de
Algoritmos Genéticos para a otimização da geometria de agregados teve início na
década de 90 por Hartke (Hartke, 1993) e Xiao e Willians (Xiao, 1993) para a otimi-
zação de pequenos agregados de silício e agregados moleculares, respectivamente.
Em ambos os casos, a geometria dos agregados era codificada por bits. Depois de
seu trabalho pioneiro, Hartke publicou o resultado da otimização da geometria por
Algoritmos Genéticos para outros agregados, tais como água(Hartke, 2003) e mer-
cúrio (Hartke, 2001).
Uma evolução importante para a otimização dos agregados porAlgoritmos
Genéticos foi introduzida por Zeiri, que passou a representar a estrutura do agre-
gado por genes reais (Zeiri, 1995). Esta metodologia permitiu representar a posição
dos elementos de forma contínua, removendo a necessidade decodificação e de-
codificação do cromossomo binário. Em seguida, Deaven e Ho desenvolveram um
algoritmo híbrido onde uma minimização local por gradienteé aplicada sempre que
uma nova estrutura é gerada pelo Algoritmo Genético (Deaven, 1995). A introdução
da minimização local transforma a curva do potencial de energia em uma superfície
de degraus, onde cada degrau corresponde a uma base de atração, como mostrado
na figura 7.1. Esta simplificação facilita consideravelmente a busca pelo mínimo
global, reduzindo o espaço de busca do Algoritmo Genético. Neste contexto, a uti-
lização da minimização local corresponde a uma evolução Lamarquiana, ao invés
da Darwiniana, já que os indivíduos agregam aos seus cromossomos características
que adquiriram pela minimização local, alterando parte do que foi herdado.
Outra melhoria introduzida por Deaven e Ho foi a introdução de um novo
operador tri-dimensional, chamado de corte e união (em inglês, "cut and splice")
(Deaven, 1995). Este operador dá um significado físico maiorao processo de cros-
sover. Neste caso, bons esquematas correspondem às regiõesdos agregados pais
que possuem energia local baixa. Deaven e Ho aplicaram este operador na otimi-
zação de agregados de carbono usando potenciais empíricos,permitindo encontrar
muitos mais mínimos de baixa energia que outros operadores (Johnston, 2003). Um
exemplo deste operador é mostrado na figura 7.2.
Geralmente, pelo alto poder computacional necessário, a otimização de
agregados é realizada com o auxílio de métodos empíricos ou semi-empíricos.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 109
Figura 7.1: Simplificação da superfície de energia por degraus.
Figura 7.2: Exemplo do operador de crossover criado por Deaven e Ho.
Mais recentemente, Alexandrova e Boldyrev apresentaram a otimização de di-
versos agregados usando métodos quânticos, tais como DFT (Alexandrova, 2004)
(Alexandrova, 2005).
7.3Descrição do Problema
Neste trabalho, a otimização da geometria dos agregados foirealizada se-
guindo o fluxograma mostrado na figura 7.3.
Em cada ciclo do Algoritmo Genético, um conjunto de novos indivíduos
é criado para substituir os piores indivíduos da população.A porcentagem de
indivíduos substituídos é chamada deGAP. Como proposto por Deaven e Ho
(Deaven, 1995), todos os indivíduos criados são otimizadospara o mínimo local
mais próximo, usando-se um método de gradiente.
As características do Algoritmo Genético são descritas a seguir.
7.3.1Representação dos Indivíduos e Geração da População Inicial
Conforme já foi discutido, este trabalho visa à otimização dageometria de
agregados iônicos e moleculares. A representação do problema pelo cromossomo
deve ser diferente para cada um dos dois casos, conforme mostrado a seguir:
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 110
Figura 7.3: Fluxograma da otimização de agregados atômicose moleculares.
– Agregados Atômicos: três genes reais (x, y e z) representama posição de cada
átomo do agregado. Logo, o tamanho do cromossomo é igual a 3N,onde N é
o número total de átomos. A figura 7.4 mostra um exemplo de cromossomo
para um agregado com 3 átomos.
Figura 7.4: Cromossomo do agregado iônicos.
– Agregados Moleculares: neste caso são usados seis genes reais (x, y, z,
α, β, θ). Os três primeiros genes representam a posição do átomo base da
molécula e os outros três genes a orientação da molécula. Logo, o tamanho
do cromossomo é igual a 6N, onde N é o número total de moléculas. A figura
7.5 mostra um exemplo de cromossomo para um agregado com 3 moléculas.
Figura 7.5: Cromossomo do agregado molecular.
Conforme mostra o fluxograma da figura 7.3, o primeiro passo do Algoritmo
Genético é a geração da população inicial. O tamanho da população do Algoritmo
Genético,Npop, varia de acordo com o número de átomos ou moléculas e é defi-
nido pelo usuário. Para os estudos de casos apresentados neste trabalho, este valor
não ultrapassa 50. Os indivíduos da população inicial são gerados aleatoriamente,
respeitando um limite de máximo espaço, R, definido pelo usuário de acordo com
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 111
as distâncias inter-atômicas nos agregados. Todos os indivíduos gerados aleatori-
amente na primeira geração são, posteriormente, otimizados para o mínimo local
mais próximo.
7.3.2Avaliação e Seleção dos Genitores
A avaliação de cada um dos indivíduos é dada pela energia obtida por algum
cálculo de química computacional.
A seleção dos genitores usada neste trabalho é conhecida como roleta. Neste
caso, os indivíduos mais aptos têm uma probabilidade maior de serem escolhidos
para gerarem os novos indivíduos. Como o objetivo, neste trabalho, é minimizar a
energia, os indivíduos de menor energia devem ter uma probabilidade maior de
serem escolhidos. Portanto, com o intuito de auxiliar a evolução do Algoritmo
Genético, este trabalho usa um método de normalização linear, com os valores
variando entre 1 eNpop. A tabela 7.1 apresenta um exemplo simples de uma
população de 10 indivíduos. A segunda coluna mostra a avaliação original do
indivíduo, ou seja, a energia do agregado correspondente emuma unidade de
medida qualquer. A terceira coluna mostra a aptidão do indivíduo após a aplicação
de uma normalização linear de mínimo 5 e máximo 50. Os valoresdesta última
coluna são usados pela roleta para a seleção dos genitores. Logo, como era desejado,
um indivíduo de menor energia tem mais probabilidade de ser escolhido do que um
indivíduo de maior energia.
Indivíduo Avaliação Original Aptidão Normalizada1 -123,46 502 -123,42 453 -123,40 404 -123,36 355 -123,25 306 -123,18 257 -123,03 208 -122,42 159 -121,01 1010 -119,68 5
Tabela 7.1: Aptidão dos indivíduos.
7.3.3Operadores
Existem dois tipos principais de operadores genéticos responsáveis pela cria-
ção de novos indivíduos.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 112
O operador decrossoveré usualmente aplicado para combinar o material
genético de dois genitores para a criação de novos indivíduos. Normalmente, o
operador proposto por Deaven e Ho (Deaven, 1995), corte e união, é utilizado com
sucesso. Um exemplo deste operador é mostrado na figura 7.2. Apesar do bom
desempenho apresentado por este operador, para agregados que apresentam mais
de um tipo de elemento pode ser extremamente difícil encontrar uma posição de
corte que mantenha o mesmo número de átomos de cada elemento no agregado.
Com o intuito de resolver este problema, este trabalho apresenta uma variação deste
operador combinada com a metodologia de um operador para problemas baseados
em ordem (Michalewicz, 1994).
O funcionamento do operador proposto é descrito a seguir: A figura 7.6
mostra a estrutura de dois agregados que poderiam ser usadospara gerar dois
novos indivíduos. Para aplicar o operador, é escolhido aleatoriamente o eixo onde
os agregados serão cortados e o ponto de corte usado. Suponhaque tenha sido
escolhido o eixo z e o ponto de corte 3, ou seja, os agregados serão cortados abaixo
do terceiro átomo de cima para baixo. Caso o procedimento do operador corte e
união fosse usado, os novos agregados gerados seriam iguaisaos mostrados na
figura 7.7. Observe que o agregado à esquerda possuiria 5 átomos do elemento azul
e 3 do elemento laranja. O inverso ocorreria com o outro agregado. Obviamente,
estes agregados são inválidos, já que o desejado é possuir quatro átomos de cada
elemento.
Figura 7.6: Dois agregados genitores.
Para resolver o problema descrito acima e sempre gerar indivíduos válidos,
o operador proposto enumera todos os átomos do agregado. Os átomos acima do
ponto de corte do agregado 1 (1, 2 e 3) são mantidos em suas posições originais e
os átomos abaixo da linha de corte (4, 5, 6, 7 e 8) completam o agregado com as
posições ocupadas no agregado 2. O outro filho é formado de maneira semelhante,
somente invertendo os agregados. A figura 7.8 mostra os novosindivíduos gerados.
Como pode ser visto, o novo operador não gera indivíduos inválidos. A única
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 113
Figura 7.7: Dois filhos inválidos.
desvantagem deste novo operador é a inserção de átomos em umaregião de mínimo
local, como ocorre na parte superior do filho 2 da figura 7.8.
Figura 7.8: Dois novos indivíduos gerados.
Com os objetivos de evitar a estagnação e manter a diversidadeda população,
um ou mais operadores de mutação são introduzidos no Algoritmo Genético.
Johnston apresentou uma diversidade de operadores para agregados atômicos, que
podem ser facilmente estendidos aos agregados moleculares(Johnston, 2003). Os
operadores são descritos a seguir:
– Deslocamento de átomo: A mutação ocorre pela alteração aleatória das coor-
denadas geométricas de alguns átomos do agregado;
– Torção: A mutação ocorre pela rotação, no eixo z, da metade superior do
agregado. O ângulo de rotação é escolhido aleatoriamente;
– Substituição de agregado: Um agregado completo é substituído por um novo
agregado gerado aleatoriamente. O novo agregado é gerado exatamente da
mesma forma que os agregados da população inicial;
– Troca de átomo: A mutação ocorre pela troca de pares de átomos de elementos
diferentes.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 114
7.4Agregados de Li e F
7.4.1Agregados de (LiF )nLi+
Este experimento visa obter as geometrias mais estáveis para agregados de
(LiF )nLi+, onde n= 2 - 4. Os agregados otimizados são usados para explicar os re-
sultados experimentais realizados no laboratório Van der Graaf do Departamento de
Física da PUC-Rio, onde uma superfície de LiF policristalino ébombardeada por
fragmentos de fissão do252C f de≈ 60MeV, ocasionando a emissão de íons secun-
dários que são estudados por espectroscopia de massa. O espectro de íons positivos
é dominado pela série (LiF )nLi+, n = 0 - 7, aparecendo com uma abundância de
duas ordens de grandeza maior que a série (LiF )+n (Fernandez, 2009).
Na busca pela geometria dos agregados, as energias, usadas como aptidões
dos indivíduos do Algoritmo Genético, foram obtidas utilizando o método DFT
com o funcional híbrido B3LYP e a função de base 3-21G. Todos oscálculos foram
realizados usando o programa GAUSSIAN 03 (G03). Neste experimento, o objetivo
é encontrar o agregado de menor energia, além de outros de baixa energia. Portanto,
todas as estruturas que convergiram com sucesso para um mínimo local durante a
evolução foram guardadas em um banco de estruturas e posteriormente refinadas
usando-se uma função de base maior, 6-311++G(3df,3pd).
Nestes experimentos o tamanho da população inicial do AG variou entre
15 e 20 indivíduos, dependendo do número de átomos envolvidos. O número de
gerações foi sempre igual a 50. O operador de crossover utilizado foi o proposto
neste trabalho e descrito anteriormente e a mutação aplicada foi a de deslocamento
de átomos. O AG só foi aplicado em agregados com multiplicidade singlete. Para
multiplicidades de spin maiores diferentes rodadas dos AG são necessárias, como
descrito em (Alexandrova, 2004). Alguns cálculos isoladosforam realizados com
multiplicidade triplete, porém a energia sempre apresentou um valor maior. Por esta
razão, apenas os cálculos com multiplicidade singlete foram considerados.
Em todos os experimentos, o agregado de menor energia foi encontrado nas
primeiras cinco gerações. Comportamento semelhante foi observado nos trabalhos
(Alexandrova, 2004) e (Alexandrova, 2005). Esta rápida convergência se deve ao
fato da otimização tratar agregados com poucos átomos (um máximo de 9 átomos),
além do uso de um algoritmo de minimização local eficiente. Aolongo da evolução,
os operadores genéticos tiram proveito das estruturas maisestáveis para encontrar
outros isômeros de baixa energia.
Os resultados para os experimentos de n= 2 são mostrados na tabela 7.2
e para n= 3 na tabela 7.3. Os resultados para n= 4 são mostrados no apêndice
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 115
-222.4186509 -222.4045603 -222.3960408
Tabela 7.2: Estruturas dos aglomerados (LiF )2Li+.
-329.9832686 -329.966228 -329.9636088
-329.9631894 -329.96154 -329.9542264
-329.9477844 -329.9439183
Tabela 7.3: Estruturas dos aglomerados (LiF )3Li+.
C. As tabelas mostram as estruturas em ordem crescente de energia (em Hartree).
Todas as energias apresentadas foram corrigidas para a energia de ponto zero (do
inglêsZero Point Energy- ZPE) para obter a energia total (ET = SCF+ ZPE).
Experimentos com agregados maiores não foram realizados devido ao grande tempo
computacional necessário.
Observe que o agregado linear é o mais estável para n= 2. Para n= 3, a estru-
tura linear foi encontrada como a segunda mais estável. Uma estrutura tendendo à
cúbica é ligeiramente mais estável neste caso. Já para n= 4, o Algoritmo Genético
não foi capaz de encontrar uma estrutura linear. Esta estrutura foi simulada sepa-
radamente e a energia obtida foi igual a -437.5114563 Hartrees. Das 17 estruturas
encontradas para este caso, apenas quatro possuem energia maior que a energia do
agregado linear. O trabalho (Fernandez, 2009) mostra que asestruturas lineares são
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 116
cada vez menos estáveis à medida que tamanho do agregado aumenta.
Pode-se concluir que o Algoritmo Genético não foi capaz de encontrar o agre-
gado linear por dois motivos. O primeiro e mais importante é que o cubo de raio R
definido para inicializar a população é pequeno para acomodar o agregado linear.
Além disso, o agregado linear possui energia relativamentealta quando compa-
rado aos agregados mais estáveis, dificultando a sua formação pelos operadores
genéticos. Para contornar este problema, poder-se-ia usara estratégia adotada em
(Alexandrova, 2005), onde agregados lineares e planares são introduzidos já na po-
pulação inicial.
Apesar das estruturas mais estáveis encontradas neste trabalho serem iguais
àquelas apresentadas anteriormente na literatura, o uso doAG permitiu introduzir
uma grande quantidade de isômeros de baixa energia diferentes daqueles apresen-
tados para n= 3 e 4 (Haketa, 2002).
7.4.2Agregados de (LiF )n
Estes experimentos seguem o mesmo método descrito para os agregados de
(LiF )nLi+. A maior diferença é que estes agregados são neutros.
Tal como os agregados da seção anterior, neste caso foram otimizados agre-
gados para n= 2 - 4. Os resultados para n= 2 estão mostrados na tabela 7.4 e para
n= 3 na tabela 7.5. Os resultados para n= 4 são mostrados no apêndice C. Observe
que para este caso, o agregado linear não é o mais estável até mesmo para n= 2.
Novamente, este trabalho introduz agregados diferentes daqueles apresenta-
dos para n= 3 e 4 na literatura (Haketa, 2002).
-215.0392339 -214.993798
Tabela 7.4: Estruturas dos aglomerados (LiF )2.
-322.5999171 -322.5687344
Tabela 7.5: Estruturas dos aglomerados (LiF )3.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 117
-315.021411 -315.004955 -314.994748
Tabela 7.6: Estruturas dos aglomerados (LiF )2F−.
-422.575126 -422.565739 -422.560808
-422.557149 -422.549052 -422.540097
-422.530358
Tabela 7.7: Estruturas dos aglomerados (LiF )3F−.
7.4.3Agregados de (LiF )nF−
Os mesmos experimentos foram realizados para os íons negativos (LiF )nF−.
Os resultados para n= 2 são apresentados na tabela 7.6 e para n= 3 na tabela 7.7.
Os resultados para n= 4 e 5 também são mostrado no apêndice C.
Tal como foi observado para os íons positivos, o agregado linear é o mais
estável para n= 2 e o segundo mais estável para n= 3. Para n= 4 e 5, os agregados
lineares não são tão estáveis, assim como havia sido observado com os agregados
positivos. Neste caso, o AG encontrou o agregado linear paran = 4 e este é o que
possui a nona menor energia. Por outro lado, o agregado linear não foi encontrado
para n= 5. Este agregado foi calculado separadamente e sua energia émaior do que
a dos 14 encontrados.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 118
Os resultados deste trabalhos estão presentes em (Fernandez, 2009b) e fazem
parte da primeira investigação sobre os agregados de (LiF )nF−.
7.5Agregados de H2O
Agregados de água neutros têm sido extensivamente investigados por um
longo período de tempo por fornecerem um entendimento importante das propri-
edades de moléculas de água, inclusive através do uso de algoritmos evolutivos
(Guimarães, 2002) (Nguyen, 2008) (Bandow, 2006) (Silva, 2006). Grande parte dos
estudos concentra suas atenções na investigação das mudanças de estruturas e pro-
priedades de pequenos agregados de água com relação ao número de moléculas. Vá-
rios resultados de cálculosab initio mostram que o potencial intermolecular água-
água praticamente governa a estrutura dos agregados. Além disso, o interesse por
potenciais empíricos (mecânica molecular) tem crescido com o objetivo de descre-
ver as interações intermoleculares água-água de maneira mais precisa e com maior
rapidez (Fanourgakis, 2006) (Burnham, 2002).
Comparativamente com o número de trabalhos com agregados de água neu-
tros, o estudo de agregados de água iônicos ainda é escasso e poucos trabalhos são
encontrados na literatura (Vostrikov, 2006) (Kulkarni, 2008) (Likholyot, 2007).
Este trabalho tem como objetivo o estudo teórico da formaçãode agregados
de água iônicos a partir de experimentos semelhantes àqueles realizados com os
agregados de Li e F descritos na seção anterior. Este trabalho foi realizado em três
fases distintas, conforme apresentadas a seguir:
– Otimização de agregados de água neutros (H2O)n,n = [1,8];
– Obtenção dos agregados positivamente carregados (H2O)+n ,n = [1,8]
– Obtenção de agregados iônicos através da agregação de íonsaos agregados
neutros (H2O)nI ,n = [1,8] ondeI pode serH2O+, H3O+ ouOH−.
Cada uma das etapas serão descritas a seguir.
7.5.1Agregados de (H2O)n
Esta primeira etapa apresenta o uso de Algoritmos Genéticos(AG) para en-
contrar o mínimo global de energia de agregados de água usando o potencial em-
pírico TTM2.1-F. De fato, o método de busca e otimização AG jáfoi recentemente
utilizado para a otimização de agregados de água com o potencial TTM2.1-F para
n = 6 - 34 (Bandow, 2006).
Em seguida, os agregados obtidos por esta metodologia foramrecalculados
usando o método DFT B3LYP/6-311++G(2d,2p). O método e função de base
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 119
escolhidos foram baseados nos resultados apresentados em (Bryantsev, 2009), onde
vários níveis de teoria foram usados para o cálculo de agregados de água neutros
e ionizados. Os resultados obtidos nesta seção servem como base para a realização
das etapas seguintes.
O TTM2-F é um potencial de interação flexível e polarizável desenvolvido
por Burnham e Xantheas (Burnham, 2002). Apesar de o modelo ter sido apenas
parametrizado com dímeros de água, já foi mostrado que ele é capaz de reproduzir
as energias de ligação de agregados de água com grande concordância com os
cálculos em MP2 para n= 2 - 6 e n= 20 (Lagutschenkov, 2005). Neste trabalho
nós consideramos o potencial empírico TTM2.1-F, que é uma versão revisada
do modelo original e apresenta resultados que resolvem cálculos relacionados ao
momento de dipolo de água individuais e pequenas interaçõesintermoleculares
(Fanourgakis, 2006).
Os resultados obtidos neste trabalho concordam com os resultados apresen-
tados na literatura (Bandow, 2006) e são apresentados na tabela 7.8. Os agregados
mais estáveis para n= 3, 4 e 5 formam estruturas em anel.
A primeira estrutura interessante aparece para n= 6. Neste caso, o anel
não é a estrutura mais estável. A estrutura de menor energia encontrada é em
forma de gaiola com quatro anéis quaternários. Este resultado, juntamente com os
outros resultados da literatura, sugere que os anéis quádruplos e quíntuplos sejam
energeticamente mais favoráveis que os anéis sêxtuplos. O Agregado para n= 7 é
muito próximo do anterior, porém este apresenta três anéis quádruplos, um triplo
e um quíntuplo. Este último agregado é praticamente um cubo,com um vértice
faltando. Finalmente, o agregado para n= 8 forma um cubo perfeito, contendo seis
anéis quádruplos.
7.5.2Agregados de (H2O)+n
Nesta segunda etapa, os agregados de (H2O)n obtidos anteriormente serão
usados de base para a obtenção dos agregados positivos. Imagine que os agregados
neutros tenham se formado em um processo de bombardeamento semelhante ao
que foi descrito para os agregados de Li e F. Suponha agora que, durante o
bombardeamento, um agregado neutro e estável tenha sido atingido por um elétron
e este tenha arrancado um elétron do agregado, deixando-o com uma carga positiva,
conforme ilustrado na figura 7.9.
Os agregados obtidos a partir daqueles neutros e estáveis são mostrados na
tabela 7.9. É fácil perceber que a maioria dos agregados iônicos possui geometria
diferente dos agregados neutros originais. Para n= 2, um dos hidrogênios de uma
molécula parece migrar para a outra molécula, deixando a primeira com apenas um
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 120
-152,931994 -229,410557
-305,891845 -382,367790
-458,842485 -535,322505
-611,808416
Tabela 7.8: Estruturas dos aglomerados (H2O)n.
Figura 7.9: Formação de agregados de água positivos atravésda perda de umelétron.
átomo de hidrogênio. Para n= 3, as moléculas de água praticamente se mantém,
exceto por um átomo de hidrogênio que se distancia do átomo deoxigênio, mas
não o suficiente para migrar para outra molécula. Neste caso,a estrutura em anel é
desfeita e há um agregado com uma ligação de hidrogênio e duasmoléculas ligadas
por uma interação iônica. Já para o caso de n= 4, a estrutura é muito semelhante
àquela apresentada na tabela 7.8. Porém, esta estrutura encontrada não é um mínimo
verdadeiro, ou seja, é instável. Os diversos cálculos realizados não foram capazes de
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 121
encontrar um agregado estável para este caso. Pode-se considerar que este composto
é uma radical livre catiônico, que são comuns em espectroscopia de massa, apesar
de menos estáveis que os radicais livre aniônicos. Estes radicais costumam se
fragmentar em misturas de especies iônicas e radicais livres não carregados.
-152,535233 -229,039935
-305,492964 -381,981257
-458,513164 -535,002857
-611,485133
Tabela 7.9: Estruturas dos aglomerados (H2O)+n .
Já para n= 5, o agregado estável obtido é muito próximo da estrutura do
agregado neutro original. Porém, neste caso, o anel formadopelas moléculas está
um pouco fora do plano. Para n= 6, a estrutura neutra apresentada anteriormente se
transforma em uma estrutura mais aberta e, tal como ocorreu para n= 2, um átomo
de hidrogênio migra para uma outra molécula. Para n= 7, a estrutura neutra em
formato tendendo a um cubo se transforma em uma estrutura em anel com cindo
moléculas, tal como para n= 5, ligada a um agregado muito parecido com aquele
para n= 2 neutro mostrado na tabela 7.8. Finalmente, a estrutura do agregado neutro
em forma de cubo para n= 8 se transforma em uma estrutura muito diferente,
contendo um anel quádruplo, dois anéis quíntuplos e dois agregados idênticos
àqueles para n= 2 neutro.
É curioso observar que apenas para o agregado com quatro moléculas de
água não foi possível encontrar uma estrutura íônica estável. Este fato pode ter
ocorrido por duas razões: primeiro, as estruturas estáveispara o agregado iônico
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 122
com quatro são realmente muito diferentes da estrutura neutra, sendo impossível
obtê-la partindo-se da estrutura inicial. A outra possibilidade é a deficiência dos
métodos teóricos utilizados, não permitindo encontrar a solução exata. Para eliminar
esta hipótese, vários cálculos, em diferentes níveis de teoria, devem ser realizados
e seus resultados analisados.
A importância destes cálculos teóricos é fundamental para explicar a geome-
tria dos agregados de água formados experimentalmente. Nesta fase, este trabalho
visa explicar a formação de agregados a partir de agregados neutros estáveis, tal
como muitos devem se formar na natureza. A próxima fase mostra uma outra alter-
nativa para a formação de agregados iônicos.
7.5.3Agregados de (H2O)nI
Tal como foi feito para o caso anterior, os agregados neutrosserão usados
como base para encontrar novos agregados iônicos. Porém, neste caso vamos
considerar que um íon (positivo ou negativo) vai de encontrocom o agregado neutro,
mas sem energia suficiente para quebrá-lo, ou seja, o íon se ligará à superfície do
agregado. Após se adsorver na superfície deste, o novo agregado é relaxado como
um todo para encontrar a estrutura mais estável do composto iônico. Todo este
processo está ilustrado na figura 7.10.
Figura 7.10: Formação de agregados de água iônicos através da agregação demoléculas iônicas.
Contudo, os íons podem se aproximar da superfície do agregadocom diversas
orientações diferentes e em diferentes posições. Logo, como intuito de minimizar
a quantidade de cálculos e, principalmente, estudar as configurações com maior
probabilidade de ocorrer, um Algoritmo Genético foi usado para encontrar a confi-
guração mais estável para o íon na superfície do agregado.
O cromossomo que representa a solução do problema possui sete genes e está
ilustrado na figura 7.11. Os três primeiros genes (x, y e z) sãousados para definir
o vetor que parte do centroide do agregado e indica a posição do íon na superfície
deste. O quarto gene (r) indica qual a distância do átomo referência do íon (neste
caso o átomo marcado de preto na figura) com relação ao centroide. Por fim, os
três últimos genes (α, β e γ) são usados para definir a orientação do íon, ou seja, a
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 123
rotação deste. Estes genes representam os ângulos de Euler,que permitem a rotação
em uma esfera.
Figura 7.11: O cromossomo para encontrar a posição mais estável do íon nasuperfície do agregado e a figura ilustrativa do problema em 2D.
Os valores de x, y e z variam de 0 a 1. Os ângulosα e γ variam de−π a π e
β varia de 0 aπ. Já o valor de r varia de 0,5 a 7 Å paran ≤ 6 e de 1,5 a 9 Å, caso
contrário.
Por se tratar de um problema de otimização numérica, decidiu-se utilizar o
Algoritmo Evolutivo com Inspiração Quântica (AEIQ), já descrito anteriormente.
Os parâmetros do algoritmo usado são listados abaixo:
– Tamanho da População Clássica: 200
– Tamanho da População Quântica: 5
– Porcentagem de Observações: 5/200= 2,5%
– Intervalo de Variações (Gerações): 10
– Taxa de Crossover: 95
– Taxa de Mutação: 10
– Variação da Largura do Pulso: 10
– Gerações: 400
– Rodadas: 5
Os parâmetros acima dizem que 200 soluções são geradas aleatoriamente no
inicio da execução. A cada uma das 399 gerações seguintes, umindivíduo clássico
(solução para o problema) é gerado por cada indivíduo quântico (distribuição de
probabilidades), totalizando 5 indivíduos por geração. A cada um destes novos
indivíduos gerados há uma probabilidade de 95% da aplicaçãode crossover com
outro indivíduo já existente na população, tal como no AG clássico. A cada 10
gerações, a largura da função de distribuição é estreitada ou alargada em 10%,
dependendo da evolução do experimento. Se o algoritmo converge, os indivíuos
passam a sofrer mutações para poder explorar melhor o espaçode busca. O AG é
repetido 5 vezes de forma independente.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 124
Como o número de moléculas de água nos agregados estudados variam de
2 a 8, três íons diferentes foram testados. Para cada uma destas configurações, 5
rodadas independentes do AG foram feitas, totalizando 105 execuções do AG para
obter os resultados descrito a seguir.
Os resultados obtidos pelo AG são posteriormente refinados utilizando o
mesmo método DFT B3LYP/6-311++G(2d,2p) utilizados nos cálculos anteriores.
Os três íons estudados neste trabalho são:H2O+, H3O+ eOH−. Os resultados
são apresentados abaixo.
H2O+
Os resultados obtidos para estes agregados são apresentados na tabela 7.10
e estão ordenados por tamanho e energia. Cada agregado é identificado por uma
codificação definida como A-B, onde A indica o número de moléculas de água no
agregado antes da incorporação do íon e B o número sequencialdo agregado. Por
exemplo, o código 3-1 indica um íon incorporado em um agregado com 3 moléculas
de água e é o mais estável encontrado, enquanto o código 3-2 indica um agregado
com o mesmo número de molécula, mas com uma energia maior que ado composto
anterior.
Os aglomerados (H2O)nH2O+ obtidos nesta etapa podem ser comparados com
os agregados (H2O)+n+1 obtidos na etapa anterior, já que ambos possuem o mesmo
número de moléculas. A única diferença entre os agregados iônicos é a forma como
eles foram gerados.
O agregado para n= 2 obtido nesta etapa é igual àquele obtido para n= 3
na etapa anterior. É importante lembrar que a estrutura paran = 4 obtida na etapa
anterior não é estável. Já nesta etapa, foram obtidas duas estruturas para n= 3.
Observe que ambas as estruturas diferem bastante do anel quádruplo instável obtido
anteriormente. Já para n= 4 nesta etapa, foram obtidas três estruturas diferentes
e todas são bem mais estáveis que aquela obtida para n= 5 da etapa anterior. É
interessante observar que a estrutura menos estável desta etapa é bem parecida
com aquela da etapa anterior. Para n= 5, as duas estruturas obtidas também são
mais estáveis que aquela obtida para n= 6 do passo anterior. Ao contrário, a única
estrutura encontrada para n= 6 é menos estável que a estrutura obtida para n= 7
anteriormente. Para o caso de n= 7, duas estruturas foram obtidas, sendo que apenas
uma possui energia menor que aquela para n= 8 do caso anterior. Finalmente, para
n = 8 uma estrutura cúbica com uma molécula ligada por ponte de hidrogênio foi
obtida e não há como compará-la com os agregados da etapa anterior, já que esta
possui uma molécula de água a mais.
Um rápida observação nas estruturas obtidas indica que em alguns agregados
há a migração de um átomo de hidrogênio de uma molécula para outra, tal como
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 125
2-1 : -229,039935 3-1 : -305,528305 3-2 : -305,528149
4-1 : -382,020716 4-2 : -382,018126 4-3 : -382,014615
5-1 : -458,517760 5-2 : -458,510348 6-1 : -534,981337
7-1 : -611,485872 7-2 : -611, 481029 8-1 : -687,967533
Tabela 7.10: Estruturas dos aglomerados (H2O)nH2O+.
reportado na etapa anterior. Para todos os casos, exceto para n= 6, os agregados
formados pela incorporação de um íon aos agregados gerou estruturas mais estáveis
que aqueles formados pela perda de um elétron pelo agregado neutro.
H3O+
Os resultados obtidos são apresentados tal como para o íon anterior e as
estruturas são mostradas na tabela 7.11.
A troca do íonH2O+ pelo íonH3O+ proporciona algumas mudanças interes-
santes nas estruturas dos agregados encontrados. Neste caso, todas as moléculas se
interagem por ligações de hidrogênio. Foi encontrada uma estrutura a menos para n
= 3 e 4. As geometrias para as estruturas com n< 7 são bem parecidas com aquelas
anteriores, com algumas variações.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 126
2-1 : -229,751526 3-1 : -306,239206 4-1 : -382,723024
4-2 : -382,722868 5-1 : -459,206488 5-2 : -459,204543
6-1 : -535,707874 7-1 : -612,172460 7-2 : -612,169866
8-1 : -688,647709
Tabela 7.11: Estruturas dos aglomerados (H2O)nH3O+.
OH−
Finalmente, os resultados para os agregados formados pela interação com o
OH− são apresentados na tabela 7.12. Tal como foi observado parao caso doH3O+,
as geometrias dos agregados formados mostram as moléculas interagindo através
de ligações de hidrogênio.
Capítulo 7. Otimização de Agregados Atômicos e Moleculares 127
2-1 : -228,835011 3-1 : -305,326858 3-2 : -305,320523
4-1 : -381,813574 4-2 : -381,806637 5-1 : -458,300388
5-2 : -458,299321 5-3 : -458,293567 6-1 : -534,779925
6-2 : -534,777286 6-3 : -534,776742 6-4 : -534,775561
7-1 : -611,252050 8-1 : -687,731843
Tabela 7.12: Estruturas dos aglomerados (H2O)nH3O+.
8Conclusões e Trabalhos Futuros
Este trabalho propôs investigar o apoio das técnicas de Inteligência Compu-
tacional no desenvolvimento da Nanociência e Nanotecnologia. Tal apoio é aqui
denominado de “Nanotecnologia Computacional Inteligente”. Vários estudos de
caso foram apresentados e propostos de forma a investigar o apoio das técnicas de
IC no projeto, caracterização, simulação e otimização de estruturas nanométricas e
subnanométricas. O uso de Redes Neurais Artificiais é apresentado para inferir as
características de nanoestruturas a partir dos parâmetrosde entrada para a síntese.
De posse destes sistemas de inferência, pode-se usar um Algoritmo Genético para
obter o conjunto de parâmetros ótimo para sintetizar a nanoestrutura desejada. Os
Algoritmos Genéticos são também usados, juntamente com simuladores de nano-
dispositivos, para encontrar as estruturas e parâmetros ótimos para a síntese dos
nanodispositivos desejados. Os cálculo de modelagem molecular dependem forte-
mente dos parâmetros usados. Os métodosab initio, utilizam funções gaussianas
para aproximar as funções de onda dos átomos. As funções gaussianas utilizadas
necessitam de expoentes otimizados para a boa representação destas funções de
onda. Por fim, os agregados atômicos e moleculares têm sido largamente estudados
e Algoritmos Genéticos são usados para a obtenção do isômerode menor energia e
outros isômeros de baixa energia. Neste trabalho foram otimizadas as estruturas de
agregados de Li e F, além de agregados deH2O.
Com relação à inferência e otimização de parâmetros para a síntese de na-
noestruturas, os resultados obtidos demonstram o grande potencial das técnicas de
Inteligência Computacional. Mesmo com uma base de dados pequena ou bastante
heterogênea, a Rede Neural Artificial foi capaz de inferir características muito se-
melhantes àquelas obtidas pelos resultados experimentais. Os erros obtidos para os
dois casos apresentados ficaram em torno de 10% e 4%, respectivamente. Apesar
dos resultados apresentados inferirem características específicas de pontos quânti-
cos e de nanocompósitos, as técnicas computacionais utilizadas podem ser facil-
mente estendidas para outras características destes materiais e, até mesmo, para in-
ferir propriedades de outros materiais, tais como, nanotubos, supramoléculas, den-
drímeros, etc. Os sistemas propostos e aplicados neste trabalho diminuem signi-
ficativamente o número de experimentos necessários nos laboratórios, já que eles
Capítulo 8. Conclusões e Trabalhos Futuros 129
podem ser usados para guiar a busca pelos parâmetros ótimos.Como consequência
da diminuição na quantidade de experimentos, há uma reduçãosignificativas nos
custos das pesquisas. Os resultados preliminares são bastante promissores, prin-
cipalmente para aplicações industriais, mostrando que as técnicas de Inteligência
Computacional podem ser parte fundamental da nanoinformática e, consequente-
mente, acelerar o desenvolvimento da Nanotecnologia. O desenvolvimento de fer-
ramentas de manipulação de dados, como mostrado neste trabalho, é fundamental
para o desenvolvimento da Nanoinformática. A única desvantagem da heurística
proposta é a dependência de dados experimentais confiáveis,em grande quantidade
e bem distribuídos. A inferência só pode ser realizada a partir de uma quantidade
de dados mínima e o sistema resultante é totalmente dependende da qualidade dos
dados usados.
Em uma outra alternativa estudada para o projeto de nanodispositivos, Algo-
ritmos Genéticos são aplicados juntamente simuladores dedicados. Estes simula-
dores são os responsáveis pela avaliação dos nanodispositivos propostos pelo AG,
indicando o quão bom é cada uma das soluções evoluídas. Dois diferentes projetos
foram realizados e, em ambos, os resultados obtidos foram surpreendentes, apresen-
tando estruturas inovadoras e mais eficientes que aquelas anteriormente propostas
na literatura. O uso de um sistema de projeto automático possibilita explorar todo
o espaço de busca permitido para a construção dos nanodispositivos e, consequen-
temente, não fica limitado às regras de projeto usadas por especialistas. Por esta
razão, muitas vezes os nanodispositivos obtidos apresentam estruturas e configura-
ções inimagináveis. Os resultados apresentados para os circuitos de QCA são um
exemplo disto. As estruturas obtidas possuem um grau de polarização das células de
saída semelhante àquelas propostas pelos especialista, porém aquelas obtidas pelo
sistema proposto possuem uma redução significativa no número de células. Por ou-
tro lado, as estruturas construídas pelos especialistas são muito mais amigáveis e
fáceis de serem entendidas. Contudo, é exatamente a liberdade de construção, sem
a preocupação do entendimento, que permite aos sistemas de projeto automático
encontrarem soluções inovadoras. A mesma observação pode ser feita sobre a oti-
mização dos OLEDs multicamadas, basta observar que as concentrações obtidas
pelo AG se diferenciam daquelas propostas pelos especialistas.
Com relação à otimização dos expoentes das funções de base, esta tese
propôs a otimização dos parâmetros do método GCHF. Os resultados obtidos
através da aplicação do Algoritmo Genético na otimização destes parâmetros foram
satisfatórios. As energias obtidas para a heurística SOGBS são semelhantes àquelas
descritas na literatura. Para este caso o AG converge rapidamente para o mesmo
valor em todos os experimentos realizados, indicando que o mínimo global é
obtido. Já para as heurísticas DOGBS e TOGBS, o AG é capaz de obter energias
Capítulo 8. Conclusões e Trabalhos Futuros 130
inferiores àquelas apresentadas na literatura. Este trabalho também apresenta outras
alternativas para a otimização destes expoentes. Para o caso conhecido como
full-optimized, onde todos os expoentes são otimizados um a um, os resultados
preliminares igualaram aqueles descritos na literatura. Porém, o AG não é muito
dependente do ponto de otimização inicial, diferentementedo método anteriormente
proposto na literatura.
Este trabalho apresentou o uso de técnicas de Inteligência Computacional em
três propostas diferentes para a otimização de funções de base. Em todas elas, o uso
da computação evolutiva apresentou resultados iguais ou melhores do que aqueles
anteriormente propostos na literatura. O primeiro e o segundo casos apresentados
utilizam-se de uma equação para a geração dos expoentes das funções de base. Os
resultados obtidos nesta tese apresentam melhorias para ambos os casos. A segunda
alternativa, otimização dos parâmetros da expansão polinomial, também introdu-
ziu a otimização da distribuição das primitivas gaussianasentre as simetrias. Tal
distribuição nunca foi otimizada anteriormente na literatura, já que os especialistas
sempre se utilizam de seus conhecimentos e intuições. Apesar de não haver uma
distribuição radicalmente diferente do que foi apresentado anteriormente na litera-
tura, esta flexibilização permitiu uma diminuição significativa da energia. Por fim,
o terceiro e último caso propôs a otimização total dos expoentes. Claramente esta
é a alternativa que fornece os melhores resultados. Porém, ocusto computacional
para a otimização é extremamente alto, devido à grande quantidade de parâmetros.
Os resultados obtidos foram semelhantes ao já apresentadosna literatura, a meto-
dologia proposta neste trabalho não é dependente do ponto deotimização inicial,
diferentemente dos métodos anteriormente propostos na literatura.
Finalmente, este trabalho também apresentou o uso de Algoritmos Genético
na busca pela geometria de agregados atômicos e moleculares. Dois casos diferentes
foram estudados. O uso de AG na busca pela geometria de menor energia já
foi utilizado com sucesso em diferentes trabalhos. Porém, no primeiro caso deste
trabalho, o AG foi utilizado pela primeira vez para encontrar a estrutura de menor
energia e outros isômeros de baixa energia. Além disso, estetrabalho também
propôs um novo operador genético para combinar aglomeradosque possuam mais
de um tipo de átomos diferentes. No segundo caso apresentado, um AG semelhante
ao utilizado para os agregados de Li e F foi usado para obter osaglomerados
de (H2O)n neutros de menor energia. Contudo, este caso trata de um aglomerado
molecular e a representação genética se diferencia da representação do primeiro
caso, conforme já discutido anteriormente. Por fim, uma novaestratégia evolutiva,
utilizando um AEIQ, foi usada para encontrar aglomerados formados pela união
de aglomerados de (H2O)n neutros com diferentes íons positivos e um negativo.
Os resultados apresentaram estruturas inovadoras, diferentes daquelas apresentadas
Capítulo 8. Conclusões e Trabalhos Futuros 131
anteriormente na literatura.
Apesar do uso de técnicas de Inteligência Computacional já ter sido realizada
pontualmente eu um ou outro projeto em Nanociência e Nanotecnologia, está tese
apresentou pela primeira vez uma avaliação mais ampla do apoio destas ferramentas
computacionais no desenvolvimento nanotecnológico. Os resultados obtidos neste
trabalho indicam que os métodos de Inteligência Computacional poderão ter um
impacto positivo no desenvolvimento da Nanociência e Nanotecnologia. Como
previsto na introdução deste trabalho, as técnicas de IC podem ser utilizadas na
caracterização, projeto, simulação e otimização de estruturas nanométricas e sub-
nanométricas.
O sucesso da aplicação destas técnicas nas mais diversas áreas da ciência e da
indústria é mais um fator de otimismo no desenvolvimento da Nanotecnologia. Con-
tudo, a Nanociência e a Nanotecnologia possuem um uma grandevantagem quando
comparadas às outras áreas onde a Inteligência Computacional foi aplicada com su-
cesso. Diferentemente das outras áreas, a Nanociência e a Nanotecnologia formam
um campo de pesquisa e desenvolvimento ainda pouco explorado e com um poten-
cial de crescimento enorme. Os nanodispositivos e as nanoestruturas obtidas com o
auxílio da IC certamente serão usadas em aplicações inovadoras, que transformarão
muito o estilo e qualidade de vida da sociedade. Como comparação podemos citar o
uso dos Algoritmos Genéticos no desenvolvimento de circuitos eletrônicos. Apesar
do sucesso deste tipo de aplicação, quando ela foi usada pelaprimeira vez a indústria
da eletrônica já estava consolidada. Logo, os circuitos eletrônicos revolucionários
criados pelos AGs não causaram grande impacto na sociedade eem grande parte
somente são aplicados em pesquisas avançadas, tal como explorações espaciais. Já
a indústria da Nanotecnologia ainda não está totalmente consolidada, na verdade
ela está em seus estágios iniciais, e a continuação das pesquisas apresentadas neste
trabalho pode ser um fator acelerador do desenvolvimento esperado.
8.1Trabalhos Futuros
Conforme já foi discutido anteriormente, este trabalho apresentou uma série
de projetos envolvendo a apoio da técnicas de Inteligência Computacional no de-
senvolvimento da Nanociência e Nanotecnologia. O sucesso dos resultados obtidos
credenciam a aplicação da IC em diversos outros projetos.
Com relação aos projetos realizados pode-se propor:
– Sistemas híbridos de inferência e otimização podem ser usados para o con-
trole da fabricação de outras nanoestruturas, tais como: nanotubos de car-
bono, nanotubos inorgânicos, filmes finos, nanocatalisadores, dendrímeros,
nanopartículas, nanofármacos, etc.
Capítulo 8. Conclusões e Trabalhos Futuros 132
– O uso de simuladores de OLEDs mais completos, tal como alguns já dispo-
níveis comercialmente, possibilitarão a otimização não somente da concen-
tração dos portadores de carga, mas também da estrutura do nanodispositivo
como um todo, ou seja, o número de camadas, a espessura de cadauma delas,
os materiais usados, etc.
– Algoritmos Genéticos tradicionais ou com inspirações quânticas podem ser
usados para a otimização de funções de base para todos os átomos da tabela
periódica em diferentes níveis de teoria. Os mesmo algoritmos podem ser
usados para a otimização de parâmetros de campos de forças utilizados na
simulação de diversas nanoestruturas diferentes.
– Agregados de diferentes átomos ou moléculas podem ser explorados usando
os eficientes métodos de busca pela geometria mais estável.
Além das aplicações anteriormente citadas, acredita-se que novas metodolo-
gias inteligentes e sistema híbridos podem ser extremamente valiosos no desen-
volvimento da Nanociência e Nanotecnologia. Este trabalhoexplorou basicamente
as Redes Neurais Artificiais e os Algoritmos Evolutivos, mas muitas outras meto-
dologias existente ou ainda a serem propostas podem auxiliar no desenvolvimento
nanotecnológico. Dentre algumas outras ferramentas, pode-se citar:
– Programação Genética;
– Sistemas Fuzzy;
– Sistemas Neuro-Fuzzy;
– Sistemas Neuro-Genéticos;
– Agentes Inteligentes;
– Sistema Monte-Carlo-Fuzzy;
– Algoritmos com Inspiração Quântica.
Alguns projetos sugeridos são:
– Programação Genética para o desenvolvimento de “Experimentos Virtuais”,
tal como demostrados com Redes Neurais Artificiais;
– Programação Genética para a criação de funcionais de trocae correlação para
cálculos DFT;
– Agentes Inteligentes aplicados à simulação de sistemas deauto-montagem;
– Sistema Monte-Carlo-Fuzzy para avaliar a incerteza de posicionamento de
átomos em cálculos moleculares;
Capítulo 8. Conclusões e Trabalhos Futuros 133
– O desenvolvimento de novos algoritmos inteligentes inspirados no comporta-
mento de nanoestruturas.
O número de aplicações e projetos é incontável e dependem basicamente do
conhecimento dos especialistas e das ferramentas computacionais.
Referências Bibliográficas
[AbsDaCruz, 2005] DA CRUZ, A. V. A.; BARBOSA, C. R. H.; PACHECO, M.
A. C. ; VELLASCO, M. B. R.. Quantum-inspired evolutionary algorithms
and its application to numerical optimization problems. In: ICONIP,
Berlin, Germany, 2005. Springer-Verlag. 2.7
[Alexandrova, 2004] ALEXANDROVA, A.; BOLDYREV, A.; FU, Y.; YANG, X.;
WANG, X. ; WANG, L.. Structure of the NaCl (x= 1–4) clusters via ab
initio genetic algorithm and photoelectron spectroscopy. The Journal of
Chemical Physics, 121:5709, 2004. 7.2, 7.2, 7.4.1
[Alexandrova, 2005] ALEXANDROVA, A.; BOLDYREV, A.. Search for the Li
n 0/(n) 5-7) Lowest-Energy Structures Using the ab Initio Gradient
Embedded Genetic Algorithm (GEGA). Elucidation of the Chemical
Bonding in the Lithium Clusters . J. Chem. Theory Comput, 1(4):566–
580, 2005. 7.2, 7.2, 7.4.1, 7.4.1
[Arkhipov, 2006] ARKHIPOV, A.; FREDDOLINO, P. ; SCHULTEN, K.. Stability
and Dynamics of Virus Capsids Described by Coarse-Grained Modeling.
Structure, 14(12):1767–1777, 2006. 2.3.1
[Back, 1996] BÄCK, T.. Evolutionary algorithms in theory and practice. Oxford
University Press New York, 1996. 3.1.1
[Bandow, 2006] BANDOW, B.; HARTKE, B.. Larger Water Clusters with Edges
and Corners on Their Way to Ice:# 160 Structural Trends Elucidated
with an Improved Parallel Evolutionary Algorithm . Journal of Physical
Chemistry A, 110(17):5809–5822, 2006. 7.5, 7.5.1
[Bazterra, 2004] BAZTERRA, V.; ONA, O.; CAPUTO, M.; FERRARO, M.; FU-
ENTEALBA, P. ; FACELLI, J.. Modified genetic algorithms to model
cluster structures in medium-size silicon clusters. Physical Review A,
69(5):53202, 2004. 7.2
[Bhushan, 2007] BHUSHAN, B.. Springer handbook of nanotechnology. Sprin-
ger, Berlin, 2007. 2.1, 2.1, 2.3.2, 2.4
Referências Bibliográficas 135
[Bimberg, 1999] BIMBERG, D.; GRUNDMANN, M. ; LEDENTSOV, N.. Quan-
tum Dot Heterostructures. Wiley, 1999. 4.2
[Bishop, 1970] BISHOP, D.; SOMORJAI, R.. Integral-Transform Gaussian
Functions for Heliumlike Systems. Journal of Mathematical Physics,
11:1150, 1970. 6.2
[Bland, 2002] BLAND, S.. Future challenges for MOVPE–an industrial
perspective. Journal of Materials Science: Materials in Electronics,
13(11):679–682, 2002. 4.2.1
[Borgstrom, 2003] BORGSTROM, M.; PIRES, M.; BRYLLERT, T.; LANDI, S.;
SEIFERT, W. ; SOUZA, P.. InAs quantum dots grown on InAlGaAs
lattice matched to InP. Journal of Crystal Growth, 252(4):481–485, 2003.
4.2.1
[Bryantsev, 2009] BRYANTSEV, V.; DIALLO, M.; VAN DUIN, A. ; GODDARD III,
W.. Evaluation of B3LYP, X3LYP, and M06-Class Density Functionals
for Predicting the Binding Energies of Neutral, Protonated, and Depro-
tonated Water Clusters. Journal of Chemical Theory and Computation,
5:1016–1026, 2009. 7.5.1
[Bunge,1992] BUNGE, C.; BARRIENTOS, J.; BUNGE, A. ; COGORDAN, J..
Hartree-Fock and Roothaan-Hartree-Fock energies for the ground sta-
tes of He through Xe. Physical Review A, 46(7):3691–3696, 1992. 6.6,
6.6
[Burnham, 2002] BURNHAM, C.; XANTHEAS, S.. Development of transferable
interaction models for water. IV. A flexible, all-atom polarizable poten-
tial (TTM2-F) based on geometry dependent charges derived froman ab
initio monomer dipole moment surface. The Journal of Chemical Phy-
sics, 116:5115, 2002. 7.5, 7.5.1
[Callister, 1993] CALLISTER, W.. Materials science and engineering: an intro-
duction. John Wiley & Sons New York, 1993. 4.3
[Cao, 1999] CAO, Y.; PARKER, I.; YU, G.; ZHANG, C. ; HEEGER, A.. Improved
quantum efficiency for electroluminescence in semiconducting polymers.
Nature, 397:414–417, 1999. 5.1
[Chattopadhyayfs, 1981] CHATTOPADHYAYFS, P.; DREIZLERI, R. ; TRSICJ,
M.. Application of the generator coordinate method to one-and two-
electron atoms in an electric field. J. Phys. B: At. Mol. Phys, 14:3849–
3855, 1981. 6.3
Referências Bibliográficas 136
[Chang, 1996] CHANG, C.; SZE, S.. ULSI technology. McGraw-Hill New York,
1996. D
[Chan, 2002] CHAN, C.; WU, J.; LI, J. ; CHEUNG, Y.. Polypropylene/calcium
carbonate nanocomposites. Polymer, 43(10):2981–2992, 2002. B
[Clementi, 1990] CLEMENTI, E.; CHAKRAVORTY, S.; CORONGIU, G. ; SON-
NAD, V.. Independent Electron Models: Hartree-Fock for Many-
Electron Atoms. MOTE CC-90 Modern Techniques in Computational
Chemistry (E. Clementi, Ed.), Escom, Leiden, p. 90–72199, 1990. 6.1
[Cohentannoudji, 1979] COHEN-TANNOUDJI, C.; DIU, B.; LALÖ, F. ; CRASE-
MANN, B.. Quantum Mechanics. American Journal of Physics, 47:662,
1979. 2.3.2
[Davis, 1991] DAVIS, L.; OTHERS. Handbook of genetic algorithms. Van
nostrand reinhold New York, 1991. 3.1.1
[Davis, 1991] A.V. ABS DA CRUZ, C.R. HALL BARBOSA, M. P.. Algoritmos
Evolucionários com Inspiração em Computação Quântica e sua Aplica-
ção em Problemas de Otimização Numérica.2004. 3.1.4, 3.1.4
[Deaven, 1995] DEAVEN, D.; HO, K.. Molecular Geometry Optimization with
a Genetic Algorithm. Physical Review Letters, 75(2):288–291, 1995. 7.2,
7.2, 7.3, 7.3.3
[Dowling, 2004] DOWLING, A.; CLIFT, R.; GROBERT, N. ; OTHERS. Nanosci-
ence and Nanotechnologies: Opportunities and Uncertainties. The Royal
Society and the Royal Academy of Engineering, 29, 2004. 2.1
[Doye, 2004] DOYE, J.; LEARY, R.; LOCATELLI, M. ; SCHOEN, F.. Global
Optimization of Morse Clusters by Potential Energy Transformations.
Informs Journal on Computing, 16(4):371–379, 2004. 7.1, 7.2
[Fagerstrom, 2002] FAGERSTROM, J.; FAXEN, T.; MUNGER, P.; YNNERMAN,
A.; DESPLAT, J.; DE ANGELIS, F.; MERCURI, F.; ROSI, M.; SGAMEL-
LOTTI, A.; TARANTELLI, F. ; OTHERS. High Performance Computing
Development for the Next Decade, and its Implications for Molecular
Modelling Applications. The ENACTS project, http://www. enacts. org.
2.6
[Fanourgakis, 2006] FANOURGAKIS, G.; XANTHEAS, S.. The flexible, polari-
zable, thole-type interaction potential for water (TTM2-F) revisited. J.
Phys. Chem. A, 110(11):4100–4106, 2006. 7.5, 7.5.1
Referências Bibliográficas 137
[Fernandez, 2009] FERNANDEZ-LIMA, F.; VILELANETO, O.; PIMENTEL, A.;
PONCIANO, C.; PACHECO, M.; NASCIMENTO, M. ; SILVEIRA, E.. A
Theoretical and Experimental Study of Positive and Neutral LiF Clus-
ters Produced by Fast Ion Impact on a Polycrystalline LiF Target. The
Journal of Physical Chemistry A, 113(9):1813–1821, 2009. 1.3, 7.4.1,
7.4.1
[Fernandez, 2009b] FERNANDEZ-LIMA, F.; VILELANETO, O.; PIMENTEL, A.;
PONCIANO, M.; NASCIMENTO, M. ; SILVEIRA, E.. Theoretical and Ex-
perimental Study of Negative LiF Clusters Produced by Fast Ion Impact
on a Polycrystalline 7LiF Target. The Journal of Physical Chemistry A,
to appear, 2009. 7.4.3
[Fogel, 1966] FOGEL, L.. Author Artificial intelligence through simulated
evolution. New York: John Wiley & Sons, 1966., 1966. 3.1.1
[Foresman, 1996] FORESMAN, J.; FRISCH, A.. Exploring chemistry with
electronic structure methods. 1996. 2.3.1
[Fornes, 2003] FORNES, T.; PAUL, D.. Modeling properties of nylon 6/clay
nanocomposites using composite theories. Polymer, 44(17):4993–5013,
2003. 4.3, 4.3.1
[Fu, 2006] FU, J.; NAGUIB, H.. Effect of Nanoclay on the Mechanical Proper-
ties of PMMA /Clay Nanocomposite Foams. Journal of Cellular Plastics,
42(4):325, 2006. B
[Fukui, 1991] FUKUI, T.; ANDO, S.; TOKURA, Y. ; TORIYAMA, T.. GaAs te-
trahedral quantum dot structures fabricated using selective area meta-
lorganic chemical vapor deposition. Applied Physics Letters, 58:2018,
1991. 4.2
[G03] FRISCH, M. J.; TRUCKS, G. W.; SCHLEGEL, H. B.; SCUSERIA, G. E.;
ROBB, M. A.; CHEESEMAN, J. R.; MONTGOMERY, JR., J. A.; VRE-
VEN, T.; KUDIN, K. N.; BURANT, J. C.; MILLAM, J. M.; IYENGAR, S. S.;
TOMASI, J.; BARONE, V.; MENNUCCI, B.; COSSI, M.; SCALMANI, G.;
REGA, N.; PETERSSON, G. A.; NAKATSUJI, H.; HADA, M.; EHARA, M.;
TOYOTA, K.; FUKUDA, R.; HASEGAWA, J.; ISHIDA, M.; NAKAJIMA, T.;
HONDA, Y.; KITAO, O.; NAKAI, H.; KLENE, M.; LI, X.; KNOX, J. E.; HRAT-
CHIAN, H. P.; CROSS, J. B.; BAKKEN, V.; ADAMO, C.; JARAMILLO,
J.; GOMPERTS, R.; STRATMANN, R. E.; YAZYEV, O.; AUSTIN, A. J.;
Referências Bibliográficas 138
CAMMI, R.; POMELLI, C.; OCHTERSKI, J. W.; AYALA, P. Y.; MORO-
KUMA, K.; VOTH, G. A.; SALVADOR, P.; DANNENBERG, J. J.; ZAKR-
ZEWSKI, V. G.; DAPPRICH, S.; DANIELS, A. D.; STRAIN, M. C.; FAR-
KAS, O.; MALICK, D. K.; RABUCK, A. D.; RAGHAVACHARI, K.; FORES-
MAN, J. B.; ORTIZ, J. V.; CUI, Q.; BABOUL, A. G.; CLIFFORD, S.; CIOS-
LOWSKI, J.; STEFANOV, B. B.; LIU, G.; LIASHENKO, A.; PISKORZ, P.;
KOMAROMI, I.; MARTIN, R. L.; FOX, D. J.; KEITH, T.; AL-LAHAM, M. A.;
PENG, C. Y.; NANAYAKKARA, A.; CHALLACOMBE, M.; GILL, P. M. W.;
JOHNSON, B.; CHEN, W.; WONG, M. W.; GONZALEZ, C. ; POPLE, J. A..
Gaussian 03, Revision C.02. Gaussian, Inc., Wallingford, CT, 2004. 6.5,
6.6, 7.4.1
[Gibson, 1994] GIBSON, R.. Principles of composite material mechanics.
McGraw-Hill, New York, 1994. 4.3
[Goasguen, 2005] GOASGUEN, S.; MADHAVAN, K.; MCLENNAN, M.;
LUNDSTORM, M. ; KLIMECK, G.. The NanoHUB: A Science Gateway
for the Computational Nanotechnology Community. Workshop on Sci-
ence Gateways: Common Community Interfaces to Grid Resources, GGF,
14, 2005. 2.5
[Gojny, 2004] GOJNY, F.; WICHMANN, M.; KÖPKE, U.; FIEDLER, B. ;
SCHULTE, K.. Carbon nanotube-reinforced epoxy-composites: enhan-
ced stiffness and fracture toughness at low nanotube content. Composi-
tes Science and Technology, 64(15):2363–2371, 2004. B
[Gojny, 2005] GOJNY, F.; WICHMANN, M.; FIEDLER, B. ; SCHULTE, K.. In-
fluence of different carbon nanotubes on the mechanical properties of
epoxy matrix composites–A comparative study. Composites Science
and Technology, 65(15-16):2300–2313, 2005. B
[Goldberg, 1989] GOLDBERG, D.. Genetic algorithms in search, optimization
and machine learning. Addison-Wesley Longman Publishing Co., Inc.
Boston, MA, USA, 1989. 3.1.1
[Gomes, 2006] GOMES, A.; CUSTODIO, R.. Polynomial expansion of basis
sets: Alternatives to fully optimized exponents. Journal of Molecular
Structure: THEOCHEM, 760(1-3):39–44, 2006. 6.2, 6.4, 6.5, 6.6
[Goodman, 1998] GOODMAN, J.. Chemical Applications of Molecular Mode-
ling. Royal Society of Chemistry, The, 2007. 2.3.4
Referências Bibliográficas 139
[Greenham, 1993] GREENHAM, N.; MORATTI, S.; BRADLEY, D.; FRIEND, R.
; HOLMES, A.. Efficient light-emitting diodes based on polymers with
high electron affinities. 1993. 5.1
[Griffin, 1957] GRIFFIN, J.. Collective Motions in Nuclei by the Method of
Generator Coordinates. Physical Review, 108(2):311–327, 1957. 6.3
[Grundmann, 2002] GRUNDMANN, M.. Nano-Optoelectronics: Concepts, Phy-
sics, and Devices. Springer, 2002. 4.2
[Gu, 2006] GU, Y.; VANCOURT, T. ; HERBORDT, M.. Accelerating molecular
dynamics simulations with configurable circuits. Computers and Digital
Techniques, IEE Proceedings-, 153(3):189–195, 2006. 2.6
[Guimarães, 2002] GUIMARÃES, F.; BELCHIOR, J.; JOHNSTON, R. ; RO-
BERTS, C.. Global optimization analysis of water clusters (HO)(11? n?
13) through a genetic evolutionary approach. The Journal of Chemical
Physics, 116:8327, 2002. 7.5
[Gusso, 2004] GUSSO, A.; MA, D.; HÜMMELGEN, I. ; DA LUZ, M.. Modeling of
organic light-emitting diodes with graded concentration in the emissive
multilayer . Journal of Applied Physics, 95:2056, 2004. (document), 5.1,
5.1.1, 5.1.2, 5.1.2, 5.1.3, 5.2, 5.1.3, 5.3, 5.1.3
[Gusso, 2004] GUSSO, A.; MA, D.; HÜMMELGEN, I. ; DA LUZ, M.. Modeling of
organic light-emitting diodes with graded concentration in the emissive
multilayer . Journal of Applied Physics, 95:2056, 2004. 2.5
[Haketa, 2002] HAKETA, N.; YOKOYAMA, K.; TANAKA, H. ; KUDO, H.. Theore-
tical study on the geometric and electronic structure of thelithium-rich
LinFn- 1 (n= 2–5) clusters. Journal of Molecular Structure: THEOCHEM,
577(1):55–67, 2002. 7.4.1, 7.4.2
[Han, 2000] HAN, K.; KIM, J.. Genetic quantum algorithm and its application
to combinatorial optimization problem . In: PROCEEDINGS OF THE
2000 CONGRESS ON EVOLUTIONARY COMPUTATION, volumen 2, p.
1354–1360, 2000. 2.7
[Han, 2000] HAN, K.; KIM, J.. Genetic quantum algorithm and its application
to combinatorialoptimization problem . In: EVOLUTIONARY COMPU-
TATION, 2000. PROCEEDINGS OF THE 2000 CONGRESS ON, volu-
men 2, 2000. 3.1.4, 3.1.4, 3.1.4
Referências Bibliográficas 140
[Han, 2002] HAN, K.; KIM, J.. Quantum-inspired evolutionary algorithm for a
class of combinatorial optimization. IEEE transactions on evolutionary
computation, 6(6):580–593, 2002. 3.1.4, 3.1.4, 3.1.4
[Hartke, 1993] HARTKE, B.. Global geometry optimization of clusters using
genetic algorithms. The Journal of Physical Chemistry, 97(39):9973–
9976, 1993. 7.2
[Harima, 2000] HARIMA, Y.; KUNUGI, Y.; YAMASHITA, K. ; SHIOTANI, M.. De-
termination of mobilities of charge carriers in electrochemically anion-
doped polythiophene film. Chemical Physics Letters, 317(3-5):310–314,
2000. 5.1.1
[Hartke, 2001] HARTKE, B.; FLAD, H. ; DOLG, M.. Structures of mercury
clusters in a quantum–empirical hybrid model. Physical Chemistry
Chemical Physics, 3(23):5121–5129, 2001. 7.2
[Hartke, 2003] HARTKE, B.. Size-dependent transition from all-surface to
interior-molecule structures in pure neutral water clusters. Physical
Chemistry Chemical Physics, 5(2):275–284, 2003. 7.2
[Haykin94] HAYKIN, S.. Neural Networks: A Comprehensive Foundation.
Prentice Hall PTR Upper Saddle River, NJ, USA, 2nd edition, 1994. 3.2.3
[Haykin, 1999] HAYKIN, S.. Neural Networks – A Comprehensive Foundation.
Prentice Hall, 2 edition, 1999. 4.2.1
[Hill, 1953] HILL, D.. Nuclear Constitution and the Interpretation of Fission
Phenomena. Physical Review, 89(5):1102–1145, 1953. 6.3
[Hohenberg, 1964] HOHENBERG, P.; KOHN, W.. Inhomogeneous Electron
Gas. Physical Review, 136:B864, 1964. 2.3.2
[Hong, 2005] HONG, Z.; ZHANG, P.; HE, C.; QIU, X.; LIU, A.; CHEN, L.;
CHEN, X. ; JING, X.. Nano-composite of poly (l-lactide) and surface
grafted hydroxyapatite: Mechanical properties and biocompatibility .
Biomaterials, 26(32):6296–6304, 2005. B
[Hopfield, 1982] HOPFIELD, J.. Neural networks and physical systems with
emergent collective computational abilities. Proceedings of the national
academy of sciences, 79(8):2554–2558, 1982. 3.2.1
Referências Bibliográficas 141
[Hussain, 2007] HUSSAIN, F.; ROY, S.; NARASIMHAN, K.; VENGADASSA-
LAM, K. ; LU, H.. E-Glass Polypropylene Pultruded Nanocomposite: Ma-
nufacture, Characterization, Thermal and Mechanical Properties. Jour-
nal of Thermoplastic Composite Materials, 20(4):411, 2007. B
[Jo, 2008] JO, B.; PARK, S. ; KIM, D.. Mechanical properties of nano-MMT
reinforced polymer composite and polymer concrete. Construction and
Building Materials, 22(1):14–20, 2008. B
[Johnson, 2002] JOHNSON, S.; JOANNOPOULOS, J.. The MIT Photonic-
Bands Package. a href="http://ab-initio. mit. edu/mpb/» http://ab-initio. mit.
edu/mpb/</a. 2.5
[Johnston, 2003] JOHNSTON, R.. Evolving better nanoparticles: Genetic
algorithms for optimising cluster geometries. Dalton Transactions,
2003(22):4193–4207, 2003. 7.1, 7.2, 7.2, 7.3.3
[Jorge, 1997] JORGE, F.; DE CASTRO, E. ; DA SILVA, A.. Accurate uni-
versal Gaussian basis set for hydrogen through lanthanum generated
with the generator coordinate Hartree-Fock method. Chemical Physics,
216(3):317–321, 1997. 6.3
[Jorge, 1999b] JORGE, F.; MUNIZ, E.. Accurate adapted Gaussian basis sets
for the atoms from H through Xe. International Journal of Quantum
Chemistry, 71(4):307–312, 1999. 6.3
[Jorge, 1999] JORGE, F.; DE CASTRO, E.. Improved generator coordinate
Hartree–Fock method: application to first-row atoms. Chemical Physics
Letters, 302(5-6):454–460, 1999. 6.3, 6.5, 6.6, 6.6, 6.6, 6.6
[Kadau, 2006] KADAU, K.; GERMANN, T. ; LOMDAHL, P.. Molecular dynamics
comes of age: 320 billion atom simulation on BlueGene/L . Int. J. Mod.
Phys. C, 17:1755–1761, 2006. 2.3.1
[Klobukowski, 1993] KLOBUKOWSKI, M.. Comparison of generator formulas
for exponential parameters of Gaussian basis sets. Chemical Physics
Letters, 214, 2:166–174, 1993. 6.4, 6.4
[Klobukowski, 1994] KLOBUKOWSKI, M.. Systematic sequences of well-
balanced Gaussian basis sets. Canadian Journal of Chemistry,
72(7):1741–1752, 1994. (document), 6.4, 6.4, 6.6, 6.7, 6.8, 6.9, 6.6
[Koehler, 2000] KOEHLER, M.; DA LUZ, M. ; HUMMELGEN, I.. Bipolar tunnel-
ling injection into single-layer organic light emitting devices: analytical
Referências Bibliográficas 142
solution using the regional approximation. Journal of Physics D: Applied
Physics, 33(17):2096–2107, 2000. 5.1
[Kohn, 1965] KOHN, W.; SHAM, L.. SELF-CONSISTENT EQUATIONS IN-
CLUDING EXCHANGE AND CORRELATION EFFECTS . Physical
Review, 1965. 2.3.2
[Koza, 1992] KOZA, J.. Genetic programming: on the programming of com-
puters by means of natural selection. MIT press, 1992. 3.1.1
[Kulkarni, 2008] KULKARNI, A.; GADRE, S. ; NAGASE, S.. Quantum chemical
and electrostatic studies of anionic water clusters,(H2O)n. Journal of
Molecular Structure: THEOCHEM, 851(1-3):213–219, 2008. 7.5
[Lagutschenkov, 2005] LAGUTSCHENKOV, A.; FANOURGAKIS, G.;
NIEDNER-SCHATTEBURG, G. ; XANTHEAS, S.. The spectrosco-
pic signature of the “all-surface” to “internally solvated ” structural
transition in water clusters in the n= 17–21 size regime. The Journal of
chemical physics, 122:194310, 2005. 7.5.1
[Lathouwers, 1978] LATHOUWERS, L.. Generator-coordinate theory of mole-
cular spectra. Physical Review A, 18(5):2150–2158, 1978. 6.3
[Leach, 2001] LEACH, A.. Molecular Modelling: Principles and Applications.
Prentice Hall, 2001. 2.3.2, 2.3.2, 2.3.2, 2.3.2, 2.3.2, 2.3.2, 2.3.4, 6.2
[Lent, 1994] LENT, C.; TOUGAW, P. ; POROD, W.. Logical devices implemen-
ted using quantum cellular automata. J. Appl. Phys, 75:1818–1825,
1994. 5.2, 5.2.1
[Likholyot, 2007] LIKHOLYOT, A.; LEMKE, K.; HOVEY, J. ; SEWARD, T.. Mass
spectrometric and quantum chemical determination of proton water
clustering equilibria . Geochimica et Cosmochimica Acta, 71(10):2436–
2447, 2007. 7.5
[Ma, 2000] MA, D.; HÜMMELGEN, I.; JING, X.; HONG, Z.; WANG, L.; ZHAO,
X.; WANG, F. ; KARASZ, F.. Charge transport in a blue-emitting alterna-
ting block copolymer with a small spacer to conjugated segment length
ratio . Journal of Applied Physics, 87:312, 2000. 5.1
[Ma, 2002] MA, D.; LEE, C.; LEE, S. ; HUNG, L.. Improved efficiency by a
graded emissive region in organic light-emitting diodes. Applied Physics
Letters, 80:3641, 2002. (document), 5.1, 5.1.1, 5.1.3, 5.3, 5.1.3, 5.1.3
Referências Bibliográficas 143
[Mackay, 1992] MACKAY, D.. Bayesian interpolation. Neural computation,
4(3):415–447, 1992. 3.2.3
[Malliaras, 1998] MALLIARAS, G.; SCOTT, J.. The roles of injection and
mobility in organic light emitting diodes . Journal of Applied Physics,
83:5399, 1998. 5.1
[Mansoori, 2005] MANSOORI, G.. Principles of Nanotechnology: Molecular-
Based Study of Condensed Matter in Small Systems. World Scientific,
2005. 2.1
[Michalewicz, 1994] MICHALEWICZ, Z.. Genetic algorithms+ data structures
= evolution programs (2nd, extended ed.). Springer-Verlag New York,
Inc., New York, NY, USA, 1994. 3.1.2, 7.3.3
[Michalewicz, 1996] MICHALEWICZ, Z.. Genetic algorithms+ data structu-
res= evolution programs. Springer, 1996. 3.1.1
[Michalewicz, 1996] MICHALEWICZ, Z.. Genetic algorithms+ data structu-
res= evolution programs. Springer, 1996. 5.1.2, 5.1.2
[Mitchell, 1996] MITCHELL, M.. An introduction to genetic algorithms. Brad-
ford Books, 1996. 3.1.1
[Mohallem, 1986] MOHALLEM, J.; DREIZLER, R. ; TRSIC, M.. A Griffin-Hill-
Wheeler version of the Hartree-Fock equations. International Journal of
Quantum Chemistry, 30(s 20):45–55, 1986. 6.2, 6.3, 6.3
[Moore, 1995] MOORE, M.; NARAYANAN, A.. Quantum-inspired computing,
1995. 2.7
[Morgon, 2007] MORGON, N.; MORGON, N.; COUTINHO, K. ; COUTINHO, K..
Métodos de química teórica e modelagem molecular. Livraria da Física,
2007. 2.3.2, 2.3.2
[Nguyen, 2008] NGUYEN, Q.; ONG, Y.; SOH, H. ; KUO, J.. Multiscale Appro-
ach to Explore the Potential Energy Surface of Water Clusters (H2O)
nn? 8. The Journal of Physical Chemistry A, 112(28):6257–6261, 2008.
7.5
[Pal, 2008] PAL, R.. Mechanical properties of composites of randomly oriented
platelets. Composites Part A, 39(9):1496–1502, 2008. 4.3, 4.3.1, 4.3.1,
4.3.1, 4.3.1
Referências Bibliográficas 144
[Partridge, 1989] PARTRIDGE, H.. Near Hartree–Fock quality GTO basis sets
for the first-and third-row atoms . The Journal of Chemical Physics,
90:1043, 1989. 6.6, 6.6
[Pauling, 1985] PAULING, L.; WILSON, E.. Introduction to Quantum Mecha-
nics. Dover Publications, 1985. 2.3.2
[Paul, 2006] PAUL, B.; FUJITA, S.; OKAJIMA, M. ; LEE, T.. Modeling and
analysis of circuit performance of ballistic CNFET. Proceedings of the
43rd annual conference on Design automation, p. 717–722, 2006. 2.6
[Petroff, 1982] PETROFF, P.; GOSSARD, A.; LOGAN, R. ; WIEGMANN, W..
Toward quantum well wires: Fabrication and optical propert ies. Applied
Physics Letters, 41:635, 1982. 4.2
[Poole, 2003] POOLE, C.; OWENS, F.. Introduction to Nanotechnology. Wiley-
Interscience, 2003. 1.1
[Potter, 2000] POTTER, M.; JONG, K.. Cooperative coevolution: An architec-
ture for evolving coadapted subcomponents. Evolutionary Computation,
8(1):1–29, 2000. 3.1.3
[Reed, 1986] REED, M.; BATE, R.; BRADSHAW, K.; DUNCAN, W.; FRENSLEY,
W.; LEE, J. ; SHIH, H.. Spatial quantization in GaAs–AlGaAs multiple
quantum dots. Journal of Vacuum Science & Technology B: Microelec-
tronics and Nanometer Structures, 4:358, 1986. 4.2
[Reed, 1998] REED, R.; MARKS, R.. Neural smithing: supervised learning in
feedforward artificial neural networks . MIT Press Cambridge, MA, USA,
1999. (document), 3.8, 3.2.3, 3.2.3, 3.2.3
[Ryzhii, 2004] RYZHII, V.; KHMYROVA, I.; RYZHII, M. ; MITIN, V.. Compari-
son of dark current, responsivity and detectivity in different intersub-
band infrared photodetectors. Semiconductor Science and Technology,
19(1):8–16, 2004. 4.2
[Schmidt, 2007] SCHMIDT, K.. Nanofrontiers: Visions for the Future of Nano-
technology. Washington, DC, Project on Emerging Nanotechnooogies.
Retrieved from http://www. nanotech project. org/reports, 2007. 2.4, 4.1
[Scott, 1997] SCOTT, J.; KARG, S. ; CARTER, S.. Bipolar charge and current
distributions in organic light-emitting diodes. Journal of Applied Physics,
82:1454, 1997. 5.1, 5.1.1
Referências Bibliográficas 145
[Silva, 2006] DE ABREU E SILVA, E.; DUARTE, H. ; BELCHIOR, J.. An appro-
ach based on genetic algorithms and DFT for studying clusters:(H2O) n
(2? n? 13) cluster analysis. Chemical Physics, 323(2-3):553–562, 2006.
7.5
[Simpson, 1989] SIMPSON, J.; OTHERS. Oxford English Dictionary . Claren-
don Oxford, 1989. 2.3
[Singulani, 2008] SINGULANI, A.; VILELA NETO, O.; AURÉLIO PACHECO, M.;
VELLASCO, M.; PIRES, M. ; SOUZA, P.. Computational intelligence
applied to the growth of quantum dots. Journal of Crystal Growth,
310(23):5063–5065, 2008. 1.3
[Somorjai, 1968] SOMORJAI, R.. INTEGRAL TRANSFORM FUNCTIONS.
A NEW CLASS OF APPROXIMATE WAVE FUNCTIONS . 1968. 6.2
[Somorjai, 1969] SOMORJAI, R.. Integral transform functions. A simple non-
exponential orbital for the He series.Chemical Physics Letters, 3(6):395–
397, 1969. 6.2
[Souza, 2007] SOUZA, P. L.; LOPES, A. J.; GEBHARD, T.; UNTERRAINER, K.;
PIRES, M. P.; VILLAS-BOAS, J. M.; VIEIRA, G. S.; GUIMARAES, P. S. S.
; STUDART, N.. Quantum dot structures grown on al containing qua-
ternary material for infrared photodetection beyond 10 mu m. Applied
Physics Letters, 90(17):173510, 2007. 4.2
[Spector, 2004] SPECTOR, L.. Automatic Quantum Computer Programming
– A Genetic Programming Approach. Springer, 2004. 2.7
[Steiner, 2004] STEINER, T.. Semiconductor Nanostructures for Optoelectro-
nic Applications. Artech House, 2004. 4.2, 4.2
[Szabo, 1989] SZABO, A.; OSTLUND, N.. Modern quantum chemistry.
McGraw-Hill New York, 1989. 2.3.2, 6.1
[Tachibana, 2000] TACHIBANA, K.; SOMEYA, T.; ISHIDA, S. ; ARAKAWA, Y..
Selective growth of InGaN quantum dot structures and their micropho-
toluminescence at room temperature. Applied Physics Letters, 76:3212,
2000. 4.2
[Taniguchi, 1974] TANIGUCHI, N.; OTHERS. On the Basic Concept of Nanote-
chnology. Proc. Int. Conf. Prod. Eng, p. 18–23, 1974. 2.1
Referências Bibliográficas 146
[Thio, 2002] THIO, Y.; ARGON, A.; COHEN, R. ; WEINBERG, M.. Toughening
of isotactic polypropylene with CaCO3 particles. Polymer, 43(13):3661–
3674, 2002. B
[Tjong, 2006] TJONG, S.. Structural and mechanical properties of polymer
nanocomposites. Materials Science & Engineering R, 53(3-4):73–197,
2006. B
[Ufimtsev, 2008] UFIMTSEV, I.; MARTÍNEZ, T.. Quantum Chemistry on
Graphical Processing Units. 1. Strategies for Two-ElectronIntegral Eva-
luation. J. Chem. Theory Comput, 4(2):222–231, 2008. 2.6
[Vianna, 2004] VIANNA, J.; CANUTO, S. ; FAZZIO, A.. Teoria Quântica de
Moléculas e Sólidos. Editora Livraria de Física, 2004. 2.3.2
[VilelaNeto, 2006] NETO, O. P. V.. Simulação e síntese automática de circuitos
de autômatos celulares com pontos quânticos através de técnicas inteli-
gentes. Master’s thesis, Pontifícia Universidade Católica do Rio de Ja-
neiro, 2006. 5.2.1
[VilelaNeto, 2007] NETO, O.; PACHECO, M. ; BARBOSA, C.. Neural Network
Simulation and Evolutionary Synthesis of QCA Circuits. IEEE TRAN-
SACTIONS ON COMPUTERS, p. 191–201, 2007. (document), 2.6, 5.2,
5.2.2, 5.2.2, 5.9, 5.2.3, 5.10, 5.2.3
[Vostrikov, 2006] VOSTRIKOV, A.; DROZDOV, S.; RUDNEV, V. ; KURKINA,
L.. Molecular dynamics study of neutral and charged water clusters.
Computational Materials Science, 35(3):254–260, 2006. 7.5
[Walus, 2002] WALUS, K.; VETTETH, A.; JULLIEN, G. ; DIMITROV, V.. Design
AND Simulation OF Quantum-Dot Cellular Automata . CMC Symp. on
Microelectronics Research and Development in Canada, Ottawa, June,
2002. 2.5
[Walus, 2004] WALUS, K.; DYSART, T.; JULLIEN, G. ; BUDIMAN, R.. QCADe-
signer: A rapid design and simulation tool for quantum-dot cellular au-
tomata. IEEE Transactions on Nanotechnology, 3(1):26–31, 2004. 5.2.2
[Wang, 2004a] WANG, J.; PYRZ, R.. Prediction of the overall moduli of laye-
red silicate-reinforced nanocomposites–part I: basic theory and formu-
las. Composites Science and Technology, 64(7-8):925–934, 2004. 4.3
[Wang, 2004b] WANG, J.; PYRZ, R.. Prediction of the overall moduli of laye-
red silicate-reinforced nanocomposites–part II: analyses. Composites
Science and Technology, 64(7-8):935–944, 2004. 4.3
Referências Bibliográficas 147
[Wasserman, 1989] WASSERMAN, P.. Neural computing: theory and prac-
tice. Van Nostrand Reinhold Co. New York, NY, USA, 1989. 3.2.1, 3.2.1
[Webster, 2004] WEBSTER, T.; WAID, M.; MCKENZIE, J.; PRICE, R. ; EJIO-
FOR, J.. Nano-biotechnology: carbon nanofibres as improved neural
and orthopaedic implants. Nanotechnology, 15(1):48–54, 2004. B
[Werner, 2003] WERNER, A.; LI, F.; HARADA, K.; PFEIFFER, M.; FRITZ, T. ;
LEO, K.. Pyronin B as a donor for n-type doping of organic thin films.
Applied Physics Letters, 82:4495, 2003. 5.1
[Wong, 1975] WONG, C.. Generator-coordinate methods in nuclear physics.
Phys. Rep, 15(5), 1975. 6.3
[Wu, 2004] WU, Y.; JIA, Q.; YU, D. ; ZHANG, L.. Modeling Youngs modulus of
rubber–clay nanocomposites using composite theories. Polymer Testing,
23(8):903–909, 2004. 4.3.1
[Xiao, 1993] XIAO, Y.; WILLIAMS, D.. Genetic algorithm: a new approach to
the prediction of the structure of molecular clusters. Chemical Physics
Letters, 215(1-3):17–24, 1993. 7.2
[Zebulum, 2002] ZEBULUM, R.; PACHECO, M. ; VELLASCO, M.. Evolutionary
Electronics: Automatic Design of Electronic Circuits and Systems by
Genetic Algorithms. CRC Press, 2002. 1.1
[Zeiri, 1995] ZEIRI, Y.. Prediction of the lowest energy structure of clusters
using a genetic algorithm. Physical Review E, 51(4):2769–2772, 1995.
7.2
[Zeng, 2004] ZENG, J.; SALTYSIAK, B.; JOHNSON, W.; SCHIRALDI, D. ;
KUMAR, S.. Processing and properties of poly (methyl methacry-
late)/carbon nano fiber composites. Composites Part B, 35(2):173–178,
2004. B
[Zhang, 2004] ZHANG, Q.; YU, Z.; XIE, X. ; MAI, Y.. Crystallization and
impact energy of polypropylene/CaCO3 nanocomposites with nonionic
modifier. Polymer, 45(17):5985–5994, 2004. 4.3.1, 4.3.1, B
[Zurada, 1992] ZURADA, J.. Introduction to artificial neural systems. West
Publishing Co. St. Paul, MN, USA, 1992. 3.2.3
[da Cruz, 2004] DA CRUZ, A.; BARBOSA, C.; PACHECO, M. ; VELLASCO,
M.. Quantum-inspired evolutionary algorithms and its application to
Referências Bibliográficas 148
numerical optimization problems. Lecture notes in computer science, p.
212–217, 2004. 3.1.4
ATabela com os Experimentos dos Pontos Quânticos
Apêndice
A.
Tabelacom
osE
xperimentos
dosP
ontosQ
uânticos150
Entradas Saídassample fluxo de In Esp. Base Temp. Cresc. T Cresc. % In % Al Densidade Altura Desvio Padrão
sccm nm oC s 108PQ/cm2 nm nm1 60 50 500 3 100 0 13 15.5 1.72 60 50 500 3 100 0 1.5 12.4 1.93 60 50 500 3 100 0 2.4 17 1.14 60 50 500 3 100 0 1.8 13.8 1.55 72 50 500 2.4 100 0 0.76 11.9 1.26 60 50 500 3.6 100 0 4.76 13.7 1.57 60 50 490 3 100 0 1.88 11.7 1.18 60 50 500 4.2 100 0 8.5 15.1 0.89 60 50 500 4.8 100 0 3.16 12.6 1.1
10 60 50 500 4.6 100 0 3.32 16.2 1.111 60 50 500 3.9 100 0 5 15.4 0.812 60 50 540 4.2 100 0 64.75 26.5 3.813 60 50 520 4.2 100 0 78.25 18.7 2.814 60 50 540 4.2 100 0 23.56 29.2 5.915 60 50 515 4.2 100 0 50 18.5 1.516 66 50 520 4.2 100 0 66.5 17 217 30 50 520 4.2 100 0 0.48 25 118 76 50 520 4.2 100 0 52.25 13.8 2.819 60 50 520 4.2 100 0 92.75 16.1 2.920 60 50 520 3.8 100 0 74.5 22.5 3.721 60 50 520 3.2 100 0 18.5 26.6 2.122 60 500 500 5 52.9 0 105 7.42 1.7123 60 500 500 5 49.1 0 39 10 1.5
Apêndice
A.
Tabelacom
osE
xperimentos
dosP
ontosQ
uânticos151
Entradas Saídassample fluxo de In Esp. Base Temp. Cresc. T Cresc. % In % Al Densidade Altura Desvio Padrão
sccm nm oC s 108PQ/cm2 nm nm24 60 500 500 5 55.4 0 70.5 8.5 1.225 60 500 500 5 54.8 0 62 9.3 1.426 60 500 500 5 51.3 0 49 9.2 1.127 60 500 500 5 53.3 0 57.5 9.9 1.528 60 500 500 5.5 53 0 80 7.8 1.829 60 500 500 5.9 53.2 0 78.5 7.5 1.730 60 500 510 5.5 53 0 79 8 1.531 60 500 510 5.5 53 0 80 8.3 1.632 60 500 520 5.9 52.7 0 90 6 133 60 500 520 3.5 53.6 0 69 5.1 134 60 10 520 5.5 53.3 0 118 9.1 1.535 66 10 520 5.5 53.3 0 148 8.2 1.536 60 10 500 5.5 53.3 0 129 8.1 237 66 10 500 5.5 53.3 0 130 8.7 2.238 72 10 520 5.5 53.3 0 156 8.4 1.739 78 10 520 5.5 53.3 0 173 8.6 1.940 90 10 520 5.5 53.3 0 182 9 2.241 66 500 520 5.5 51.8 0 147 9.3 1.542 66 10 520 5.5 51.8 0 128 9.9 143 66 10 520 5.5 54.5 0 132 7.6 1.644 66 500 520 5.5 54.5 23.3 130 7.5 1.545 66 10 520 5.5 54.5 23 162 7.1 1.546 66 10 490 5.5 53.3 5.8 106.25 8.7 1.947 60 500 500 5 52.3 16.5 210 4.45 1.68
Apêndice
A.
Tabelacom
osE
xperimentos
dosP
ontosQ
uânticos152
Entradas Saídassample fluxo de In Esp. Base Temp. Cresc. T Cresc. % In % Al Densidade Altura Desvio Padrão
sccm nm oC s 108PQ/cm2 nm nm48 60 500 500 5 50.2 29 91 6.85 2.0249 60 500 500 5 52 16.5 87 5.95 3.1850 60 500 500 5 53.4 16.5 138 5.5 1.9751 60 500 500 5 52.6 11.2 6.16 2.1152 60 500 500 5 53.4 14.5 67.5 7.7 1.753 60 500 500 5 53.4 19.3 75 8.6 1.854 66 500 520 5.5 52.8 19.3 89.5 7.49 1.6455 66 500 520 5.5 50.3 19.3 109.0 7.76 1.6956 66 500 520 5.5 52.5 19.3 100.0 7.66 1.5957 66 1.5 520 5.5 52.5 19.3 120.0 9.15 2.158 66 500 520 5.5 52.5 19.3 83.0 8.57 1.8159 66 1.5 500 5.5 52.5 19.3 54.3 4.09 1.3960 66 1.5 500 6.3 52.5 19.3 235.3 7.83 2.2561 66 1.5 500 5.9 52.5 16.5 192.0 7.86 2.4762 66 1.5 520 5.5 52.5 16.1 108.25 3.57 0.9463 66 500 520 5.5 53.7 16.1 138.8 8.93 1.9964 66 500 520 6.3 52.6 16.1 126.5 6.57 1.4965 69 1.5 500 6.3 52.3 18 111.75 11.7 1.1866 66 500 520 6.3 52.3 0 114.8 8.53 1.6167 66 500 520 6 52.3 29 113.0 9.06 4.03
BTabela com os Experimentos dos Nanocompósitos
Matrizes
– DGEBPA Diglicil éter de bisfenol A
– iPP Polipropileno isotático
– PA6 Poliamida 6 (nylon)
– PLLA Poli(L- Ácido Lático) (Poly-L-Lactide Acid)
– PMMA Polimetilmetacrilato
– PP Polipropileno
– PU Poliuretano
– UP Poliester não saturado (Unsaturated Polyester)
Cargas
– CB Carbono ativado (carbon black)
– CNF Nanofibra de carbono (carbon nanofiber)
– DWCNT Nanotubo de carbono de parede dupla (double wall carbonnano-
tube)
– MMT Montmorilonita
– MWCNT Nanotubo de carbono de paredes múltiplas (multiwall carbon na-
notube)
– SWCNT Nanotubo de carbono de parede única (singlewall carbonnanotube)
Apêndice B. Tabela com os Experimentos dos Nanocompósitos 154
Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPA) ReferênciaPU – – – – 0.004 (Webster, 2004)PU CNF 0.02 60 500 0.006 (Webster, 2004)PU CNF 0.1 60 500 0.022 (Webster, 2004)PU CNF 0.25 60 500 0.028 (Webster, 2004)PP – – – – 0.71 (Zhang, 2004)PP CaCO3 0.05 44 1 0.71 (Zhang, 2004)PP CaCO3 0.1 44 1 0.74 (Zhang, 2004)PP CaCO3 0.15 44 1 0.81 (Zhang, 2004)PP CaCO3 0.15 44 1 0.78 (Zhang, 2004)PP CaCO3 0.15 44 1 0.76 (Zhang, 2004)PP CaCO3 0.15 44 1 0.74 (Zhang, 2004)PP CaCO3 0.2 44 1 0.84 (Zhang, 2004)iPP – – – – 1.437 (Thio, 2002)iPP CaCO3 0.135068 160 1 1.691 (Thio, 2002)iPP CaCO3 0.247934 160 1 1.871 (Thio, 2002)iPP CaCO3 0.425868 160 1 1.973 (Thio, 2002)iPP CaCO3 0.559779 220 1 2.697 (Thio, 2002)iPP CaCO3 0.247934 370 1 1.682 (Thio, 2002)iPP CaCO3 0.372974 370 1 1.785 (Thio, 2002)iPP CaCO3 0.474052 370 1 2.44 (Thio, 2002)iPP CaCO3 0.559779 560 1 2.867 (Thio, 2002)PP – – – – 1.6 (Chan, 2002)PP CaCO3 0.137352 44 1 2.7 (Chan, 2002)PP CaCO3 0.137352 44 1 3 (Chan, 2002)PP CaCO3 0.137352 44 1 2.5 (Chan, 2002)PP CaCO3 0.242403 44 1 3 (Chan, 2002)PP CaCO3 0.242403 44 1 2.6 (Chan, 2002)PP CaCO3 0.242403 44 1 2.9 (Chan, 2002)PP CaCO3 0.324431 44 1 2.6 (Chan, 2002)
Tabela B.1: Dados retirados de tabelas disponíveis na literatura.
Apêndice B. Tabela com os Experimentos dos Nanocompósitos 155
Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPa) ReferênciaPMMA – – – – 4.7 (Zeng, 2004)PMMA CNF (PR21PS) 0.05 200 100 8 (Zeng, 2004)PMMA CNF (PR21PS) 0.1 200 100 7.7 (Zeng, 2004)PMMA CNF (PR24PS) 0.05 100 100 7.5 (Zeng, 2004)PMMA CNF (PR24PS) 0.1 100 100 7.6 (Zeng, 2004)E–glass–PP – – – – 4.12 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.01 1 200 6.68 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.02 1 200 6.97 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.03 1 200 7.1 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.04 1 200 7.92 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.05 1 200 8.23 (Hussain, 2007)E–glass–PP MMT (1.28E) 0.1 1 200 8.67 (Hussain, 2007)PMMA – – – – 1.35 (Fu, 2006)PMMA MMT (20A) 0.005 2.42 200 1.72 (Fu, 2006)PMMA MMT (20A) 0.01 2.42 200 1.48 (Fu, 2006)PMMA MMT (20A) 0.02 2.42 200 1.39 (Fu, 2006)PMMA MMT (20A) 0.005 2.42 200 1.28 (Fu, 2006)PMMA MMT (20A) 0.01 2.42 200 1.26 (Fu, 2006)PMMA MMT (20A) 0.02 2.42 200 1.24 (Fu, 2006)Epoxy – – – – 2.599 (Gojny, 2005)Epoxy CB 0.001 30 1 2.752 (Gojny, 2005)Epoxy CB 0.003 30 1 2.796 (Gojny, 2005)Epoxy CB 0.005 30 1 2.83 (Gojny, 2005)Epoxy SWCNT 0.0005 2 500 2.681 (Gojny, 2005)Epoxy SWCNT 0.001 2 500 2.691 (Gojny, 2005)Epoxy SWCNT 0.003 2 500 2.812 (Gojny, 2005)Epoxy DWCNT 0.001 2.8 500 2.785 (Gojny, 2005)Epoxy DWCNT 0.003 2.8 500 2.885 (Gojny, 2005)Epoxy DWCNT 0.005 2.8 500 2.79 (Gojny, 2005)Epoxy DWCNT–NH2 0.001 2.8 500 2.61 (Gojny, 2005)Epoxy DWCNT–NH2 0.003 2.8 500 2.944 (Gojny, 2005)Epoxy DWCNT–NH2 0.005 2.8 500 2.978 (Gojny, 2005)Epoxy MWCNT 0.001 15 3333.3 2.78 (Gojny, 2005)Epoxy MWCNT 0.003 15 3333.3 2.765 (Gojny, 2005)Epoxy MWCNT 0.005 15 3333.3 2.609 (Gojny, 2005)Epoxy MWCNT–NH2 0.001 15 3333.3 2.884 (Gojny, 2005)Epoxy MWCNT–NH2 0.003 15 3333.3 2.819 (Gojny, 2005)Epoxy MWCNT–NH2 0.005 15 3333.3 2.82 (Gojny, 2005)
Tabela B.2: Dados retirados de tabelas disponíveis na literatura. (continuação)
Apêndice B. Tabela com os Experimentos dos Nanocompósitos 156
Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPA) ReferênciaEpoxy – – – – 3.282 (Gojny, 2004)Epoxy CB 0.1 30 1 3.297 (Gojny, 2004)Epoxy DWNT 0.1 2.8 2500 3.352 (Gojny, 2004)Epoxy DWNT–NH2 0.1 2.8 2500 3.496 (Gojny, 2004)Epoxy DWNT–NH2 1 2.8 2500 3.508 (Gojny, 2004)UP – – – – 2.994631 (Jo, 2008)UP MMT Na+ 0.02 1.17 100 3.087248 (Jo, 2008)UP MMT Na+ 0.05 1.17 100 3.515436 (Jo, 2008)UP MMT Na+ 0.08 1.17 100 3.230201 (Jo, 2008)UP MMT Na+ 0.1 1.17 100 2.851678 (Jo, 2008)UP MMT (25A) 0.02 1.85 100 3.189262 (Jo, 2008)UP MMT (25A) 0.05 1.85 100 3.655034 (Jo, 2008)UP MMT (25A) 0.08 1.85 100 3.332886 (Jo, 2008)UP MMT (25A) 0.1 1.85 100 3.097315 (Jo, 2008)UP MMT (30B) 0.02 1.86 100 2.844295 (Jo, 2008)UP MMT (30B) 0.05 1.86 100 4.033557 (Jo, 2008)UP MMT (30B) 0.08 1.86 100 3.515436 (Jo, 2008)UP MMT (30B) 0.1 1.86 100 3.148322 (Jo, 2008)PA6 – – – – 20.17752 (Tjong, 2006)PA6 SiO2 0.05 12 1 22.37711 (Tjong, 2006)PA6 SiO2 0.1 12 1 24.19246 (Tjong, 2006)PP – – – – 1.390909 (Tjong, 2006)PP SiO2 0.01 12 1 1.421818 (Tjong, 2006)PP SiO2 0.025 12 1 1.492727 (Tjong, 2006)PP SiO2 0.05 12 1 1.565455 (Tjong, 2006)PP SiO2 0.075 12 1 1.614545 (Tjong, 2006)PP SiO2 0.1 12 1 1.690909 (Tjong, 2006)PP SiO2 0.15 12 1 1.8 (Tjong, 2006)
Tabela B.3: Dados retirados de gráficos disponíveis na literatura.
Apêndice B. Tabela com os Experimentos dos Nanocompósitos 157
Concent. Tam. Razão de EMatriz Carga (wt%) (nm) Aspecto (GPA) ReferênciaPLLA (moulded) – – – – 1.855 (Hong, 2005)PLLA (moulded) g-HAP 0.02 20 5 2.34 (Hong, 2005)PLLA (moulded) g-HAP 0.04 20 5 2.553 (Hong, 2005)PLLA (moulded) g-HAP 0.06 20 5 2.553 (Hong, 2005)PLLA (moulded) g-HAP 0.08 20 5 2.644 (Hong, 2005)PLLA (moulded) g-HAP 0.1 20 5 2.68 (Hong, 2005)PLLA (moulded) g-HAP 0.15 20 5 2.98 (Hong, 2005)PLLA (moulded) g-HAP 0.2 20 5 3.161 (Hong, 2005)PLLA (moulded) HAP 0.02 20 5 2.34 (Hong, 2005)PLLA (moulded) HAP 0.04 20 5 2.42 (Hong, 2005)PLLA (moulded) HAP 0.06 20 5 2.526 (Hong, 2005)PLLA (moulded) HAP 0.08 20 5 2.631 (Hong, 2005)PLLA (moulded) HAP 0.1 20 5 2.651 (Hong, 2005)PLLA (moulded) HAP 0.15 20 5 2.954 (Hong, 2005)PLLA (moulded) HAP 0.2 20 5 3.051 (Hong, 2005)PLLA (annealed) – – – – 3.064 (Hong, 2005)PLLA (annealed) HAP 0.02 20 5 3.257 (Hong, 2005)PLLA (annealed) HAP 0.04 20 5 3.201 (Hong, 2005)PLLA (annealed) HAP 0.06 20 5 3.311 (Hong, 2005)PLLA (annealed) HAP 0.08 20 5 3.533 (Hong, 2005)PLLA (annealed) HAP 0.1 20 5 3.617 (Hong, 2005)PLLA (annealed) HAP 0.15 20 5 3.641 (Hong, 2005)PLLA (annealed) HAP 0.2 20 5 3.851 (Hong, 2005)PLLA (annealed) g-HAP 0.02 20 5 3.233 (Hong, 2005)PLLA (annealed) g-HAP 0.04 20 5 3.286 (Hong, 2005)PLLA (annealed) g-HAP 0.06 20 5 3.365 (Hong, 2005)PLLA (annealed) g-HAP 0.08 20 5 3.557 (Hong, 2005)PLLA (annealed) g-HAP 0.1 20 5 3.514 (Hong, 2005)PLLA (annealed) g-HAP 0.15 20 5 3.832 (Hong, 2005)PLLA (annealed) g-HAP 0.2 20 5 3.988 (Hong, 2005)
Tabela B.4: Dados retirados de gráficos disponíveis na literatura. (continuação)
CResultados para os agregados de Li e F
Agregados de(LiF )4Li+
-437.5591057 -437.5363501 -437.5305583
-437.5252658 -437.5241856 -437.5221094
-437.521931 -437.5197022 -437.5194124
-437.5162035 -437.5151571 -437.5138115
-437.5132765 -437.5065181 -437.5024028
-437.5022807 -437.4875088
Tabela C.1: Estruturas dos aglomerados (LiF )4Li+.
Apêndice C. Resultados para os agregados de Li e F 159
Agregados de(LiF )4
-430.1630023 -430.1497364 -430.1442856
-430.1251002 -430.1237355
Tabela C.2: Estruturas dos aglomerados (LiF )4.
Apêndice C. Resultados para os agregados de Li e F 160
Agregados de(LiF )4F−
-530,148160 -530,128213 -530,116100
-530,114973 -530,113500 -530,112855
-530,111754 -530,109168 -530,107444
-530,106252 -530,096268 -530,093002
-530,086193 -530,082332
Tabela C.3: Estruturas dos aglomerados (LiF )4F−.
Apêndice C. Resultados para os agregados de Li e F 161
Agregados de(LiF )5F−
-637,703005 -637,702522 -637689894
-637,686801 -637,686789 -637,686729
-637,681344 -637,673634 -637,670310
-637,668581 -637,666413 -637,665640
-637,655340 -637,653673
Tabela C.4: Estruturas dos aglomerados (LiF )5F−.
DSíntese de OLEDs multicamadas
Dois M-OLEDs foram fabricados para verificar a validade experimental dos
resultados encontrados nas simulações. OAlq3 e o NPB foram usados tal como
fornecidos para fabricar os dispositivos OLEDs. Anodos pré-padronizados de óxido
de índio estanho (ITO) pré-depositados em substratos de vidro (com uma resistência
de 8 (Ω/quadrado) foram limpos por tratamento RCA(Chang, 1996), enxaguados
com água deionizada, seguido de sonicação em etanol por 10 minutos.
Depois da limpeza os substratos foram secados debaixo de nitrogênio. Ca-
madas orgânicas foram depositadas em substratos à temperatura ambiente por eva-
poração térmica de cadinhos de quartzo resistivamente aquecidos em sistema com
ambiente de alto vácuo, com uma pressão base em torno de 3.10−8torr ( 4.10−6Pa)
Os M-OLEDs foram montados usando-se uma heterojunção contendo uma
camada de puro NPB (30nm), uma região graduada com cinco camadas internas
co-depositadaNPB : Alq3 (10 nm de espessura cada) e uma pura camada de
Alq3 (20nm). A região graduada foi produzida por co-deposição depuro NPB e
Alq3 de duas fontes separadas. Finalmente, sem quebrar o vácuo, uma camada de
50nm de espessura de Mg:Ag (10:1) com uma camada protetora deprata (50nm),
usada como catodo, foi co-evaporada a partir de cadinhos em taxa de 0.5nm/s em
uma segunda câmara de vácuo. A espessura das camadas puras e arazão deNPB
paraAlq3 em cada camada interna foi precisamente controlada por software in situ
através de um monitor de cristal de quartzo. Os dispositivoseletroluminecentes
fabricados apresentaram área ativa em torno de 3mm2 foram operadas em voltagens,
com ITO como eletrodo positivo eMg : Ag/Ag como eletrodo negativo. Os
dispositivos foram transferidos diretamente do sistema dedeposição para uma
câmara manipuladora com atmosfera controlada deN2 e caracterizada dentro de
uma hora após fabricação. O comportamento IxV e as medidas debrilho foram
executadas usando-se um Keithlhey2400 calibrado e um Radiômetro/Fotômetro
fabricado por United Detector Technology (UDT-350).
Livros Grátis( http://www.livrosgratis.com.br )
Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas
Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo