Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Química Vitor Daniel de Viterbo Desenvolvimento de redes neurais artificiais quânticas com aplicações em Química Belo Horizonte 2014 Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Química Vitor Daniel de Viterbo Orientador: João Pedro Braga Coorientadora: Rita de Cássia Oliveira Sebastião Desenvolvimento de redes neurais artificiais quânticas com aplicações em Química Belo Horizonte 2014 UFMG/ICEx/DQ. 1018a T. 464 Vitor Daniel de Viterbo Desenvolvimento de redes neurais artificiais quânticas com aplicações em Química Tese apresentada ao Departamento de Química do Instituto de Ciências Exatas da Universidade Federal de Minas Gerais como requisito parcial para obtenção do grau de Doutor em Ciências- Química. Belo Horizonte 2014 Para os meus avós, José Catarino, Canuta, Antônio e Geralda, e meus sobrinhos, Heitor e Hugo. “O discurso possibilitou a comunicação de ideias Habilitando os seres humanos a trabalharem juntos Para construírem o impossível As maiores conquistas da humanidade Surgiram do diálogo Nossas maiores esperanças podem se tornar realidade no futuro com a tecnologia à nossa disposição As possibilidades são ilimitadas Tudo o que precisamos fazer é ter certeza de que continuaremos falando” (Stephen Hawking) Agradecimentos Agradeço a Deus e a Nossa Senhora. Muito obrigado Professor João Pedro Braga por me buscar novamente para o mundo acadêmico e científico. Obrigado por aceitar esse trabalho e permitir que ele seja uma semente para continuarmos evoluindo nessa nova fronteira ainda cheia de conceitos e perspectivas novas. Obrigado pelo carinho de amigo e tutor. Obrigado Professora Rita de Cássia Sebastião pelo acompanhamento em momentos decisivos. O agradecimento apenas com palavras é pouco diante do significado desse trabalho em minha vida. Procurar palavras para resumir a importância da influência do grupo de pessoas que participaram desse processo ou parte dele é injusto, mas é prazeroso lembrar de cada instante de inspiração que colaborou para este momento. Obrigado minha mãe, Margot, meu pai José Vitor e minha irmã Vanessa, pelo incessante apoio familiar. Obrigado minha amiga e parceira, Lívia Salum, pelo constante apoio. Um agradecimento carinhoso para minha querida Mônica, pela inspiração e vibração pelo meu trabalho. Agradeço à Universidade Federal de Minas Gerais, por ter disponibilizado a sua estru- tura. Agradeço aos funcionários da secretaria do Departamento de Química pela atenção no atendimento. Agradeço ao CNPq pelo suporte financeiro. Resumo A Química necessita de computadores velozes para o processamento de uma grande quan- tidade de informações e dados complexos. A simulação de sistemas líquidos, a interação entre átomos e moléculas e a identificação de moléculas necessitam de computadores mais eficientes para a solução desses problemas. Esta tese descreve a pesquisa, modelagem e desenvolvimento de uma rede neural artificial usando os conceitos da Computação Quântica para trabalhar como uma rede neural quântica. Esta tese também implementa o estudo de um algoritmo quântico de procura e o estudo dos estados ligados que os dímeros do gás hélio, HeNe, HeAr, HeKr e HeXe podem suportar. Três abordagens foram seguidas: a) o método da fase variável, para gerar dados. b) redes neurais clássicas, usando os dados gerados anteriormente. c) redes neurais quânticas. O foco é a validação e testes do conceito das redes neurais quânticas, com base na informação obtida das redes neurais artificiais clássicas, acopladas a um algoritmo quântico. Uma rede neural quântica foi modelada para aprender o comportamento de um sistema químico estudado anteriormente. O conceito da Computação Quântica e do computador quântico mostra a evolução com- plexa da computação clássica bem como uma mudança de conceito em termos de circuitos (hardware) e algoritmos (software). Palavras-chave: Computação Quântica, Rede Neural Artificial Quântica, Algoritmo Quântico, Dímeros de gás hélio. ix Abstract Processing of complex data and in large amount requires the use of high-speed compu- ters in Chemistry. Liquids systems simulations, atoms and molecules interaction and their identification require computers more robust to solve these problems. This thesis describes the research, modeling and development of a neural network that utilizes the Quantum Computation to work as a quantum neural network. Additionally, this thesis implements studies of a quantum search algorithm and number of bounds states helium gas dimers, HeNe, HeAr, HeKr and HeXe can withstand. Three steps were followed A) variable phase method, for data generation B) classical neural network, using data generated by the step above. C) quantum neural network. The purpose of following these three steps was to validate the quantum neural network. The validation was based on the information generated by the classic neural network coupled to a quantum algorithm to model a quantum neural network, which will learn the behavior of a chemical system previously studied. Quantum Computation and computer approaches proves the complex evolution of classic computing as well as changes related to hardware and software concepts. Key-words: Quantum Computation, Quantum Artificial Neural Network, Quantum Algorithm, Helium Dimers. x Lista de Figuras 2.1 Esboço da máquina de Turing. . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.2 Símbolo da Porta NOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 Símbolo da porta AND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.4 Símbolo da Porta OR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.5 Símbolo da porta XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6 Porta XOR obtida a partir da combinação de portas básicas . . . . . . . . . 13 2.7 Meio somador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.8 O primeiro transistor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.9 Estrutura física do transitor de silício (direita) e seu símbolo (esquerda) . . . 14 2.10 Comparação entre um sinal digital e um sinal analógico. . . . . . . . . . . . 16 2.11 Comparação entre um sinal digital e um sinal analógico. . . . . . . . . . . . 17 2.12 Versão simplificada de uma UCP. . . . . . . . . . . . . . . . . . . . . . . . . 18 2.13 Diagrama em blocos de um sistema mínimo. . . . . . . . . . . . . . . . . . . 19 3.2 Neurônio biológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.3 Conexões sinápticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.4 Um modelo matemático para neurônio. . . . . . . . . . . . . . . . . . . . . 25 3.5 RNA genérica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.6 Função de ativação logsig. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.7 Função de ativação do tipo tangente hiperbólica. . . . . . . . . . . . . . . . . 32 4.1 Pontos calculados utilizando-se o polinômio de Morsali. . . . . . . . . . . . . 41 4.2 Modedo de um RNA para estudo de g(r). . . . . . . . . . . . . . . . . . . . 41 4.3 Comparação entra os pontos gerados para g(r) . . . . . . . . . . . . . . . . . 43 4.4 RNA para o cálculo de g(r, ρ). . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.5 Superfície para o treinamento da RNA. . . . . . . . . . . . . . . . . . . . . . 45 4.6 Decaimento do erro da RNA para o conjunto de dados [r, ρ, g(r, ρ)]. . . . . . 46 xi 4.7 Comparação entre a superfície prevista (superior), que foi deslocada três uni- dades de g(r) para cima, somente para efeito de comparação com a superfície a simulada (inferior). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.8 RNA modelada para o cálculo de g(r, ρ, T ). . . . . . . . . . . . . . . . . . . . 48 4.9 comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 0.9. . . . . . . . . 51 4.10 comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 1.0. . . . . . . . . 52 4.11 comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 7 e T ∗ = 1.0. . . . . . . . . 53 5.1 Deslocamento de fase para o dímero HeKr . . . . . . . . . . . . . . . . . . . 65 5.2 Energia potencial (linha cheia, espessa), deslocamento de fase (linha cheia, fina) e equação MFV para o dímero HeXe (linha pontilhada) . . . . . . . . . 66 5.3 Mudança de fase para HeHe . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.4 RNA modelada para o estudo da formação de estados ligados, em que j é o número total de neurônios da camada oculta, determinado experimentalmente. 73 5.5 Qualidade do aprendizado em função do número de neurônios, em que a linha pontilhada é a função custo da rede e a linha cheia é o desvio em relação ao dado de validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.6 Qualidade do aprendizado em função do número de neurônios, em que a linha pontilhada é a função custo da rede e a linha cheia é o desvio em relação ao dado de validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.7 Decaimento do erro da RNA em épocas . . . . . . . . . . . . . . . . . . . . . 76 6.1 Esfera de Bloch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.2 Esquema da porta quântica CNOT . . . . . . . . . . . . . . . . . . . . . . . 85 6.3 Defeito no diamante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 6.4 Porta quântica com rotação controlada. Em que el. representa o spin do elétron e nucl. representa o spin do núcleo. . . . . . . . . . . . . . . . . . . . 88 6.5 Porta de Toffoli. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 6.6 Diagrama em blocos proposto para o computador quântico. . . . . . . . . . . 90 7.1 Inversão na média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 7.2 Fluxograma do algoritmo de Grover . . . . . . . . . . . . . . . . . . . . . . . 97 7.3 Potencial Harmônico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7.4 Potencial Harmônico invertido para adequação ao algoritmo de Grover . . . 105 xii 7.5 Estado de |ψ〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.1 Símbolo da Porta NOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.2 Símbolo da porta XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.3 Linha do desenvolvimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.4 Neurônio Quântico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 8.5 Modelo de um neurônio quântico baseado na porta CNOT, em que os dois terminais do lado esquerdo são as entradas de estímulos e os dois terminais do lado direito são as saídas de estímulos. . . . . . . . . . . . . . . . . . . . . . 112 8.6 Modelo proposto para um neurônio quântico . . . . . . . . . . . . . . . . . . 114 8.7 Rede neural quântica estruturada . . . . . . . . . . . . . . . . . . . . . . . . 122 8.8 Matrix de Hadamard de 64 por 64 termos, em que os quadrados brancos equivalem a “1” e os quadrados escuros equivalem a “-1”. . . . . . . . . . . . 123 8.9 Identificação do registro de maior probabilidade de encontrar a solução, carac- terizando o treinamento da RNAQ. . . . . . . . . . . . . . . . . . . . . . . . 124 xiii Lista de Tabelas 2.1 Equivalências entre o sistema decimal e o sistema binário . . . . . . . . . . . 8 2.2 Tabela verdade da porta NOT. . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 Tabela verdade da porta AND . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.4 Tabela verdade da porta OR . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.5 Comportamento da porta OR . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.6 Tabela verdade da porta XOR . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4.1 Constantes geradas para a equação 4.7 . . . . . . . . . . . . . . . . . . . . . 42 4.2 Constantes geradas para a equação 4.9 . . . . . . . . . . . . . . . . . . . . . 49 4.3 Constantes geradas para a equação 4.9 . . . . . . . . . . . . . . . . . . . . . 50 5.1 Comparação de S obtida via o método de Numerov (assumido como “exato”) e via método da fase variável (calculado) . . . . . . . . . . . . . . . . . . . . 61 5.2 Parâmetros para o potencial de Tang . . . . . . . . . . . . . . . . . . . . . . 62 5.3 Relação dos estados ligados para diferentes dímeros de gases nobres . . . . . 64 5.4 Análise sensitiva do potencial de Tang(HeHe) . . . . . . . . . . . . . . . . . 68 5.5 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeNe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.6 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeAr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.7 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeKr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.8 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeXe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.9 Representação numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 5.10 Relação dos estados ligados para diferentes dímeros de gases nobres, saída da RNA cássica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.11 Comportamento da RNA no cálculo de estados ligados . . . . . . . . . . . . 76 xiv 6.1 Comportamento da porta CNOT . . . . . . . . . . . . . . . . . . . . . . . . 86 7.1 Correlação entre o estado quântico de um registro e o espectro . . . . . . . . 100 7.2 Correlação entre o estado quântico de um registro e o espectro . . . . . . . . 103 7.3 Correlação entre o estado quântico de um registro . . . . . . . . . . . . . . . 104 7.4 Estado final do oráculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.1 Correspondência entre a Rede Neural Clássica e a Rede Neural Quântica . . 113 8.2 Função XOR reproduzida pelo neurônio quântico. . . . . . . . . . . . . . . . 114 8.3 Relação dos estados ligados para diferentes dímeros de gases nobres . . . . . 115 8.4 Codificação dos elétrons do Criptônio para o uso na RNAQ . . . . . . . . . . 116 8.5 Determinação do número de estados ligados por uma RNAQ algorítimo do Grover. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 xv Lista de abreviaturas e siglas CC Computação Clássica CQ Computação Quântica DVD Digital Versatile Disc IA Inteligência Artificial IV Infravermelho ENIAC Electrical Numerical Integrator and Computer ERIV Espectro na Região do Infravermelho MFV Método da Fase Variável MMC Método de Monte Carlo MMCM Método de Monte Carlo Metroplis MLP MultiLayer Perceptron NAV Números Aleatórios Verdadeiros NPA Números Pseudo-Aleatórios OPFS Operações de Ponto Flutuantes por Segundo RNA Rede Neural Artificial RNAQ Rede Neural Artificial Quântica UCP Unidade Central de Processamento xvi Sumário 1 Introdução geral 1 2 Noções sobre a computação clássica 4 2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2 A máquina de Turing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3 O bit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.4 Portas lógicas e os circuitos lógicos . . . . . . . . . . . . . . . . . . . . . . . 8 2.5 Estrutura básica de um computador clássico . . . . . . . . . . . . . . . . . . 17 2.6 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3 Noções sobre redes neurais artificiais clássicas 22 3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2 Um modelo matemático para um neurônio . . . . . . . . . . . . . . . . . . . 25 3.3 O perceptron de múltiplas camadas . . . . . . . . . . . . . . . . . . . . . . . 26 3.4 A propagação dos estímulos em uma RNA . . . . . . . . . . . . . . . . . . . 28 3.5 O treinamento das Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . 29 3.6 A função de ativação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.7 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4 A função de distribuição radial modelada via RNA 37 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 4.2 O modelo de Morsali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.3 O modelo de Bamdad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.4 Simulação de líquidos via redes neurais em função de r . . . . . . . . . . . . 40 4.5 Resultados obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.6 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 5 O estudo dos estados ligados de dímeros com o He via RNA clássica 55 5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 xvii 5.2 Análise da formação de estados ligados em dímeros de He . . . . . . . . . . . 57 5.2.1 O método da fase variável . . . . . . . . . . . . . . . . . . . . . . . . 59 5.2.2 O potencial de dímeros de gases nobres . . . . . . . . . . . . . . . . . 61 5.2.3 Os estados ligados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.3 Resultados e discussão sobre a determinação do número de estados ligados . 63 5.3.1 Análise sensitiva do potencial em relação ao parâmetro C6. . . . . . . 68 5.4 Previsão do número de estados ligados via RNA clássica . . . . . . . . . . . 70 5.5 Resultados e discussão sobre o uso de uma RNA para a determinação de estados ligados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.6 Conclusões gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6 A Computação Quântica e o computador quântico 79 6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 6.2 Conceitos básicos da computação quântica . . . . . . . . . . . . . . . . . . . 80 6.3 O qubit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 6.4 A Porta CNOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 6.5 Realização experimental da porta CNOT . . . . . . . . . . . . . . . . . . . . 87 6.6 O computador quântico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 6.7 Conclusões gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 7 Algoritmo de Grover 92 7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 7.2 O algoritmo quântico de busca . . . . . . . . . . . . . . . . . . . . . . . . . . 93 7.3 Inversão seletiva de fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 7.4 Inversão seletiva da fase na média (Amplificação) . . . . . . . . . . . . . . . 96 7.5 Identificação de moléculas utilizando o algoritmo de Grover . . . . . . . . . . 98 7.6 Resultados e discussão sobre a aplicação do algoritmo de Grover . . . . . . . 102 7.6.1 Identificação de moléculas utilizando o algoritmo de Grover . . . . . 103 7.6.2 Determinação do mínimo de um potencial . . . . . . . . . . . . . . . 104 7.7 Conclusões gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8 Redes neurais quânticas aplicadas ao estudo de estados ligados de dímeros de He 108 8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.2 Um modelo para o neurônio quântico . . . . . . . . . . . . . . . . . . . . . . 110 8.3 A propagação em um neurônio quântico . . . . . . . . . . . . . . . . . . . . 112 8.4 A função XOR por redes neurais quânticas . . . . . . . . . . . . . . . . . . . 113 xviii 8.5 Determinação do número de estados ligados via RNAQ . . . . . . . . . . . . 115 8.6 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 9 Conclusão geral 127 Referências Bibliográficas 131 xix Capítulo 1 Introdução geral A utilização dos computadores para cálculos científicos permitiu obter resultados até então inviáveis para serem feitos algebricamente. Em especial, na química, é utilizado massivamente. Vários processos ainda demandam tempo computacional, logo, a busca por máquinas mais rápidas e eficientes está em evidência. O conceito de computador quântico teve seu princípio em meados de 1981, quando Richard Feynman iniciou as especulações sobre uma máquina computacional mais eficiente utilizando a mecânica quântica [1]. O conceito da computação quântica foi inicialmente identificado no trabalho de Benioff, quando foi proposto um modelo para uma máquina de Turing de natureza quân- tica [2]. O interesse aumentou quando Shor [3] em 1994 mostrou que os números podem ser tratados no tempo por um polinômio em um computador quântico. Grover [4] em 1996 desen- volveu um algoritmo quântico capaz de efetuar buscas em um banco de dados representado em binário, hoje conhecido como algoritmo de Grover. Esses dois algoritmos tornaram-se referências nos estudos relacionados à computação quântica. Algoritmos quânticos já vêm sendo utilizados na computação para a criptografia na transferência de dados [5]. Um algoritmo quântico promete ser mais veloz e solucionar problemas com maior eficiência do que o algoritmo clássico. Alguns estudos mostram que problemas complexos para os computadores clássicos podem ser resolvidos por um compu- 1 tador quântico de forma mais eficiente [6]. Como, por exemplo, na criptografia de dados em transmissões de informações. Com base nessas perspectivas e no avanço das pesquisas, abre-se um grande espaço de aplicações desta tecnologia [7]. Estudar as características da computação quântica torna-se fundamental para adequá-la às áreas de interesse. Há a neces- sidade do estudo dos conceitos da computação clássica dentro da computação quântica, para aproveitamento de conversão dos atuais algoritmos [8, 9]. O presente trabalho tem como objetivo principal verificar a possibilidade de ex- plorar o conceito de Computação Quântica (CQ) na modelagem de sistemas físico-químicos, tendo como meta executar um algorítimo quântico na solução de um problema diretamente ligado à química e a modelagem de uma rede neural artificial quântica. Assim, um con- junto de sistemas foi estudado por metodologias clássicas, com o objetivo de gerar material para, posteriormente ser agrupado, de forma a constituir um caminho completo, desde a caracterização de um problema em química e a sua modelagem dentro da CQ. O conteúdo desenvolvido está apresentado nos oito capítulos seguintes, sendo que no Capítulo 2, foi abordado o conceito básico da computação clássica, bem como seus princí- pios, para o suporte ao entendimento da teoria da computação quântica. Foram destacadas neste capítulo, as portas lógicas, por se tratar da base necessária para a construção de um computador atual. Foi, também, citada a Máquina de Turing, por ser um modelo para o estudo de um sistema computacional e posteriormente relacionada com a arquitetura de Neu- mann na qual os computadores atuais são organizados. O principal objetivo desse capítulo é apresentar o bit, como menor unidade de informação, a porta NOT e a porta XOR, que serão base para o entendimento da CQ. No Capítulo 3, está apresentada a teoria sobre redes neurais artificiais clássicas, cujo entendimento é fundamental para o desenvolvimento de Redes Neurais Artificiais Quân- ticas (RNAQ). O Capítulo 4 apresenta o estudo da função de distribuição radial via Redes Neurais Artificiais Clássicas (RNAC), com o objetivo de mostrar a modelagem e o comportamento de uma rede em um problema de natureza físico-química. Nesse estudo é mostrada a abordagem clássica e uma abordagem utilizando-se uma ferramenta da inteligência artificial, a RNA. Neste caso foi proposta uma nova forma de representar um sistema composto por um líquido através de uma equação baseada em uma rede neural artificial, caracterizado pela função de distribuição radial g(r). 2 O Capítulo 5 apresenta um estudo na área de físico-química e física-quântica, sendo um trabalho sobre espalhamento quântico e o estudo da formação de estados ligados com átomos de hélio. No trabalho sobre espalhamento explora-se o uso da computação clássica para cálculos quânticos. O sistema quântico é representado de forma numérica e algorítimos são usados para a resolução do problema. Os resultados dessa parte do trabalho formam uma base de informações adotadas como a simulação de um sistema real, com o objetivo de serem adotadas como resultado equivalente a um experimento, para a modelagem e validação de uma RNAQ. Os estudos apresentados neste capítulo foram publicados em dois artigos (Anexos). O Capítulo 6 apresenta os conceitos sobre a computação quântica e seu estado da arte. Posteriormente, foram implementados algoritmos quânticos permitindo explorar as suas possíveis aplicações em química, como descrito no Capítulo 7 que apresenta o estudo sobre o Algoritmo de Grover aplicado à uma análise na espectroscopia na região do infravermelho. Finalmente, no Capítulo 8 é apresentado o conceito de um modelo para um neu- rônio quântico e uma aplicação de uma RNAQ, usando como dados as informações obtidas no desenvolvimento deste trabalho e apresentadas no Capítulo 5 e o capítulo (9) apresenta as conclusões gerais. 3 Capítulo 2 Noções sobre a computação clássica 2.1 Introdução Em 1936 Alan Turing publicou um trabalho sobre o que seria uma máquina base para o desenvolvimento de qualquer máquina capaz de efetuar cálculos numéricos que pode ser denominado computação. Em 1946 foi criado o primeiro computador eletrônico digital, Electrical Numerical Integrator and Computer (ENIAC), por John Eckert e John Mauchly, com a participação de Jonh von Neumann. Este era fabricado com mais de 17.000 válvulas a vácuo. As contribuições de Von Neumann foram fundamentais para o desenvolvimento da computação clássica [10]. John von Neumann introduziu a idéia de cérebros eletrônicos [11, 12], que consistia em modelar a arquitetura do computador segundo o sistema nervoso central humano, utilizando a álgebra de Boole [13] e os sistemas binários. Com a invenção do componente eletrônico chamado transistor, que substituiu a válvula, e dos circuitos integrados, que miniaturizaram os circuitos eletrônicos, a capaci- dade de processamento e a velocidade dos computadores evoluiram significativamente. Os computadores populares são, hoje, mais compactos e mais poderosos que o ENIAC. Os com- putadores podem chegar a 109 operações de ponto flutuante por segundo (OPFS) e 1015 OPFS no caso dos supercomputadores. O termo computação clássica (CC) será adotado 4 para se referenciar aos computadores atuais. 2.2 A máquina de Turing Um dos conceitos fundamentais da computação é a máquina de Turing (Figura 2.1). Este dispositivo caracteriza-se como uma plataforma na qual um algoritmo válido deve ser capaz de entrar em operação e envolve os conceitos das funções computáveis, dos números computáveis e da computabilidade [14]. Figura 2.1: Esboço da máquina de Turing. A máquina de Turing foi idealizada por Alan Turing [15]. Trata-se de uma má- quina abstrata, mas com conceitos válidos para as máquinas reais. Em seu trabalho Turing descreveu muito mais que uma máquina. Na realidade foi também elaborada uma “lingua- gem” que define o comportamento lógico de um sistema computacional e um modelo com regras, em que podem se basear os projetos dos sistemas conhecidos hoje como computadores. Pode-se identificar na máquina de Turing três partes fundamentais: uma fita linear; uma cabeça de leitura e escrita; e uma unidade de controle. A fita da máquina de Turing A fita é um dispositivo para o registro de informações. Ela deve ter a propriedade de guardar uma informação, permitir que esta informação seja apagada e também deve permitir que a informação possa ser substituída por outra. Leitura e escrita 5 A cabeça de leitura e escrita tem a função de escrever (registrar), um único símbolo dentro de um quadrado da fita, bem como ler um símbolo previamente escrito na fita e apagar um símbolo previamente escrito na fita. A máquina A unidade de controle é um dispositivo com diferentes funções: controlar o movi- mento da fita, receber um símbolo lido pela cabeça de leitura/escrita; enviar um símbolo para ser escrito na fita pela cabeça de leitura/escrita; fazer com que a cabeça de leitura/escrita apague um símbolo na fita; assumir qualquer estado dentro de um número finito de estados. Para a máquina computar um número, deve ser criada uma seqüência de estados, leitura e escrita e movimentos da fita. Essa breve introdução sobre a máquina de Turing tem como objetivo situar o trabalho em relação aos princípios utilizados no desenvolvimento dos computadores clássi- cos, além de fornecer um fundamento teórico, em relação às máquinas, para se explorar a computação quântica. O projeto de uma máquina real, baseada na máquina de Turing, envolve a elabo- ração de conjunto de símbolos que possibilitem a comunicação com o operador. As regras de comportamento da unidade de controle devem ser implementadas na forma de circuitos eletrônicos. A álgebra de Boole é a ferramenta básica para o desenvolvimento dos circuitos eletrônicos na máquina real. A álgebra de Boole A álgebra de Boole teve sua origem na publicação de Boole [16] em 1854. Em seu trabalho, Boole cria uma estrutura baseada em comportamentos lógicos e valores discretos. Boole propôs um conjunto de leis para formar e expressar o raciocínio lógico. Os termos “equação lógica” e “função lógica” são empregados para denotar qual- quer função envolvendo as variáveis lógicas x, y, etc. O trabalho de Boole é bem mais extenso do que é descrito nesse trabalho, porém a descrição aqui apresentada é o suficiente para in- troduzir o assunto e fornecer uma base para uma discussão sobre os fundamentos necessários para propor um computador quântico. O Álgebra de Boole é utilizada em sistemas numéricos 6 binários, cuja menor unidade de informação é o bit. 2.3 O bit O código binário é a base numérica utilizada na máquina de Turing. Diferente- mente do código decimal, que possui dez símbolos que vão de 0 (zero) a 9 (nove), o código binário possui apenas dois símbolos, o 0 (zero) e o 1 (um). Cada combinação de zeros e uns representa uma informação chamada de bit, que pode assumir o valor zero, chamado de nível lógico zero (NL 0) ou o valor um chamado de nível lógico um (NL 1). Surge então um sistema binário, composto por duas situações. Essas situações podem ser rotuladas em vários aspectos e usadas para indicar situações discretas, como verdadeiro ou falso, aceso ou apagado, aberto ou fechado, ativado ou desativado, zero ou um, ligado ou desligado. No estudo de sistemas computacionais os números decimais serão representados pelos algarismos seguidos pela letra D indicando a base decimal, por exemplo o número 10 (dez) passa a ser representado por 10D. Os números binários serão representados pe- los algarismos e pela letra B, por exemplo, o número binário 10, que é equivalente ao 2 (dois) em decimal, é representado por 10B. Essa representação será adotada quando houver a necessidade de se trabalhar com números na base decimal e na base binária durante o desenvolvimento deste trabalho. Diferentemente do sistema decimal em que os valores relativos dos algarismos são organizados, como por exemplo, em unidades (100), dezenas (101), centenas(102), o código binário tem a base 2 e suas casas são potências de 2, como por exemplo, 20, 21 e 22. A quantidade representada é definida como uma combinação de dígitos binários e sendo obtida de acordo com a expressão N = m∑ n=0 Dn × 2n (2.1) em que N é um número inteiro, m é o número de bits usados para se representar o valor em binário e Dn é o valor absoluto do bit n. A combinação de oito bits formam um Byte. O Byte é utilizado para a represen- tação de grandes quantidades de dados. As máquinas digitais trabalham com a manipulação de zeros e uns na forma de Bytes. 7 A Tabela 2.1 contém algumas relações entre as representações de números na base decimal e na base binária. Tabela 2.1: Equivalências entre o sistema decimal e o sistema binário para valores inteiros entre zero e dez Decimal Binário 0 0000 1 0001 2 0010 3 0011 4 0100 5 0101 6 0110 7 0111 8 1000 9 1001 10 1010 2.4 Portas lógicas e os circuitos lógicos As portas lógicas são dispositivos que, ao estarem combinados, permitem repro- duzir a matemática e o comportamento lógico nos sistemas digitais e permitem implementar, fisicamente, a álgebra de Boole. Essas portas são caracterizadas pelo seu símbolo, sua tabela de comportamento chamada de “tabela verdade” e sua expressão lógica. A tabela verdade de uma porta lógica contém as variáveis de entrada e de saída e seus possíveis estados em função da lógica. Essas portas são descritas a seguir. Os sistemas digitais são baseados nas portas lógicas conhecidas como NOT, AND e OR. As outras portas lógicas são obtidas a partir da combinação dessas três. A porta lógica NOT A porta mais simples da eletrônica digital é a porta NÃO, muito conhecida na literatura como porta NOT. Esta porta é a implementação física da função NOT f(x) = (1− x) (2.2) em que x é um bit, então f(0) = 1 e f(1) = 0. 8 Essa regra funcionará para um bit e para um vetor de dimensão n, cujos elementos são bits no estado 0 ou no estado 1. O símbolo da porta NOT é mostrado na Figura 2.2, em que A é a entrada, e S é a saída da porta. Figura 2.2: Símbolo da Porta NOT O comportamento da porta NOT segue a tabela verdade (Tabela 2.2). Tabela 2.2: Tabela verdade da porta NOT. Entrada A Saída S 0 1 1 0 A expressão lógica que representa esta porta é S = A (lê-se S é igual a A bar- rado). Essa porta pode ser construída utilizando-se um componente eletrônico conhecido como transistor de junção bipolar (TJB). Porta lógica AND A porta lógica AND é a implementação da função lógica AND. A função lógica AND é representada pela expressão f(x, y) = xy (2.3) em que x = 0 ou x = 1 e y = 0 ou y = 1 (x ∈ N| x = 0 ou x = 1)(y ∈ N| y = 0 ou y = 1). A lógica AND entre A e B é definida como o produtório dos elementos dispostos em uma mesma linha da matriz de estados possíveis para as entradas da porta AND (Equação 2.4). 9 E(A,B) = 2∏ j=1 cij (2.4) em que i é a linha da matriz C que contém as combinações referentes aos estados de A e B , equivalentes a ai e bi, e j = 0 refere-se à linha da matriz C. A porta é composta por entradas equivalentes às variáveis da função e uma saída, equivalente ao valor que a função assume, de acordo com os valores das variáveis de entrada. O símbolo da porta AND é mostrado na Figura 2.3. Figura 2.3: Símbolo da porta AND A expressão para a porta é S = A.B, em que S é a saída da porta1. A tabela verdade da porta AND é mostrada na Tabela 2.3. Tabela 2.3: Tabela verdade da porta AND Entrada A Entrada B Saída S 0 0 0 0 1 0 1 1 1 1 0 0 A porta lógica OR A função lógica OU, mais conhecida pelo seu nome em inglês OR, representa a soma lógica, dentro da definição de Boole [16]. Nesta função basta que uma das variáveis seja 1 para que o valor da função seja 1 (Tabela 2.4). O comportamento da porta OR (Figura 2.4), segue a Tabela 2.5. 1Nos circuitos físicos, as variáveis de entrada são sinais elétricos 10 Tabela 2.4: Tabela verdade da porta OR Entrada A Entrada B Saída S 0 0 0 0 1 1 1 1 1 1 0 1 Figura 2.4: Símbolo da Porta OR Tabela 2.5: Comportamento da porta OR Entrada A Entrada B Saída S 0 0 0 0 1 1 1 0 1 1 1 1 A expressão Lógica é S = A+B. O sinal “+” não efetua exatamente a mesma operação da matemática. Ele difere no fato de que na matemática 1 + 1 = 2 e na eletrônica digital 1 + 1 = 1. Será mostrado posteriormente que a soma em binário terá outro símbolo e será efetuada por uma combinação de portas lógicas. Não há uma porta lógica que efetue sozinha uma soma idêntica à soma encontrada na matemática. A combinação de portas lógicas tem o objetivo criar circuitos digitais capazes de efetuar operações lógicas e aritméticas. Nos circuitos combinacionais a ativação da saída de- pende dos estados das entradas. Um exemplo de um circuito combinacional é o decodificador de binário para decimal em que cada combinação binária ativa uma saída que representa o número decimal equivalente. Esse decodificador é um gerador de produtos canônicos que permite, a cada combinação binária, gerar uma base canônica para um espaço vetorial de n 11 dimensões. A porta lógica XOR A porta XOR, é utilizada na construção da Unidade Lógica e Aritmética presente nos microprocessadores atuais. A expressão lógica da porta XOR é S = A ⊕ B. O símbolo está representado na Figura 2.5. Figura 2.5: Símbolo da porta XOR. O comportamento da porta XOR segue a Tabela 2.6 Tabela 2.6: Tabela verdade da porta XOR Entrada A Entrada B Saída S 0 0 0 0 1 1 1 0 1 1 1 0 A função exclusive-OR, ou XOR, é fundamental na implementação da aritmética dentro da lógica, sendo um componente responsável por parte do processo de soma de dois bits. A expressão desta função é x(1 − y) + y(1 − x). Essa expressão é uma combinação de funções lógicas. O termo 1 − y é o NOT de y, o termo 1 − x é o NOT de x, os produtos, x(1− y) e y(1− x), são a AND entre x e 1− y e a AND entre y e 1− x, respectivamente. A soma é a mesma da lógica OR. A expressão lógica desta combinação é S = A.B + A.B (2.5) 12 Esta porta é obtida da combinação das portas lógicas básicas Figura 2.6. Figura 2.6: Porta XOR obtida a partir da combinação de portas básicas A porta XOR permite implementar, em binário, o comportamento da primeira casa binária no processo de soma. Pois, 0 + 0 = 0, 0 + 1 = 1, 1 + 0 = 1 e 1 + 1 = 0, como na tabela verdade da porta XOR, mostrada anteriormente. Como a XOR só possui uma saída, torna-se necessária a adição de uma segunda porta para tratar o “vai um”. O “vai um” só ocorre quando os dois bits que estão sendo somados são iguais a “1”, 1+1 = 0, a porta AND apresenta o comportamento ideal para esse caso, pois, de acordo com a sua tabela verdade, somente quando os dois bits em suas entradas forem iguais a “1”, a sua saída vai assumir o valor “1”. Logo a soma de dois bits (bit A e o bit B) é implementada por um circuito com duas expressões, XOR(bit A, bit B), para a soma, e AND(bit A, bit B), para o “vai um”. O bit A e o bit B atuam simultaneamente na porta XOR e na AND. O circuito que representa o meio somador esta representado na Figura 2.7. Figura 2.7: Meio somador Portas lógicas em chips de silício 13 As portas lógicas são construídas utilizando-se o transistor (Figura 2.8) desenvol- vido a partir de chips de silício. Figura 2.8: O primeiro transistor1. O cristal de silício é dopado com impurezas de forma a criar materiais do tipo n, com excesso de elétrons, e materiais do tipo p, com escassez de elétrons chamadas de lacunas. Os materiais são dispostos em três camadas (Figura 2.9), que participam da condução de elétrons, e uma quarta camada base para a montagem do transístor, formando um transistor npn ou o transistor pnp. A primeira camada é chamada de coletor, a segunda (do meio) é chamada de base e a terceira é chamada de emissor. Quando elétrons são injetados ou retirados da camada da base, ocorre um fluxo intenso de elétrons do emissor para o coletor. Figura 2.9: Estrutura física do transitor de silício (direita) e seu símbolo (esquerda) 1. 1 1 14 Cada transistor, mede aproximadamente 45nm de comprimento, com mais de 100 átomos. Os microprocessadores atuais pode conter mais de 800 milhões de transistores. O transistor funciona como uma válvula controlando o fluxo de elétrons. Basica- mente controla-se um fluxo intenso de elétrons a partir de um fluxo de elétrons bem menor. A razão β entre o fluxo maior e o fluxo menor pode chegar a mais de 1.000 vezes. O transistor é utilizado como um amplificador de sinais. Sinais digitais e sinais analógicos Os sistemas computacionais atuais são baseados na eletrônica digital. Não há como falar sobre o termo digital sem mencionar o termo analógico. Muito se discute sobre a diferença de um sistema analógico de um sistema digital. Como eles são sempre comparados, deve-se estabelecer corretamente a relação entre esses sistemas. O sistema digital não é o oposto do sistema analógico. O sistema digital trata-se de uma discretização do sistema analógico. Os equipamentos atuais podem ser puramente analógicos, puramente digitais ou um misto das duas tecnologias. Em certos casos um equipamento é classificado como digital, mas manipula informações de natureza analógica. Os telefones celulares são um exemplo. Os celulares digitais transmitem e recebem os sinais da voz codificados em sinais digitais, mas são utilizados para a transmissão do sinal da voz proveniente dos humanos que é um sinal analógico. A caracterização de um sistema como analógico ou digital pode ser feita em função do tipo de sinal em que esse sistema atua. A função f(x) = sen(x) + 1 2 (2.6) pode assumir “infinitos valores” entre zero e um, de forma que isso a caracteriza como um sinal analógico. Os sinais analógicos são contínuos ao longo do tempo. Ao se gerar um sinal a partir dessa onda, utilizando-se regras mostradas nas equações 2.7 e 2.8, tem-se uma onda chamada de onda quadrada que possui níveis discretos ao longo do tempo, ou seja, um finito número de valores para f(x). Isso a caracteriza com um sinal digital. 15 f(x) = 0 se sen(x) + 1 2 ≤ 0 (2.7) f(x) = 1 se sen(x) + 1 2 > 0 (2.8) Tem-se, na Figura 2.10, uma comparação do sinal digital e do sinal analógico. Figura 2.10: Comparação entre um sinal digital e um sinal analógico. A eletrônica digital está contida na eletrônica analógica, no que se refere ao mundo macroscópico. Ao utilizar os extremos de um sinal analógico, tem-se sinais que possuem valores discretos. Os sinais digitais são discretos ao longo do tempo e apresentam uma descontinuidade na transição de um estado lógico. Por exemplo, a utilização dos máximos e mínimos de um sinal senoidal transforma essa onda em uma onda chamada quadrada. Os sistemas digitais precisam interagir com o mundo real, que possui caracterís- ticas analógicas. Como mostrado na Figura 2.10, uma onda senoidal se transforma em uma onda quadrada quando representada digitalmente com duas situações. Claramente houve uma perda significativa de informações referentes à onda senoidal. Torna-se necessário repre- sentar essa onda senoidal com uma quantidade maior de informação digital. A solução é criar 16 uma combinação de bits que crie ondas discretas que se aproximem das ondas analógicas a um nível aceitável de acordo com a aplicação. A Figura 2.11 é uma demonstração de como aproximar um sinal digital de um sinal analógico. Neste caso, a onda senoidal foi represen- tada por quatro valores possíveis (0, 00, 0, 33, 0, 66 e 1, 00) e a cada valor foi atribuído uma combinação de bits de forma a identificá-los 00, 01, 10 e 11. Esse processo permitiu converter um sinal analógico para um sinal digital. A aproximação pode ser melhorada aumentando-se o números de bits. Figura 2.11: Comparação entre um sinal digital e um sinal analógico. 2.5 Estrutura básica de um computador clássico A computação convencional utilizada nos computadores atuais, baseia-se na ele- trônica digital. A eletrônica digital tem como característica a manipulação de informações discretas. Essas informações são atribuídas a circuitos eletrônicos. A vantagem em usar um sinal digital está evidenciada na simplicidade de sua representação. As UCP atuais são bem complexas e com muitos recursos lógicos e aritméticos, porem não são o alvo deste estudo. Assim, uma breve descrição de sua funcionalidade foi abordada, para servir de base para 17 entendimento do processamento de informações. A UCP é caracterizada pela interação de dois sistemas distintos, o software e o hardware. O hardware representa toda a parte física que compõe a UCP. O software representa toda a parte intelectual de manipulação dos bits na forma lógica ou aritmética. A unidade central de processamento (UCP) é considerada o “cérebro” de um com- putador e nela são processadas as informações. A princípio, sua função é permitir executar um conjunto de comandos de tal forma a resolver um problema matemático ou lógico (Figura 2.12). Figura 2.12: Versão simplificada de uma UCP. A UCP deve ser capaz de receber um comando requisitando processar uma soma, buscar a primeira grandeza, codificada em binário, armazenar essa grandeza internamente em 18 sua memória, buscar a segunda grandeza, armazenar essa grandeza internamente, proceder com a soma, armazenar o resultado internamente ou externamente em uma memória. Uma representação simplificada da UCP foi adotada para o atual estudo. O hardware da UCP simplificada deste estudo permite efetuar a operação de soma de quatro bits, sendo composta por um somador de quatro bits, que será a unidade aritmética (UA), um decodificador de instruções, três registros e uma interface de entrada e saída . Um decodificador de instruções atua no sistema controlando o fluxo de dados e habilitando o sistema a efetuar uma operação na forma de instrução vinda de um software. Um computador é basicamente composto por uma Unidade Central de Processa- mento (UCP), hoje chamada de processador ou microprocessador, uma memória permanente, uma memória temporária e interfaces de entrada e saída de informação, como mostrado na Figura 2.13. Figura 2.13: Diagrama em blocos de um sistema mínimo baseado em processador e na arquitetura de Von Neumann. 19 Esta estrutura, considerada a parte física do computador, é conhecida como hard- ware. A UCP, responsável pela parte lógica do computador, é construída utilizando-se chips de silício, de forma a manipular os efeitos dos movimentos dos elétrons. Os chips são compos- tos por transístores arranjados na forma de circuitos eletrônicos. Os arranjos dos transistores são estruturados para que seja possível implementar a álgebra de Boole. Computação clássica A computação clássica, utilizada nos computadores, possui regras adaptadas das regras da matemática e regras de comportamento lógico. Para facilitar o entendimento da computação quântica, torna-se necessário o entendimento prévio dos computadores atuais. A computação clássica é caracterizada pela implementação de algoritmos na forma de softwares. Um software é composto por um conjunto de instruções que serão enviadas ao decodificador. Esse conjunto de instruções são os programas. No exemplo a seguir uma UCP foi elaborada para responder a quatro instruções de software: O programa para se somar os números 12 e 15 é: Soma de dois números Início: CVA CVB SOMA DC Fim Nesta versão simplificada, o programa é executado acionando-se os comandos na sequência. Os comandos podem ser implementos como chaves que quando pressionadas 20 enviam o sinal de acionamento para a UC. A UCP utilizada nesse exemplo foi elaborada com uma interface de entrada e saídas de quatro bits, três registros (memórias), um somador binário de quatro bits, um decodificador de comandos e uma unidade de controle. A computação clássica representa todo o universo de programas de computador, criados em uma linguagem próxima à falada pelos seres humanos, em inglês, por exemplo. Esses programas são passados para binário e executados em UCP construídas em chips de silício. As linguagens de programação são as ferramentas que permitem que o usuário possa interagir com os sistemas computacionais. Desta forma, as linguagens de programação são criadas utilizando os mesmos princípios das regras utilizadas na construção dos computadores e uma linguagem baseada na comunicação dos humanos. Linguagens de programação, como o C++ e o FORTRAN, são amplamente utilizados na computação clássica. 2.6 Conclusões A complexidade dos algoritmos estudados nessa primeira etapa, serviram de mo- tivação para o estudo de um sistema computacional com capacidade de processamento mais eficaz, uma vez que a demanda de tempo para os sistemas, relativamente simples, estudados foi alta. O tempo computacional foi o principal aspecto que levantou interesse no que se refere aos algoritmos implementados. Os algoritmos considerados simples, no que refere-se ao número de variáveis e número de linhas de programação, demandaram, relativamente, um longo tempo para execução, em uma CPU atual. Seria necessário um super computador para sistemas de mesma natureza mais complexos. Por exemplo, com uma quantidade maior de partículas. Essas evidências comprovam a necessidade de se buscar uma eficiência maior para um sistema de processamento de dados. 21 Capítulo 3 Noções sobre redes neurais artificiais clássicas 3.1 Introdução Dentro do estudo da Inteligência Artificial (IA), estão inseridas as Redes Neurais Artificiais (RNA), que se caracterizam na linha de estudo conhecida como de conexionismo. O conexionismo é a visão da mente humana no aspecto computacional e relaciona as habili- dades intelectuais humanas com as conexões em uma rede de neurônios artificiais. As redes neurais podem ser classificadas em Redes Neurais Biológicas, de natureza orgânica, Redes Neurais Artificiais, de natureza eletrônica e Redes Neurais Artificiais Simuladas, de natureza algorítmica. A rede neural biológica é a rede de neurônios existente nos seres vivos, a rede neural artificial é baseada em circuitos elétricos e eletrônicos que tentam imitar o comporta- mento das redes existentes em sistemas biológicos e a rede neural artificial simulada é a rede desenvolvida sob a forma de algoritmos e implementada em softwares [17]. É usual chamar as redes neurais artificiais simuladas de redes neurais artificiais, simplesmente. Redes neurais, como redes de muitas camadas (Multilayer Percptron-MLP) e as de Hopfield [18], têm propriedades que são úteis nos estudos de problemas que envolvem, 22 por exemplo, a determinação de parâmetros em expressões teóricas que descrevem o sistema correlacionando-o com dados experimentais. As redes neurais também têm grande utilidade em problemas diretos, uma vez que possibilitam a inclusão de variáveis para a melhoria na performance do modelo elaborado para a representação de um sistema. A capacidade das RNAs em correlacionar conjuntos de dados, de uma maneira universal, permite a aplicação dessa técnica em problemas diretos e inversos. O uso de redes neurais se mostrou eficiente em diversas aplicações tecnológicas para sistemas complexos, mas destacamos a química e áreas afins [19], como no estudo de proteínas [20,21] e no estudo de estruturas químicas [22]. Na medicina as redes neurais foram utilizadas na categorização do batimento cardíaco de fetos [23]. Em sistemas químicos especificamente [24] utilizou uma RNA em termoquímica e utilizou a própria estrutura da RNA para determinar os parâmetros do sistema químico [25]. Viterbo [26] em 2001 utilizou uma RNA em problemas inversos no estudo de aniquilação de pósitrons. Uma RNA pode conseguir aprender o comportamento de um sistema em que existe uma relação entre suas variáveis, podendo ser composta por camadas que neurônios interconectados. Uma rede MLP pode ser estruturada com uma camada de entrada, composta por uma ou várias entradas, uma ou varias camadas ocultas, com um ou vários neurônios e uma camada de saída composta por uma ou várias saídas [18]. As conexões formam redes distribuídas e paralelas cujo aprendizado é obtido através de ajustes adaptativos de parâmetros [27]. Em um neurônio matemático de McCullock-Pitts as conexões sinápticas são representadas por pesos que geralmente são identificados pela letra w da palavra weights de origem inglesa. Os primeiros estudos em modelagem matemática para o sistema nervoso foram classificados como biofísica matemática e foram iniciados por Nicolas Rashevsky que propôs um dos primeiros modelos do neurônio dando início às idéias que precederam as redes neurais artificiais [28]. Posteriomente, McCulloch e Pitts [29] apresentaram um modelo composto por uma rede de neurônios contendo um corpo celular (soma) e axônios, como na representação gráfica de um neurônio biológico mostrada na Figura 3.2, os quais estão ligados por conexões sinápticas aos dendritos de outros neurônios Figura 3.3. 23 Figura 3.2: Neurônio biológico. Figura 3.3: Conexões sinápticas. 24 3.2 Um modelo matemático para um neurônio Os neurônios artificiais respondem de maneira particular em relação a estímulos recebidos e esta resposta pode ser definida como ativação. Esse modelo, posteriormente, influenciou Jon von Neumann no desenvolvimento de computadores digitais [10]. O mo- delo matemático de um neurônio possui conexões sinápticas chamadas pesos sinápticos, w0, w1, w2, . . . , wNe , sendo Ne o número de entradas. Os pesos estão respectivamente as- sociados às entradas de estímulos x0 = 1, x1, x2,. . . ,xNe . Os estímulos propagam-se a partir dos dendritos, passando pelo corpo do neurônio, em direção aos terminais sinápticos. O ar- ranjo de neurônios em uma RNA é configurado de forma a obter um caminho para estímulo, da entrada para a saída da RNA. O processo em que o estímulo se propaga da entrada para a saída da RNA chama-se propagação. Esses estímulos formam o vetor de entrada [xm] e propagam-se através do vetor de pesos [wm], m = 0, 1, ..., Ne. A interação do elemento x0 com o elemento w0 cria o termo x0w0 chamado de bias(Figura 3.4). Figura 3.4: Um modelo matemático para neurônio. A junção aditiva, representada por ∑ , é a soma dos estímulos de entradas modi- 25 ficados pelos pesos e seu valor é dado por v = Ne∑ m=0 wmxm (3.1) em que m é, portanto, o índice que identifica uma determinada entrada de estímulos e Ne é o total de entradas. 3.3 O perceptron de múltiplas camadas A RNA genérica, representada na Figura 3.5 é composta por entradas de estímulos (lado esquedo) que formam a camada de entrada ou nós de entrada, camadas de neurônios intermediárias e uma camada de saída (lado direito). O modelo de neurônio matemático mostrado na figura 3.4, mostrada na seção anterior, foi adotado no presente trabalho. A Figura 3.5: RNA genérica. expressão da RNA que corresponde ao elemento de matriz yj+1(i)l associado à saída do l-ésimo 26 neurônio, da (j + 1)-ésima camada, diante do i-ésimo elemento do conjunto de referência é dado por y j+1(i) l = ϕ  N1∑ n=0 wj+1nl [ ϕ ( Ne∑ m=0 wjmnx i m )] (3.2) em que xim é o estímulo de entrada no neurônio m para a amostra i, w j mn são os peso que conectam as entradas aos neurônios, ϕ é a função de ativação. No caso de uma rede com uma camada oculta (j = 1), tem-se y 2(i) l = ϕ  N1∑ n=0 w2nl [ ϕ ( Ne∑ m=0 w1mny j+1(i) l )] . (3.3) Portanto, a matriz [y2(i)l ] é a saída da rede. Esta rede de neurônios permite explorar certas propriedades atribuídas às RNAs. Um arranjo de neurônios muito utilizado é o perceptron de várias camadas (PVC) mais chamado de MLP. O MLP foi desenvolvido a partir do perceptron [30] caracterizado como um classificador linear. O MLP descrito por Haykin [18] em 2001 é uma estrutura que apresenta características adaptativas que permitem que a rede atue como um interpolador ou como uma ferramenta de reconhecimento de padrões ( [31]) . A MLP foi a primeira arquitetura adotada neste trabalho. Os valores dos pesos são determinados por um processo conhecido como treinamento. Durante o treinamento, o aprendizado da RNA é avaliado em função do erro que comete em reproduzir os dados de treinamento. O erro é calculado pela expressão e(i)m (W ) = d (i) m − y(i)m , (3.4) em que d(i)m é uma matriz que contém amostras do comportamento desejado para o sistema em estudo sendo o alvo do processo em que os pesos são ajustados e y(t)m é um vetor que contém a resposta da RNA no instante t para os estímulos apresentados na entrada da RNA. Deseja-se obter um erro e(i)m (W ) que valide o aprendizado, não sendo, necessariamente, igual a zero. Os pesos podem ser ajustados por um processo de minimização, conhecido como 27 treinamento, baseado em mínimos quadrados. Cada procedimento de ajuste de todos o pesos, envolvendo uma propagação e uma retropropagação completa através da estrutura da RNA, é chamado de época. O momento de parada do treinamento é definido por um erro, ou desvio, aceitável e é acompanhado pela expressão ε(i) = 1 2 Ns∑ m=1 ( e(i)m )2 . (3.5) 3.4 A propagação dos estímulos em uma RNA A soma de estímulos é argumento da função de ativação ϕ(·) que é o próximo estágio de funcionamento do neurônio. Deste modo, a saída y é representada pela equação: y = ϕ ( Ne∑ m=0 wmxm ) (3.6) O uso das redes neurais se dá, em geral, em dois momentos distintos. O primeiro refere-se ao treinamento que consiste no uso de amostras de referência usadas para calibrar os pesos da rede de modo a obter um mapeamento de diferentes estados do sistema em estudo. Embora no treinamento ocorra também a propagação, distinguimos como propagação o se- gundo momento quando é colocado uma amostra incógnita na entrada e a RNA, treinada, correlaciona a amostra a uma classificação em virtude do treinamento anterior, a propaga- ção e classificação de uma amostra incógnita é determinada pela RNA e a qualidade desta determinação é utilizada para se verificar a qualidade da capacidade de previsão. Veremos que a propagação do estímulo pela rede poderá ser representada por uma expressão matemática. Por hora, definimos a matriz de entrada das amostras de referência do sistema em estudo por [xim] = ([x 1 m], [x 2 m], . . . , [x i m], . . . , [x M m ]), i = 1, 2, . . . ,M formada pelos M vetores-coluna de amostra de referência. O índice i = 1, ...,M é, portanto, o índice de amostras do sistema em estudo. Definimos também a matriz [wjmn] formada pelos pesos atribuídos às conexões entre a camada de entrada e a camada oculta, em que n = 1, . . . , N1 é o índice de neurônios na primeira camada oculta com N1 neurônios, m = 1, . . . , Ne é o índice de entradas com Ne entradas e j = 1, . . . , Nc, o índice de camadas com Nc camadas totais. 28 A matriz [vjn] (i) representa os estados dos neurônios da camada j diante do i-ésimo vetor de referência. A propagação dos sinais referentes ao(s) estímulo(s) para a próxima camada (primeira camada oculta), identificada como j diante da i-ésima amostra é calculada vj(i)n = ∑Ne m=0w j mnx i m yj(i)n = ϕ (∑Ne m=0w j mnx i m ) yk(i)n = ϕ (∑Ne m=0w j mny j(i) n ) (3.7) em que ϕ é a função de ativação, yk(i)n é o valor da saída do neurônio n para a i-ésima amostra. A próxima camada pode ser a camada de saída ou uma outra camada oculta. Como entrada para a próxima camada tem-se a saída yj(i)n . Assim, v j+1(i) l = N1∑ n=0 wj+1nl y i n , (3.8) y j+1(i) l = ϕ  N1∑ n=0 wj+1nl y i n  . (3.9) 3.5 O treinamento das Redes Neurais Artificiais O aprendizado da RNA adotada para esse estudo se dá pela colocação de um conjunto de referência chamado de conjunto de dados de treinamento. Esse conjunto de dados de treinamento é composto por um conjunto de dados de entrada e um conjunto de dados de saída (chamados de alvo do treinamento). O aprendizado caracteriza-se pela capacidade de uma RNA prever o comportamento de um sistema em relação a informações não fornecidas durante o processo de treinamento. Os dados de entradas são apresentados na entrada da rede e propagamos para a próxima camada de neurônios, a característica da próxima camada varia de acordo com o número de camadas da rede, podendo ser uma camada oculta ou a camada de saída. A saída da rede é então comparada com o alvo do treinamento e calculado o erro que a rede comete em tentar simular o sistema. Esse erro é usado para o ajuste dos pesos. O ajuste dos pesos da rede se dará através da retropropagação. A rede é estimulada da saída para a entrada 29 e seus pesos são ajustados durante o processo. A influência de cada peso, da saída para a camada mais próxima em direção à entrada é avaliada e será um elemento de uma matriz de correção de pesos. O processo é repetido até chegar à entrada da rede. A matriz contendo as influências de cada peso no erro da rede é utilizada em um algoritmo de back-propagation, como o LMPB, para se minimizar o erro que é acompanhado por uma função de custo. A função de custo é utilizada para se determinar o grau de aprendizado da rede em relação ao conjunto de dados de treinamento. O Conjunto de treinamento pode ser definido pelo conjunto dos pares de referência de entrada e saída do sistema: T = { (x(1)m , d (1) l )|m=1,...,Ne,l=1,...,Ns , (x(2)m , d(2)l ), . . . , (x(M)m , d(M)l ) } , (3.10) em que, d(i)m é o valor desejado para aquela saída, ou alvo de treinamento. O grau de apren- dizado da RNA é mensurado pelo erro que a RNA apresenta na tentativa de simular o conjunto de dados de treinamento e é dado pelo erro (Eq.3.4) cometido na última camada ao se comparar a saída de cada neurônio para cada elemento do conjunto de treinamento, e(i)m = d (i) m − yj=Ns (i)m = d(i)m − ϕ N1∑ l=0 wj=Nslm x (i) l  . (3.11) Define-se a função custo somando o erro quadrático sobre toda a camada de saída para cada elemento do conjunto de treinamento, ε(i) = 1 2 Ns∑ m=1 ( e(i)m )2 . (3.12) Assim, temos que ε(i) = ε(i) [ wj=Nslm ] é funcional dos pesos sinápticos entre a última camada oculta e a camada de saída. O erro que a RNA comete deve ser um mínimo na superfície de erro dos dados. Para computar a soma sobre o conjunto de treinamento define-se a função custo total ou energia, ε = 1 M M∑ i=1 ε(i) (3.13) A estratégia geral para minimizar ε é baseada na técnica de mínimos quadrados. 30 Usa-se o gradiente localmente no espaço dos pesos para determinar um sentido de variação dos pesos de modo a constituir um passo ∆wjlm para aproximar o sistema iterativamente de um mínimo de ε(i). Para cada elemento do conjunto de treinamento, o passo é calculado da seguinte forma: ∆wj (i)lm = −µ ∂ε(i) ∂wjlm (3.14) onde 0 < µ < 1 é chamado taxa de aprendizado. Trata-se de um fator real que torna pequeno o passo a ser dado para forçar as iterações e evitar instabilidades no método e é escolhido por tentativas a partir de valores próximos de zero. O ajuste dos pesos sinápticos para a camada de saída é obtido através da com- paração dos valores desejados com os valores de saída d(i)m − yj=Ns (i)m através da função custo ε(i) e calcular o passo e o gradiente associados, usando a definição (3.9), tem-se ∂ε(i) ∂wjlm = ∂ε(i) ∂e (i) m ∂e(i)m ∂y Ns(i) m ∂yNs(i)m ∂v Ns(i) m ∂vNs(i)m ∂wjlm = e(i)m · (−1) · ϕ′(vNs(i)m ) · yNs(i)m (3.15) Portanto, temos ∆wj (i)lm = µe (i) m ϕ ′(vNs(i)m )y Ns(i) m (3.16) Ao final da soma sobre todo o conjunto de treinamento, o passo será ∆wjlm = M∑ i=1 ∆wj (i)lm . (3.17) Cada ciclo completo, de ensinamento da RNA, compreende uma iteração de ensi- namento (IE). 3.6 A função de ativação O estado do neurônio é calculado através de uma função de transferência ϕ(.), esta função pode ser linear ou não linear. Em sistemas digitais, essa função estabelece o estado do neurônio como ativo ou não ativo, normalmente é adotado como nível lógico 0 e nível lógico 1, ou +1 e −1. A função log sigmóide (logsig) (Figura3.6) é um exemplo muito utilizado na estrutura de redes. 31 Figura 3.6: Função de ativação logsig. Outra função importante é a tangente hiperbólica (tanh) (Figura 3.7 que apresenta limites ente −1 e +1). Figura 3.7: Função de ativação do tipo tangente hiperbólica. Em ambientes analógicos, que é o caso da concentração de compostos na análise qualitativa, por se tratar de valores representados por números reais, utiliza-se uma função linear ou a parte linear da tanh ou da logsig. Para o ajuste dos pesos da camada oculta não temos uma definição de e(i)m . A 32 minimização de ε se dá através da retropropagação, de forma supervisionada. As saídas do conjunto de treinamento são aplicadas como estímulos reversos na RNA, da saída para a entrada e o efeito é usado para gerar a correção nos pesos, com ajuste determinado pela expressão 3.14, em busca de um mínimo através do mesmo processo baseado no valor do gradiente, referenciado pela função custo (equação 3.13). A saída para cada neurônio da camada anterior, o erro ou desvio de cada neurônio da camada de saída e a função custo associada à soma dos desvios podem ser escritas respectivamente por y j+1(i) l = ϕ  N1∑ n=0 wj+1nl y i n  , (3.18) e(i)m = d (i) m − yj=Ns (i)m = d(i)m − ϕ N1∑ l=0 wj=Nslm y (i) l  , (3.19) ε(i) = 1 2 Ns∑ l=1 ( e (i) l )2 . (3.20) De posse destes resultados, o gradiente pode ser computado do modo a seguir: ∂ε(i) ∂wN1lm = ∂ε(i) ∂y N1(i) m ∂yN1(i)m ∂v N1(i) m ∂vN1(i)m ∂wN1lm (3.21) Contudo, computando a dependência ε(i) = ε(i)(e(i)m ), temos ∂ε(i) ∂wN1lm = Ns∑ l=1 ∂ε(i) ∂e (i) l ∂e (i) l ∂y N1(i) m  ∂yN1(i)m ∂v N1(i) m ∂vN1(i)m ∂wN1lm (3.22) Novamente, Podemos computar adicionalmente as dependências e(i)m = e (i) m ( v (i) l ) e v(i)l = v (i) l (y (i) l ) para obter ∂ε(i) ∂wN1lm = Ns∑ l=1 ∂ε(i) ∂e (i) l  ∂e(i)l ∂y Ns(i) l ∂y Ns(i) l ∂v Ns(i) l ∂v Ns(i) l ∂y N1(i) m  ∂yN1(i)m ∂v N1(i) m ∂vN1(i)m ∂wN1lm . (3.23) Deste modo, com o cálculo das derivadas, torna-se direta a obtenção do gradiente, ∂ε(i) ∂wN1lm = [ Ns∑ l=1 e (i) l ϕ ′(vNs(i)l )w N1 lm ] ϕ′(vN1(i)m )y N1(i) m y N1(i) m . (3.24) Assim, ∆wN1 (i)lm == µ [ Ns∑ l=1 e (i) l ϕ ′(vNs(i)l )w N1 lm ] ϕ′(vN1(i)m )y N1(i) m y N1(i) m (3.25) 33 Ao final da soma sobre todo o conjunto de treinamento, o passo para a penúltima camada será ∆wN1lm = M∑ i=1 ∆wN1 (i)lm (3.26) Essa minimização é otimizada no método Levenberg-Marquardt que é uma vari- ação do método de Newton [18] com parâmetro µ conforme a equação 3.27 como método de minimização do erro, ∆x = (JT (x)J(x) + µI )−1JT (x)e(x) (3.27) em que I é a matriz identidade, J é a matriz jacobiana 3.28 [32] [33] [34] J(W ) =  ∂e1,1 ∂w11,1 ∂e1,2 ∂w11,2 · · · ∂e1,q ∂w11,q ∂e2,1 ∂w12,1 ∂e2,2 ∂w12,2 · · · ∂e2,q ∂w12,q ... ... . . . ... ∂ep,1 ∂w1p,1 ∂ep,2 ∂w1p,2 · · · ∂ep,q ∂w1p,q  (3.28) e e(x) é o vetor de erros. O parâmetro µ é dinâmico e é aumentado quando se tem um aumento do erro da rede e diminuído quando se tem uma diminuição no erro da rede, estabilizando o treinamento. O algoritmo pode ser representado na seguinte forma: 34 Algoritmo de Levenberg-Marquardt x← Amostras de entrada y← Amostras de saída em função de x Início: n← 0 α← maxdiag(JTJ) ys ← 0 (simulado pela RNA) Enquanto n < nmáximo faça ∆W = −[JT (W )J(W ) + µ× I )]−1JT (W )e(W ) Wn+1 ←Wn +∆W0 Se en(W) < en−1(W) Wn ←Wn n← n+ 1 Fim Se Fim Enquanto Fim O termo que atualiza os pesos é ∆W = −JT (W )J(W ) + µ× I )−1JT (W )e(W ). (3.29) A cada época as matrizes de pesos são atualizadas de acordo com a equação 3.30. Wt+1 = Wt +∆W (3.30) em que t é a variável que representa a época do treinamento. Desta forma a equação 3.30 é computada até uma minimização da energia da rede a um valor desejado. 3.7 Conclusões Neste Capítulo foram tratadas as informações básicas de um modelo de RNA, cuja estrutura são neurônios “clássicos” modelados matematicamente e implementados sob as re- 35 gras da Computação Clássica. A eficiência dessa estrutura limita-se à eficiência do sistema computacional (computador clássico) utilizado, dando incentivo à busca de um sistema com- putacional mais eficiente como o computador quântico e a Computação Quântica, a serem tratados no Capítulo 6. As RNAs apresentam-se como uma ferramenta prática para o estudo de sistemas complexos e seus conceitos já estão bem estabelecidos, e com uma ampla abertura para a exploração de suas capacidades em várias áreas da ciência. Em relação ao comportamento da RNA, pode-se observar que extrapolação aos dados de treinamento ainda devem ser alvo de estudo, uma vez que a validação do treinamento se dá em função de informações conhecidas. A informação física contida na estrutura da RNA nem sempre pode ser identificada, pois redes de estruturas diferentes podem representar um mesmo sistema. Por exemplo, uma RNA com uma camada de neurônios ocultos pode representar o mesmo sistema que uma RNA de uma única camada, desta forma, os coeficientes que representariam um sistema teriam significados diferentes e distribuídos ao longo da estrutura da RNA. No Capítulo a seguir, será mostrado o desenvolvimento de uma aplicação da RNA clássica no tratamento um sistema físico, em que dados de um modelo disponível na literatura serão comparados. Este estudo teve como objetivo caracterizar uma estrutura de RNA para servir de base comparativa para a rede neural quântica desenvolvida e discutida no Capítulo 8. 36 Capítulo 4 A função de distribuição radial modelada via RNA 4.1 Introdução Esta parte do trabalho tem o objetivo de apresentar uma aplicação de uma RNA em um sistema físico-químico e gerar informações sobre o comportamento de uma RNA para auxiliar na modelagem de uma RNAQ tratada no Capítulo 8. Vários modelos de função distribuição radial são propostos na literatura [35, 36], baseados em ajustes polinomiais. Estes ajustes polinomiais são reconhecidamente problemas mal colocados, pois envolvem a inversão de matriz de transferência e matriz de Hilbert, como no caso estudado neste capítulo. A distribuição radial é um fator importante no estudo de líquidos. Um sistema composto por átomos em um ambiente de duas dimensões pode ter seu comportamento estudado utilizando-se o método de Monte Carlo. O estudo teórico de um sistema caracterizado como um líquido envolve um processo de modelagem em que os átomos e moléculas são representados por aproximações geométricas e suas interações repre- sentadas por potenciais. DesDestaca-se, no presente estudo, determinação da distribuição de partículas em um líquido representadas por uma função caracterizada pela distância e 37 interação entre as partículas. Propriedades termodinâmicas, bem como informações sobre estruturas de líquidos, podem ser obtidas pela função distribuição radial [37]. O Cálculo da pressão, da energia interna e energia livre de Helmholtz [38] são alguns exemplos das propriedades possíveis de serem calculadas. Neste trabalho foi explorado o modelo desenvol- vido por Morsali [35]. A distribuição radial g(r) pode ser obtida experimentalmente através de espalhamento de nêutrons, espalhamento de raios-x, ou técnicas de simulação utilizando Monte Carlo. Em um líquido constituído por um gás nobre, a função de distribuição radial g(r) indica, a partir de um átomo ai, de raio r, a probabilidade de se encontrar um segundo átomo aj, a uma distância r + dr. Em um sistema de densidade volumétrica ρ, a densidade, a uma distância r, é ρ(r) sendo g(r) = ρ(r) ρ . Em distâncias relativamente maiores, a função g(r) tende a 1, indicando que a densidade é a mesma do líquido. Através da difração de raios-x, é possível observar que a densidade de partículas oscila em função da distância. 4.2 O modelo de Morsali O modelo de Morsali, para a representação da distribuição radial, foi obtido da modelagem de um fluido de Lennard-Jones, cujo potencial é representado pelo potencial de Lennard-Jones EP (R) = C12 R12 − C6 R6 (4.1) em que R é a distância, C12 e C6 são constantes relacionadas ao alcance do potencial em termos da parte repulsiva e da parte atrativa, detre outros, representa a interação entre duas partículas [39], que também pode ser escrito na forma V (r) = 4 ǫ k [( σ r )12 − ( σ r )6] (4.2) em que as constantes ǫ/k e σ valem 119, 8K e 3, 405 Å, respectivamente. No modelo de Morsali a função de distribuição radial é calculada através de duas equações, em função da distância r, em Angström (Å), entre as partículas. Neste enfoque a função radial depende da distância reduzida r∗ = r/σ, da tempe- ratura T ∗ = (kT )/ǫ e da densidade ρ∗ = ρσ3, em que k, σ, ǫ, r, T , and ρ são a constante de 38 Boltzmann, o parâmetro de comprimento da função do potencial de Lennard-Jones (3, 405Å), o parâmetro de energia da função do potencial de Lennard-Jones (ǫ/k = 119, 8 K), a distância entre as partículas, a temperatura absoluta e a densidade, respectivamente. Para valores de r∗ > 1 tem-se a seguinte expressão: g(r∗, T ∗, ρ∗) = 1 + (r∗)2e[−(ar ∗+b)]sen[(cr∗ + d)] + (r∗)−2e−(gr ∗+h)cos(kr∗ + 1). (4.3) Para valores de r∗ ≤ 1, tem-se a equação g(r∗, T ∗, ρ∗) = s e[−(mr ∗+n)]4 , (4.4) em que o parâmetro a(T, ρ) e o parâmetro g(T, ρ) são calculados através de uma expressão com nove constantes, os parâmetros b(T, ρ) e h(T, ρ) são calculados através de uma expressão com três constantes, os parâmetros c(T, ρ) e k(T, ρ) são calculados através de uma expressão com oito constantes, os parâmetros d(ρ) e l(ρ) são calculados através de uma expressão com quatro constantes e o parâmetro s(T, ρ) é calculado através de uma expressão com oito constantes. Esses parâmetros determinam o formato a oscilação amortecida da função de distribuição radial. O parâmetro m(T, ρ) é calculado através de uma expressão com seis constantes e o parâmetro n(T, ρ) é calculado através de uma expressão com três constantes. Esses dois parâmetros determinam o decaimento do primeiro pico da função de distribuição radial. São ao todo 65 constantes, como descrito na referência [35]. 4.3 O modelo de Bamdad Um segundo modelo apresentado por Bamdad (2006) [36] é calculado pelas equa- ções g(r) = α2r∗−α3e−α4u + α5r∗10, (4.5) em que u = (α1 r )12 − (α1 r )6, para valores de r∗ ≤ 1, 55 e g(r) = β1−β3e−β3(r∗−β4)cos(β5r∗−β4), (4.6) para valores de r∗ > 1, 55, αi e βi são parâmetros ajustáveis e dependentes da temperatura e densidade. Bamdad determinou, através da dinâmica molecular clássica, usando o algoritmo de Verlet [40], o valor de g(r) para dezesseis temperaturas, combinadas com onze densidades, 39 dando um total de 1408 constantes, devido às características do métodos. Os modelos de Morsali e o de Bamdad são dependentes de r, ρ e T , sendo que uma variável deve ser considerada constante para o estudo da dependência das outras, havendo a necessidade de um novo cálculo a cada estudo e a consulta dos dados tabelados. Estes ajustes polinomiais são reconhecidamente problemas mal colocados, pois en- volvem a inversão da matriz de transferência e da matriz de Hilbert, conforme será abordado no presente estudo. Desta forma, qualquer algoritmo: menos a rede neural, decomposição em valores singulares (SVD), Tikhonov, ou outras técnicas de resolução de problemas inversos, terão, obrigatoriamente, de tratar os erros experimentais de forma média, ou ignorá-los, uma vez que dados provenientes de experimentos possuem erros de medida e comprometem os três fatores característicos que são: a existência, a continuidade e a unicidade da solução um problema. 4.4 Simulação de líquidos via redes neurais em função de r A implementação de redes neurais, baseadas nos ajustes polinomiais propostos no modelo teórico de Morsali e de Bamdad, possibilitou otimizar o volume de dados, uma vez que a estrutura compreende as equações do modelo. Houve o aumento da resolução da expressão para o cálculo da função de distribuição radial g(r) via RNA, pois, em uma comparação com o trabalho de Bamdad, em que foi necessário fazer a escolha de parâmetros, em uma tabela contendo 1936 valores, para que o seu modelo pudesse reproduzir a distribuição radial, mostrou que no caso da RNA, os parâmetros foram compactados e distribuídos em sua estrutura. Em um primeiro estudo, foi modelada uma RNA para reproduzir o polinômio de Morsali [35], ou seja, a distribuição de partículas em função de r de um fluido de Lennard- Jones. Foi proposto um fluido composto por 2000 átomos de argônio. Foram calculados 1.021 pontos utilizando o polinômio de Morsali g(r∗, T ∗, ρ∗) para o treinamento da RNA (Figura 4.1), com a densidade ρ∗ = 0, 8880 a uma temperatura de T ∗ = 1, 095. 40 0 1 2 3 4 5 6 0 0.5 1 1.5 2 2.5 3 Figura 4.1: Pontos calculados utilizando-se o polinômio de Morsali. Desta forma o estímulo de entrada da RNA (Figura 4.2) foi um vetor composto por amostras dos valores de g(r) para diferentes valores de r∗. Portanto, o par [r, g(r)] (entrada e saída, respectivamente), foi usado no treinamento. A equação 4.7 foi proposta Figura 4.2: Modedo de um RNA para estudo de g(r). 41 para representar a estrutura da rede para aprendizado e reprodução desses dados. g(r∗)ρ∗,T ∗ = b2 + i=11∑ i=1 tanh(w1ir ∗ + b1j)w2i . (4.7) Esta equação representa uma rede de uma entrada, numericamente representada pela variável r∗, uma camada intermediária com 11 neurônios conectados à entrada através dos elementos w1i da matriz de pesosW1 com ativação sigmoidal e uma camada de saída com um neurônio de saída linear, que representa g(r) (Figura 4.2). A saída é conectada à camada intermediária através dos elementos w2i da matriz de pesos W2. Inicialmente, os valores para as constantes w1i , w2i , b1i e b2 são atribuídos aleatoriamente. Utiliza-se, então, o processo de treinamento para se adequar os valores das constantes para a reprodução de g(r). 4.5 Resultados obtidos Após o treinamento, com 25 etapas, os valores obtidos para as constantes foram validados por comparação com os dados originais obtidos do polinômio de Morsali. Os parâ- metros para o uso da equação 4.7 estão relacionados na Tabela 4.1, contabilizando um total de 34 constantes. A Figura 4.3 mostra uma comparação de g(r) gerado através do polinômio Tabela 4.1: Constantes geradas para a equação 4.7 para um sistema contendo 2000 átomos de argônio i w1i b1i w2i b2 1 3,2774 -12,0874 0,1956 0,4629 2 -4,5659 12,4266 -0,212 3 -5,2150 11,6863 0,2717 4 -2,4162 13,4045 -0,3607 5 -6,3519 11,2272 -0,3795 6 -6,2501 7,0526 1,8401 7 -3,9864 12,7773 0,1803 8 -3,0802 12,7413 0,1429 9 -2,7038 12,5644 -0,2693 10 -18,5651 18,3682 -2,083 11 1,1669 -6,2083 -0,6699 42 de Morsali e g(r) gerado através da rede após o treinamento, em que a correspondência física para os parâmetros está distribuída ao longo da estrutura da rede. 0 1 2 3 4 5 6 0 0.5 1 1.5 2 2.5 3 r g(r ) Figura 4.3: Comparação entra os pontos gerados para g(r), em que a linha contínua representa g(r) obtido por Morsali e as cruzes representam g(r) gerada pela rede. Ademais, será apresentada uma significativa redução no números de parâmetros para se calcular g(r) baseada na implementação de uma RNA. Simulação de líquidos via redes neurais em função de r e ρ 43 A rede proposta para se calcular g(r∗, ρ∗) foi representada pela expressão g(r∗, ρ∗)T ∗ = b2 + ( i=I1,j=J1∑ j=1, i=1 w2kj tanh [ i=I2∑ i=1 ( b1j + j=J2∑ j=1 w11ir ∗ + w12iρ ∗ )]) (4.8) em que os índices i e j representam os neurônios das camadas. A RNAmodelada para o cálculo de g(r, ρ)T possui em sua estrutura, 23 neurônios na camada intermediária estruturada de acordo com a Figura 4.4. Figura 4.4: RNA para o cálculo de g(r, ρ). O dados de treinamento para a entrada da RNA (r e ρ) o os dados de saída (g(r, ρ)), alvo do treinamento, estão representados graficamente na Figura 4.5. Os pesos foram gerados de forma aleatória para o início do treinamento. Da mesma forma que foi feito para g(r) na seção anterior, os pesos foram treinados para g(r∗, ρ∗). Neste caso foram geradas 1021 amostras do sistema, permutando-se diferentes valores de r e ρ, com 0, 8000 ≥ r∗ ≤ 5, 9010 e 0, 50 ≥ ρ∗ ≤ 0, 88, respectivamente. Foram necessárias 10.000 épocas (etapas de treinamento) para o completo treinamento da RNA. A função de custo total representada pela equação 3.13 no Capítulo 3, cujo valor antes do treinamento era da 44 0 1 2 3 4 5 6 0.5 0.6 0.7 0.8 0.9 0 0.5 1 1.5 2 2.5 3 ρ r g(r ) Figura 4.5: Superfície para o treinamento da RNA. 45 ordem de 104, teve seu valor minimizado a 0.3420. O decaimento do erro da RNA para as 100 primeiras etapas de treinamento está representado no gráfico da Figura 4.6. 0 10 20 30 40 50 60 70 80 90 100 0 2000 4000 6000 8000 10000 12000 Etapas de treinamento Er ro (C us to tot al) Figura 4.6: Decaimento do erro da RNA para o conjunto de dados [r, ρ, g(r, ρ)]. A Figura 4.7 mostra uma sobreposição de uma superfície para g(r) para diferentes valores de ρ e de r (0, 8000 ≥ r ≤ 5, 9010 e 0, 50 ≥ ρ ≤ 0, 88 ) obtido por Morsali e uma superfície gerada por uma única expressão g(r, ρ) representada pela RNA. O tempo de execução do algorítimo de treinamento foi de 438,1 s. 46 0 1 2 3 4 5 6 0.5 1 −1 0 1 2 3 4 5 6 ρ r g(r ) Figura 4.7: Comparação entre a superfície prevista (superior), que foi deslocada três unidades de g(r) para cima, somente para efeito de comparação com a superfície a simulada (inferior). 47 Uma terceira rede foi proposta para representar a distribuição radial de forma mais abrangente. Esta foi a principal rede gerada para o estudo da função g(r). A dimensão da RNA foi ampliada para aceitar como entrada, além do r e ρ, a temperatura T . Portanto, uma RNA capaz de reproduzir o valor de g(r), seja este obtido experimentalmente ou através de modelos, em função de três variáveis, em uma única expressão, foi modelada e treinada. A expressão modelada para esta RNA foi g(r, ρ, T ) = b2 + ( i=I1,j=J1∑ j=1, i=1 w2kj tanh [ i=I2∑ i=1 ( b1j + j=J2∑ j=1 w11ir + w12iρ+ w13iT )]) (4.9) Para a modelagem desta rede foram usados três nós de entrada (r∗, ρ∗, T ∗), 27 neurônios na camada intermediária e um neurônio de saída (g(r, ρ, T )) como representada na Figura 4.8. Figura 4.8: RNA modelada para o cálculo de g(r, ρ, T ). A função custo total foi minimizada a 0,02 após 20.000 etapas de treinamento. O 48 tempo de execução do algorítimo de treinamento foi de 2427 s. A Tabela 4.2 contém os pesos w1 e bias b1 referentes à primeira camada de neurônios. Tabela 4.2: Constantes geradas para a equação 4.9 para a RNA w1(Coluna1) w1(Coluna2) w1(Coluna3) b1 -1.7011 -0.6454 -0.1085 7.0521 6.1692 -0.6929 0.5742 -6.9414 1.8349 2.7974 0.2593 -11.2092 -2.6254 -0.5495 -0.0059 4.9497 2.3948 3.0926 -0.0877 -10.1368 -1.8328 -2.7110 -0.2451 12.4464 -1.3311 -1.2606 0.0054 4.1984 -1.4295 7.2869 0.1405 0.0015 19.5939 0.1704 0.5445 -19.8880 -1.5851 -1.6570 0.0147 5.5395 -6.1343 0.7639 -0.5876 6.8763 1.6861 0.7160 0.1010 -7.0180 1.7422 2.0199 -0.0293 -6.2529 -1.7138 9.7930 0.1563 -0.7438 19.8798 0.5717 0.5276 -20.3593 2.9664 0.7535 0.3227 -8.4707 9.5486 1.6501 0.3088 -11.7738 -1.5891 8.6997 0.1505 -0.4216 -1.3618 -1.3125 0.0059 4.5325 -2.5938 -0.3534 -0.0184 4.8076 350.2151 -346.3401 222.6812 -271.1008 9.6003 8.3707 6.3268 -20.8263 -1.7380 -2.4686 -0.2433 11.7342 -2.6336 -0.7093 0.0061 5.0285 1.3214 -6.3172 -0.1311 -0.2980 -1.6321 -2.2166 -0.2384 10.9424 -19.6351 -0.3656 -0.5377 20.0254 A Tabela 4.3 contém os pesos w2 e bias b2 referentes à camada de saída. A Figura 4.9 mostra uma comparação entre a função g(r) desejada e a função g(r) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 0.9. A Figura 4.10 mostra uma comparação entre a função g(r) desejada e a função g(r) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 1.0. A Figura 4.11 mostra uma comparação entre a função g(r) desejada e a função g(r) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 7 e T ∗ = 1.0. 49 Tabela 4.3: Constantes geradas para a equação 4.9 para a RNA wT2 b2 36.9206 0.4923 -45.7811 0.4570 -94.8556 0.6000 26.3762 -100.6848 109.8535 -96.5782 -168.9971 -42.6588 40.2492 -54.7180 40.3347 -91.3352 0.5379 1.8265 -102.1729 219.9046 41.3329 -0.0085 0.0198 -55.1929 53.7689 48.5382 29.3006 -189.7436 50 0 1 2 3 4 5 6 0 0.5 1 1.5 2 2.5 r* g(r *,ρ * ,T *) Figura 4.9: comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) repro- duzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 0.9. 51 0 1 2 3 4 5 6 0 0.5 1 1.5 2 2.5 r* g(r *,ρ * ,T *) Figura 4.10: comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 1.0. 52 0 1 2 3 4 5 6 0 0.5 1 1.5 2 2.5 r* g(r *,ρ * ,T *) Figura 4.11: comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 7 e T ∗ = 1.0. 53 4.6 Conclusões Foi possível utilizar a rede como uma expressão única para o cálculo de g(r). Esta evidência possibilitou o estudo de uma RNA estruturada em função de r, T e, posteriormente, ρ. Os resultados desta etapa do trabalho serviram como prova de conceito na utilização da RNA em cálculos que envolvem grandezas com significados físicos. A capacidade de compactação de dados da RNA foi explorada. Uma vantagem no uso da rede está ligada à sua versatilidade em generalizações. Basicamente a estrutura da rede foi modificada de acordo com a quantidade de variáveis utilizadas no cálculo da distribuição radial. A mesma estrutura básica foi utilizada nos três estudos, tendo sido somente o número de neurônios modificado. O efeito do aumento de neurônios, para cada aplicação, demandou um aumento do tempo de treinamento. A descontinuidade das equações dos modelo de Morsali exigia que duas expressões fossem utilizadas, uma para valores de r∗ > 1 e outra para valores de r∗ ≤ 1 para representar a função de distribuição radial g(r). Com a RNA foi possível reproduzir com uma única equação toda a faixa de valores de r∗, o que evidencia a vantagem em utilizar a RNA como uma função de ajuste. A mesma comparação pode ser feita com o modelo de Bamdad, que também utilizou diferentes equações para diferentes faixas de valores de r∗ Concluímos, através da obtenção da minimização da função custo total, que a RNA foi eficaz na interpolação entre uma superfície e uma variável, uma vez que foi possível criar uma expressão em duas e três dimensões. O principal aspecto na utilização da RNA, na representação de g(r), está caracterizado na dimensão de sua equação. As equações dos modelos de Morsali e de Bamdad eram unidimensionais em função somente de r∗, um conjunto de dados tabelados era utilizado nas equações para valores de ρ∗ e T ∗ específicos. Uma outra grande vantagem da RNA foi agrupar em uma única equação a de- pendência do g(r) de ρ∗ e T ∗, permitindo obter qualquer valor de g(r) dentro da faixa de treinamento. Portanto, infinitos valores de g(r), entre os limites de treinamento podem ser reproduzidos. 54 Capítulo 5 O estudo dos estados ligados de dímeros com o He via RNA clássica 5.1 Introdução A capacidade de uma RNA em correlacionar superfícies de dados, possibilita acei- tar dados, obtidos de processos de modelagem matemática e computacional, como dados experimentais, desde que estes estejam devidamente validados e representem com fidelidade o sistema real. Assim, com o objetivo de explorar a rede neural artificial, como uma impor- tante ferramenta em interpolação e correlacionamento de superfícies de dados, na modelagem em físico-química e, sendo o presente trabalho teórico e computacional, as informações ex- perimentais poderiam ser obtidas de um banco de dados provenientes de experimentos ou através de modelagem matemática e computacional dos sistemas a serem estudados. Desta forma, dados obtidos através da modelagem de um sistema físico-químico, foram usados du- rante o desenvolvimento do modelo e informações novas foram geradas. Além de servir como fonte de dados para o treinamento de uma RNA, foram geradas informações suficientes para uma publicação na área, como demonstrado no artigo publicado em 2012, durante o desen- volvimento deste trabalho1. Neste artigo, estão descritas as principais informações utilizadas nesta modelagem, bem como os resultados obtidos para serem utilizados na modelagem da 1LEMES, N. H. T.; VITERBO, V. D.; SEBASTIAO, R. C. O. and BRAGA, J. P.. Parametric sensitivity analysis for the helium dimers on a model potential. Quím. Nova, São Paulo , v. 35, n. 5, 2012 55 RNA, na sequência do trabalho. A análise sensitiva de parâmetros de um potencial para hélio e o número de estados ligados para as moléculas de HeNe, HeAr, HeKr e HeXe, foram os itens da primeira parte desta tese. O número de estados ligados, que esses dímeros de gases raros podem suportar, em diferentes momentos angulares, serão apresentados e discutidos. O método de fase variável, em conjunto com o teorema de Levinson, foi usado para explorar o processo de espalhamento quântico em colisões de baixa energia, usando o potencial de Tang e Toennies. Estes dímeros, podem suportar um estado ligado, mesmo para um momento angular igual a cinco, como no caso do dímero HeXe. Estados vibracionais excitados, com momento angular zero, também são possíveis para HeKr e HeXe. A partir de análise sensitiva tem-se uma ordem aceitável de magnitude nos parâmetros dos potenciais. Uma RNA clássica foi estruturada para determinar a formação de estados ligados em dímeros de He, a partir de uma correlação dos pares de átomos, com seus respectivos possíveis estados ligados, além de servir de prova de conceito na modelagem e na análise da capacidade de aprendizado de uma RNA clássica, direcionada à utilização em proble- mas físico-químicos, em relação ao comportamento do sistema, como base para a posterior modelagem da RNA quântica. 56 5.2 Análise da formação de estados ligados em dímeros de He As informações, teóricas obtidas através de modelagem, em conjunto com as infor- mações experimentais, são importantes itens para se determinar as propriedades e interações entre átomos e permitem determinar a qualidade de potenciais. Esses potenciais devem reproduzir, dentro de um erro experimental, uma ampla gama de dados experimentais. Po- tenciais podem ser obtidos por um processo direto [41], com parâmetros de ajustes, para se adequar aos dados experimentais, ou de forma inversa [42], tratando primeiramente os dados de forma a se reproduzir o potencial necessário. A informação dos estados ligados pode ser obtida da matriz de espalhamento S, representada pela expressão S = ei(η++η−)cos(η+ − η−), iei(η++η−)sen(η+ − η−) iei(η++η−)sen(η+ − η−), ei(η++η−)cos(η+ − η−)  (5.1) em que η+ e η− são dois deslocamentos de fase, que contém toda a informação necessária para o processo de colisão [43]. O cálculo da matriz de espalhamento pode ser obtido resolvendo a equação de Schrödinger independente do tempo [44], d2ul(R) dR2 + [ k2 − l(l + 1) R2 − 8πµ h¯2 Ep ] ul(R) = 0 (5.2) em que h¯ = h2pi , h é a constante de Planck, l é o momento angular, R é a coordenada do espalhamento, µ é a massa reduzida do sistema e ul(R) é o potencial, que exigirá basicamente as seguintes etapas: a) Determinação das condições iniciais para a função de onda; b) Solução numérica da equação de Schrödinger e c) Determinação das condições de contorno para a função de Bessel para a condição final. Existem vários métodos para resolver a equação de Schrödinger como, por exem- plo, o método das log-derivadas e o método de Numerov, discutidos por Braga [44]. Este procedimento numérico pode ser simplificado usando uma propriedade importante da matriz de espalhamento: a matriz S que é uma relação das amplitudes e a normalização total da função de onda que é irrelevante. 57 Este é o aspecto fundamental para a aproximação de fase variável [45] no es- palhamento elástico, uma alternativa teórica e um método computacional para matriz de espalhamento descrita. A análise no presente trabalho será baseada no procedimento direto, usando o método da fase variável para descrever o processo do espalhamento quântico. Para um dado potencial ul(R) a condição de contorno pode ser dada por ul(R) ∝ e−(kRl lpi2 ) − Se+(kR− lpi2 ) ∝ sen(kR− lπ2 + δl) (5.3) em que S é a matriz de espalhamento, Sl = e2iδl e δl denota o deslocamento de fase. A matriz de espalhamento S, calculada para um dado potencial, possibilita exe- cutar um teste mais sensível de sua qualidade, portanto médias não devem ser envolvidas. Portanto, pequenas variações nos parâmetros do potencial, podem causar um efeito mensu- rável em S, como será discutido. Juntamente com o método de fase variável, a aplicação do teorema de Levinson será explorada. Este teorema importante relaciona o número de estados ligados que uma molécula pode suportar, usando cálculos de matrizes de espalhamento com energias insignificantes de colisão [43,46]. A análise sensitiva dos parâmetros de um potencial, de dímeros de gases nobres, e o efeito na formação de estados ligados, foram explorados nesse trabalho. Foi discutido como um espectro é afetado pela variação dos coeficientes de espalhamento de longo e curto alcance. Esta análise serviu para se definir valores toleráveis para a propriedade em questão e, portanto, os limites apropriados para qualquer potencial. O potencial a ser utilizado, no presente estudo é o potencial genérico proposto por Tang e Toennies [47], embora outros potenciais estejam disponíveis, em especial para a interação hélio-hélio [48]. No entanto, o potencial de Tang e Toennies está caracterizado para várias moléculas e é apropriado para inverter dados, em outros estudos sobre o assunto. Esta etapa é importante como um estudo preliminar de clusters (aglomerados) de gases nobres [49]. Esses clusters podem ser estudados usando mecânica clássica, em um processo análogo ao usado em clusters de átomo-molécula [50, 51]. Para clusters compostos por hélio e neônio, os efeitos quânticos são importantes, embora a aproximação clássica seja viável para clusters partindo do argônio [52]. Informações sobre a estrutura dos estados ligados, de gases nobres, foram obtidas e podem ser usadas como motivação para estudos em clusters de gases nobres, usando a dinâmica quântica e a clássica [53]. 58 O método da fase variável apresenta-se como uma ferramenta importante no es- tudo da formação de estados ligados entre átomos, em especial, o átomo de He com alguns outros gases nobres. 5.2.1 O método da fase variável Para colisões atômicas, a matriz de espalhamento pode ser substituída pelo des- locamento da fase δ. Este deslocamento da fase traz informações sobre o quanto a fase, para uma função de onda calculada para um potencial real, é deslocada em comparação com uma função de onda com potencial zero. A partir dessa diferença de fase, as quantidades em relação ao espalhamento podem ser calculadas. A ideia principal do método da fase variável (MFV) consiste em definir uma função de energia potencial EP (R), que seja válida a uma certa distância, ρ e zero para valores superiores. As condições de contorno são aplicadas a ρ que é então é propagada. O deslocamento da fase, calculado para o parâmetro ρ, é construído quando este limite é movido para uma longa distância. Portanto, para o potencial U(R) =  Uρ(R) 0 ≤ R ≤ ρ0 R > ρ (5.4) em que, U(R) = 2µ h¯2 Ep(R), µ é a massa reduzida do sistema, procura-se a solução na forma, φP (R) = α(ρ)sen(kR + δ(ρ)) com k2 = 2µ h¯2 E. A amplitude e a fase, neste caso, dependem do parâmetro ρ. No limite ρ → ∞ a fase obtida corresponderá ao potencial real Ep(R). A solução é considerada para duas regiões, tal como, φ(R) para 0 ≤ R ≤ ρ e φρ(R) para R ≥ ρ. O método de busca para a solução φ(R) e para R ≥ ρ corresponde a uma função de onda da partícula livre, φρ(R) = α(ρ) sin(kR + δ(ρ)) (5.5) para obter, a partir da equação de Schrödinger, uma equação para a função de onda log- derivativa, Yρ(R) = 1φρ(R) dφρ(R) dR , dYρ(R) dR + k2 − Uρ(R) + Y 2ρ (R) = 0. (5.6) 59 A continuidade da função de onda na fronteira fornece dδ(ρ) dR = −Uρ(R) k sin2(kR + δ(ρ)) (5.7) que é uma equação diferencial de primeira ordem para a fase. A condição inicial, δ(R0) = −kR0, em que R0 é um valor inicial para o raio, junto com a condição final δ = δ + lpi2 que agrega uma possível contribuição centrífuga e possibilita determinar o deslocamento de fase e a matriz de espalhamento. A equação 5.7 é a equação básica de fase variável. A potencialidade do método foi enfatizada por F. Calogero numa série de artigos derivados do MFV para o caso geral [54]. Uma equação para a matriz de espalhamento, ao invéz da fase, foi estabelecida. No entanto, a equação para a fase é mais atrativa, uma vez que assume uma forma real e de simples interpretação. Exemplos numéricos foram dados por Calogero para um potencial exponencial e para um potencial constante [55]. O método da equação de fase também foi popularizado por F. Calogero, principalmente por causa de seu livro, escrito em 1967 [45]. O método de fase variável não tem sido explorado de forma apropriada, mesmo para o caso de uma dimensão. O número de estados ligados pode ser facilmente obtido no limite de energia de colisão zero, utilizando a equação de fase. Isto exige que equação diferencial de primeira ordem seja integrada à curta distância. Por outro lado, pode-se integrar a equação de Schrödinger, e isso envolverá uma distância muito grande, se o estado ligado tiver uma energia muito pequena. Este é o caso dos dímeros estudados aqui, como será discutido. O método também pode ser formulado em várias dimensões, [56], embora uma comparação entre este método e as bem estabelecidas equações acopladas [57] não tenha sido realizado. A matriz S pode ser obtida a partir da fase pela relação S = ei2δ = cos(2δ) + isen(2δ) (5.8) em que δ é a fase [58]. O potencial de Morse Ep(R) = De(1− e−α(R−Re))2 −De (5.9) em que De =1136 Å−2, α = 2.4Å−1 e Re =0.74Å [59], que são valores aproximados para interação do hidrogênio, foi usado para ilustrar esse método. 60 A matriz de espalhamento, calculada a partir do método de fase variável e a partir do método de Numerov, que é muito preciso, foram renormalizadas e são apresentados na tabela 5.1. Os resultados são quase idênticos, indicando a validade do algoritmo de fase variável. As parte real e imaginária, da matriz de espalhamento são dadas pela equação 5.8. Tabela 5.1: Comparação de S obtida via o método de Numerov (assumido como “exato”) e via método da fase variável (calculado) l Scalculado Sexato 0 -0.2521-i0.9677 -0.2521-i0.9677 1 -0.5164-i0.8563 0.5164+i0.8563 2 -0.9452-i0.3266 -0.9452-i0.3265 4 0.3851+i0.9229 0.3852+i0.9228 Os resultados indicam que o método de fase variável fornece respostas exatas essenciais e pode ser mais explorada. 5.2.2 O potencial de dímeros de gases nobres Estabelecer a função de energia potencial global é o primeiro passo crucial na análise dinâmica clássica ou quântica. A função de energia potencial é, geralmente, aproxi- mada por um potencial modelo, com parâmetros obtidos de dados experimentais disponíveis, combinados com cálculos quânticos eletrônicos [60]. Dentro de outro enfoque, o potencial pode ser obtido diretamente através da inversão de dados. Este irá produzir potenciais para a propriedade experimental em estudo. Sebastião (2003) [25] obteve um potencial de alta qualidade para reproduzir o segundo coeficiente do virial, tratando o sistema como um pro- blema inverso e Lemes (2008) [42], também, dentro dessa abordagem, reproduziu a seção de choque diferencial . No último caso, o potencial foi invertido usando a primeira aproximação de Born. No entanto, para aumentar a precisão de um potencial invertido tem de se usar uma teoria mais precisa, tal como um cálculo quântico completo. Potenciais modelo têm que ser flexíveis para representar uma ampla gama de mo- léculas. Este é o caso para o potencial descrito na referência [60], que utiliza uma tangente hiperbólica para amortecer os termos de longo alcance, embora estes termos tenham uma contribuição para o curto alcance também. Outro potencial, descrito por Slawomir e Toczy- lowski [61], também é usado para discutir energias dos estados ligados em dímeros de gases 61 nobres, limitados para espécies a partir de hélio até o argônio. Este potencial está restrito a estas espécies e não pode ser utilizado para outras moléculas de gases raros. Um com uma função de amortecimento com contribuição zero em curto alcance, foi desenvolvido por Tang e Toennies [47] na forma, Ep(R) = Ae−bR − ∑ n=3,4,5 (1− f2n(bR)e−bR)C2nR−2n (5.10) com fm(R) = ∑m p=0 xp p! com parâmetros para 21 moléculas diatômicas de gases nobres estão relacionados na referência [47]. Os parâmetros A e b, em conjunto com coeficientes de dispersão foram tabelados. A função de amortecimento depende apenas no parâmetro b. Os parâmetros C6, C8 e C10 correspondem aos termos relacionados ao alcance do potencial. Estes cinco parâmetros, por conseguinte, definem completamente o potencial. Dentre as 21 moléculas disponíveis, o presente trabalho se concentra nas moléculas, HeHe, HeNe, HeAr, HeKr e HeXe. Este conjunto de moléculas será suficiente para estabelecer a confiança nos estudos sobre o assunto. Os dados para este conjunto de moléculas estão na Tabela 5.2 [47]. Tabela 5.2: Parâmetros para o potencial de Tang (em unidades atômicas) para dímeros formados por He e outros gases nobres. Sistema A b C6 C8 C10 HeHe 41,96 2,523 1,461 14,11 183,6 HeNe 98,02 2,496 3,029 36,18 545,1 HeAr 124,3 2,153 9,538 167,5 3701 HeKr 118,9 2,025 13,40 280,0 7257 HeXe 95,90 1,853 19,54 525,0 16670 Outros potenciais para os dímeros de gases nobres, estão disponíveis, em especial para o sistema de hélio diatômico, que foi estudado em mais detalhes. Por exemplo, Varandas [48] apresentou um potencial de interação hélio-hélio, que tem uma precisão de um centikelvin no mínimo. O hélio diatômico também tem sido estudado por teoria da perturbação [62]. Os efeitos relativísticos também foram incorporados neste tipo de molécula [63]. Embora estes sejam potenciais muito precisos, eles estão limitados a um conjunto de parâmetros para cada molécula. O objetivo, no atual trabalho, é estudar os dímeros de hélio numa análise comparativa de mudança de fase. Uma análise crítica dos potenciais para dímeros de hélio, merecem um estudo separado. 62 5.2.3 Os estados ligados O número de estados ligados possíveis para os dímeros de gases raros, para di- ferentes momentos angulares, serão apresentados e discutidos. A energia em que ocorre a mudança de fase para diferentes momentos angulares é um número inteiro múltiplo de π. O teorema de Levinson estabelece que esse número inteiro é igual ao número de estados ligados que a molécula pode apresentar, para este momento angular [64] sendo nbπ = lim E→0 δl. (5.11) A partir deste teorema é, portanto, possível utilizar as informações para prever propriedades sobre determinados estados. 5.3 Resultados e discussão sobre a determinação do nú- mero de estados ligados via deslocamento de fase O Potencial para a molécula de hélio, como na equação 5.10, prevê um mínimo de energia com 10,99 K a uma distância de 5,62 bohrs. Na verdade, os aspectos teóricos da interação molecular He2 remetem-se a 1928, com um cálculo feito por Slater [65]. Este cálculo dá a energia de dissociação e a distância de equilíbrio como sendo 8,9K a 5,60 bohrs. No entanto, a questão de uma vibração estável de uma molécula diatômica He2 foi tratada, em uma forma consistente, apenas recentemente. A existência de uma molécula diatômica de He é uma questão de especial interesse, pois seria a mais fraca molécula de van der Waals. Esta questão foi analisada a partir de um aspecto teórico, utilizando a teoria do alcance efetivo [66], em que é necessária a integração da equação de Schrödinger. Uma vez que o estado ligado de uma molécula é referido como sendo 10−8 eV, a integração é necessária até 10000 au (unidades atômicas). Portanto, lidar com esta energia, para detectar um estado ligado, pode ser uma fonte de erro. O presente método para detectar estados ligados, usando o limite do deslocamento de fase do espalhamento, não tem esse problema, a integração máxima esta a 7 au. 63 A convergência do deslocamento de fase para a pequena energia de colisão tem de ser investigada para se aplicar o teorema de Levinson. Esta convergência foi testada para o dímero mais pesado, HeXe, em que a energia de colisão de cerca de 10−10 au foi obtida. Esta análise para uma molécula diatômica pesada vai garantir a energia adequada para os outros dímeros. O número de estados ligados para os dímeros de hélio são mostrados na Tabela 5.3. Em nenhum dos valores do momento angular l houve a formação de um estado Tabela 5.3: Relação dos estados ligados para diferentes dímeros de gases nobres l HeHe HeNe HeAr HeKr HeXe 0 0 1 1 2 2 1 0 1 1 1 1 2 0 1 1 1 1 3 0 0 1 1 1 4 0 0 1 1 1 5 0 0 0 1 1 6 0 0 0 0 0 ligado HeHe. Os dímeros de HeNe e HeAr formam no mínimo um estado ligado. Os dímeros HeKr e HeXe têm o mesmo comportamento, apesar da diferença entre os átomos de Kr e Xe. Para o momento angular maior do que 5, nenhuma destas moléculas pode suportar um estado ligado. Integração do deslocamento de fase para colisões de baixa energia deve ser reali- zada com um algoritmo numérico muito preciso. O problema surge como uma consequência do teorema Levinson. Neste limite de energia de colisão, o deslocamento de fase comporta- se como uma função degrau, como exemplificado para HeKr com momento angular zero e E = 10−8 meV (Figura 5.1). O método de Runge-Kutta de quinta e o de sexta ordem, com passo variável, como descrito por Forsythe [67] foram adequados para fazer a equação 5.11 aplicável. Para esta energia de colisão, uma quantidade limitada de resultados foram validados com quatro algarismos significativos. Uma consideração preliminar para o número de estados ligados, pode ser realizada considerando-se a energia de dissociação, que aumenta em um fator de cerca de 3, 0 × 10−5 a partir de hélio até o argônio, mas aumenta em 1/10 deste valor do Ar para Xe. Esse comportamento diferente é, por conseguinte, esperado do hélio para argônio e não uma mudança apreciável do argônio para xenônio, como mostrado na Tabela 5.2. Contudo, a 64 Figura 5.1: Deslocamento de fase para o dímero HeKr correlação de energia de dissociação com estados ligados é uma forma de análise para um outro fator, como a concavidade do potencial (constante de força), que também pode desempenhar um papel importante. Como o número de estados ligados vai mudar, por exemplo, para uma alteração de 10% do coeficiente de dispersão. A análise sensitiva (AS) fornece a resposta para essa importante questão. A análise sensitiva pode ser utilizada de duas maneiras: direta ou inversa. Análise sensitiva direta é importante para se discutir a formação de clusters, em relação às perturbações nos parâmetros do potencial [52], que também foi usado para inverter e analisar os de dados do espalhamento quântico, sob a aproximação de Born [42] e na análise termodinâmica do segundo coeficiente do virial [68–70]. No presente trabalho a AS foi aplicada na variação dos parâmetros do sistema, no que diz respeito à formação de moléculas diatômicas. A importância da análise sensitiva pode ser apreciada considerando a dependência radial do deslocamento de fase e sua derivada, ou seja, a Equação 5.7, sobreposta pela própria energia potencial. Estas três variáveis são consideradas em conjunto na Figura 5.2, para HeXe l = 0 e E = 0, 1 MeV. Não há acúmulo de fase na região clássica proibida. Antes R=4 au o potencial 65 Figura 5.2: Energia potencial (linha cheia, espessa), deslocamento de fase (linha cheia, fina) e equação MFV para o dímero HeXe (linha pontilhada) terá pouca importância em estados ligados e propriedades de colisão. A energia de colisão para detectar estados ligados é insignificante e a transição é de fato cerca de 6,7 au. Isto também se reflete na equação fase variável, mostrando que dδ dR tem pequena contribuição para ser adicionado à fase, que pode ser, graficamente, observada para valores de R inferiores a 5 au. Por outro lado, a Equação 5.7 vai a zero em Ep(R) = 0 e não vai mudar de sinal até a convergência. A competição entra as forças repulsivas e forças de atrativas irão se manifestar no deslocamento de fase. Todos os deslocamentos de fase calculados neste trabalho, têm valores positivos assintóticos, que são as forças atrativas que dominam o processo de encontrar estados ligados. A situação é obviamente diferente para energia de colisão maior. A região de maior sensibilidade para o potencial é perto de seu mínimo, caso em que o derivada de fase tem o seu máximo. No entanto, esta certamente não é a única região para a construção da fase. A mudança de fase é construída ao longo do potencial, que tem contribuição importante da parte de longo alcance. Esta consideração preliminar, deve ser quantificada na variação dos parâmetros do potencial. 66 Qual deve ser a influência da precisão associada ao valor sobre a formação de estados ligados? Usando a massa atômica do hélio como sendo 4,0026 ou 4,002603267 amu tem-se zero estados ligados, indicando que a precisão da massa atômica não é responsável pela questão sobre a estabilidade He2. Mesmo para massa atômica igual a 4,02 amu não haverá molécula de hélio. Considerações semelhantes também são válidas para os outros membros da série. O número de estados ligados não vai mudar para molécula HeXe se a massa do Xe for alterada mesmo em 10%. Desde que massas atômicas sejam precisas dentro de uma parte por dez mil, este parâmetro não pode afetar a estabilidade da molécula diatômica. A importância do coeficiente de dispersão deve ser investigada. Desde que os termos de longo alcance decaiam a uma potência de R2n, pode-se esperar que a contribuição de C10 seja menos importante. A interação dipolo-dipolo terá a contribuição mais impor- tante para o espectro molecular, enquanto que a interação quadrupolo, termo C8, terá uma contribuição entre dipolo e octopolo. No entanto, estes coeficientes não podem ser variados para valores grandes, uma vez que isto irá alterar a individualidade da molécula em estudo. Pequenas variações em torno dos valores tabelados, como na Tabela 5.2, serão analisados para o momento angular zero. Através da análise sensitiva para o potencial em todas as moléculas diatômicas da série, foi observado que as grandes variações do coeficiente C10 não alteram o número de estados ligados com l = 0. Em alguns casos, este coeficiente pode ser definido mesmo como sendo zero, exceto para HeKr. O HeKr tem a energia de dissociação mais profunda da série e esta interação deverá ser mais relevante. Por outro lado, uma pequena variação do coeficiente C6 para a interação com o hélio, cerca de 0, 46%, irá prever uma molécula He2. Isso é equivalente a variar C6 de 1,4610 au a 1,4678 au. Esse ponto representa um valor de transição que determina a existência da molécula de Hélio, mantendo todos os outros parâmetros constantes. Em geral, para todos os três coeficientes de dispersão e para l = 0, foi observado que uma variação máxima de 5% (HeNe) ainda é aceitável para fornecer o mesmo número de estados ligados. Esse tipo de informação é importante na análise de problemas inversos. Os valores invertidos devem estar nessa faixa de precisão. 67 5.3.1 Análise sensitiva do potencial em relação ao parâmetro C6. As análises sensitivas foram feitas tendo como referência o acréscimo ou decréscimo de estados ligados indicados por l = 0, como indicado nas tabelas a seguir. Foi feita a análise sensitiva do potencial para o dímero HeHe, variando-se o parâmetro C6. O resultado obtido está mostrado na Tabela 5.4. Tabela 5.4: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeHe C6 original C6 alterado Variação de %C6 l = 0 1,461 1,46100 0,00000 0 1,461 1,46779 0,46475 0 1,461 1,46780 0,46543 1 A Figura 5.3 mostra o comportamento da mudança de fase na formação do estado ligado para o HeHe. Esta mudança mostra a grande sensibilidade do sistema em relação ao coeficiente C6. Isto é equivalente a mudar C6 de 1,4610 a 1,4678 au. Este ponto representa Figura 5.3: Mudança de fase para HeHe ocasionada por uma pequena variação do coeficiente C6 um valor limiar de C6 para a existência da molécula de hélio, mantendo todos os outros 68 parâmetros constantes. Em geral, para os três coeficientes de dispersão e l = 0, verificou-se que uma variação máxima de 5% (HeNe) ainda é aceito para dar o mesmo número de estados ligados. Este tipo de informação é importante para a análise do problema inverso. Valores invertidos, em sua maioria, estão dentro deste intervalo de precisão. Foram feitas as análises sensitivas do potencial para os dímeros HeNe, HeAr, HeKr (Tabelas 5.5, 5.6, 5.7 e 5.8). Tabela 5.5: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeNe C6 original C6 alterado Variação de C6 l = 0 3,029 0,929 -69,32%% 0 3,029 1,029 -66,03% 1 3,029 3,029 0% 1 3,029 5,499 81,54% 1 3,029 5,509 81,87% 2 Tabela 5.6: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeAr C6 original C6 alterado Variação de C6 l = 0 9,538 0,938 -90,165% 0 9,538 1,038 -89,117% 1 9,538 9,538 0% 1 9,538 9,988 4,717% 1 9,538 10,038 5,24% 2 Tabela 5.7: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeKr C6 original C6 alterado Variação de C6 l = 0 13,40 13,40 0% 2 13,40 26,5 94,40% 3 Tabela 5.8: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímero HeXe C6 original C6 alterado Variação de C6 l = 0 19,54 15,59 -20,21% 1 19,54 15,69 -19,70% 2 19,54 19,54 0% 2 19,54 34,79 78,045% 2 19,54 34,99 79,07% 3 À medida que o momento angular é aumentado, o coeficiente de dispersão torna- se mais importante e a parte repulsiva do potencial, menos importante. Pontos de viragem irão se mover para a direita neste caso. Pode-se qualitativamente descrever a importância 69 da parte de curto alcance do potencial, variando o valor inicial para a integração da equação MFV. Os valores iniciais, sem alterar o número de estados ligados são, 3,2 au (HeNe), 4,3 au (HeAr), 3,1 au (HeKr) e 3,6 au (HeXe). A molécula HeHe já não apresenta nenhum estado ligado e essa mudança, na condição inicial, não afetará a formação do estado ligado. Portanto, tendo os resultados para HeNe, como por exemplo, o curto intervalo do potencial, antes de 3 au, não afetará os estados ligados. Um núcleo rígido pode ser definido neste ponto, sem alterar o espectro de HeNe. 5.4 Previsão do número de estados ligados via RNA clássica Nesta etapa, uma RNA clássica foi modelada para a determinação do número de estados ligados, completando a etapa anterior. O objetivo geral foi verificar o comportamento de uma RNA convencional para os estados ligados, como base para a adequação e modelagem de uma rede neural artificial quântica e como objetivo específico, desta etapa, estabelecer uma estrutura para uma RNA clássica, que determinasse a interação entre os pares de gases nobres. Esta estrutura deve ser capaz de correlacionar os pares de átomos com os possíveis estados ligados. No capítulo 3, foram apresentadas noções básicas sobre as RNA clássicas que ser- viram como suporte para a modelagem e estruturação desta metodologia, na determinação dos estados ligados, a partir da estrutura de pares de átomos. O primeiro passo na modela- gem, consistiu em representar os átomos em um formato que contivesse informações físicas que pudessem se processadas pela RNA. Foi necessário apresentar à RNA, em sua entrada, estímulos numéricos que identificassem os pares de átomos a serem correlacionados com uma determinada informação. Assim, foi necessário estabelecer um padrão para comunicar com a RNA de modo a informar as estruturas e os pares de átomos que formariam, ou não, os dímeros. A distribuição eletrônica de cada átomo apresentou-se como uma forte candidata à essa representação. A distribuição eletrônica é única, para cada um dos átomos de gases nobres que participam do presente estudo. Portanto, de acordo com as características da RNA adotada, os estímulos numéricos baseados na estrutura dos átomos foram modelados. Os elétrons 70 em uma camada eletrônica de um átomo são indistinguíveis, mas por questão de adequação à RNA, foi determinada uma nomenclatura para cada elétron, em função da distribuição eletrônica do átomo. Como por exemplo, para o átomo de He, que tem dois elétrons, um elétron foi representado como elétron 1s1, por ser o primeiro elétron representado como estímulo à RNA e o segundo elétron representado como elétron 1s2, em que 1s é a camada em que se encontram. Não há violação das leis da Física, nessa representação, pois o estímulo referente a cada um desses elétrons, quando presentes no átomo, será representado pelo valor numérico de mesmo grandeza, o nível lógico “1”, e corresponde a um estímulo a ser propagado na estrutura da RNA. Assim, cada átomo foi representado pela sua distribuição eletrônica (Tabela 5.9). A primeira coluna da tabela contém a identificação dos elétrons. No caso do He, mesmo os elétrons não existentes em sua estrutura foram representados, dada a estrutura da RNA (segunda coluna da tabela). Os elétrons citados, mas não existentes na estrutura do átomo, foram caracterizados pelo estímulo de nível lógico “0”, por exemplo, o elétron 2s1, que não está presente no He, recebeu o estímulo “0”. Por outro lado, o Ne possui um elétron ocupando essa posição, assim, o elétron 2s1, para o Ne, recebe o estímulo “1” (terceira coluna da tabela). O mesmo acontece para o restante dos elétrons desse átomo e dos elétrons do Ar e do Kr. O número total de linhas da Tabela 5.9 foi determinado pelo número total de elétrons do Kr (36), isso influencia diretamente no número de entradas da RNA, levando a um número de 72 entradas, 36 entradas para um dos dois átomos cuja formação de um estado ligado está sendo investigada. Os dados foram utilizados como entrada da RNA, apresentados aos pares, de forma a representar o dímero. A saída da RNA foi estruturada de acordo com números de estados ligados para os seus respectivos dímeros. A RNA foi estruturada com 72 entradas, sendo que 36 entradas representam o átomo de He e as outras 36 entradas representam o segundo átomo (Ne, Ar ou Kr) e uma saída caracterizada pelos dados contidos na Tabela 5.10. As RNAs apresentam diferentes comportamentos de acordo com o número de neurônios e o número de camadas. Em relação ao número de camadas, tem-se que, as RNA de uma única camada, permitem a interpolação de um conjunto de dados, mas não a classificação desse conjunto, como no exemplo da porta XOR, que envolve uma classificação em uma separação de planos e exige uma RNA com um camada oculta. Assim, no caso da formação de dímeros, a classificação dos dados é fundamental para o sucesso do comportamento da RNA. Logo, a RNA para esse sistema foi estruturada com uma camada de entrada (o par de 71 Tabela 5.9: Representação numérica de acordo com a distribuição eletrônica dos átomos de gases nobres, para a formação dos estímulos de entrada para a RNA clássica Elétron He Ne Ar Kr 1s1 1 1 1 1 1s2 1 1 1 1 2s1 0 1 1 1 2s2 0 1 1 1 2p1 0 1 1 1 2p2 0 1 1 1 2p3 0 1 1 1 2p4 0 1 1 1 2p5 0 1 1 1 2p6 0 1 1 1 3s1 0 0 1 1 3s2 0 0 1 1 3p1 0 0 1 1 3p2 0 0 1 1 3p3 0 0 1 1 3p4 0 0 1 1 3p5 0 0 1 1 3p6 0 0 1 1 4s1 0 0 0 1 4s2 0 0 0 1 3d1 0 0 0 1 3d2 0 0 0 1 3d3 0 0 0 1 3d4 0 0 0 1 3d5 0 0 0 1 3d6 0 0 0 1 3d7 0 0 0 1 3d8 0 0 0 1 3d9 0 0 0 1 3d10 0 0 0 1 4p1 0 0 0 1 4p2 0 0 0 1 4p3 0 0 0 1 4p4 0 0 0 1 4p5 0 0 0 1 4p6 0 0 0 1 72 Tabela 5.10: Relação dos estados ligados para diferentes dímeros de gases nobres, saída da RNA cássica l HeHe HeNe HeAr HeKr 0 0 1 1 2 átomos, representados pelos seus elétrons), uma camada oculta com até j neurônios e uma saída (número de estados ligados) como mostrado na Figura 5.4. Figura 5.4: RNA modelada para o estudo da formação de estados ligados, em que j é o número total de neurônios da camada oculta, determinado experimentalmente. 73 5.5 Resultados e discussão sobre o uso de uma RNA para a determinação de estados ligados O número de neurônios para a camada oculta foi determinado através da evolução da RNA a partir de uma estrutura com um neurônio oculto, validação da RNA, partindo para uma nova estrutura com um neurônio a mais e mais sinapses, se necessário, até a estrutura final. O treinamento foi então efetuado e o erro avaliado. A qualidade da RNA não é determinada simplesmente pela minimização do seu erro determinado pela expressão 3.12 (descrita no Capítulo 3). Por exemplo, um treinamento cujo erro mínimo aceitável seja atingido, permite com que a RNA reproduza com fidelidade os dados de treinamento mas não necessariamente permite a interpolação. Um número de neurônios inferior ao necessário, pode impedir que a RNA passe por todos os pontos com um desvio uniforme, podendo favorecer um conjunto específico, sub-treinamento (underfitting). Por outro lado, um número de neurônios superior ao necessário, pode fazer com que RNA passe por todos os pontos exatamente, sem nenhum desvio, podendo negligenciar o erro experimental, por exemplo, super-treinamento (overfitting). Assim, para garantir a qualidade da RNA, um dímero foi deixado fora do treina- mento, para validação. A qualidade da validação foi checada na forma de um desvio do valor desejado, mas sem influenciar no treinamento. Portanto a qualidade de RNA foi determinada pelo par, erro de treinamento e desvio de validação (Figura 5.5). A estrutura ideal foi determinada através da evolução das conexões sinápticas. O primeiro treinamento foi executado com um neurônio, o segundo com dois neurônios e assim por diante. O menor erro e o menor desvio, foram as referências para a validação do treina- mento e a estrutura otimizada. Em detalhes na Figura 5.6, pode-se observar que a estrutura com doze neurônios ocultos j = 12 apresentou o menor par erro-desvio. Assim, esta foi a estrutura final para esta RNA. A evolução do erro a cada iteração de ensinamento, da RNA, a um valor aceitável está mostrada na Figura 5.7. Foram necessárias duas IE em 2,121 s de tempo de uso do 74 0 2 4 6 8 10 12 14 16 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Número de neurônios Er ro Figura 5.5: Qualidade do aprendizado em função do número de neurônios, em que a linha pontilhada é a função custo da rede e a linha cheia é o desvio em relação ao dado de validação 8 8.5 9 9.5 10 10.5 11 11.5 12 12.5 13 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Número de neurônios Er ro Figura 5.6: Qualidade do aprendizado em função do número de neurônios, em que a linha pontilhada é a função custo da rede e a linha cheia é o desvio em relação ao dado de validação 75 processador de um computador de 32 bits. Figura 5.7: Decaimento do erro da RNA em épocas Após o o treinamento a RNA foi capaz de calcular o número de estados ligados para três dímeros e fazer a previsão para um dos dímeros (Tabela5.11). Os dímeros HeHe, HeNe e HeAr, foram usados no treinamento e o dímero HeKr foi usado para a validação. Tabela 5.11: Comportamento da RNA no cálculo de estados ligados Dímero l = 0real l = 0 simulado via RNA previsto via RNA HeHe 0 0,00020 HeNe 1 1,00010 HeAr 1 1,00027 HeKr 2 1,9244 O valores relacionados à RNA não foram arredondados propositalmente para mos- trar a aproximação do valor desejado. 76 5.6 Conclusões gerais A análise sensitiva para o cálculo do espalhamento quântico foi mostrada para os dímeros de hélio, juntamente com a estrutura de estado ligado para diferentes momentos angulares. Exceto para HeHe, todas as moléculas consolidaram estados. As moléculas HeKr e HeXe podem suportar dois estados vibracionais com l = 0 e essas moléculas ainda existem com maior momento angular. A análise foi realizada utilizando a variável método de fase e teorema de Levinson. A análise sensitiva foi realizada para quantificar como a mudança de fase é alterada para os parâmetros potenciais variacionais. O efeito de massa também foi estudado para a série. A precisão da massa não é responsável por dar um estado ligado à molécula de hélio. Por exemplo, usando massa atômica como 4,0026 ou 4,002603267 amu ainda tem-se zero estados ligados para este potencial. A alteração da massa do átomo de xenônio até 10% continua deixando a molécula HeXe com dois estados ligados em nível de rotação fundamental. A faixa aceitável para os parâmetros do potencial foi determinada considerando a mesma estrutura do estado ligado original. Os coeficiente de dispersão foram alterados, um de cada vez, mantendo todos os outros parâmetros constantes. A importância nos coeficientes de dispersão aparece em ordem decrescente, do C10 para o coeficiente C6. Os resultados são basicamente inalterados pela variação do coeficiente de C10. Por outro lado, as variações em C6 podem ser muito importantes. Por exemplo, para molécula He2, uma variação positiva de 0, 46%, neste coeficiente, prevê uma vibração no estado ligado de momento angular zero. A sensibilidade na parte repulsiva do potencial, foi determinada pelo estabelecimento de uma coordenada mínima inicial, tolerável, suportar a estruturas originais dos estados ligados. Este mínimo foi encontrado a cerca de 4,0 au, para todos os dímeros de hélio. Embora a análise sensitiva tenha sido realizada de uma forma paramétrica, para formar um potencial específico, os presentes resultados são úteis para o espectro de dímeros de gases nobres para a estrutura do potencial. Levando em conta a evidência experimental, para molécula de hélio, [69] pode-se argumentar sobre a qualidade potencial. Os resultados têm mostrado que, melhorar o potencial não significa melhorar os parâmetros do potencial. Na verdade, uma outra forma funcional do potencial tem de ser considerada, e isto pode ser conseguido pela analise sensitiva [70]. Isto irá fornecer a função correta para os dímeros de hélio. 77 Em contraste com métodos numéricos, para calcular espalhamento elástico, que exigem o conhecimento das funções de Bessel, uma aproximação simples, com base no método de fase variável foi discutido. O algoritmo é muito simples e várias consequências importantes podem ser exploradas. O cálculo das matrizes de espalhamento foi realizado e comparado com o método Numerov renormalizado. O comportamento da mudança de fase, como uma função da energia e momentos angulares, foi explorado juntamente com exemplos numéricos sobre o teorema de Levinson. O método de fase variável, como aqui apresentado, pode ser mais explorado no cálculo de outras propriedades quânticas, como as amplitudes das seções de choque diferencial e transversal. Uma apresentação elementar do método de fase variável, para calcular a matriz de espalhamento quântico foi proposta. Esta abordagem que foi apresentada em 1933 por Morse e Allis, não foi totalmente explorada como uma ferramenta para introduzir ideias do espalhamento quântico. Este presente trabalho apresentou a derivação da equação de fase variável, seguida por uma simulação numérica unidimensional. A dependência da mudança de fase com momento angular e de energia, juntamente com o teorema de Levinson, foram apresentados. Foi possível, através da RNA, estabelecer uma correlação entre a estruturas eletrô- nicas dos átomos, deste estudo, com o número de estados ligados. A qualidade do treinamento da RNA foi validada pela previsão feita de formação de dois estados ligados para o dímero HeKr, o qual não participou do treinamento. Não foram estudados os estados ligados para outro dímeros de gases nobres e exploração da capacidade máxima desta RNA ainda está em aberto, para esse sistema. Outro fator que merece destaque é o fato de ter sido possível identificar o átomo por sua distribuição eletrônica, que é uma informação obtida da mecânica quântica. Na RNA clássica esta informação foi passada na forma de dados numéricos, ou seja, a informação quântica foi convertida para uma informação numérica, computacional clássica. Esse procedimento apresenta-se como um incentivo para o estudo da computação quântica e das RNAs quânticas, uma vez que são sistemas de natureza quântica e espera- se uma eficiência significativa no processamento informações de sistema quânticos, abrindo caminho para a exploração da Computação Quântica a ser introduzida no próximo capítulo. 78 Capítulo 6 A Computação Quântica e o computador quântico 6.1 Introdução O conceito de Computação Quântica (CQ) tem como base a utilização da Mecâ- nica Quântica no processamento de informações e, a princípio, pode ser simulada em com- putadores clássicos, para efeito de estudos e algumas aplicações. A computação quântica foi proposta bem antes de se verificar a possibilidade da construção de um sistema que pudesse processar informações nesse formato. Assim, a CQ divide-se em duas linhas de pesquisa, a busca de algorítimos e metodologias para o processamento de informações e o desenvolvi- mento de uma máquina capaz de processar os algorítimos. Em paralelo, neste capítulo, serão mencionadas e introduzidas algumas realizações experimentais relacionadas à construção do computador quântico, bem como os modelos propostos. O computador quântico seria a pla- taforma física necessária para o processamento dos algorítimos quânticos. A implementação de um computador quântico ainda se encontra no estado da arte. A empresa pioneira na construção do protótipo de um computador quântico é a D-Wave [71]. Muitas propostas sobre o seu funcionamento e a viabilidade de sua construção ainda são alvo de discussões. Dentre as discussões se destacam, a compactação do processador, o aumento significativo da capacidade de processamento de informações e a velocidade na transmissão dos dados. O foco principal desta parte do trabalho é apresentar os principais conceitos sobre a computação 79 quântica e identificar as ferramentas para a sua implementação. 6.2 Conceitos básicos da computação quântica Um sistema baseado na computação quântica evolui no tempo da mesma forma que os sistemas quânticos. A equação de Schrödinger [72], obitida em 1926 por Erwin Schrö- dinger −h¯2 2m ∂2ψ(x, t) ∂x2 + V (x, t)ψ(x, t) = ih¯ ∂ψ(x, t) ∂t (6.1) é fundamental no estudo dos sistemas quânticos. A evolução no tempo é unitária e gerada pelo Hamiltoniano do sistema. O vetor que descreve o sistema no tempo é governado pela equação de Schrödinger ih¯ d dt |ψ〉 = H|ψ〉, (6.2) em que H é a Hamiltoniana, h¯ = h2pi e h é a constante obtida por Max Plank em 1900, hoje conhecida como constante de Plank. Em seu trabalho, Plank usou como base a lei de Rayleigh-Jeans e a lei de Wien para solucionar o problema da radiação do corpo negro [73] originando a constante h que é fundamental na caracterização de sistemas quânticos. No caso em que H for independente do tempo, para o estado inicial no tempo t = 0, tem-se como solução |ψ(t)〉 = e−iHth¯ |ψ(0)〉. (6.3) Tem-se U = e−i Ht h¯ , em que U é um operador unitário, chamado de operador de evolução unitário. O operador U(t), uma vez que H é autoadjunta, satisfaz (UT )∗U = I para uma ordem linear em dt. Uma vez que o produto de operadores lineares é finito, a evolução no tempo em um intervalo finito também é unitária (Equação 6.4). |ψ(t)〉 = U(t)|ψ(0)〉. (6.4) A equação de Schrödinger satisfaz os conceitos relativos à mecânica ondulatória e caracteriza os sistemas quânticos. Portanto, até o presente momento, qualquer sistema que tiver como fundamento de seu funcionamento a equação de Schrödinger, ou os princípios que a sustentam, pode ser considerado um sistema quântico. Esse fator é fundamental para 80 discriminar um computador clássico de um computador quântico. Essa equação, bem como os parâmetros que a compõem, em especial a constante de Plank h, de alguma forma devem aparecer na estrutura do computador quântico e da Computação Quântica. Na Computação Quântica as portas quânticas são implementadas via transforma- ções lineares, operadores lineares, ou o operador U que envolve os estados equivalentes às regras da computação clássica. 81 6.3 O qubit Como na computação clássica, a computação quântica têm a sua unidade básica de informação e é conhecida como bit quântico (quantum bit), ou qubit. Para a representa- ção do qubit foi adotada a notação de Dirac. O qubit |ψ〉 é uma superposição dos estados independentes, nos quais |0〉, equivalente ao vetor (1, 0), |0〉 = 1 0  , (6.5) referente ao estado falso ou nível lógico zero da computação clássica e o |1〉, equivalente ao vetor (0, 1), |1〉 = 0 1  , (6.6) referente ao estado verdadeiro ou nível lógico um da computação clássica. A superposição, ou estado mais geral do qubit, é representada pela expressão |ψ〉 = α|0〉+ β|1〉 = α β  , (6.7) em que, α e β são números complexos tais que |α|2+|β|2= 1. (6.8) Assim, |α|2 determina a probabilidade de encontrar o qubit |ψ〉 no estado |0〉 e |β|2 determina a probabilidade de encontrar |ψ〉 no estado |1〉. Um qubit com mais de dois estados é representado de forma semelhante. A pro- babilidade é redistribuída nos possíveis estados. Por exemplo, um qubit de quatro estados, equivalentes aos estados binários, clássicos, 00, 01, 10 e 11 é representado pela expressão |ψ〉 = p00|00〉+ p01|01〉+ p10|10〉+ p11|11〉 =  p00 p01 p10 p11  , (6.9) 82 em que p00, p01, p10 e p11, são probabilidades associadas aos estados. Fica evidente na expressão 6.9, a compactação da representação de um sistema formado pela combinação de dois bits, gerando quatro estados, em apenas um qubit. Os pesquisadores da empresa D-Waver alegam terem construído um computador quântico com 512 qubits que ainda está sendo avaliado pela comunidade científica. Esse computador utiliza supercondutores trabalhando a uma temperatura de aproximadamente -273 oC. Segundo os pesquisadores da Empresa, o seu processador utiliza a uma propriedade chamada de quantum annealing [74], que não será discutida neste texto. O estado do qubit pode ser representado geometricamente através da esfera de Bloch (Figura 6.1), e representado pela expressão |ψ〉 = cosθ 2 |0〉+ eiϕsenθ 2 |1〉, (6.10) em que θ e ϕ são números reais [75], a qual representa um qubit. Figura 6.1: Esfera de Bloch Durante a medida do estado de um qubit, os estados |0〉 e |1〉 são medidos si- multaneamente, sendo |0〉 com probabilidade |α|2 e 1〉 com probabilidade |β|2. Desta forma, diferentemente da computação clássica, a unidade mínima de informação da CQ pode pos- suir mais do que dois estados, pois o estado do qubit, teoricamente, é qualquer ponto (em 83 função de ϕ e θ) na superfície da esfera de Bloch. Esta característica permite que muito mais informação seja processada em uma unidade de “tempo”. Um sistema composto por vários qubits tem o seu estado total representado pelo produto tensorial entre seus qubits (Eq. 6.11) |ψ〉 = |ψ1〉 ⊗ |ψ2〉 ⊗ ...⊗ |ψn〉 = |ψ1〉|ψ2〉...|ψn〉 (6.11) Esse produto tensorial é fundamental para representar a superposição de sistemas. Uma vez caracterizado o qubit, dentro da teoria quântica e apresentada uma rea- lização experimental, pode-se considerar essa base para a continuidade dos estudos. Tem-se então a necessidade de estabelecer um sistema para o processamento dessa informação. A me- lhor referência para o desenvolvimento da CQ é a computação clássica e suas características. Assim serão estabelecidas portas lógicas quânticas. 6.4 A Porta CNOT De forma análoga à computação clássica, a computação quântica também tem as portas lógicas, como mecanismo para manipulação da informação. A porta CNOT [76–78] é uma representação matricial que manipula qubits e tem a seguinte forma: CNOT =  1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0  (6.12) A CNOT efetua o flip de um qubit. O flip representa uma mudança de estado do qubit, passando de um estado |0〉 =  0 0 1 0  (6.13) 84 para um estado |1〉 =  0 0 0 1  (6.14) e é expresso por CNOT(|0〉) =  1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0   0 0 1 0  =  0 0 0 1  (6.15) Pode-se observar que o elemento ψ|0〉3 troca de valor com o elemento ψ|0〉4, que leva o qubit |ψ〉 de ψ|0〉 para ψ|1〉. Essa porta pode ser representada também na forma de um circuito quântico (Fi- gura 6.2), em que |A〉 é o controle da porta, |B〉 é um qubit, alvo do controle, e |B〉 ⊕ |A〉 é a saída da porta. Figura 6.2: Esquema da porta quântica CNOT Nesta representação, o qubit |A〉 e o qubit |B〉, do lado esquerdo, são as entradas da porta. O qubit |A〉 e o qubit |B ⊕ A〉, são as saídas da porta. O estado do qubit |A〉 e do qubit |B〉 se propagam da esquerda para a direita. O qubit |A〉 não sofre alteração, garantindo que a transformação seja unitária, e o qubit |A〉 interage com o qubit |B〉 de forma similar à porta XOR, da computação clássica, apresentada anteriormente, e seu efeito, que também se propaga da esquerda para a direita é apresentado na saída. O qubit |A〉 é chamado de controle e o qubit |B〉 é chamado de alvo. 85 Esta operação pode ser representada pela expressão CNOT (|A,B〉)→ |A,B ⊕ A〉, (6.16) em que ⊕ representa a função XOR da computação clássica. A Tabela 6.1 mostra o comportamento da porta CNOT e o estado do qubit antes e depois do flip. Tabela 6.1: Comportamento da porta CNOT Antes do flip Depois do flip |A〉 |B〉 |A〉 |B ⊕ A〉 0 0 0 0 0 1 0 1 1 0 1 1 1 1 1 0 |α〉⊗|β〉 = |α〉 |β〉 = |α, β〉 CNOT |0, ψ〉 = |0, ψ〉 |0, ψ〉 = a|0〉|0〉+ b|0〉|1〉 =  a b 0 0  . (6.17) CNOT |0, ψ〉 =  1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0   a b 0 0  =  a b 0 0  = |0, ψ〉 (6.18) |1, ψ〉 =  0 0 a b  (6.19) . 86 CNOT |1, ψ〉 =  1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0   0 0 a b  = a  0 0 0 1 + b  0 0 1 0  (6.20) |1, 1〉 =  0 0 0 1  (6.21) |1, 0〉 =  0 0 1 0  (6.22) CNOT|1, ψ〉 = a|1, 1〉+ b|1, 0〉 = |1〉 (a|1〉+ b|0〉) = |1, φ〉 (6.23) 6.5 Realização experimental da porta CNOT através do acoplamento elétron-núcleo Dentre os sistemas propostos na implementação do computador quântico, está o qubit obtido a partir do desacoplamento dinâmico universal de um simples spin, em estado sólido [79]. O fenômeno é ocasionado por uma impureza presente na estrutura do diamante. Átomos de nitrogênio causam o aparecimento de centros contendo uma lacuna acoplada a um spin, também referenciada como nitrogen-vacancy defect center ou (NV) (Figura 6.3). No trabalho de Lange [79] de 2010 foi demonstrado que é possível isolar e ler (determinar) o estado do spin em um NV , utilizando micro-ondas, caracterizando-o como um possível candidato a um qubit. 87 Figura 6.3: Defeito no diamante, em que V é o centro da vacância, N é um átomo de nitrogênio e C são os átomos de carbono. Experimentalmente, é possível implementar uma porta com rotação controlada [80], representada na Figura 6.4 em que el. representa o qubit de controle e nucl representa Figura 6.4: Porta quântica com rotação controlada. Em que el. representa o spin do elétron e nucl. representa o spin do núcleo. o qubit alvo do controle. Um flip, transformação de |0〉 em |1〉 ou |1〉 em |0〉, na porta CNOT equivale a uma rotação de 180o no estado do qubit, θ = 180o, levando-o de |0〉 para |1〉 ou de |1〉 para |0〉, dependendo do seu estado. Neste sistema o spin do elétron (el.) é o qubit de controle e o spin nuclear (nucl.) é o qubit alvo, RX(θ) é a rotação. Esta porta foi implementada a partir dos centros NV que são caracterizados por imperfeições na estrutura dos diamantes e criam um par elétron núcleo que interagem da mesma forma que uma porta CNOT . Para evitar a decoerência [80], Sar em 2012 introduziu uma série de rotações auxiliares, e utilizou a porta CPhase , adequado a porta CNOT ao sistema físico. Uma outra porta necessária para a construção de uma unidade central de proces- samento quântica é a porta de Toffoli [81] (Figura 6.5), comprovada experimentalmente [82]. 88 Figura 6.5: Porta de Toffoli. 6.6 O computador quântico A arquitetura do computador quântico, a princípio, seguiria a mesma base do computador clássico. Foi assumido e proposto, no presente trabalho, a possibilidade da im- plementação de um computador quântico que seria composto pela unidade de processamento, memória e interface (Figura 6.6). Dentre os vários sistemas propostos para a construção do computador quântico, o sistema baseado no acoplamento Spin eletrônico-Spin nuclear, foi considerado como uma realização experimental, plausível, para o processamento, com natu- reza quântica, de uma informação no decorrer do presente estudo. A escolha desse sistema justifica-se no fato de estar suportado por realizações experimentais significativas que per- mitirá verificar em laboratório a validade e viabilidade da implementação e execução de um algorítimo quântico. A unidade central de processamento seria baseada na porta CNOT e nas propri- edades da mecânica quântica e um possível somador como no computador clássico. 6.7 Conclusões gerais Foi possível, agrupar um conjunto de tecnologias e experimentos, para estabelecer um modelo compreensível de um computador quântico. Foi possível estabelecer uma relação entre o computador clássico e seu equivalente quântico, no que se diz respeito à representação dos dados, bit e qubit, e ao processamento, UCP clássica e UCP quântica. 89 Figura 6.6: Diagrama em blocos proposto para o computador quântico. 90 Em relação à coletânea de realizações experimentais, ficou evidente que existe um grande avanço em direção a um modelo definitivo para o computador quântico. Esta relação mostrada nesse trabalho foi importante para estabelecer um critério de confiabilidade de aplicabilidade real dos algoritmos quânticos. Pois, assim que seja possível implementar o Hardware computador quântico, todos operadores usados nos algoritmos, ou softwares quânticos, poderão ser executados nos novos computadores. A natureza dos computadores quânticos exigirá a implementação de uma nova interface com o usuário e com os dispositivos de entrada e saída de dados e informações. 91 Capítulo 7 Algoritmo de Grover 7.1 Introdução O algoritmo desenvolvido por Grover [4], utilizando uma transformação de in- versão sobre a média, é uma aplicação direta da computação quântica na solução de um problema. Embora desenvolvido para uma possível aplicação em um computador quântico, este algoritmo apresenta características que podem ser exploradas em um computador clás- sico. O algoritmo de Grover permite fazer uma busca em um banco de dados formatado em uma linguagem na qual um sistema quântico possa processar e apresenta vantagem em relação aos algoritmos clássicos. A busca em um banco de dados por um algoritmo clássico consiste na leitura de registros. Para um banco de dados contendo n registros, em média, um algoritmo clássico efetua a leitura de 12 registros e, na pior das hipóteses, efetua a leitura de (n − 1) registros. Em termos computacionais essa característica é medida na forma de complexidade. A complexidade permite estimar a demanda de recursos computacionais e o tempo de execução de um programa. Uma complexidade O(n) equivale à quantidade de passos para resolver um problema e é diretamente proporcional ao número de variáveis 92 envolvidas. A complexidade O(n) indica que o custo computacional é linear. Um algoritmo de busca clássico tem complexidade O(n). 7.2 O algoritmo quântico de busca Grover demonstrou que seu algoritmo permite efetuar uma busca em um banco de dados a uma complexidade O( √ n), o que reduz significativamente o tempo de busca, comprovado experimentalmente [80]. Dada uma função f(x), x = 1, 2, ..., n, para um valor de x desconhecido, tem-se como objetivo encontrar o valor de x, tal que f(x) 6= 0, Esse processo é caracterizado como um problema inverso. Um dos princípios básicos usado nesse algorítimo é o fenômeno quântico conhecido como superposição. Esse fenômeno permite que uma partícula excita simultaneamente em dois lugares ao mesmo tempo, sendo que, quando ocorre uma interação, essa partícula passa a existir em um só local. Algebricamente, é obtida através da transformada de Wash-Hadamard [83]. Esta operação é representada pela matriz W = 1√ 2 1 1 1 −1  , (7.1) que transforma o estado de um qubit em uma sobreposição de estados. Quando este operador atua no estado |0〉, este é transformado na sobreposição dos estados |0〉 e |1〉, assumindo o estado ( 1√ 2 , 1√ 2 ). Quando atua no estado |1〉, este é transformado no estado ( 1√ 2 ,− 1√ 2 ), assim, 1√ 2 1 1 1 −1  |0〉 |1〉  =  1√2 |0〉+ 1√2 |1〉 1√ 2 |0〉 − 1√ 2 |1〉,  . (7.2) na notação de Dirac esta sobreposição é representada na forma 1√ 2 (|0〉+|1〉) no caso do estado |0〉 e na forma 1√ 2 (|0〉 − |1〉) no caso do estado |1〉. Seja x um número na base binária de n qubits descrevendo o estado inicial do sistema e y um número, também na base binária de n qubits descrevendo o estado resposta do sistema, o sinal da amplitude de y é determinado pela paridade do produto dos índices de x e y, ou seja, (−1)x.y que é conhecida como transformação de Fourier [4] e pode ser definida como Fij = 2 −n 2 (−1)x.y, (7.3) 93 em que y é a representação binária de i, e x.y é o produto binário dos bits dos string x e y. A transformação de rotação seletiva da fase da amplitude em certos estados [84], é uma operação fundamental no algorítimo de procura quântico. Para um sistema de dois estados esta transformação pode ser estruturada na forma R = ejφ1 0 0 ejφ2  , (7.4) em que j = √−1 e φ2 são números reais arbitrários. 7.3 Inversão seletiva de fase Um caso particular da rotação seletiva de fase R, é a inversão seletiva de fase I0 [85], consiste em inverter o sinal da amplitude de um registro específico dentro de um vetor (Figura 7.1). Figura 7.1: Inversão na média Trata-se de uma matriz cujos elementos são: I0 − ij = 0 se i 6= j; I0ii = 1 se i = 0; I0ii = −1 se i 6= 0. (7.5) No trabalho original de Grover, um vetor de estados ψ continha um estado espe- cífico a ser localizado. O registro de interesse estaria em um estado oposto aos estados dos 94 registos que não eram de interesse. Por exemplo, se o registro de interesse estivesse no estado ψ = 1, os outros estados estariam iguais a ψ = 0. Um oráculo determinado pela expressão 7.6, permite localizar a posição interesse no registro. I0 − = I − 2|ψ0〉〈ψ0|, (7.6) Na expressão 7.6, |ψ0〉 é a origem da informação, um estado que contém a informação procu- rada. As transformações aplicadas a esse estado irão produzir uma alteração na amplitude de um estado particular |ψ1〉. De acordo com Grover f(x) = Ax, x = f(x)A , |ψ0〉 = f(x)A e |ψ1〉 = x. Inicialmente o algorítimo trabalha com representações binárias. Assim, |ψ0〉 =  0 0 ... 1 ... 0  , (7.7) e 〈ψ0|= [ 0 0 . . . 1 . . . 0 ] , (7.8) tem-se os produtos |ψ0〉〈ψ0|=  0 0 0 . . . 0 0 0 0 . . . 0 0 0 1 . . . 0 ... ... ... ... ... 0 0 0 . . . 0  , (7.9) 95 2|ψ0〉〈ψ0|=  0 0 0 . . . 0 0 0 0 . . . 0 0 0 2 . . . 0 ... ... ... ... ... 0 0 0 . . . 0  , (7.10) I − 2|ψ0〉〈ψ0|=  1 0 0 . . . 0 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... ... 0 0 0 . . . 1  −  0 0 0 . . . 0 0 0 0 . . . 0 0 0 2 . . . 0 ... ... ... ... ... 0 0 0 . . . 0  =  1 0 0 . . . 0 0 1 0 . . . 0 0 0 −1 . . . 0 ... ... ... ... ... 0 0 0 . . . 1  (7.11) 7.4 Inversão seletiva da fase na média (Amplificação) A inversão seletiva da fase mantendo a média das amplitudes é composta por inversão da amplitude e transformação através da porta de Hadamard (Figura7.2). A porta de Hadamard é a implementação física e simbólica da transformada de Wash-Hadamard citada anteriormente. De acordo com o princípio da amplificação da amplitude, um alvo ψt é atingido, partido-se de um estado ψ0, através da aplicação da transformação −I0−WItW seguida por W . Esta operação deve ser repetida π √ n 4 vezes para que o alvo seja atingido. W (−I0−WItW ) . . . (−I0−WItW )(−I0−WItW |ψ0〉 = |ψt〉 (7.12) (−WI0−W )It . . . (−WI0−W )It(−WI0−W )ItW |ψ0〉 = |ψt〉 (7.13) 96 Figura 7.2: Fluxograma do algoritmo de Grover 97 (−WI0−W ) = −W (I − 2|ψ0〉〈ψ0|)W, (7.14) −W (I − 2|ψ0〉〈ψ0|)W ≡ 2W |ψ0〉〈ψ0|W − I) (7.15) cada elemento é igual a 1 n , cada elemento é a média de todos os elemento do vetor inicial −Wij(I − 2|ψ0〉〈ψ0|)Wij ≡ 2Wij|ψ0〉〈ψ0|Wij − Iij) = αav (7.16) −W |ψ0〉〈ψ0|Wα = αav (7.17) I − 2|ψ0〉〈ψ0|=  1 0 0 . . . 0 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... ... 0 0 0 . . . 1   0 0 0 . . . 0 0 0 0 . . . 0 0 0 2 . . . 0 ... ... ... ... ... 0 0 0 . . . 0  =  1 0 0 . . . 0 0 1 0 . . . 0 0 0 −1 . . . 0 ... ... ... ... ... 0 0 0 . . . 1  (7.18) αav = 1n ∑ i αi o i-ésimo elemento de 7.17 é igual a 2αav − αi. Com a inversão do sinal do estado a magnitude aumenta de 2αav. Resumindo W |ψ0〉, It = I − 2|ψ0〉〈ψ0| e −WI0−W . 7.5 Identificação de moléculas utilizando o algoritmo de Grover A identificação de moléculas é uma questão importante no controle de qualidade de alimentos [86], controle de medicamentos [87], a segurança nos aeroportos para localização de 98 drogas e bombas e área forense [88] e detecção de contaminação de rios [89]. Neste trabalho, foi explorada a absorção de luz na região do infravermelho. Os números de onda na região do infravermelho estão entre 4000 e 400 cm−1 (em diferentes ligações, de diferentes substâncias, os modos normais de vibração absorvem energia e têm números de onda diferentes, em um espectro na região do infravermelho.) Uma molécula pode ser caracterizada por picos de absorções no espectro na região do infravermelho [90]. Como exemplo, o intervalo entre 3650 − 3580 cm−1 é associado com O − H existentes em moléculas de álcool, o intervalo entre 3200 − 3550 cm−1 está associado com ligações H − H que se estende em moléculas de álcool, a faixa entre 1250 − 970 cm−1 é associada com ligações C − O em moléculas de álcool. Cada molécula tem o seu próprio espectro de infravermelho. Como exemplo, é possível correlacionar um espectro com a molécula de metanol usando os picos que aparecem nos números de onda 3347, 3336, 2933, 2522, 2046, 1460, 1116, 1030 e 652 cm −1. A grande quantidade de moléculas exige uma grande base de dados para armazenar a informação e a sequência para localizar uma informação depende da qualidade do algoritmo utilizado para executar a pesquisa incluindo o hardware, especialmente em sistemas em tempo real. Em sistemas de tempo real o tempo para procurar e processar uma informação é crucial para o seu desempenho [91]. Além disso, a identificação das substâncias podem envolver a caracterização de um par de diferentes técnicas como espectroscopia na região do infravermelho (ERIV), espectrometria de massa e ressonância magnética nuclear [92]. Os softwares de buscas são baseados em algoritmos clássicos para executar uma busca em um banco de dados. Aumentar a velocidade para encontrar dados é um dos focos da ciência da computação [93]. Devido às características do computador clássico, a representação das informações são apresentadas de forma semelhante às regras da álgebra linear. As informações receberão um tratamento diferente em um computador quântico. No caso de um espectro obtido na região do infravermelho, tem de ser considerada uma diferente forma de representação dessa informação. Como uma primeira abordagem, o sistema estudado neste trabalho, foi um protótipo de uma base de dados de espectros na regão do infravermelho. Em seguida, o modelo de um banco de dados que se baseia em um registro quântico em que seu endereço foi convertido para um modelo baseado em química quântica. O objetivo inicial foi o desenvolvimento de um algoritmo para efetuar a identi- ficação de uma molécula por análise de espectro na região do infravermelho, utilizando um algoritmo quântico. Basicamente, o espectro é aplicado ao algoritmo que faz uma busca numa base de dados para fazer a correlação com espectros armazenados previamente. 99 Neste trabalho foi desenvolvida uma aplicação do algoritmo de Grover, para os estudos iniciais, que permitiu correlacionar um espectro na região do infravermelho, de teste, com um espectro presente em um banco de dados de espectros de infravermelho de moléculas conhecidas. Interfaces entre o algoritmo quântico e o computador clássico podem ser neces- sárias e viabilizam a implementação e simulação dos sistemas desenvolvidos, utilizando-se a computação quântica. Foram utilizados espectros na região do infravermelho de alguns hidrocarbonetos e álcoois na fase gasosa. O espectro na região do infravermelho (ERIV) foi convertido em um formato adequado ao algoritmo de Grover. Os espectros foram divididos em regiões e cada região foi subdividida em faixas de números de onda. Dentro de cada região apenas uma faixa foi usada para indicar a interação do feixe de infravermelho com a amostra. Cada faixa foi representada por um registro quântico. O registro que representou o pico da absorção mais intensa assumiu o estado |1〉 e o restante assumiu o estado |0〉. Esse processo foi repetido para todas as regiões do espectros e para todos os espectros que compuseram o banco de dados inicial. A tabela 7.1 contém uma amostra do conversão do espectro em registros quân- ticos, em que f0=4000 cm−1 a f1=3874 cm−1 é a primeira faixa de freqüências e represen- tam o registro |1〉, f2=3875cm−1 a f3=3749cm−1 representam o registro |2〉, f4=3750cm−1 a f5=3924cm−1 representam o registro |3〉, f6=3625cm−1 a f7=3499cm−1 representam o registro |4〉, f8=3500cm−1 a f9=3374cm−1 representam o registro |5〉, f10=3375cm−1 a f11=3249cm−1 representam o registro |6〉 e f12=3250cm−1 a f13=2999cm−1 representam o registro |7〉. O registro |0〉 foi usado para indicar a ausência de absorção nesta na região do espectro. Tabela 7.1: Correlação entre o estado quântico de um registro e o espectro na região do infravermelho Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉 Faixa de freqüências - f0-f1 f2-f3 f4-f5 f6-f7 f8-f9 f10-f11 f12-f13 Ligação detectada - - - - - - OH - O espectro foi dividido em quatro regiões semelhantes a essa (regiões compreen- didas entre 4000 cm−1 a 500 cm−1). Esse banco de dados básico foi utilizado para a prova de conceito. 100 O algoritmo de Grover foi configurado para trabalhar com três qubits e três itera- ções de Grover, confirmando a ordem de complexidade proposta como sendo igual a O( √ N). A execução do algoritmo possibilitou localizar o conjunto de registros quânticos necessário para identificar um espectro apresentado ao algoritmo e presente no banco de dados. Esta prova de conceito possibilitou o avanço dos estudos dentro da computação quântica. A velocidade para encontrar um determinado objeto em um banco de dados é muito importante e decisivo para sistemas de tempo real, é importante para estudar a poluição de rios, quando são utilizados detetores ou sensores para avaliar os níveis de contaminação que em geral necessita de uma solução rápida para a ação de um agente ambiental. Cada estado é representado em binário. A Tabela 7.1 mostra a possíveis estados para um sistema representado por estados com oito bits. Dada a função y = f(x), (7.19) onde y = 1 para o estado xs e y = 0 para todos os outros estados xm, então o estado xs vai ser a solução. O objetivo do algoritmo é encontrar xs. Em termos computacionais, xs é o endereço do registo de que o bit de dados é armazenada uma tabela. Primeiro, o sistema tem que estar em um estado arbitrário, como exemplo 1 |0〉. Se o sistema está em estado de |0〉 é necessário girar a fase de π radianos usando a transformação ejφ1 0 0 ejφ2  , (7.20) em que j = √−1 e φ1, φ2 são números reais arbitrários. O operador de Grover é aplicado a O( √ n) vezes. A complexidade é S( √ N), N onde está o número de qubits. É necessário repetir a aplicação do oráculo um número de tempo estimado em pi4 √ N M , onde M é o número de soluções que são procurados. Como dito anteriormente, o espectro infravermelho de uma molécula é um registro relacionado ao número de onda, e não valores discretos. Foi necessário codificar o espectro para adequar ao algoritmo quântico. A maneira de representar o espectro de infravermelho foi modificada para ser utilizado em computador quântico de modo a tornar possível a utilização do algoritmo de Grover. O algoritmo de Grover foi desenvolvido para encontrar apenas dados discretos em um registo. Pode-se calibrar o espectrômetro para fornecer os dados do espectros 101 no formato apropriado para o algorítimo de Grover, de forma que não haja manipulação prévia do dados, o que comprometeria a real aplicabilidade do algorítimo. Foi desenvolvida uma aplicação utilizando o algoritmo de Grover, com base no código desenvolvido por Burda [94] para correlacionar um espectro na região do infravermelho para um grupo que representa uma molécula. Foi utilizado um espectro que abrange o intervalo de 4000 cm−1 a 500 cm −1 dividido em cinco registros, r0, r1, r2, r3 e r4 com oito estados (|0〉, |1〉, |2〉, |3〉, |4〉, |5〉, |6〉 e |7〉). O formato do registro r0 é mostrado na Tabela 7.1 onde a primeira linha contém os possíveis estados do registro, a segunda linha a representação binária do estado do registro. No início, o estado do registro é pré-estabelecido como 1 |0〉, isso significa que nenhum pico foi detectado ainda (Tabela 7.1). O estado do registro está correlacionado com o pico mais intenso no grupo. Este processo pode ser executado pelo espectrômetro após a implementação desse recurso em sua interface de usuário. A Tabela 7.1 mostra a correlação entre os estados do espectro quântico e os utilizados no algoritmo, como exemplo, para o primeiro grupo de intervalos de frequências (4000-2999 cm−1), OH é o grupo, f0=4000, f1=3874, f2=3875, f3=3749, f4=3750, f5=3624, f6=3625, f7=35499, f8=3500, f9=3374, f10=3375, f11=3249, f12=3250 e f13=2999. A mesma ideia foi usada para o restante do espectro. O grupo OH é representado pelo registro r0 no estado |6〉. O algoritmo de Grover vai encontrar o estado do registro, que será comparado com os espectros de análise. É fácil de converter o espectro na região do infravermelho para este formato, também é possível incluir esta funcionalidade no espectrômetro. 7.6 Resultados e discussão sobre a aplicação do algo- ritmo de Grover A seguir são apresentados os resultados a aplicação do algoritmo de Grover em dois problemas protótipos, que serviram como prova de conceito para o presente estudo. 102 7.6.1 Identificação de moléculas utilizando o algoritmo de Grover A informação sobre as moléculas tem de ser armazenada numa base de dados. O processo de pesquisa em base de dados para a identificação de moléculas consiste em fazer uma correlação entre uma informação digitalizada a partir de um sensor e um conjunto de dados armazenados numa base de dados. As identificações são positivas quando as leituras correspondem com dados em um banco de dados. Neste trabalho, a base de dados foi pre- enchida com dados de espectro na região do infravermelho de moléculas [90]. O objetivo foi utilizar um algoritmo quântico para encontrar o endereço que contém os dados que estão correlacionados com o espectro de uma molécula desconhecida. O algoritmo foi configurado para trabalhar com qubits e duas interações de Grover. O algoritmo foi executado para os cinco grupos de frequências e obteve-se os estados de saída equivalentes aos grupos OH, CH, CC e CO, que caracterizam as moléculas de metanol. Podemos aumentar a precisão da identificação da molécula aumentando o número de q-bits para representar as gamas de frequências, sendo mais seletiva. Com dois passos de Grover em cada grupo obteve-se a correlação com o banco de dados. A Tabela 7.2 mostra a evolução do oráculo para encontrar o estado do registro r0 que mostra a localização do pico mais importante dentro da faixa de f0 − f1. Na primeira iteração do oráculo mostra que a localização do pico é no estado |6〉 com 78, 13% de probabilidade de acerto. A probabilidade de ser os outros estados é igual a 3, 12%. Tabela 7.2: Correlação entre o estado quântico de um registro e o espectro na região do infravermelho Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉 Faixa de freqüências - f0-f1 f2-f3 f4-f5 f6-f7 f8-f9 f10-f11 f12-f13 Ligação detectada - - - - - - OH - Estado inicial do registro 1 0 0 0 0 0 0 0 Estado final do registro r0 0 0 0 0 0 0 1 0 Em termos de computação quântica a informação sobre a molécula de metanol tem o seu endereço na base de dados representado pela (|6〉,|1〉, |6〉, |1〉,|3〉). Foram necessárias dez iterações do algoritmo de Grover contra dezessete usando a pesquisa clássica. O tamanho do registro foi de 8, portanto na computação clássica é necessário, no pior caso, para verificar sete posições para encontrar o alvo, a complexidade O(8), para N = 8. Utilizando o algoritmo de Grover, foi obtido o resultado com três interações, significa complexidade O( √ N), o número 103 estimado de iterações foi 2, 8 mas foi arredondado para 3, uma vez que as interações são contadas com números inteiros. 7.6.2 Determinação do mínimo de um potencial protótipo via al- goritmo de Grover Nesta parte do trabalho, foi desenvolvido um algoritmo, baseado no algoritmo de Grover, para determinar o mínimo de um potencial simples, para efeito de prova de conceito. O algorítimo foi adaptado para poder trabalhar com valores no sistema decimal, ao contrário do algorítimo inicial que propunha a amplificação e inversão de valores discretos (binários). Seja f(x) = x2 um potencial, representados na Figura 7.3, discretizado de forma a ser representado por um vetor x com oito elementos contendo os valores reais. Cada elemento índice do elemento dentro do vetor x foi correlacionado com um estado quântico Tabela 7.3. Assim o algoritmo irá procurar qual o estado quântico aponta para a posição dentro do vetor que contém a solução do problema, ou seja, o mínimo do potencial. Tabela 7.3: Correlação entre o estado quântico de um registro e a intensidade do potencial, em que o número real passa a ser representado pelo estado quântico que indica aonde se encontra o seu valor Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉 Intensidade do potencial -0,50 -0,23 0,04 0,31 0,58 0,85 1,12 1,39 Estado inicial do registro 1 0 0 0 0 0 0 0 Estado final do registro |ψ0〉 0 0 0 0 0 0 1 0 Para adequação ao algoritmo quântico de Grover, o potencial foi modificado para apresentar um máximo ao invés de um mínimo (Figura 7.3). O algoritmo foi configurado para três iterações do oráculo. Após aplicar o algo- ritmo obteve-se o estado |ψ〉 = 2, como mostrado na Tabela 7.4. O estado |ψ〉 = 0 equivale a x = 1, o estado |ψ〉 = 1 equivale a x = 2, o estado 104 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 X f(x ) Figura 7.3: Potencial Harmônico 1 2 3 4 5 6 7 8 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 Figura 7.4: Potencial Harmônico invertido para adequação ao algoritmo de Grover 105 Tabela 7.4: Estado final do oráculo. Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉 Intensidade do potencial -0,50 -0,23 0,04 0,31 0,58 0,85 1,12 1,39 Estado inicial do registro 1 0 0 0 0 0 0 0 Estado final do registro 0,173 0,36 0,55 0,26 0,21 0,40 0,16 -0,49 Estado final normalizado |ψ0〉 0 0 1 0 0 0 0 0 0 1 2 3 4 5 6 7 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Pa rte R ea l |ψ〉 Figura 7.5: Estado de |ψ〉 que indica o índice do registro x que contém o mínimo, sendo que o índice |2〉 equivale ao elemento “3” do vetor clássico que contém o mínimo do potencial. 106 |ψ〉 = 2 equivale a x = 3 e assim sucessivamente. 7.7 Conclusões gerais A principal questão no estudo da mecânica quântica, em ciência da computação, é a impossibilidade, até agora, em executar os algoritmos em um computador quântico real. A primeira maneira de cobrir este problema foi fazer a conversão dos dados utilizados em computadores clássicos com os dados para os computadores quânticos. Uma vez determinada uma maneira de usar os dados clássicos em um formato adequado ao computador quântico, é possível o desenvolvimento e a utilização dos algoritmos. A conversão de um espectro na região do infravermelho para o trabalho foi suficiente para testar o algoritmo de Grover com o presente problema. A eficiência do processo pode aumentar usando um registro maior. Neste trabalho, o espectro foi dividido em regiões para alocar os picos mais importantes, mas o ideal seria desenvolver uma maneira de codificar o espectro em um único registro. Este processo deverá envolver a melhoria do algoritmo de Grover para trabalhar com uma função com mais do que um estado. O estudo de interfaces é crítico para a execução do algoritmo. O uso de uma linguagem específica para uma simulação em computador quântico pode ser experimentado, a fim de facilitar o algoritmo de agendamento e aumentar a gama de aplicações. Essa aplicação do algoritmo quântico, em química, serviu de prova de conceito da aplicabilidade da CQ em problemas reais. A determinação do mínimo de um potencial indica a eficiência do algoritmo, uma vez que uma informação desconhecida foi localizada sem a interação com o usuário, bem como a sua aplicabilidade em um problema real. Até então, os dados a serem procurados eram manipulados pelo usuário. O sucesso na aplicação do algoritmo de Grover na procura de um mínimo, caracteriza o passo inicial para a imple- mentação de sistema baseados nas redes neurais artificiais, em que a energia mínima da rede caracteriza o aprendizado. A não utilização de valores discretos, como proposto por Grover, implicou na não obtenção de 100% de probabilidade na identificação do estado do registro. Porém é nítido que o estado solução do problema foi privilegiado em sua intensidade (Figura 7.5). 107 Capítulo 8 Redes neurais quânticas aplicadas ao estudo de estados ligados de dímeros de He 8.1 Introdução O atual trabalho consiste em um estudo inicial sobre as Redes Neurais Artificiais Quânticas. O estado da arte das RNAQ ainda encontra-se em processo de estruturação. Com o objetivo de esclarecimento e de situar o presente trabalho, o conteúdo, aqui apresentado, constou de uma breve introdução ao conceito do computador clássico. Identificando suas principais características funcionais, como por exemplo o bit (“0” ou “1”), cujas combinações permitem converter o mundo real para o ambiente computacional, de forma numérica. A porta NOT (Figura 8.1), que transforma o “0” no “1” e “1” no “0”. A porta XOR (Figura Figura 8.1: Símbolo da Porta NOT 108 8.2) que efetua a principal operação que permite implementar a soma entre dois números, dando ao computador clássico, a capacidade de reproduzir todo o universo matemático e tudo que for modelado dentro de suas regras. Sendo esse computador construído a base de silício e seguem a álgebra de Boole. Figura 8.2: Símbolo da porta XOR. A RNA clássica, apresentada, foi desenvolvida com o objetivo de estabelecer de forma sólida o conceito de rede neural, para então servir como referência e guia no estudo das redes neurais artificiais quântica. Um trabalho sobre a função de distribuição radial, foi implementado de forma a contribuir para o entendimento da modelagem da RNA. O estudo dos estados ligados de dímeros de He via RNA clássica caracterizou- se como a fronteira conceitual identificada no presente trabalho, pois, esse estudo utilizou a mecânica quântica em algoritmos desenvolvidos para o computador clássico e uma RNA clássica desenvolvida em um computador clássico. Assim foi estabelecida a ligação entre a mecânica clássica e o conceito de rede neural, sem discriminar essa última entre clássica ou quântica. Definido um problema em química, com foco no desenvolvimento e aplicação de uma RNAQ, foi estudado o algoritmo de Grover, em que a ambientação na computação quântica foi permitida. Um trabalho publicado em congresso evidenciou a aplicabilidade desse algoritmo em um problema químico, utilizado como um protótipo primitivo, para validação do método. Esse capítulo envolve o conjunto de itens estudados durante o trabalho bem como o aprendizado decorrente dos testes e aplicações das teorias envolvidas. Tenta-se deixar claro a problemática da transição da computação clássica para a computação quântica, as 109 dificuldades e exigências da interface para os dados. A Figura 8.3 foi criada para mostrar como cada item tratado nesse trabalho esteve contido dentro de um contexto, sobreposto e em alguns casos contido dentro de outro, dentro da linha do desenvolvimento do trabalho. Figura 8.3: Linha do desenvolvimento contendo os itens trabalhados e suas relações durante a transição entre a computação clássica e a computação quântica O próximo passo é a modelagem e aplicação de uma RNAQ. Várias são as pro- postas para o modelo quântico de uma RNA e para um neurônio quântico teórico. 8.2 Um modelo para o neurônio quântico Um exemplo de aplicação da computação quântica em redes neurais é dado a seguir. Consideremos o neurônio, proposto por Fei [95], com N entradas |x1〉 ... |xx〉, como mostrado na Figura 8.4. |xj〉 um qubit na forma |xj〉 = aj |0〉+ bj |1〉 = (aj, bj)T (8.1) Neste exemplo o qubit é um vetor complexo em um espaço bi-dimensional cuja base é {|0〉 , |1〉}. Esta base pode ser expressa como {(1, 0)T , (0, 1)T}. Os estados das bases 110 Figura 8.4: Neurônio Quântico |0〉 e |1〉 equivalem aos valores 0 e 1 do bit clássico. Um qubit |φ〉 é a superposição desses dois estados, sendo |φ〉 = α|0〉+β|1〉, em que β e α são probabilidade de amplitudes |α|2+|β|2= 1. A combinação de 〈xj| e |xi〉 como em 〈xj |xi〉 denota o produto interno de dois vetores e é um escalar, logo: 〈0 |0〉 = 〈1 |1〉 = 1 (8.2) e 〈0 |1〉 = 〈1 |0〉 = 0 (8.3) Outro modelo, está disponível na literatura, não tratado aqui, como o modelo de Li [96] (Figura 8.5), que trata da porta quântica CNOT , cujo efeito do qubit de controle é ajustado de forma a comportar-se como um peso sináptico. 111 Figura 8.5: Modelo de um neurônio quântico baseado na porta CNOT, em que os dois terminais do lado esquerdo são as entradas de estímulos e os dois terminais do lado direito são as saídas de estímulos. 8.3 A propagação em um neurônio quântico A propagação de um estímulo quântico caracteriza-se pela interação entre os qubits, através das matrizes unitárias (pesos) e a sua saída será determinada por: |y〉 = F̂ ∑ j=1 Nŵj |xj〉 (8.4) em que ŵj é uma matriz 2x2 atuando na base {|0〉 , |1〉}, F̂ é um operador que pode ser implementado por uma rede de portas quânticas. Em um processo de treinamento, ŵj pode ser calculado por ajustes dos pesos através de uma retropropagação, como nas redes clássicas. A retropropagação consiste em ajustar os pesos, no sentido oposto à propagação dos estímulos, em função do erro que a rede comete ao reproduzir os dados de treinamento. 112 8.4 A função XOR por redes neurais quânticas A correspondência entre a Rede Neural Clássica e a Rede Neural Quântica, em relação à natureza clássica e à natureza quântica, é mostrada na Tabela 8.1. Tabela 8.1: Correspondência entre a Rede Neural Clássica e a Rede Neural Quântica Redes Clássicas Redes Quânticas Estado do neurônio qubits xi ∈ R |x〉 = a |0〉 + b |1〉 Conexão Entrelaçamento {wij} |x0x1...xp−1〉 Regra de aprendizado Superposição de estados entrelaçados∑p s=1 x s ix s j ∑p s=1 as |x0x1...xp−1〉 Procura de um vencedor Transformação unitária n = maxarg(fi) U : ψ −→ ψ′ Resultado na saída Decorrência N ∑p s=1 as |xs〉 ⇒ ∣∣∣xk〉 É conhecido da literatura que uma rede neural clássica de uma única camada não pode aprender o comportamento de uma função XOR [18]. Neste caso são necessárias duas camadas, sendo uma com dois neurônios de entrada e um neurônio na saída. Nos resultados apresentados a seguir, um único neurônio quântico, proposto (Fi- gura 8.6) por [95], foi capaz de representar uma função XOR. Considerando este neurônio com duas entradas, tem-se a saída: |y〉 = F̂ ∑ j=1 ŵj |xj〉 = F̂ (ŵ1 |x1〉+ ŵ2 |x2〉). (8.5) Escolhendo 113 Figura 8.6: Modelo proposto para um neurônio quântico ŵ1 = ŵ2 = Ĥ = 1√ 2  1 1 1 −1  (8.6) e F̂ = 1√ 2  0 1 1 −1  sgn(.) 0 0 sgn(.)  (8.7) em que sgn(.) é o sinal dos valores dos elementos para função e são determinados por um processo de treinamento. A saída desse neurônio possibilitou reproduzir o comportamento da função XOR Tabela 8.2. Tabela 8.2: Função XOR reproduzida pelo neurônio quântico. |x1〉 |x2〉 ŵ1 |x1〉+ ŵ2 |x2〉 |y〉 |0〉 |0〉 (√2,√2)T |0〉 |0〉 |1〉 (√2, 0)T |1〉 |1〉 |0〉 (√2, 0)T |1〉 |1〉 |1〉 (√2,−√2)T |0〉 114 8.5 Determinação do número de estados ligados via RNAQ No Capítulo 5 estados ligados para dímeros formados por He com alguns gases nobres foram estudados de forma a estabelecer um conjunto de informações que reproduziriam um sistema experimental. Os dados obtidos teoricamente representam um sistema físico real (Tabela 8.3). Assim, esses dados puderam ser usados para representar aqueles que seriam os dados obtidos experimentalmente [97], em que um sistema composto por substâncias em solução aquosa, foi simulado e tratado como dados de um sistema real obtidos de um experimento. Tabela 8.3: Relação dos estados ligados para diferentes dímeros de gases nobres l HeHe HeNe HeAr HeKr HeXe 0 0 1 1 2 2 1 0 1 1 1 1 2 0 1 1 1 1 3 0 0 1 1 1 4 0 0 1 1 1 5 0 0 0 1 1 6 0 0 0 0 0 Nesta parte do trabalho, foram escolhidos para a modelagem quatro dímeros, HeHe, HeNe, HeAr e HeKr. Nesta modelagem o sistema foi composto por gases nobres, e as variáveis do sistema foram representadas na forma adequada para serem processadas através de uma linguagem relacionada à computação quântica. Supondo que, para dois estados 0 e 1 |ψsqubit〉 = α|0〉+ β|1〉 = α β  , (8.8) em que |ψsqubit〉 é o qubit que representa o estado do sistema. Como na expressão 6.9 do 115 capítulo 6, para |xn〉 estados de probabilidade pn, tem-se |ψsqubit〉 = p0|x0〉+ p1|x1〉+ ...+ pn|xn〉 =  p0 p1 ... pn  , (8.9) em que n varia de 0 até o número de estados possíveis. No tratamento via RNA quântica o átomo foi representado por sua distribuição eletrônica, convertida no formato adequado à computação quântica. O qubit recebeu a seguinte notação para representar um átomo: |ψÁtomoqubit 〉 = p0|OrbitalEletron0 〉+ p1|OrbitalEletron1 〉+ ...+ pn|OrbitalEletronn 〉 =  p0 p1 ... pn  , (8.10) em que p0, p1,...pn são as amplitudes de probabilidade. O qubit foi modelado levando-se em conta o átomo mais complexo em estudo, neste caso, o Criptônio Kr, que possui 36 elétrons, foi o primeiro a ser representado. Para que não houvesse conflito com a notação empregada na mecânica quântica os elétrons foram codificados em binário de acordo com a Tabela 8.4. Tabela 8.4: Codificação dos elétrons do Criptônio para o uso na RNAQ Elétron Codificação 1s1 1√ 36 |000000〉 1s2 1√ 36 |000001〉 2s1 1√ 36 |000010〉 2s2 1√ 36 |000011〉 2p1 1√ 36 |000100〉 2p2 1√ 36 |000101〉 2p3 1√ 36 |000110〉 2p4 1√ 36 |000111〉 116 Tabela 8.4 – Continuação da página anterior. Elétron Codificação 2p5 1√ 36 |001000〉 2p6 1√ 36 |001001〉 3s1 1√ 36 |001010〉 3s2 1√ 36 |001011〉 3p1 1√ 36 |001100〉 3p2 1√ 36 |001101〉 3p3 1√ 36 |001110〉 3p4 1√ 36 |001111〉 3p5 1√ 36 |010000〉 3p6 1√ 36 |010001〉 4s1 1√ 36 |010010〉 4s2 1√ 36 |010011〉 3d1 1√ 36 |010100〉 3d2 1√ 36 |010101〉 3d3 1√ 36 |010110〉 3d4 1√ 36 |010111〉 3d5 1√ 36 |011000〉 3d6 1√ 36 |011001〉 3d7 1√ 36 |011010〉 3d8 1√ 36 |011011〉 3d9 1√ 36 |011100〉 3d10 1√ 36 |011101〉 4p1 1√ 36 |011110〉 4p2 1√ 36 |011111〉 4p3 1√ 36 |100000〉 4p4 1√ 36 |100001〉 4p5 1√ 36 |100010〉 4p6 1√ 36 |100011〉 5s1 0 |100100〉 5s2 0 |100101〉 4d1 0 |100110〉 4d2 0 |100111〉 117 Tabela 8.4 – Continuação da página anterior. Elétron Codificação 4d3 0 |101000〉 4d4 0 |101001〉 4d5 0 |101010〉 4d6 0 |101011〉 4d7 0 |101100〉 4d8 0 |101101〉 4d9 0 |101110〉 4d10 0 |101111〉 5p1 0 |110000〉 5p2 0 |110001〉 5p3 0 |110010〉 5p4 0 |110011〉 5p5 0 |110100〉 5p6 0 |110101〉 6s1 0 |110110〉 6s2 0 |110111〉 4f 1 0 |111000〉 4f 2 0 |111001〉 4f 3 0 |111010〉 4f 4 0 |111011〉 4f 5 0 |111100〉 4f 6 0 |111101〉 4f 7 0 |111110〉 4f 8 0 |111111〉 118 Assim, o átomo de Kr foi representado pelo qubit |ψKrqubit〉 = 1√ 36 |000000〉+ 1√ 36 |000001〉+ 1√ 36 |000010〉+ 1√ 36 |000011〉+ 1√ 36 |000100〉 + 1√ 36 |000101〉+ 1√ 36 |000110〉+ 1√ 36 |000111〉+ 1√ 36 |001000〉+ 1√ 36 |001001〉 + 1√ 36 |001010〉+ 1√ 36 |001011〉+ 1√ 36 |001100〉+ 1√ 36 |001101〉+ 1√ 36 |001110〉 + 1√ 36 |001111〉+ 1√ 36 |010000〉+ 1√ 36 |010001〉+ 1√ 36 |010010〉+ 1√ 36 |010011〉 + 1√ 36 |010100〉+ 1√ 36 |010101〉+ 1√ 36 |010110〉+ 1√ 36 |010111〉+ 1√ 36 |011000〉 + 1√ 36 |011001〉+ 1√ 36 |011010〉+ 1√ 36 |011011〉+ 1√ 36 |011100〉+ 1√ 36 |011101〉 + 1√ 36 |011110〉+ 1√ 36 |011111〉+ 1√ 36 |100000〉+ 1√ 36 |100001〉+ 1√ 36 |100010〉 + 1√ 36 |100011〉+ 0|100100〉+ 0|100101〉+ 0|100110〉+ 0|100111〉 + 0|101000〉+ 0|101001〉+ 0|101010〉+ 0|101011〉+ 0|101100〉+ 0|101101〉 + 0|101110〉+ 0|101111〉+ 0|110000〉+ 0|110001〉+ 0|110010〉+ 0|110011〉 + 0|110100〉+ 0|110101〉+ 0|110110〉+ 0|110111〉+ 0|111000〉+ 0|111001〉 + 0|111010〉+ 0|111011〉+ 0|111100〉+ 0|111101〉+ 0|111110〉+ 0|111111〉 (8.11) em que os 36 primeiros estados, |000000〉, |000001〉,..., |100011〉 representam os elétrons desse átomo, com probabilidade igual a 1/ √ 36 cada uma, indicando que todos têm o mesmo peso na representação do átomo e o restante dos estados possuem probabilidade igual a zero, indicando que estes estados não têm peso na representação do átomo, ou seja, os orbitais estão vazios. Os estados que representam orbitais vazios, foram adicionados para completar um número de estados suficiente para obter uma quantidade de estados equivalente a uma potência de base 2, neste caso 64, dada a natureza da computação quântica. Como esses estados não possuem peso na representação do átomo, foi atribuída a probabilidade 0 aos seus índices. Seguindo o mesmo princípio utilizado para o Kr, o átomo de He foi representado 119 por |ψHequbit〉 = 1√ 2 |000000〉+ 1√ 2 |000001〉+ 0|000010〉+ 0|000011〉+ 0|000100〉+ 0|000101〉 + 0|000110〉+ 0|000111〉+ 0|001000〉+ 0|001001〉+ 0|001010〉+ 0|001011〉 + 0|001100〉+ 0|001101〉+ 0|001110〉+ 0|001111〉+ 0|010000〉+ 0|010001〉 + 0|010010〉+ 0|010011〉+ 0|010100〉+ 0|010101〉+ 0|010110〉+ 0|010111〉 + 0|011000〉+ 0|011001〉+ 0|011010〉+ 0|011011〉+ 0|011100〉+ 0|011101〉 + 0|011110〉+ 0|011111〉+ 0|100000〉+ 0|100001〉+ 0|100010〉+ 0|100011〉 +0|100100〉+0|100101〉+0|100110〉+0|100111〉+0|101000〉+0|101001〉+0|101010〉 +0|101011〉+0|101100〉+0|101101〉+0|101110〉+0|101111〉+0|110000〉+0|110001〉 +0|110010〉+0|110011〉+0|110100〉+0|110101〉+0|110110〉+0|110111〉+0|111000〉 +0|111001〉+0|111010〉+0|111011〉+0|111100〉+0|111101〉+0|111110〉+0|111111〉 (8.12) em que os dois primeiros estados, |000000〉, |000001〉, representam os elétrons desse átomo, com probabilidade igual a 1/ √ 2. O átomo de Ne, com seus dez elétrons, foi representado por |ψNequbit〉 = 1√ 10 |000000〉+ 1√ 10 |000001〉+ 1√ 10 |000010〉+ 1√ 10 |000011〉+ 1√ 10 |000100〉 + 1√ 10 |000101〉+ 1√ 10 |000110〉+ 1√ 10 |000111〉+ 1√ 10 |001000〉+ 1√ 10 |001001〉 +0|001010〉+0|001011〉+0|001100〉+0|001101〉+0|001110〉+0|001111〉+0|010000〉 +0|010001〉+0|010010〉+0|010011〉+0|010100〉+0|010101〉+0|010110〉+0|010111〉 +0|011000〉+0|011001〉+0|011010〉+0|011011〉+0|011100〉+0|011101〉+0|011110〉 +0|011111〉+0|100000〉+0|100001〉+0|100010〉+0|100011〉+0|100100〉+0|100101〉 +0|100110〉+0|100111〉+0|101000〉+0|101001〉+0|101010〉+0|101011〉+0|101100〉 +0|101101〉+0|101110〉+0|101111〉+0|110000〉+0|110001〉+0|110010〉+0|110011〉 + 0|110100〉+ 0|110101〉+ 0|110110〉+ 0|110111〉+ 0|111000〉+ 0|111001〉 + 0|111010〉+ 0|111011〉+ 0|111100〉+ 0|111101〉+ 0|111110〉+ 0|111111〉 (8.13) em que os dez primeiros estados, |000000〉, |000001〉,...,|001001〉 representam os elétrons desse átomo, com probabilidade igual a 1/ √ 10. O átomo de Ar, com seus dezoito elétrons, foi representado por 120 |ψArqubit〉 = 1√ 18 |000000〉+ 1√ 18 |000001〉+ 1√ 18 |000010〉+ 1√ 18 |000011〉+ 1√ 18 |000100〉 + 1√ 18 |000101〉+ 1√ 18 |000110〉+ 1√ 18 |000111〉+ 1√ 18 |001000〉+ 1√ 18 |001001〉 + 1√ 18 |001010〉+ 1√ 18 |001011〉+ 1√ 18 |001100〉+ 1√ 18 |001101〉+ 1√ 18 |001110〉 + 1√ 18 |001111〉+ 1√ 18 |010000〉+ 1√ 18 |010001〉+0|010010〉+0|010011〉+0|010100〉 +0|010101〉+0|010110〉+0|010111〉+0|011000〉+0|011001〉+0|011010〉+0|011011〉 + 0|011100〉+ 0|011101〉+ 0|011110〉+ 0|011111〉+ 0|100000〉+ 0|100001〉 + 0|100010〉+ 0|100011〉+ 0|100100〉+ 0|100101〉+ 0|100110〉+ 0|100111〉 + 0|101000〉+ 0|101001〉+ 0|101010〉+ 0|101011〉+ 0|101100〉+ 0|101101〉 + 0|101110〉+ 0|101111〉+ 0|110000〉+ 0|110001〉+ 0|110010〉+ 0|110011〉 + 0|110100〉+ 0|110101〉+ 0|110110〉+ 0|110111〉+ 0|111000〉+ 0|111001〉 + 0|111010〉+ 0|111011〉+ 0|111100〉+ 0|111101〉+ 0|111110〉+ 0|111111〉 (8.14) em que os dezoito primeiros estados, |000000〉, |000001〉,..., |010001〉 representam os elétrons desse átomo, com probabilidade igual a 1/ √ 18. Da mesma forma que a RNA clássica, a RNA quântica pode ser treinada por um processo de aprendizado supervisionado [95]. Os conjuntos de dados para o treinamento, obtido no trabalho citado no Capítulo 5, já publicados [98], são: [|ψHequbit〉, |ψNequbit〉, |ψArqubit〉, |ψKrqubit]〉, para a entrada da rede. Esses dados são apresentados na entrada da rede aos pares. Os dados de saída, [|ψ0qubit, |ψ1qubit, |ψ2qubit, |ψ3qubit], são apresentados na saída da rede para um treinamento supervisionado. O par [|ψHequbit〉, |ψHequbit〉] corresponde à ativação da saída |ψ0, indicando a não formação de estados ligados. Considerando quatro neurônios com duas entradas, tem-se as seguintes expressões para a rede: ∣∣∣ψ0qubit〉 = F̂ (ŵ1 ∣∣∣ψA1qubit〉+ ŵ2 ∣∣∣ψA2qubit〉)∣∣∣ψ1qubit〉 = F̂ (ŵ1 ∣∣∣ψA1qubit〉+ ŵ2 ∣∣∣ψA2qubit〉)∣∣∣ψ2qubit〉 = F̂ (ŵ1 ∣∣∣ψA1qubit〉+ ŵ2 ∣∣∣ψA2qubit〉)∣∣∣ψ3qubit〉 = F̂ (ŵ1 ∣∣∣ψA1qubit〉+ ŵ2 ∣∣∣ψA2qubit〉) (8.15) 121 Adotando-se uma estrutura similar à da RNA clássica, a RNA quântica foi estru- turada de acordo com a figura 8.7. Figura 8.7: Rede neural quântica estruturada para a determinação do número de estados ligados à partir da estrutura eletrônica dos pares de átomos, em que |ψA1qubit〉 e |ψA2qubit〉 são as entradas da rede e |ψ0qubit〉, |ψ1qubit〉, |ψ2qubit〉 e |ψ3qubit〉 são as saídas. O pesos sinápticos ŵ1 e ŵ2, são transformações unitárias tais que: ŵ1 = ŵ2 = Ĥ = 1√ 2  1 1 1 −1  (8.16) O operado F̂ tem a função de atuar nos qubits de forma a correlacioná-los com os qubits que determinam os estados das saídas. F̂ = 1√ 2  0 1 1 −1  sgn(.) 0 0 sgn(.)  (8.17) em que sgn(.) é o sinal da função. Para o caso dos estado ligados uma matriz de pesos sinápticos de 64 linhas e 64 colunas foi escolhida como sendo a transformação unitária (Figura 8.8). 122 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 Figura 8.8: Matrix de Hadamard de 64 por 64 termos, em que os quadrados brancos equivalem a “1” e os quadrados escuros equivalem a “-1”. 123 Através de um processo de treinamento os valores dos elementos de F̂ são deter- minados. Neste trabalho, um conjunto de 1024 matrizes de estados F̂ foram geradas com valores aleatórios, supondo que dentre essas matrizes, uma ou mais, contivessem um conjunto de dados solução. Através do algorítimo de Grover, foi localizada a matriz solução, através do vetor de erros. Não há acompanhamento do decaimento do erro, uma vez que as possíveis soluções são geradas simultaneamente no computador quântico e o algorítimo de Grover deve ser executado com um número finito e pré-determinado de iterações. O Algoritmo de Grover foi executado com 25 interações quânticas e o estado final do oráculo foi medido como sendo |ψqubit〉 = |548〉 indicando que a solução encontrava-se no registro 548 (Figura 8.9). 0 100 200 300 400 500 600 700 800 900 1000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Pr ob ab ilid ad e Figura 8.9: Identificação do registro de maior probabilidade de encontrar a solução, caracte- rizando o treinamento da RNAQ. O tempo estimado para a execução do processo foi baseado no trabalho de Er- makok [99], que realizou experimentalmente o algorítimo de Grover, utilizando ressonância 124 Tabela 8.5: Determinação do número de estados ligados por uma RNAQ algorítimo do Gro- ver. ∣∣∣ψA1qubit〉 ∣∣∣ψA2qubit〉 ∣∣∣ψsqubit〉∣∣∣ψHequbit〉 ∣∣∣ψHequbit〉 ∣∣∣ψ0qubit = 0, ψ1qubit = 0, ψ2qubit = 0, ψ3qubit = 0〉∣∣∣ψHequbit〉 ∣∣∣ψNequbit〉 ∣∣∣ψ0qubit = 0, ψ1qubit = 1, ψ2qubit = 0, ψ3qubit = 0〉∣∣∣ψHequbit〉 ∣∣∣ψArqubit〉 ∣∣∣ψ0qubit = 0, ψ1qubit = 1, ψ2qubit = 0, ψ3qubit = 0〉∣∣∣ψHequbit〉 ∣∣∣ψKrqubit〉 ∣∣∣ψ0qubit = 0, ψ1qubit = 0, ψ2qubit = 1, ψ3qubit = 0〉 magnética nuclear, que também esta no foco dos estudos referentes ao computador quântico. Assim, a preparação do estado fundamental demanda um tempo de 0,00200s e o Algorítimo de Grover demanda um tempo de 0,00658s, ambos rodando em um computador quântico. A Tabela 8.5 contem a relação entre os dados de entrada, que identificam o dímero e as medidas observáveis |ψ〉 das saídas da RNAQ. Em geral os estados são amplitudes representadas por |〈ψ|ψ〉|2 8.6 Conclusão O neurônio quântico se mostrou eficiente e reduziu significativamente a complexi- dade de uma rede neural. Essa redução na complexidade da RNA reflete-se na simplificação do pacote de dados trabalhados de forma simultânea. É importante ressaltar que essa dimi- nuição na complexidade refere-se ao código sendo executado em um computador quântico. Considerou-se que as interfaces criadas para preencher a lacuna da não existência de um computador quântico, acessível durante o desenvolvimento deste trabalho. O sucesso na aplicação dos princípios quânticos no neurônio exemplificaram o efeito da substituição dos princípios da computação clássica pelos princípios da computação quântica. A primeira evidência da eficiência de uma rede neural quântica ficou caracterizada na necessidade de apenas uma camada de neurônio(s). Isso é uma vantagem considerável em relação RNA clássica, pois a camada adicional em uma RNA clássica adiciona a propriedade 125 de classificação à sua estrutura. A segunda característica importante da RNAQ foi a necessidade de somente um neurônio, no caso, quântico. Em relação à rede neural quântica, foi concluído que realmente um simples neurônio quântico é capaz de atuar como uma função XOR. Esta é uma vantagem importante em relação à rede neural clássica, pois só é possível implementar a função XOR quando esta rede está na topologia de duas ou mais camadas e mais de um neurônio. Uma linguagem de programação mais próxima dos sistemas de natureza quântica é muito mais apropriado para a resolução de problemas mais complexos. O efeito da classificação e da correlação de dados quânticos foram mostrados. Fica em aberto o estudo da viabilidade da expansão do número de átomos e dímeros, que a RNAQ, seguindo o modelo aqui estudado pode suportar. 126 Capítulo 9 Conclusão geral A interface com o usuário, em um computador clássico, mascara o que ocorre real- mente dentro da máquina. As linguagens de programação, de alto nível, inibem a percepção do usuário em relação à forma que o processador de um computador clássico trabalha. O conceito de bit, em geral, é puramente lógico e não retrata o efeito físico de sua manipu- lação em termos dos circuitos lógicos. Um nivelamento, na forma de esclarecimento, deve ser investigado para consolidar os conhecimentos sobre o computador clássico de forma a entender a sua estrutura mínima básica. O conceito sobre bit, portas lógicas, porta lógica NOT e XOR, devem ser plenamente entendidos. A analogia entre o computador clássico e o conceito do que seria, ou será, o computador quântico, deve ser de constante discussão. O entendimento da computação quântica e sua utilização não segue o mesmo paradigma da computação clássica. Na computação clássica, implementa-se a máquina (hardware) e pos- teriormente desenvolvem-se programas, baseados em algoritmos, para serem executados. Na computação quântica, essa ordem não é verdadeira, esta pode avançar de forma independente do computador quântico. A computação quântica segue as leis da mecânica quântica e uma vez que um algoritmo obedece essas leis, ele pode ser considerado plausível. O computador quântico, máquina responsável por executar algoritmos quânticos, também deve seguir as leis da mecânica quântica e deve ser capaz de responder aos estímulos de natureza quântica. O que discute-se é a clareza da incorporação de efeitos quânticos em algoritmos 127 de otimização. Apesar do fato de que o primeiro ponto em sistema quântico é o aparecimento da constante de Planck que caracteriza a mecânica quântica numa forma rigorosa. Então, como caracterizar a influência onde está a constante de Planck é uma questão relevante. Não está explicita a influência da constante de Planck no algorítimo de Grover. Podem então ser chamados de AQ? De forma rigorosa a resposta é: não. Grover não precisa de interpretado como um algoritmo quântico para funcionar, mas precisa se im- plementado sob as regras da mecânica quântica para poder ser executado em um computador quântico e mostra a sua vantagem em relação ao clássico. Nenhum desses algoritmos começa na equação de Schrödinger e termina em algoritmo de otimização. O que chega mais perto disso seria o Grover, mas, aparentemente, não incorpora a constante de Planck. Conclui-se que o desenvolvimento, tanto da Computação Quântica quanto do computador quântico, até o atual momento, pode ser dado de forma assíncrona, pois, seguindo as leis da quântica, ambos os desenvolvimentos irão convergir para o mesmo ponto, sendo que inclusão da constante de Plank deve ser investigada. Uma consequência do presente estudo foi a volta à formulação de Bohm da Mecânica Quântica. Essa formulação incorpora de forma clara emaranhamento, não localidade e o paradoxo EPR, emprestadas no estudo dos computadores quânticos. Diante de algumas realizações experimentais referenciadas ao longo do texto, foi possível idealizar uma máquina completa e até propor um sistema de processamento para uma possível CPU quântica. Este trabalho permitiu estabelecer de forma sólida um modelo para o computador quântico, baseado em realizações experimentais. Propor um modelo para o computador quântico foi primordial para situar o grupo na CQ. A computação quântica não é simplesmente a implantação de um novo conceito de computadores e algorítimos. Ela envolve um novo conceito na estruturação dos problemas numéricos, armazenamento de informação e linguagem de programação. O conceito de CQ não concentra somente na criação de algorítimos. O fato do computador quântico ser um conceito que ainda não foi totalmente estruturado, causa uma gama de discussões sobre o que realmente é a computação quântica e onde se estabelece a fronteira entre, computação quântica, computador quântico, algorítimos e usuários. Ficou claro que há a necessidade de se criar uma linguagem própria a CQ e uma interface com o usuário. 128 Os algoritmos plausíveis para a computação quântica chamam a atenção para o desenvolvimento de uma linguagem mais amigável para a Química, a qual não é limitada pelos recursos disponibilizados pela computação clássica. O computador quântico promete um aumento da velocidade de processamento e uma compactação maior do processadores. Os algoritmos quânticos prometem ser mais velozes e solucionar problemas com maior eficiência do que os computadores clássicos. Pro- blemas complexos para os computadores clássicos podem ser resolvidos com baixo custo computacional por um computador quântico. Com base nessas perspectivas e no avanço das pesquisas, abre-se um grande espaço de aplicações desta tecnologia. Estudar suas caracte- rísticas, torna-se fundamental para sua adequação às áreas de interesse. Há necessidade do estudo dos conceitos da computação clássica dentro da computação quântica, para aprovei- tamento e conversão dos algoritmos atuais. Fica evidente, neste momento, a necessidade de investigar a possibilidade de implementação experimental, em um sistema quântico real, das informações geradas nesse trabalho. O objetivo principal deste trabalho, o uso de um modelo de RNAQ em um sistema químico, foi demonstrado. Foi possível executar, em um computador clássico, uma rede neural artificial quântica, lançando mão de interfaces, para compor uma camada computacional entre o algoritmo quântico e o computador clássico. Esta camada que pode ser olhada como uma interface, poderá ser facilmente retirada quando da utilização do algoritmo em um computador quântico real. A rede neural artificial quântica, tendo os devidos ajustes temporais, em função de ter sido rodada em um computador clássico, apresentou-se como uma estrutura extre- mamente compacta e com velocidade superior à clássica. O sucesso desta implementação sugere investigar sistemas mais complexos, envolvendo uma grande quantidade de átomos e moléculas, abrindo caminho para processamento de informações na área de química, até então inviáveis para o computador clássico, em termos temporais e em termos da grande quantidade de variáveis. Pode-se esperar que problemas de instabilidade numérica possam ser contornados. No entando, essa nova visão implica em abandonar a ideia de que as redes neurais quânticas devam ser inspiradas, puramente, nas redes neurais clássicas. O algoritmo de Grover e a teoria de Bohm devem ser investigados rigorosamente, uma vez que, O algoritmo de Grover tem analogia na mecânica clássica e quântica e não é, obviamente, um algoritmo que só tem a sua demostração em termos da mecânica quântica. 129 Deve ser visto como um algoritmo eficiente, de busca, dentro da mecânica clássica e visto como um algorítimo cuja linguagem, facilmente enquadra-se dentro da filosofia da computação quântica. Ao contrário de Grover, a teoria de Bohm é quântica e rica em novas interpreta- ções. Um texto separado sobre Bohm será escrito. Este trabalho enquadra-se como um início básico, dos estudos no campo da computação quântica, no grupo de pesquisa. Por se tratar de uma área relativamente nova, ele tem a importância de ser um texto e uma proposta inicial para estudos posteriores. 130 Referências Bibliográficas 1 FEYNMAN, R. Simulating physics with computers. Int. J.Theor.Phys., v. 21, p. 467–488, 1982. 2 BENIOFF, P. Quantum mechanical hamiltonian models of turing machines. Journal of Statistical Physics, Springer Netherlands, v. 29, p. 515–546, 1982. ISSN 0022-4715. 10.1007/BF01342185. Disponível em: . 3 SHOR, P. W. Algorithms for quantum computation: Discrete logarithms and factoring. Proceedings, 35th Annual Symposium on Foundations of Computer Science, p. 124–134., 1994. 4 GROVER, L. K. A fast quantum mechanical algorithm for database search. Proceedings 28th Annual Symposium on the Theory of Computing (STOC), ACM, New York, NY, USA, p. 212–219, 1996. 5 DU, J.-Z. et al. Threshold quantum cryptograph based on grover’s algorithm. Physics Letters A, v. 363, p. 361–368, 2007. ISSN 0375-9601. Disponível em: . 6 MCGEOCH, C. C.; WANG, C. Experimental evaluation of an adiabiatic quantum system for combinatorial optimization. In: Proceedings of the ACM International Conference on Computing Frontiers. New York, NY, USA: ACM, 2013. (CF ’13), p. 23:1–23:11. ISBN 978-1-4503-2053-5. Disponível em: . 7 USRA, U. S. R. A. Disponível em: , Acesso em: 05 Maio 2013. Disponível em: . 8 MICHIELSEN, K.; RAEDT, H. D.; RAEDT, K. D. A simulator for quantum computer hardware. Nanotechnology, v. 13, n. 1, p. 23, 2002. Disponível em: . 9 STRELCHUK, S.; HORODECKI, M.; OPPENHEIM, J. Generalized teleportation and entanglement recycling. Phys. Rev. Lett., American Physical Society, v. 110, p. 010505, Jan 2013. Disponível em: . 10 KOWALTOWSKI, T. Von neumann: suas contribuições à computação. Estudos Avançados, scielo, v. 10, p. 237–260, 04 1996. ISSN 0103-4014. 131 11 NEUMANN, J. von. The principles of large-scale computing machines. Ann. Hist. Comp, v. 3, n. 3, p. 263–273, 1946. 12 NEUMANN, J. von. The computer and the brain,. Yale Univ. Press,New Haven, 1958. 13 BOOLE, G. The mathematical analysis of logic : being an essay towards a calculus of deductive reasoning. [S.l.]: Cambridge : Macmillan, Barclay, & Macmillan, 1847. 14 CHURCH, A. A Note on the Entscheidungsproblem. The Journal of Symbolic Logic, v. 1, n. 1, p. 40–41, 1936. Disponível em: . 15 TURING, A. M. On computable numbers, with an application to the entscheidungs- problem. Proceedings of the London Mathematical Society, s2-42, n. 1, p. 230–265, 1936. Disponível em: . 16 BOOLE, G. An Investigation of the Laws of Thought. [S.l.]: Cambridge : Macmillan & Co., 1854. ISBN 0486600289. 17 ROGERS, J. Object-oriented neural networks in C++. Orlando, FL, USA: Academic Press, Inc., 1996. ISBN 0-12-593115-8. 18 HAYKIN, S. Redes Neurais: Princípios e Práticas. 2. ed. [S.l.]: Artmed Editora Ltda., 2001. 19 ALMEIDA, M. et al. Artificial neural networks applied to theoretical chemistry. In: SBRN ’98: Proceedings of the Vth Brazilian Symposium on Neural Networks. Washington, DC, USA: IEEE Computer Society, 1998. p. 232. ISBN 0-8186-8629-4. 20 CHEN, X.-W.; LIU, M. Domain-based predictive models for protein-protein interaction prediction. EURASIP J. Appl. Signal Process., Hindawi Publishing Corp., New York, NY, United States, v. 2006, p. 55–55, 2006. ISSN 1110-8657. 21 CERONI, A.; FRASCONI, P.; POLLASTRI, G. Learning protein secondary structure from sequential and relational data. Neural Netw., Elsevier Science Ltd., Oxford, UK, UK, v. 18, n. 8, p. 1029–1039, 2005. ISSN 0893-6080. 22 RALAIVOLA, L. et al. Graph kernels for chemical informatics. Neural Netw., Elsevier Science Ltd., Oxford, UK, UK, v. 18, n. 8, p. 1093–1110, 2005. ISSN 0893-6080. 23 LISZKA-HACKZELL, J. J. Categorization of fetal heart rate patterns using neural networks. J. Med. Syst., Plenum Press, New York, NY, USA, v. 25, n. 4, p. 269–276, 2001. ISSN 0148-5598. 24 SEBASTIAO, R. C. O.; BRAGA, J. P.; YOSHIDA, M. I. Artificial neural network applied to solid state thermal decomposition. Journal of Thermal Analysis and Calorimetry, Kluwer Academic Publishers, v. 74, p. 811–818, 2003. ISSN 1572-8943. 25 SEBASTIAO, R. et al. Nonlinear global inversion of potential energy surfaces from the experimentally determined second virial coefficients. Chem. Phys. Lett., 378, n. 3-4, p. 406–409, 2003. ISSN 0009-2614. 132 26 VITERBO, V. C. et al. Inversion of simulated positron annihilation lifetime spectrum using a neural network. Journal of Chemical Information and Computer Sciences, v. 41, n. 2, p. 309–313, 2001. Disponível em: . 27 ARBIB, M. A. The Handbook of Brain Theory and Neural Networks: Second Edition. [S.l.]: The MIT Press Cambridge, Massachussetts, 2002. 28 CULL, P. The mathematical biophysics of nicolas rashevsky. BioSystems, v. 88, p. 178–184, 2007. 29 MCCULLOCH, W. S.; PITTS, W. H. A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics, v. 5, p. 115–133, 1943. 30 ROSENBLATT, F. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Review, v. 65, n. 6, p. 386–408, 1958. ISSN 0033-295X. 31 PAO, Y.-H. Adaptive Pattern Recognition and Neural Networks. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 1989. ISBN 0-201-12584-6. 32 MARQUARDT, D. W. An algorithm for least-squares estimation of nonlinear parameters. J. Soc. INDUST. APPL. MATH., v. 11, n. 2, 1963. 33 COSTA, M. A.; BRAGA, A. de P.; MENEZES, B. R. de. Improving generalization of mlps with sliding mode control and the levenberg marquardt algorithm. Neurocomputing, v. 70, p. 1342–1347, 2007. 34 HAGAN, M. T.; DEMUTH, H. B.; BEALE, M. Neural network design. Boston, MA, USA: PWS Publishing Co., 1996. ISBN 0-534-94332-2. 35 MORSALI, A. et al. An accurate expression for radial distribution function of the lennard-jones fluid. Chem. Phys., v. 310, p. 11–15, 2005. 36 BAMDAD, M. et al. A new expression for radial distribution function and infinite shear modulus of lennard-jones fluids. Chem. Phys., v. 325, p. 554–562, 2006. 37 WINTER, R. et al. The structural properties of liquid, solid and amorphous sulphur. Journal of Physics: Condensed Matter, v. 2, p. SA215, 1990. Disponível em: . 38 SIPPL, M. J. et al. Helmholtz free energies of atom pair interactions in proteins. Folding and Design, v. 1, n. 4, p. 289 – 298, 1996. ISSN 1359-0278. 39 BRAGA, J. P. Físico-Química. MG: Viçosa, MG: Editora da UFV, 2002. 265 p. (Capítulo 4 trata da energia potencial). 40 VERLET, L. Computer "experiments"on classical fluids. ii. equilibrium correlation functions. Phys. Rev., American Physical Society, v. 165, n. 1, p. 201–214, Jan 1968. 133 41 AZIZ, R. A highly accurate interatomic potential for argon. J. Chem. Phys., 99, n. 6, p. 4518–4525, SEP 15 1993. 42 LEMES, N. et al. Potential energy function from differential cross-section data: An inverse quantum scattering theory approach. Int. J. Quantum Chem., 108, n. 13, Sp. Iss. SI, p. 2623–2627, 2008. ISSN 0020-7608. 43 CHILD, M. Molecular Collision Theory. New York: Academic Press, 1974. 44 BRAGA, J. The rate of convergence of the S-matrix for the Renormalized Numerov and Log-derivate methods. J. Comp. Chem., 10, n. 3, p. 413–416, 1989. ISSN 0192-8651. 45 CALOGERO, F. Variable phase approach to potential scattering. [S.l.]: Academic Press, 1967. 46 BRAGA, J. P.; MURRELL, J. N. The bound, metastable and virtual states of rare-gas hydrides. Mol. Phys., v. 53, n. 2, p. 295–299, 1984. ISSN 0026-8976. 47 TANG, K.; TOENNIES, J. The van der Waals potentials between all the rare gas atoms from He to Rn. JOURNAL OF CHEMICAL PHYSICS, 118, n. 11, p. 4976–4983, MAR 15 2003. ISSN 0021-9606. 48 VARANDAS, A. J. C. J. Phys. Chem. A 2010, 114, 8505, v. 114, p. 8505, 2010. 49 XIE, J. et al. Theoretical-studies of the energetics and structures of atomic clusters. J. Chem. Phys. , 91, n. 1, p. 612–619, JUL 1 1989. ISSN 0021-9606. 50 BORGES, E. et al. A molecular dynamics simulation of ArnO3 (n=1-21) van der Waals complexes: Size evolution of stable structures. Chem. Phys. Lett., 472, n. 4-6, p. 194–199, 2009. ISSN 0009-2614. 51 BORGES, E.; FERREIRA, G. G.; BRAGA, J. P. Structures and energies of ArnH2O (n=1-26) clusters using a nonrigid potential surface: A molecular dynamics simulation. Int. J. Quantum Chem., 108, n. 13, Sp. Iss. SI, p. 2523–2529, 2008. ISSN 0020-7608. 52 BERRY, R. Potential surfaces and dynamics - what clusters tell us. Chem. Rev. , 93, n. 7, p. 2379–2394, NOV 1993. ISSN 0009-2665. 53 PLIEGO, J.; BELCHIOR, J.; BRAGA, J. Analysis of state-to-state differential cross sections in two-dimensional Xe-CO2 scattering with long-range effects. PHYSICAL REVIEW A, 54, n. 3, p. 2091–2098, 1996. ISSN 1050-2947. 54 CALOGERO, F. A NOVEL APPROACH TO ELEMENTARY SCATTERING THEORY. NUOVO CIMENTO, 27, n. 1, p. 261–&, 1963. 55 CALOGERO, F.; RAVENHALL, D. GENERALIZATION OF PHASE APPROACH TO SCATTERING THEORY + SOME NUMERICAL RESULTS. NUOVO CIMENTO, 32, n. 6, p. 1755–&, 1964. 134 56 MARTINAZZO, R.; BODO, E.; GIANTURCO, F. A. A modified Variable-Phase algorithm for multichannel scattering with long-range potentials. Computer Physics Communications, 151, n. , p. 187–198, 2003. 57 BRAGA, J. P. et al. A Comparative-Study Of Quantum-Mechanical And Classical Trajectory Calculations For An A + Bc Collinear Non-Adiabatic Collision. MOLECULAR PHYSICS, 65, n. 4, p. 909–923, 1988. ISSN 0026-8976. 58 VITERBO, V. D.; LEMES, N. H. T.; BRAGA., J. P. Variable phase equation in quantum scattering. Revista Brasileira de Ensino de Física, v. 36(1), p. 1310, 2014. 59 HERZBERG, G. Molecular Spectra and Molecular Structure. [S.l.]: Van Nostrand, 1950. 60 HUXLEY, P. et al. Ground-state diatomic potentials .2. van der Waals Molecules. Journal of the Chemical Society-Faraday Transactions II, 80, n. Part 11, p. 1349–1361, 1984. ISSN 0300-9238. 61 CYBULSKI, S. M.; TOCZYLOWSKI, R. R. J. Chem. Phys. 1999, 111, 10520, v. 111, p. 10520, 1999. 62 JEZIORSKA, M. et al. J. Chem. Phys. 2007, v. 127, p. 124–303, 2007. 63 JANZEN, A.; AZIZ, R. An accurate potential energy curve for helium based on ab initio calculations. JOURNAL OF CHEMICAL PHYSICS, 107, n. 3, p. 914–919, JUL 15 1997. ISSN 0021-9606. 64 CHILD, M.; GERBER, R. Inversion of inelastic atom-atom scattering data - recovery of the interaction function. Molecular Physics, 38, n. 2, p. 421–432, 1979. 65 SLATER, J. C. Phys. Rev., v. 32, p. 349, 1928. 66 UANG, Y. H.; STWALLEY, W. C. J. Chem. Phys., v. 76, p. 5069, 1982. 67 FORSYTHE, G. E.; MALCOLM, M. A.; MOLER, C. B. Computer Methods for Mathematical Computations. [S.l.]: Prentice-Hall, 1977. 68 LEMES, N.; SEBASTIAO, R.; BRAGA, J. Potential energy function from second virial data using sensitivity analysis. Inv. Prob. Sci. Eng., 14, n. 6, p. 581–587, 2006. ISSN 1741-5977. 69 LUO, F. et al. J. Chem. Phys., v. 98, p. 3564, 1993. 70 LEMES, N.; BORGES, E.; BRAGA, J. Rate constants and absorption coefficients from experimental data: An inversion procedure based on recursive neural networks. Chem. Int. Lab. Syst., 96, n. 1, p. 84–87, 2009. ISSN 0169-7439. 71 JONES, N. The quantum compay. Nature, v. 498, p. 286–288, 2013. 72 SCHRÖDINGER, E. An undulatory theory of the mechanics of atoms and molecules. Phys. Rev., American Physical Society, v. 28, p. 1049–1070, Dec 1926. Disponível em: . 135 73 BRAGA, J. P. Fundamentos de Química Quântica. MG: Viçosa, MG: Editora da UFV, 2007. 265 p. 74 JOHNSON, M. W. et al. Quantum annealing with manufactured spins. Nature, Nature Publishing Group, a division of Macmillan Publishers Limited. All Rights Reserved., v. 473, n. 7346, p. 194–198, maio 2011. ISSN 0028-0836. Disponível em: . 75 NIELSEN, M. A.; CHUANG, I. L. in Quantum Computation and Quantum Information. New York, NY: Cambridge University Press, 2000; Chapter 1, pp 13–16. 13-16 Chapter 1 p. 76 MONROE, C. et al. Demonstration of a fundamental quantum logic gate. Phys. Rev. Lett., American Physical Society, v. 75, n. 25, p. 4714–4717, Dec 1995. 77 SAU, J. D.; TEWARI, S.; SARMA, S. D. Universal quantum computation in a semiconductor quantum wire network. Phys. Rev. A, American Physical Society, v. 82, n. 5, p. 052322, Nov 2010. 78 BENNETT, C. H.; SHOR, P. W. Quantum information theory. IEEE Transactions on Information Theory, v. 44, n. 6, p. 2724–2742, 1998. 79 LANGE, G. de et al. Universal dynamical decoupling of a single solid-state spin from a spin bath. Science, v. 330, n. 6000, p. 60–63, 2010. Disponível em: . 80 SAR., T. van der et al. Decoherence-protected quantum gates for a hybrid solid-state spin register. Nature, Nature Publishing Group, a division of Macmillan Publishers Limited. All Rights Reserved., v. 484, n. 7392, p. 82–86, 2012. Disponível em: . 81 TOFFOLI, T. Reversible computing. Lect. Notes Computer Sci. 85, Springer. 1980. 82 FEDOROV, A. et al. Implementation of a toffoli gate with superconducting circuits. Nature, v. 481, n. 7380, p. 170–172, 2011. Disponível em: . 83 TIPSMARK, A. et al. Experimental demonstration of a hadamard gate for coherent state qubits. Phys. Rev. A, American Physical Society, v. 84, p. 050301, Nov 2011. Disponível em: . 84 GROVER, L. K. Quantum Mechanics Helps in Searching for a Needle in a Haystack. Physical Review Letters, American Physical Society, v. 79, n. 2, p. 325–328, jul. 1997. Disponível em: . 85 GROVER, L. K. Trade-offs in the quantum search algorithm. Phys. Rev. A, American Physical Society, v. 66, p. 052314, Nov 2002. Disponível em: . 136 86 AVALLONE, R. et al. Presence of benzodiazepine-like molecules in food and their implication in the nutrition of cirrhotic patients. Innov Food Sci Emerg, v. 2, n. 3, p. 193 – 198, 2001. 87 LI, G. et al. Separation, identification of uremic middle molecules, and preliminary study on their toxicity. Clin. Chim. Acta, v. 350, n. 1-2, p. 89 – 98, 2004. 88 IZAKE, E. L. Forensic and homeland security applications of modern portable raman spectroscopy. Forensic Sci Int, v. 202, n. 1-3, p. 1 – 8, 2010. 89 MARIKKAR, J. et al. Use of gas liquid chromatography in combination with pancreatic lipolysis and multivariate data analysis techniques for identification of lard contamination in some vegetable oils. Food Chem., v. 90, n. 1-2, p. 23 – 30, 2005. 90 SILVERSTEIN, R. M.; WEBSTER, F. X. Spectrometric Identification of Organic Compounds. 6. ed. [S.l.: s.n.], 1997. 496 p. 91 WEIAND, K. et al. pest: Fast approximate keyword search in semantic data using eigenvector-based term propagation. Inform Syst, v. 37, n. 4, p. 372–390, 2012. ISSN 0306-4379. Disponível em: . 92 SCHMIDT, H. L. Food quality control and studies on human nutrition by mass spectrometric and nuclear magnetic resonance isotope ratio determination. Fresen J Anal Chem, Springer Berlin / Heidelberg, v. 324, p. 760–66, 1986. 93 HAO, F.; DAUGMAN, J.; ZIELINSKI, P. A Fast Search Algorithm for a Large Fuzzy Database. IEEE T Inf Foren Sec, v. 3, n. 2, p. 203–212, maio 2008. Disponível em: . 94 BURDA, I. in Introduction to Quantum Computation. Boca Raton, Florida: Universal Publishers, 2005; Chapter 5, pp 120–133. 95 FEI, L.; BAOYU, Z. A study of quantum neural networks. IEEE int. Conf. Neural Networks & Signal Processing, p. 14–17, 2003. 96 LI, Y.; WU, X. Harmonic measuring approach based on quantum neural network. Physics Proceia, v. 24, p. 337–344, 2012. 97 VITERBO, V. D. de; BELCHIOR, J. C. Neural networks. JCC, v. 1, p. 199, 2003. 98 LEMES, N. H. T. et al. Parametric sensitivity analysis for the helium dimers on a model potential. Química Nova, scielo, v. 35, p. 910–913, 2012. ISSN 0100-4042. 99 ERMAKOV, V. L.; FUNG, B. M. Experimental realization of a continuous version of the grover algorithm. Phys. Rev. A, American Physical Society, v. 66, p. 042310, Oct 2002. Disponível em: . 137