Auteur : Yu Fan
arrière-plan
L'équation de Schrödinger est une équation de base de la mécanique quantique. En résolvant cette équation, la plupart des problèmes physiques et chimiques peuvent être résolus. Mais le problème est que le nombre de fonctions de base dans l’équation de Schrödinger augmente de façon exponentielle à mesure que la dimension du système moléculaire augmente. Par exemple, une molécule de méthane a 5 atomes, sa dimension est 9=3*5 – 6 et le nombre d’atomes. les fonctions de base sont 10 à la puissance 9.
Puisque l’équation de Schrödinger ne peut pas être résolue avec précision, les propriétés chimiques des molécules peuvent être prédites avec des solutions approximatives de haute précision. Les méthodes d'interaction de configuration et de cluster couplé ont une précision plus élevée, mais le coût de calcul augmente de façon exponentielle ; bien que la méthode de la théorie fonctionnelle de la densité (DFT) ait un coût de calcul relativement faible, sa précision est limitée ; En raison de sa puissante capacité d'ajustement non linéaire d'apprentissage en profondeur, DeepMind a proposé FermiNet pour obtenir une solution approximative de la fonction d'onde.
Les électrons des molécules interagissent non seulement avec le noyau atomique et d'autres électrons, mais doivent également suivre le principe d'exclusion de Pauli : deux fermions ne peuvent pas être dans le même état quantique, et la fonction d'onde après l'échange de fermions a une antisymétrie, c'est-à-dire lorsque deux fermions échangent états, la fonction d’onde doit avoir le signe opposé. Concernant l'antisymétrie de la fonction d'onde, le déterminant est naturellement cohérent. Par conséquent, l'utilisation du déterminant de Slater pour représenter la fonction d'onde est largement utilisée en chimie quantique.
**1. ** Architecture du réseau
Figure 1 Architecture globale du réseau FermiNet
Figure 2 Transfert de flux d'informations entre les couches du réseau
L'architecture réseau globale de FermiNet est illustrée à la figure 1, et la figure 2 est une vue partiellement agrandie de la couche réseau. Chaque électron du réseau a non seulement un flux d'informations distinct, mais lorsque les informations sont transmises au niveau de la couche réseau, chaque électron intégrera les informations des autres électrons et l'interaction entre les électrons, et remplacera l'orbite électronique unique d'origine par une orbite qui satisfait à la substitution. équivariance. La fonction d'onde multiélectronique (équation 1) constitue la fonction d'onde finale (équation 2), qui a une capacité d'expression plus forte que le déterminant de Slater traditionnel.
Avant que le réseau ne commence la formation, une pré-formation est effectuée pour améliorer la stabilité du processus de formation et réduire le temps de formation. La perte pré-entraînée utilise la solution de l'équation de Hartree-Fock de l'ensemble de base STO-3G comme référence, et la fonction de perte est présentée dans l'équation 3.
Pour la formation en réseau, il est basé sur une méthode de Monte Carlo variationnelle, avec la valeur attendue de l'énergie comme fonction de perte, comme le montre la formule 4. Plus précisément, l'énergie peut être exprimée par l'équation 5 et le gradient d'énergie est calculé comme indiqué dans l'équation 6. De plus, afin d'optimiser efficacement les paramètres du réseau, l'optimiseur de second ordre KFAC qui se rapproche de la méthode du gradient naturel est utilisé.
**2, ** Résultats expérimentaux
La précision de FermiNet surpasse la méthode VMC traditionnelle (comme indiqué dans le tableau 1), et la précision est meilleure que la méthode CCSD(T) avec des ensembles de bases limités, car FermiNet n'utilise pas d'ensembles de bases et il n'y a pas de problème d'extrapolation des ensembles de bases. .
Tableau 1 Valeurs énergétiques de l'état fondamental (la partie en gras est l'élément le plus proche de la valeur exacte dans FermiNet, VMC et DMC)
Bien que CCSD(T) soit très précis pour les géométries d'équilibre, il présente des limites pour les molécules qui sont dans des états faiblement excités, étirées, tordues ou hors d'équilibre, et n'est pas aussi bon que FermiNet. Les résultats sont présentés dans la figure 3. .
Figure 3 Courbe énergétique de la molécule H4
Pour la dissociation des triples liaisons azote-azote des molécules d'azote, FermiNet est meilleur que la méthode CCSD(T) sans restriction, comme le montre la figure 4.
Figure 4 Courbe énergétique de la dissociation de la triple liaison azote-azote
**3, ** Résumé
FermiNet fusionne les informations entre des électrons uniques et plusieurs électrons dans la couche réseau et remplace les orbites électroniques uniques par des fonctions d'onde multiélectroniques qui satisfont à l'équivariance de substitution. Il peut obtenir des solutions de fonction d'onde de plus grande précision, dépassant non seulement les solutions traditionnelles en termes de précision. La méthode VMC. est meilleure que la méthode CCSD(T) pour défier les structures de systèmes telles que les structures géométriques hors équilibre et la dissociation des triples liaisons azote-azote. Les réalisations de FermiNet encourageront les chercheurs à proposer des architectures de réseau nouvelles ou améliorées dans le domaine de la chimie quantique, obtenant ainsi des solutions de fonction d'onde plus efficaces et plus précises.
les références
[1] Pfau D, Spencer JS, Matthews AGDG et al. Solution ab initio de l'équation de Schrödinger à plusieurs électrons avec des réseaux de neurones profonds [J]. Recherche sur l'examen physique, 2020, 2(3) : 033429.
DOI : https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429
Un programmeur né dans les années 1990 a développé un logiciel de portage vidéo et en a réalisé plus de 7 millions en moins d'un an. La fin a été très éprouvante ! Google a confirmé les licenciements, impliquant la « malédiction des 35 ans » des codeurs chinois des équipes Flutter, Dart et . Python Arc Browser pour Windows 1.0 en 3 mois officiellement la part de marché de GA Windows 10 atteint 70 %, Windows 11 GitHub continue de décliner l'outil de développement natif d'IA GitHub Copilot Workspace JAVA. est la seule requête de type fort capable de gérer OLTP+OLAP. C'est le meilleur ORM. Nous nous rencontrons trop tard.