Geniale Lösung der Schrödinger-Gleichung, hochpräzise Lösung der Wellenfunktion basierend auf FermiNet

Autor: Yu Fan

Hintergrund

Die Schrödinger-Gleichung ist eine Grundgleichung der Quantenmechanik. Durch die Lösung dieser Gleichung können die meisten physikalischen und chemischen Probleme gelöst werden. Das Problem besteht jedoch darin, dass die Anzahl der Basisfunktionen in der Schrödinger-Gleichung exponentiell zunimmt, wenn die Dimension des molekularen Systems zunimmt. Beispielsweise hat ein Methanmolekül 5 Atome, seine Dimension beträgt 9=3*5 – 6 und die Anzahl der Basisfunktionen sind 10 hoch 9.

Da die Schrödinger-Gleichung nicht exakt gelöst werden kann, können die chemischen Eigenschaften von Molekülen mit hochpräzisen Näherungslösungen vorhergesagt werden. Konfigurationsinteraktions- und Coupled-Cluster-Methoden weisen eine höhere Genauigkeit auf, aber der Rechenaufwand steigt exponentiell. Obwohl die Density Functional Theory (DFT)-Methode einen relativ geringen Rechenaufwand hat, ist ihre Genauigkeit begrenzt. Aufgrund der leistungsstarken nichtlinearen Anpassungsfähigkeit des Deep Learning schlug DeepMind FermiNet vor, um eine ungefähre Lösung der Wellenfunktion zu erreichen.

Elektronen in Molekülen interagieren nicht nur mit dem Atomkern und anderen Elektronen, sondern müssen auch dem Pauli-Ausschlussprinzip folgen: Zwei Fermionen können nicht im gleichen Quantenzustand sein, und die Wellenfunktion nach dem Fermionaustausch weist Antisymmetrie auf, d. h. wenn sich zwei Fermionen austauschen Staaten muss die Wellenfunktion das umgekehrte Vorzeichen haben. In Bezug auf die Antisymmetrie der Wellenfunktion ist die Determinante von Natur aus konsistent. Daher wird in der Quantenchemie häufig die Slater-Determinante zur Darstellung der Wellenfunktion verwendet.

**1. ** Netzwerkarchitektur

BildAbbildung 1 Gesamtarchitektur des FermiNet-Netzwerks

BildAbbildung 2 Informationsflussübertragung zwischen Netzwerkschichten

Die gesamte Netzwerkarchitektur von FermiNet ist in Abbildung 1 dargestellt, und Abbildung 2 ist eine teilweise vergrößerte Ansicht der Netzwerkschicht. Jedes Elektron im Netzwerk verfügt nicht nur über einen separaten Informationsfluss, sondern wenn Informationen auf der Netzwerkebene übertragen werden, integriert jedes Elektron die Informationen anderer Elektronen und die Wechselwirkung zwischen Elektronen und ersetzt die ursprüngliche Einzelelektronenbahn durch eine, die die Substitution erfüllt Äquivarianz. Die Multielektronenwellenfunktion (Gleichung 1) stellt die endgültige Wellenfunktion (Gleichung 2) dar, die eine stärkere Ausdrucksfähigkeit aufweist als die traditionelle Slater-Determinante.

BildBild

Bevor das Netzwerk mit dem Training beginnt, wird ein Vortraining durchgeführt, um die Stabilität des Trainingsprozesses zu verbessern und die Trainingszeit zu verkürzen. Der vorab trainierte Verlust verwendet die Lösung der Hartree-Fock-Gleichung des STO-3G-Basissatzes als Referenz, und die Verlustfunktion ist in Gleichung 3 dargestellt.

Bild

Für das Netzwerktraining basiert es auf Variations-Monte-Carlo, wobei der Energieerwartungswert die Verlustfunktion ist, wie in Formel 4 dargestellt. Insbesondere kann die Energie durch Gleichung 5 ausgedrückt werden und der Energiegradient wird wie in Gleichung 6 dargestellt berechnet. Darüber hinaus wird zur effizienten Optimierung von Netzwerkparametern der KFAC-Optimierer zweiter Ordnung verwendet, der sich der Methode des natürlichen Gradienten annähert.

BildBildBild

**2, ** Experimentelle Ergebnisse

Die Genauigkeit von FermiNet übertrifft die herkömmliche VMC-Methode (wie in Tabelle 1 gezeigt) und ist unter begrenzten Basissätzen besser als die CCSD(T)-Methode, da FermiNet keine Basissätze verwendet und es kein Problem bei der Extrapolation von Basissätzen gibt .

BildTabelle 1 Grundzustandsenergiewerte (der fettgedruckte Teil ist der Punkt, der dem genauen Wert in FermiNet, VMC und DMC am nächsten kommt)

Obwohl CCSD(T) für Gleichgewichtsgeometrien sehr genau ist, weist es Einschränkungen für Moleküle auf, die sich in schwach angeregten Zuständen, gestreckt, verdreht oder anderweitig außerhalb der Gleichgewichtsgeometrien befinden, und ist nicht so gut wie FermiNet. Die Ergebnisse sind in Abbildung 3 dargestellt .

BildAbbildung 3 Energiekurve des Moleküls H4

Für die Stickstoff-Stickstoff-Dreifachbindungsdissoziation von Stickstoffmolekülen ist FermiNet besser als die uneingeschränkte CCSD(T)-Methode, wie in Abbildung 4 dargestellt.

BildAbbildung 4 Energiekurve der Stickstoff-Stickstoff-Dreifachbindungsdissoziation

**3, ** Zusammenfassung

FermiNet verschmilzt Informationen zwischen einzelnen Elektronen und mehreren Elektronen in der Netzwerkschicht und ersetzt Einzelelektronenbahnen durch Wellenfunktionen mit mehreren Elektronen, die die Substitutionsäquivarianz erfüllen. Es kann Wellenfunktionslösungen mit höherer Präzision erzielen, die nicht nur die Genauigkeit herkömmlicher VMC-Methoden übertreffen ist besser als die CCSD(T)-Methode für anspruchsvolle Systemstrukturen wie geometrische Nichtgleichgewichtsstrukturen und Stickstoff-Stickstoff-Dreifachbindungsdissoziation. Die Erfolge von FermiNet werden Forscher dazu ermutigen, neue oder bessere Netzwerkarchitekturen im Bereich der Quantenchemie vorzuschlagen und so effizientere und genauere Wellenfunktionslösungen zu erzielen.

Verweise

[1] Pfau D, Spencer JS, Matthews AGDG, et al. Ab-initio-Lösung der Vielelektronen-Schrödinger-Gleichung mit tiefen neuronalen Netzen[J]. Physical Review Research, 2020, 2(3): 033429.

DOI: https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429

Ein in den 1990er Jahren geborener Programmierer hat eine Videoportierungssoftware entwickelt und in weniger als einem Jahr über 7 Millionen verdient. Das Ende war sehr bestrafend! Google bestätigte Entlassungen, die den „35-jährigen Fluch“ chinesischer Programmierer in den Flutter-, Dart- und Teams- Python mit sich brachten stark und wird von GPT-4.5 vermutet; Tongyi Qianwen Open Source 8 Modelle Arc Browser für Windows 1.0 in 3 Monaten offiziell GA Windows 10 Marktanteil erreicht 70 %, Windows 11 GitHub veröffentlicht weiterhin KI-natives Entwicklungstool GitHub Copilot Workspace JAVA ist die einzige starke Abfrage, die OLTP+OLAP verarbeiten kann. Dies ist das beste ORM. Wir treffen uns zu spät.
{{o.name}}
{{m.name}}

Ich denke du magst

Origin my.oschina.net/u/4736317/blog/11082900
Empfohlen
Rangfolge