Notes d'article : Inversion de forme d'onde sismique basée sur les données - Une étude de robustesse et de généralisation

Résumé : Pour partager la compréhension de l'article, le texte original peut être trouvé dans Zhongping Zhang et Youzuo Lin, Data-driven seismic waveform inversion: A study on the robustness and generalization.

1. Contribution papier

  • VelocityGAN fournissant des prédictions en temps réel
  • Différent des autres méthodes d'inversion de forme d'onde sismique basées sur l'encodeur-décodeur et basées sur les données, VelocityGAN apprend la régularisation à partir des données et applique en outre la régularisation au générateur pour améliorer la précision de l'inversion.
  • Utiliser davantage l'apprentissage par transfert pour atténuer le problème de généralisation.

2. Travaux connexes

Figure 1. Le cadre de base de l'inversion complète de la forme d'onde

La figure 1 montre le cadre de base de l'inversion complète de la forme d'onde, qui est essentiellement de bout en bout : données sismiques au modèle de vitesse.

2.1 Inversion acoustique : une approche basée sur la physique

Le modèle direct est
P = f ( m ) (1) P = f(\mathbf{m}) \tag{1}P=f ( m )( 1 )
m \mathbf{m}m est le paramètre du modèle de vitesse (un vecteur),fff est l'opérateur du modèle direct (une fonction),PPP est le champ d'onde de pression dans le cas acoustique.
L'inversion sismique régularisée par la physique est
E ( m ) = min ⁡ m { ∥ d - f ( m ) ∥ 2 2 + λ R ( m ) } (2) E( \ mathbf{m}) = \min_{\mathbf{m}} \{\|\mathbf{d} - f(\mathbf{m})\|_2^2 + \lambda R(\mathbf{m}) \ } \tag{2}E ( m )=mmin{ f ( m ) 22+λ R ( m ) }( 2 )
d \mathbf{d}d est la donnée mesurée,∥ ⋅ ∥ 2 \| \cdot \|_22est la norme 2, et la partie correspondante représente l'erreur de correspondance des données, λ \lambdaλ est un coefficient,R ( m ) R(\mathbf{m})R ( m ) est un terme régulier causé par des paramètres, qui est utilisé pour éviter que le modèle ne soit trop complexe (sur-ajustement).

Caractéristiques de cette méthode :

  • Aucune autre prise en charge des données n'est requise. Essentiellement, l'entrée est uniquement d \mathbf{d} ;
  • Une solution itérative continue est nécessaire. Pré-deviner un modèle m \mathbf{m}m calcule la perte selon la formule (3), puis effectuem \mathbf{m}ajustement de m ;
  • L'efficacité est relativement faible (liée à l'item précédent) ;
  • Le modèle qui dépend de l'estimation initiale, c'est-à-dire m \mathbf{m}La version originale de m . Si les données n'ont pas de bruit, de très bons résultats peuvent être obtenus. Sinon, elles tomberont dans une solution optimale locale et ne pourront pas effectuer un bon ajustement.

2.2 Data Driven : Apprentissage des opérateurs d'inversion

m = g ( d ) = f − 1 ( d ) (4) \mathbf{m} = g(\mathbf{d}) = f^{-1}(\mathbf{d}) \tag{4} m=g ( )=F1 ()( 4 )
ggg est l'opérateur d'inversion qui doit être appris.
g = arg min ⁡ g { ∑ i = 1 N ∥ mi − g ( di ) ∥ 2 2 } (5) g = \argmin_g \left\{\sum_{i= 1 }^N \|\mathbf{m}_i - g(\mathbf{d}_i)\|_2^2\right\}\tag{5}g=gun ar gmoi je n{ je = 1Nmjeg ( je) 22}( 5 )
其中{ di , mi } je = 1 N \{\mathbf{d}_i, \mathbf{m}_i\}_{i=1}^N{ je,mje}je = 1Npour les données d'entraînement.

2.3 Comparaison des méthodes

Tableau 1. Comparaison de deux méthodes
méthode physique approche axée sur les données
données Aucune autre prise en charge des données n'est requise. Essentiellement, l'entrée est uniquement d \mathbf{d}d 需要训练数据{ di , mi } i = 1 N \{\mathbf{d}_i, \mathbf{m}_i\}_{i=1}^N{ je,mje}je = 1N
former Solution pour les données actuelles, pas de formation Beaucoup de temps d'apprentissage, l'effet est fortement corrélé avec les échantillons d'apprentissage
résoudre Une solution itérative continue est nécessaire. Pré-deviner un modèle m \mathbf{m}m calcule la perte selon la formule (3), puis effectuem \mathbf{m}réglage de m utiliser ggg résoudre directement
efficacité Lent à résoudre pour les données actuelles Lent à former, mais efficace à tester
compter sur Le modèle qui dépend de l'estimation initiale, c'est-à-dire m \mathbf{m}La version originale de m . Si les données n'ont pas de bruit, de très bons résultats peuvent être obtenus. Sinon, elles tomberont dans une solution optimale locale et ne pourront pas effectuer un bon ajustement qualité des données de formation

3. Travail de thèse

Figure 2. Cadre VelocityGAN

3.1 Générateur

  • La donnée d'entrée est un 32 × 1000 × 6 32 \times 1000 \times 63 2×1 0 0 0×Tenseur de 6
    • 32 récepteurs
    • 1000 points de temps
    • 3 fonctions sources (3 plans parmi les suivants, c'est-à-dire 3 plans à la même position) et 2 canaux ( 3 × 2 = 6 3 \times 2 = 63×2=6 )
  • Marqué comme modèle de vitesse
    • La taille est m × nm \times nm×n ,mmm signifie profondeur,nnn représente la distance horizontale
    • La distance entre les points adjacents est de 5 55 m, donc la taille totale estde 5 m × 5 n m 2 5m \times 5n \textrm{ m}^25 mètres×5 nm  _2
    • La valeur de chaque point de la matrice représente la vitesse de propagation de l'onde sonore
  • détails du réseau
    • Il n'y a pas de correspondance spatiale entre les données d'entrée et les étiquettes, elles ne seront donc pas pénalisées pour leurs différences comme l'U-Net habituel
    • Utilisez plusieurs k × 1 k \ fois 1k×1 Convolution unifiée à32 × 32 32 \times 323 2×3 2
    • Pour 32 × 32 32 \fois 323 2×Les données de 3 2 utilisent3 × 3 3 \times 33×3 noyaux de convolution jusqu'à8 × 8 8 \times 88×8 données
    • Enfin, utilisez 8 × 8 8 \times 88×8 noyaux de convolution, éliminent les informations spatiales (trop impitoyables)
    • Lors du décodage, obtenir progressivement la même taille que le modèle de vitesse ( m × nm \times nm×n )

3.2 Discriminateur

  • Concentrez-vous sur les informations locales, utilisez donc patchCNN au lieu de GlobalCNN

résumé

  • Les méthodes physiques n'itérent que sur un modèle, les méthodes basées sur les données apprennent d'un grand nombre de modèles, il est donc plus facile de sortir (ou d'éviter de tomber) des solutions optimales locales

Je suppose que tu aimes

Origine blog.csdn.net/minfanphd/article/details/127886005
conseillé
Classement