Tutoriel sur l'apprentissage semi-supervisé à l'aide de GAN pour Medi

Auteur : Zen et l'art de la programmation informatique

1. Introduction

Dans ce didacticiel, nous allons explorer deux sous-classes importantes d'apprentissage non supervisé : l'apprentissage semi-supervisé et les réseaux antagonistes génératifs (GAN). L'apprentissage non supervisé à partir d'images médicales à l'aide de GAN peut améliorer les performances du modèle, réduire les coûts de calcul et améliorer la généralisation. Ce didacticiel aborde également d'autres techniques d'apprentissage automatique connexes telles que les réseaux de neurones convolutifs (CNN), les réseaux de neurones récurrents (RNN), les auto-encodeurs variationnels (VAE), etc. L'apprentissage semi-supervisé vise à utiliser une petite quantité de données étiquetées pour former un meilleur modèle en même temps. Cette méthode est généralement utilisée pour traiter de grands ensembles de données, mais elle fonctionne toujours bien pour les petits ensembles de données d'images médicales. D'autre part, le Generative Adversarial Network (GAN) est un modèle récent qui a été largement utilisé dans la vision par ordinateur et la génération d'images. Ce tutoriel expliquera en détail comment les GAN sont utilisés pour l'apprentissage non supervisé à partir d'images médicales et les avantages et inconvénients de ces techniques. Nous le baserons sur l'hypothèse que l'ensemble de données d'origine comprend une grande quantité de données non étiquetées ; seule une petite quantité de données étiquetées est disponible.

2. Concepts de base et terminologie

base de données

Dans un premier temps, nous présenterons les informations pertinentes sur le jeu de données. Étant donné un ensemble de données d'images médicales, sa structure ressemble généralement à ceci :

  • Chaque image consiste en une chaîne de nombres, une matrice de valeurs de pixels. Chaque élément représente l'échelle de gris ou la valeur d'intensité de chaque pixel.
  • Les ensembles de données peuvent contenir des étiquettes (étiquettes de catégorie) et/ou des données non étiquetées (les données non étiquetées sont souvent appelées "pseudo-étiquettes"). Dans cette tâche, nous nous concentrons uniquement sur les données étiquetées. Les données de l'étiquette incluent :
    • Diagnostic du patient (pathologique ou non pathologique)
    • Type de chirurgie (si la chirurgie a réussi)
    • Type de nodule࿰

おすすめ

転載: blog.csdn.net/universsky2015/article/details/132383819