Cinq directions d'apprentissage automatique : classification de texte, correspondance de texte, annotation de séquence, classification d'image et segmentation d'image

Auteur : Zen et l'art de la programmation informatique

1. Introduction

2020 est la première année de l'apprentissage automatique. Grâce à l'apprentissage en profondeur, à l'apprentissage par renforcement et à d'autres algorithmes, l'apprentissage automatique a démontré des capacités étonnantes dans les domaines des images, du texte, de l'audio et de la vidéo. Les modèles d'apprentissage automatique deviennent de plus en plus précis, automatisés et fiables, ce qui offre une valeur énorme aux entreprises et aux particuliers. Mais dans le même temps, la technologie d'apprentissage automatique est également confrontée à de nombreux défis et risques.
Avec le développement rapide d'Internet, de plus en plus de personnes ont commencé à prêter attention à la technologie d'apprentissage automatique.De nombreux excellents modèles ont été proposés dans le traitement du langage naturel, la vision par ordinateur, les systèmes de recommandation, la bioinformatique et d'autres domaines. Cet article présentera les cinq directions les plus populaires à l'heure actuelle : la classification de texte, la correspondance de texte, l'annotation de séquence, la classification d'image et la segmentation d'image. Et grâce à des études de cas correspondantes, les lecteurs seront amenés à mieux comprendre ces technologies et les théories qui les sous-tendent.
Les principaux lecteurs de cet article sont des ingénieurs débutants à intermédiaires possédant une certaine base en apprentissage automatique ou une expérience connexe.

2.1 Classification du texte

La classification de texte est un sous-domaine de l'apprentissage automatique qui peut être utilisé pour déterminer si des textes tels que des actualités, des critiques de films, des critiques de produits, etc. appartiennent à une certaine catégorie. Par exemple, étant donné un avis d'utilisateur, notre objectif est de juger si le sentiment exprimé par l'avis est positif ou négatif. La technologie de classification de texte propose un large éventail de scénarios d'application, tels que le filtrage du spam, l'analyse des sentiments, les robots de questions-réponses, le résumé automatique des actualités et la prédiction du taux de clics publicitaires.

2.1.1 Présentation

définition du problème

Le problème consistant à déterminer si un morceau de texte appartient à une certaine catégorie s'appelle la classification de texte. La classification de texte est une tâche qui peut être efficacement automatisée sur la base de données textuelles. En général, un modèle de classification de texte se compose de deux modules : l'extraction des caractéristiques du texte et la formation du classificateur. Parmi eux, l'extraction de caractéristiques de texte fait référence à l'extraction de caractéristiques à partir de données textuelles brutes, telles que la fréquence des mots, la structure syntaxique, la tendance émotionnelle, etc. La formation de classificateur consiste à utiliser des fonctionnalités pour former un modèle de prédiction, tel qu'un classificateur bayésien ou une machine à vecteurs de support. Après la classification, le texte peut être classé et catégorisé en fonction des résultats de la classification.

Guess you like

Origin blog.csdn.net/universsky2015/article/details/132053372