L'un des concepts les plus fondamentaux de l'apprentissage automatique : ensembles de données, échantillons, fonctionnalités et étiquettes

Objet de cet article

Les ensembles de données, les échantillons, les fonctionnalités et les étiquettes sont des concepts importants dans l'apprentissage automatique, et ces concepts jouent un rôle crucial dans la conception et la mise en œuvre des algorithmes d'apprentissage automatique. Dans cet article, nous expliquerons ces concepts en détail pour mieux comprendre les principes de base et les applications des algorithmes d'apprentissage automatique.

1. Ensemble de données

L'ensemble de données est l'un des concepts les plus fondamentaux de l'apprentissage automatique. Il fait référence à un ensemble de données associées. Comme indiqué ci-dessous, il s'agit d'un ensemble de données destiné à la prévision des prix de l'immobilier. L'ensemble de données complet contient un total de quatre éléments de données, qui soit quatre échantillons.

Dans l'apprentissage automatique, les ensembles de données sont généralement utilisés comme ensembles de formation, d'ensembles de test et parfois d'ensembles de validation (le rôle des différents ensembles de données sera expliqué plus tard).

2. Échantillon

Dans le machine learning, un échantillon est généralement utilisé pour représenter une instance ou un événement, tel qu'une image, un morceau de texte ou une transaction. Il s'agit d'un élément de données dans un ensemble de données. Un échantillon est un point de données dans le ensemble de données. Il s’agit d’un concentré de données sur les unités les plus élémentaires.

Comme indiqué ci-dessus, (taille = 2 104, nombre de chambres = 5, nombre d'étages = 1, âge de la maison (année) = 45, prix = 460) est un échantillon de l'ensemble de données.

Un échantillon se compose généralement d' un ensemble de caractéristiques et d'une étiquette (l'apprentissage supervisé a des étiquettes, l'apprentissage non supervisé n'a pas d'étiquettes). Les caractéristiques représentent les attributs ou les caractéristiques de l'échantillon, et l'étiquette

Je suppose que tu aimes

Origine blog.csdn.net/huanfeng_AI/article/details/130256448
conseillé
Classement