Um dos conceitos mais básicos em aprendizado de máquina: conjuntos de dados, amostras, recursos e rótulos

Foco deste artigo

Conjuntos de dados, amostras, recursos e rótulos são conceitos importantes no aprendizado de máquina e desempenham um papel crucial no projeto e implementação de algoritmos de aprendizado de máquina. Neste artigo, explicaremos esses conceitos em detalhes para compreender melhor os princípios básicos e as aplicações dos algoritmos de aprendizado de máquina.

1. Conjunto de dados

O conjunto de dados é um dos conceitos mais básicos do aprendizado de máquina. Refere-se a um conjunto de dados relacionados. Conforme mostrado abaixo, é um conjunto de dados para previsão de preços de casas. Todo o conjunto de dados tem um total de quatro dados, que isto é, quatro amostras.

No aprendizado de máquina, os conjuntos de dados são geralmente usados ​​como conjuntos de treinamento, conjuntos de teste e, às vezes, conjuntos de validação (o papel dos diferentes conjuntos de dados será explicado posteriormente).

2. Amostra

No aprendizado de máquina, uma amostra geralmente é usada para representar uma instância ou um evento, como uma imagem, um trecho de texto ou uma transação. É um dado em um conjunto de dados. Uma amostra é um ponto de dados no conjunto de dados.É um conjunto de dados concentrado nas unidades mais básicas.

Conforme mostrado acima, (tamanho = 2.104, número de quartos = 5, número de andares = 1, idade da casa (ano) = 45, preço = 460) é uma amostra no conjunto de dados.

Uma amostra geralmente consiste em um conjunto de recursos e um rótulo (a aprendizagem supervisionada tem rótulos, a aprendizagem não supervisionada não tem rótulos).Os recursos representam os atributos ou características da amostra, e o rótulo

おすすめ

転載: blog.csdn.net/huanfeng_AI/article/details/130256448