[Série de aprendizado de máquina] Este artigo leva você a explicar em detalhes o que é aprendizado não supervisionado (Unsupervisioned Learning)

prefácio

Existem três categorias principais de aprendizado de máquina: aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço. Neste artigo, apresentaremos os princípios, algoritmos comuns e áreas de aplicação do Aprendizado Não Supervisionado.


1. Princípio

O aprendizado não supervisionado é um método importante no aprendizado de máquina, correspondendo ao aprendizado supervisionado. Seu objetivo é descobrir estruturas e padrões ocultos a partir de dados não rotulados sem a necessidade de variáveis ​​de destino pré-definidas.

A ideia central do aprendizado não supervisionado é descobrir as estruturas e padrões subjacentes nos dados, analisando as propriedades estatísticas e as semelhanças dos dados.

Ao contrário do aprendizado supervisionado, o aprendizado não supervisionado não requer dados de treinamento pré-rotulados, mas aprende por meio de processamento automático e agrupamento de dados.

O aprendizado não supervisionado pode ser dividido em duas classes de problemas: agrupamento e redução de dimensionalidade. O problema de agrupamento é dividir os dados em diferentes grupos ou clusters, de modo que a similaridade de dados no mesmo grupo seja alta e a similaridade entre grupos diferentes seja baixa. O problema de redução de dimensionalidade é mapear dados de alta dimensão para espaço de baixa dimensão para reduzir a dimensão do recurso e a complexidade dos dados.
insira a descrição da imagem aqui

2. Algoritmo

Existem muitos algoritmos clássicos no aprendizado não supervisionado. Aqui estão alguns algoritmos comuns:

1️⃣ K-significa agrupamento

O agrupamento K-means é um algoritmo de agrupamento comumente usado. Ele divide os dados em K clusters, cada cluster é representado por seu centróide (centro do cluster). A ideia central do algoritmo é agrupar minimizando a distância entre o ponto de dados e o centróide do cluster ao qual pertence.
insira a descrição da imagem aqui

2️⃣DBSCAN

DBSCAN (Clustering Espacial Baseado em Densidade de Aplicativos com Ruído) é um algoritmo de clustering baseado em densidade. Ele divide os pontos de dados em pontos principais, pontos de limite e pontos de ruído e julga se os pontos de dados pertencem ao mesmo cluster por acessibilidade de densidade.
insira a descrição da imagem aqui

3️⃣Análise de componentes principais

A Análise de Componentes Principais (PCA) é um algoritmo de redução de dimensionalidade comumente usado. Ele projeta dados de alta dimensão para espaço de baixa dimensão por meio de transformação linear para preservar os recursos mais importantes. O objetivo do PCA é encontrar um conjunto de bases ortogonais tal que os dados projetados tenham a variância máxima.
insira a descrição da imagem aqui

4️⃣t-SNE

t-SNE (T-distributed Stochastic Neighbor Embedding) é um algoritmo de redução de dimensionalidade para visualizar dados de alta dimensão. Ele mapeia dados de alta dimensão para um espaço de baixa dimensão, mantendo a relação de distância relativa entre os pontos de dados. O t-SNE funciona muito bem em agrupamento visual e problemas de classificação.
insira a descrição da imagem aqui

5️⃣Regra de associação de mineração

A mineração de regras de associação é um algoritmo para descobrir conjuntos de itens frequentes e regras de associação em um conjunto de dados. Ele descobre padrões de associação ocultos analisando as associações entre itens nos dados. A mineração de regras de associação é amplamente utilizada na análise de cesta de mercado, sistema de recomendação e outros campos.
insira a descrição da imagem aqui

3. Campos de aplicação

O aprendizado não supervisionado tem uma ampla gama de aplicações em vários campos, e algumas das áreas de aplicação comuns são descritas abaixo:

1️⃣Segmentação de imagem

Na visão computacional, o aprendizado não supervisionado é usado para tarefas de segmentação de imagens. Ao agrupar os pixels em uma imagem, a imagem pode ser dividida em diferentes regiões para processamento adicional, como reconhecimento de objetos, análise de imagens, etc.
insira a descrição da imagem aqui

2️⃣Sistema de recomendação

No campo dos sistemas de recomendação, o aprendizado não supervisionado é usado para descobrir os interesses e padrões de comportamento do usuário. Ao agrupar e minerar regras de associação nos dados históricos de comportamento do usuário, ele pode fornecer aos usuários resultados de recomendação personalizados.
insira a descrição da imagem aqui

3️⃣ Análise de redes sociais

No campo da análise de redes sociais, o aprendizado não supervisionado é usado para descobrir estruturas e relacionamentos comunitários em redes sociais. Por meio de agrupamento e análise de rede de dados de interação entre usuários, a estrutura organizacional e o modo de disseminação de informações das redes sociais podem ser revelados.
insira a descrição da imagem aqui

4️⃣Condução automática

No campo da direção autônoma, o aprendizado não supervisionado é usado para sentir e entender o ambiente e a estrada. Ao agrupar e reduzir dimensionalmente os dados do sensor, recursos importantes, como estradas, veículos e pedestres, podem ser extraídos para apoiar a tomada de decisões e o controle da direção autônoma.
insira a descrição da imagem aqui

Quatro. Resumo

O aprendizado não supervisionado é amplamente utilizado em problemas como agrupamento, redução de dimensionalidade e mineração de regras de associação, fornecendo ferramentas e métodos poderosos para entender dados e resolver problemas práticos. Com o aumento contínuo da escala de dados e a expansão contínua dos cenários de aplicação, o aprendizado não supervisionado desempenhará um papel cada vez mais importante em vários campos.


【Livro grátis】

insira a descrição da imagem aqui

[! forma de participação!

Curtir + favorito + qualquer comentário neste artigo
Prazo: 2023-07-20 21:00 à noite

Nota: O método de sorteio é <desenho aleatório do script>, e os vencedores serão anunciados na minha página inicial conforme programado, com frete grátis.


【Introdução↓】

Este livro usa ChatGPT e Python para realizar facilmente a automação de escritório, de modo que os funcionários de escritório comuns sem experiência em programação também possam controlar o Python, realizar a automação de escritório em vários cenários e melhorar a eficiência do trabalho!

Este livro apresenta de forma abrangente e sistemática as soluções de automação da linguagem Python em cenários de escritório comuns. O conteúdo inclui conhecimento básico da linguagem Python, métodos comuns de leitura e gravação de dados em Python, operação automática do Excel com Python, operação automática do Word e PPT com Python, operação automática de arquivos e pastas, e-mails, arquivos PDF, imagens e vídeos com Python, processamento de dados com Python Análise visual e interação de página da web, automação de escritório Python avançada e fácil com ChatGPT.

Dangdang link de compra: "Python Automation Office Application Encyclopedia (ChatGPT Edition)"

insira a descrição da imagem aqui

Acho que você gosta

Origin blog.csdn.net/m0_63947499/article/details/131529324
Recomendado
Clasificación