prefácio
Existem três categorias principais de aprendizado de máquina: aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço. Neste artigo, apresentaremos os princípios, algoritmos comuns e áreas de aplicação do Aprendizado Não Supervisionado.
Diretório de artigos
1. Princípio
O aprendizado não supervisionado é um método importante no aprendizado de máquina, correspondendo ao aprendizado supervisionado. Seu objetivo é descobrir estruturas e padrões ocultos a partir de dados não rotulados sem a necessidade de variáveis de destino pré-definidas.
A ideia central do aprendizado não supervisionado é descobrir as estruturas e padrões subjacentes nos dados, analisando as propriedades estatísticas e as semelhanças dos dados.
Ao contrário do aprendizado supervisionado, o aprendizado não supervisionado não requer dados de treinamento pré-rotulados, mas aprende por meio de processamento automático e agrupamento de dados.
O aprendizado não supervisionado pode ser dividido em duas classes de problemas: agrupamento e redução de dimensionalidade. O problema de agrupamento é dividir os dados em diferentes grupos ou clusters, de modo que a similaridade de dados no mesmo grupo seja alta e a similaridade entre grupos diferentes seja baixa. O problema de redução de dimensionalidade é mapear dados de alta dimensão para espaço de baixa dimensão para reduzir a dimensão do recurso e a complexidade dos dados.
2. Algoritmo
Existem muitos algoritmos clássicos no aprendizado não supervisionado. Aqui estão alguns algoritmos comuns:
1️⃣ K-significa agrupamento
O agrupamento K-means é um algoritmo de agrupamento comumente usado. Ele divide os dados em K clusters, cada cluster é representado por seu centróide (centro do cluster). A ideia central do algoritmo é agrupar minimizando a distância entre o ponto de dados e o centróide do cluster ao qual pertence.
2️⃣DBSCAN
DBSCAN (Clustering Espacial Baseado em Densidade de Aplicativos com Ruído) é um algoritmo de clustering baseado em densidade. Ele divide os pontos de dados em pontos principais, pontos de limite e pontos de ruído e julga se os pontos de dados pertencem ao mesmo cluster por acessibilidade de densidade.
3️⃣Análise de componentes principais
A Análise de Componentes Principais (PCA) é um algoritmo de redução de dimensionalidade comumente usado. Ele projeta dados de alta dimensão para espaço de baixa dimensão por meio de transformação linear para preservar os recursos mais importantes. O objetivo do PCA é encontrar um conjunto de bases ortogonais tal que os dados projetados tenham a variância máxima.
4️⃣t-SNE
t-SNE (T-distributed Stochastic Neighbor Embedding) é um algoritmo de redução de dimensionalidade para visualizar dados de alta dimensão. Ele mapeia dados de alta dimensão para um espaço de baixa dimensão, mantendo a relação de distância relativa entre os pontos de dados. O t-SNE funciona muito bem em agrupamento visual e problemas de classificação.
5️⃣Regra de associação de mineração
A mineração de regras de associação é um algoritmo para descobrir conjuntos de itens frequentes e regras de associação em um conjunto de dados. Ele descobre padrões de associação ocultos analisando as associações entre itens nos dados. A mineração de regras de associação é amplamente utilizada na análise de cesta de mercado, sistema de recomendação e outros campos.
3. Campos de aplicação
O aprendizado não supervisionado tem uma ampla gama de aplicações em vários campos, e algumas das áreas de aplicação comuns são descritas abaixo:
1️⃣Segmentação de imagem
Na visão computacional, o aprendizado não supervisionado é usado para tarefas de segmentação de imagens. Ao agrupar os pixels em uma imagem, a imagem pode ser dividida em diferentes regiões para processamento adicional, como reconhecimento de objetos, análise de imagens, etc.
2️⃣Sistema de recomendação
No campo dos sistemas de recomendação, o aprendizado não supervisionado é usado para descobrir os interesses e padrões de comportamento do usuário. Ao agrupar e minerar regras de associação nos dados históricos de comportamento do usuário, ele pode fornecer aos usuários resultados de recomendação personalizados.
3️⃣ Análise de redes sociais
No campo da análise de redes sociais, o aprendizado não supervisionado é usado para descobrir estruturas e relacionamentos comunitários em redes sociais. Por meio de agrupamento e análise de rede de dados de interação entre usuários, a estrutura organizacional e o modo de disseminação de informações das redes sociais podem ser revelados.
4️⃣Condução automática
No campo da direção autônoma, o aprendizado não supervisionado é usado para sentir e entender o ambiente e a estrada. Ao agrupar e reduzir dimensionalmente os dados do sensor, recursos importantes, como estradas, veículos e pedestres, podem ser extraídos para apoiar a tomada de decisões e o controle da direção autônoma.
Quatro. Resumo
O aprendizado não supervisionado é amplamente utilizado em problemas como agrupamento, redução de dimensionalidade e mineração de regras de associação, fornecendo ferramentas e métodos poderosos para entender dados e resolver problemas práticos. Com o aumento contínuo da escala de dados e a expansão contínua dos cenários de aplicação, o aprendizado não supervisionado desempenhará um papel cada vez mais importante em vários campos.
【Livro grátis】
[! forma de participação! 】
Curtir + favorito + qualquer comentário neste artigo
Prazo: 2023-07-20 21:00 à noite
Nota: O método de sorteio é <desenho aleatório do script>, e os vencedores serão anunciados na minha página inicial conforme programado, com frete grátis.
【Introdução↓】
Este livro usa ChatGPT e Python para realizar facilmente a automação de escritório, de modo que os funcionários de escritório comuns sem experiência em programação também possam controlar o Python, realizar a automação de escritório em vários cenários e melhorar a eficiência do trabalho!
Este livro apresenta de forma abrangente e sistemática as soluções de automação da linguagem Python em cenários de escritório comuns. O conteúdo inclui conhecimento básico da linguagem Python, métodos comuns de leitura e gravação de dados em Python, operação automática do Excel com Python, operação automática do Word e PPT com Python, operação automática de arquivos e pastas, e-mails, arquivos PDF, imagens e vídeos com Python, processamento de dados com Python Análise visual e interação de página da web, automação de escritório Python avançada e fácil com ChatGPT.
Dangdang link de compra: "Python Automation Office Application Encyclopedia (ChatGPT Edition)"