ResNet de aprendizado de máquina (rede residual) e conjuntos de dados padrão comumente usados

ResNet (Rede Residual) é uma rede neural profunda, proposta por He Kaiming do Microsoft Labs e outros grandes deuses em 2015, e conquistou o primeiro lugar na tarefa de classificação na competição ImageNet daquele ano.
Ao introduzir uma estrutura residual, o ResNet resolve o problema do desaparecimento ou explosão do gradiente no processo de treinamento de redes neurais profundas, para que a rede possa ser construída mais profundamente. A estrutura residual introduz uma conexão de salto, para que as informações da rede possam passar diretamente por algumas camadas, aumentando assim a capacidade expressiva da rede. O ResNet possui um total de 1.001 camadas, divididas em ResNet-50, ResNet-101, ResNet-152 e outros tipos. A diferença entre os diferentes tipos de ResNet está principalmente no projeto estrutural da rede, como na estrutura residual, que tipo de conexão residual é usada, se deve ser usada a normalização em lote (Normalização em lote), etc. Ao treinar ResNet, a descida gradiente estocástica (SGD) é geralmente usada para otimização, e métodos como dropout são usados ​​para evitar overfitting. Além do sucesso em tarefas de classificação de imagens, o ResNet também obteve bons resultados na detecção de alvos, segmentação de imagens e outras tarefas.

No campo do aprendizado de máquina e do aprendizado profundo, existem muitos conjuntos de dados padrão comuns usados ​​para uma variedade de tarefas e pesquisas diferentes. Aqui estão alguns conjuntos de dados padrão comuns, categorizados por tipo de tarefa:

Classificação de imagens:

  1. MNIST : Imagens em escala de cinza contendo dígitos manuscritos (0 a 9), usadas para tarefas de reconhecimento de dígitos.

  2. CIFAR-10 e CIFAR-100 : Conjuntos de dados contendo pequenas imagens com 10 e 100 categorias diferentes respectivamente, utilizados para tarefas de classificação de imagens.

  3. ImageNet : um conjunto de dados contendo um grande número de imagens e múltiplas categorias, frequentemente usado para pré-treinamento de modelos de aprendizagem profunda e tarefas de classificação de imagens.

  4. Moda MNIST : semelhante ao MNIST, mas inclui imagens de itens de moda para tarefas de classificação de imagens.

Detecção e segmentação de objetos:

  1. COCO (Common Objects in Context) : um conjunto de dados contendo um grande número de imagens e detecção, segmentação e rotulagem de objetos relacionados para tarefas de detecção e segmentação de objetos.

  2. PASCAL VOC : Um conjunto de dados contendo imagens e dados de detecção e segmentação de objetos relacionados para tarefas de visão computacional.

Classificação de texto:

  1. 20 Newsgroups : Contém 20 textos de newsgroups com diferentes tópicos para tarefas de classificação de texto.

  2. IMDb : um conjunto de dados contendo resenhas de filmes, frequentemente usado para análise de sentimentos e tarefas de classificação de texto.

Processamento de Linguagem Natural (PNL):

  1. Stanford Sentiment Treebank : um conjunto de dados contendo frases e rótulos de sentimento para análise de sentimento e tarefas de classificação de sentimento.

  2. CoNLL-2003 : Contém dados de texto multilíngue para tarefas de reconhecimento de entidade nomeada (NER).

Reconhecimento de fala:

  1. LibriSpeech : um conjunto de dados contendo grandes quantidades de áudio de fala e transcrições de texto correspondentes para tarefas de reconhecimento de fala.

Sistemas de recomendação:

  1. MovieLens : um conjunto de dados contendo classificações de filmes e dados do usuário para tarefas do sistema de recomendação.

Análise de série temporal:

  1. Repositório de aprendizado de máquina UCI : contém pequenos conjuntos de dados de aprendizado de máquina em vários domínios, alguns dos quais são adequados para tarefas de análise de série temporal.

Esses conjuntos de dados são conjuntos de dados padrão comumente usados ​​nas áreas de aprendizado de máquina e aprendizado profundo para testar o desempenho de algoritmos, modelos e técnicas. Além dos conjuntos de dados mencionados acima, existem muitos conjuntos de dados específicos de domínio adequados para tarefas e direções de pesquisa específicas. A escolha do conjunto de dados depende muitas vezes das necessidades do estudo ou aplicação.

おすすめ

転載: blog.csdn.net/qq_42244167/article/details/132482179