Visual Transformer (ViT)-Codeimplementierung in der PyTorch-Version – ist eine detaillierte Beschreibung

@[TOC](Visual Transformer (ViT) Code-Implementierung PyTorch-Version – ist eine detaillierte Beschreibung)
Englische Originalversion: https://github.com/FrancescoSaverioZuppichini/ViT
Chinesische Übersetzungsversion: https://www.jianshu.com/p /06a40338dc7c
Beschreibung des Inhalts des Visual Transformer (ViT)-Modells: https://www.jianshu.com/p/d4bc4f540c62

Hinweis: ViT muss vorab auf umfangreichen Datensätzen trainiert und dann auf nachgelagerte Datensätze verfeinert werden, um bessere Ergebnisse zu erzielen. Andernfalls ist der Effekt nicht so gut wie bei CNN-basierten Modellen wie ResNet50.

おすすめ

転載: blog.csdn.net/LIWEI940638093/article/details/123854087