@[TOC](Visual Transformer (ViT) Code-Implementierung PyTorch-Version – ist eine detaillierte Beschreibung)
Englische Originalversion: https://github.com/FrancescoSaverioZuppichini/ViT
Chinesische Übersetzungsversion: https://www.jianshu.com/p /06a40338dc7c
Beschreibung des Inhalts des Visual Transformer (ViT)-Modells: https://www.jianshu.com/p/d4bc4f540c62
Hinweis: ViT muss vorab auf umfangreichen Datensätzen trainiert und dann auf nachgelagerte Datensätze verfeinert werden, um bessere Ergebnisse zu erzielen. Andernfalls ist der Effekt nicht so gut wie bei CNN-basierten Modellen wie ResNet50.