コンピュータビジョンにおけるトランスフォーマーの応用
論文アドレス:
https://arxiv.org/abs/1706.03762
ビジョントランスフォーマー
画像は 16x16 ワードの価値があります: Transformers for Image
Recognition at Scale
コードアドレス:
https://github.com/google-research/vision_transformer
元の論文:
https://arxiv.org/abs/2010.11929
スイングトランス
Shifted Windows を使用した Hierarchical Vision Transformer
コードアドレス:
https://github.com/microsoft/Swin-Transformer
元の論文:
https://arxiv.org/pdf/2103.14030.pdf
セグフォーマー
Transformers を使用したセマンティック セグメンテーションのシンプルかつ効率的な設計
コード アドレス:
https://github.com/NVlabs/SegFormer
元の論文:
https://arxiv.org/pdf/2105.15203.pdf
画像分類コンテストにおけるトランスフォーマーの応用
水田ドクター: 水田病分類
https://www.kaggle.com/competitions/水田
病分類/overview
モデル融合
•ConvNext
• https://github.com/facebookresearch/ConvNeXt
•Eficientnet b5-b7
• https:// github.com/lukemelas/EficientNet-PyTorch
•Swin Transformer
• https://github.com/microsoft/Swin-Transformer
画像分割コンペティションにおける Transformer の応用
HuBMAP + HPA - 人体のハッキング
https://www.kaggle.com/competitions/hubmap
器官セグメンテーション
https://www.kaggle.com/code/ishandutta/hubmap-complete- Understanding -and-eda-wb