TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captu - 代码天地

TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captu

其他 2021-11-26 05:52:12 阅读次数: 0

TPH-YOLOv5

文章目录

- - TPH-YOLOv5

参考

Introduciton

TPH-YOLOv5的整体架构如上所示，YOLOv5我没怎么看过，不过我们可以直接看它的结构
- 首先Backbone部分，前8块和之前区别不大，作者的描述是CSPDarknet53 backbone with three transformer encoder blocks at the end，也就是它其实在CSPDarknet53点基础上在SPP模块的后面添加了三个Transformer层
- 接下来Neck部分，明显是参考了PANet的结构，只不过用上了CBAM和Transformer的结构
- 然后是Header部分，用的是魔改的TPH（transformer prediction heads），作者的意思是从Transformer开始到检测输出这段都叫TPH，在我看来其实就是用了Transformer模块然后把这块强行叫做TPH模块，可能就类似‘拍了拍 Transformer’？\手动狗头

Structure

CSPDarknet53

关于这部分，可以参考YOLOv4中对应部分，其实说白了就是在一堆残差块边上再加上一个残差边（可以看做大号残差）
- YOLOv4: Optimal Speed and Accuracy of Object Detection

Transformer

关于这部分，也有一篇相关记录，是看李宏毅老师的课的笔记，个人觉得李老师讲的很清楚（只看encoder部分即可）
- self-attention与Transformer补充
这里可以对比下原图和作者给出的Encoder的区别
可以看到还是有一丢丢不一样的,比如embedding后原版是直接进Multi-Head Attention的，而作者是先做了LayerNorm（这个东东没有详细提，应该是类似BN的Norm，可参考下图），然后作者的版本还多了一个Dropout的操作，这玩意在我的理解为多个subnetwork防止过拟合同时提高检测性能

CBAM

全称是Convolutional block attention module，这玩意的论文还没看，在补了，可以先参考这个：
- 注意力模型CBAM
目前的理解是使得网络的注意力集中在某些channel和spatial上，以提高检测精度

Ms-testing and model ensemble.

这玩意就是多尺度检测+合并

Self-trained classifier

所谓Self-trained classifier就是把这部分额外摘出来用相关数据做图像分类的task train一遍，然后合并回去，这。。。

效果

猜你喜欢

转载自blog.csdn.net/symuamua/article/details/120315916

TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captu

当Transformer遇见YOLOv5！TPH-YOLOv5：让小目标无处遁形！

TPH-YOLOv5: 基于Transformer预测头的改进YOLOv5用于无人机捕获场景目标检测

【目标检测论文阅读笔记】Small-object detection based on YOLOv5 in autonomous driving systems

【目标检测论文阅读笔记】FE-YOLOv5: Feature enhancement network based on YOLOv5 for small object detection

[TSP-FCOS]Rethinking Transformer-based Set Prediction for Object Detection

【tph-yolov5】论文简读

YOLOv5的head详解

【深度学习】半监督学习 Efficient Teacher: Semi-Supervised Object Detection for YOLOv5

YOLOv5 Head解耦

YOLOv5、YOLOv8改进：BoTNet Transformer

yolov5的head修改为decouple head

R-FCN:Object Detection via Region-based Fully convolutional Networks && light-head RCNN

改进YOLO：YOLOv5结合swin transformer

改进YOLO：YOLOv5结合BoTNet Transformer

在YOLOv5中添加Swin-Transformer模块

YOLOv5(v7.0)网络修改实践三：把单分支anchor-based、head改为yolov8的anchor-free、双分支解耦合head（yolox的DecoupleHead）

【YOLOv5】Backbone、Neck、Head各模块详解

yolov5 训练crowded human 【visible body detection】

Object Detection《SSD》笔记（5）

YOLOv4—object detection tricks set

YOLOv5+Swin Transformer

[DETR]Object Detection of Transformer代码笔记

Microsoft:Swin-transformer for Object Detection[-ing]

Image-Based Object Spoofifing Detection

深度学习 Green Citrus Detection and Counting in Orchards Based on YOLOv5-CS and AI Edge System 论文篇

Salient Object Detection Driven by Fixation Prediction 论文解读

训练yolov5

yolov5 deepsort

YOLOV5学习

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)