ROLO：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking（二） - 代码天地

ROLO：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking（二）

其他 2019-06-23 12:54:58 阅读次数: 0

这篇文章是对ROLO的代码解读。首先是对单目标跟踪的实现，参考博客中的说法，主要阅读的文件有三个，接下来分别进行阅读。

YOLO_network.py

从代码中可以看到最终的输出是 7*7*（5*2+20），中间全连接层的输出是4096个，最终的输出位置信息是[c,x,y,w,h,p],这些都存储在yolo_out中，是以numpy方法中的.NPY文件

argv_parser函数是对在调用这个py文件时候所传入的命令行指令进行解析，比较容易理解。

这部分在构造yolo函数的卷积部分，可以看到一代的卷积中还没有形成DBL层，只有卷积和leaky_relu，还没有引入BN层。fc和pooling层也是按照原来paper写的。

最终的输出是featur和loc连接起来，和当初的想法一样。最终拼接成4096+6的向量，然后以yolo_out 的形式存储在本地。

通读下来也没什么好写的，可能是没有具体的运行，等有问题了再补。

ROLO_network_test_single.py

一些小函数的阅读笔记：

tf.split(dimension, num_split, input)：dimension的意思就是输入张量的哪一个维度，如果是0就表示对第0维度进行切割。num_split就是切割的数量，如果是2就表示输入张量被切成2份，每一份是一个列表。

ROLO_demo_test.py

ROLO_utols.py

最终有许多小问题而没有跑起来，暂时推到博客做一个记录吧，就代码而言感觉最终的效果应该不会特别好，因为训练样本少而待训练参数多。

如果要说这个算法的格局的话，与卡尔曼滤波的差距是送入滤波器的是一个4096+5的向量，多了很多的冗余信息与帧间的冗余信息。

猜你喜欢

转载自www.cnblogs.com/deleteme/p/11072313.html

ROLO：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking（二）

ROLO：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking（一）

DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks

Convolutional Neural Networks（week 3）---Object detection

论文阅读：MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

Learning Multi-Domain Convolutional Neural Networks for Visual Tracking 论文笔记

【计算机视觉】《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》

Convolutional Neural Networks笔记（二）

STCT: Sequentially Training Convolutional Networks for visual tracking

RNN(Recurrent Neural Networks)

Introduction to Recurrent Neural Networks

Recurrent Neural Networks——RNN

Recurrent Neural Networks 简述

Gated Recurrent Neural Networks

019 Recurrent Neural Networks

CS231n Convolutional Neural Networks for Visual Recognition

CS231n:Convolutional Neural Networks for Visual Recognition

Convolutional Neural Networks：第二周

Online Adaptation of Convolutional Neural Networks for Video Object Segmentation论文阅读

Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition

Feb20-paper reading-Convolutional Recurrent Neural Networks for Dynamic MR Image Reconstruction

中文短文本分类实例五-RCNN（Recurrent Convolutional Neural Networks for TextClassiﬁcation）

多标签分类：Ensemble Application of Convolutional and Recurrent Neural Networks for Multi-label Text Categ

论文笔记：ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks

Convolutional Neural Networks

Convolutional Neural Networks:Application

Orthogonal Convolutional Neural Networks

Recurrent Neural Networks, LSTM, GRU

Recurrent Neural Networks by Example in Python

《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》论文阅读（二）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)