《Learning_object_interactions_and_descriptions_for_sematic_image》论文阅读 - 代码天地

《Learning_object_interactions_and_descriptions_for_sematic_image》论文阅读

其他 2018-11-24 12:47:13 阅读次数: 0

动机

本文主要是从训练数据的角度来提升CNN分割性能的。由于像素级别标记的样本很少，制作样本成本高。
这里直接根据关键词从网络上搜索相关图像，建立了一个数据库 IDW，结合 VOC12上面的训练数据联合训练，对此设计了一个 IDW-CNN 模型，经过联合训练得到的模型用于分割，性能提升比较大。

贡献

这是首次将图片描述在不经过手动处理和提炼的情况下用于提高语义分割性能的尝试，IDW数据集包含40k图片；
DIW-CNN提出来联合学习VOC12和IDW知识，两个数据集知识完全被探索并且互相迁移；分割和对象交互预测的表现在两个数据集上的都得到了提升。
IDW-CNN有能力稳定提高语义分割性能，当更多数据添加到IDW中时，体现了它的大场景下的应用潜力；

方法

图片和描述在IDW种是自动下载从Internet，不需要人工清洗和提炼，
IDW_CNN提出来联合训练IDW和已经存在的VOC数据；
这里有两个性质：
1. 来自不同数据库的只是可以被完全探索，并且互相转换来提高性能；
2. 分割准确率在VOC中可以提高当选择更多的VOC数据的时候，
初步认识IDW和VOC数据

在这里插入图片描述

Learning Image Descriptions

语义树

1541485356101

转换过程分为三步：
1. 我们首先通过它们的词性过滤叶节点，仅保留名词作为候选对象，并将动词和介词保留为动作候选。
2. 名词被转换为对象。我们使用WordNet 中的词汇关系数据来统一同义词。那些不属于20个对象类别的名词将从树中删除。
3. 动词也应该被认可和完善。我们使用word2ve将动词映射到定义的21个动作。最后，我们通过节点从语义树中提取对象交互。

网络结构（ IDW-CNN）

整体架构

1541486156738

1. 整合网络分为3步

我们通过卷积层将特征信道的数量从2048减少到512，表示为h，以便减少后续阶段的计算。之后，我们产生21个对象特征图的集合，表示为{hi^{m},i表示21类中的一类，每个{hi}m}通过在h和每个语义分割预测通道的元素级乘法获得；
在第二阶段中，每个{hi^m}被用作训练相应对象子网的输入，其输出表征对象i是否呈现在图像I中的概率。所以这里有21个子网络，参数不共享，但是在全连接层参数共享。
我们训练22个action nets，每个网络预测两个对象的行为，

2. Object-Pair Selection (OPS)

1541489019045

3. Refinement

在这里插入图片描述

训练

IDW-CNN联合IDW和VOC12的训练图片通过BP过程。

1. Backwards of Seg-stream

softmax语义分割的输出和groundtruth

2. Backwards of Int-stream

包含两部分损失
1. 每个对象subnet训练通过1-of-2 softmax损失决定一个特别的对象是否在图片中出现，
2. 每个action net产生一个response，一共22中response，然后整个action网络优化1-of-22 softmax损失，最大的响应表示真实action在这两个对象间，
对于IDW，真实标签和动作都可以获得，上面带有一横的就是监督信息。所以可以很容易通过BP训练，

猜你喜欢

转载自blog.csdn.net/u010067397/article/details/83788693

《Learning_object_interactions_and_descriptions_for_sematic_image》论文阅读

《Learning Deep Representations of Fine-Grained Visual Descriptions》论文及代码阅读笔记

论文阅读：Learning to Refine Object Segments

论文阅读：Deep Image Retrieval: Learning global representations for image search

ResNet论文阅读---《Deep Residual Learning for Image Recognition》

《Active Convolution- Learning the Shape of Convolution for Image Classification》论文阅读

【论文阅读】Between-class Learning for Image Classification

论文阅读笔记——《Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning》

论文阅读——《Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning》

Deep Residual Learning for Image Recognition----ResNet论文阅读

【论文阅读笔记】An Unsupervised Learning Model for Deformable Medical Image Registration

《Learning Transferable Architectures for Scalable Image Recognition》论文阅读笔记

论文阅读(二)ResNet(Deep Residual Learning for Image Recognition)笔记

论文阅读——ResNet，Deep Residual Learning for Image Recognition

论文阅读|ResNet：Deep Residual Learning for Image Recognition

论文阅读 Adversarial Complementary Learning forWeakly Supervised Object Localization

[论文阅读] Multiple Instance Active Learning for Object Detection

[论文阅读] Active Learning for Deep Object Detection via Probabilistic Modeling

论文阅读：SMILEtrack: SiMIlarity LEarning for Multiple Object Tracking

[论文阅读] Joint learning of foreground, background and edge for salient object detection

【论文阅读】Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification

论文阅读：YOLOV: Making Still Image Object Detectors Great at Video Object Detection

《RankIQA：learning from Ranking for No-reference Image Quality Assment》论文阅读

《Generative Image Inpainting with Adversarial Edge Learning》论文阅读之edge-connect

Cross-Spectral Image Patch Matching by Learning Features of the Spatially Connected Patches 论文阅读

论文阅读 (三)：An empirical study on image bag generators for multi-instance learning (2016)

[论文阅读] Cross-level Contrastive Learning and Consistency Constraint for Medical Image Segmentation

[论文阅读] BoostMIS: Boosting Medical Image Semi-supervised Learning with Adaptive Pseudo Labeling

【害虫识别论文阅读六】Image Classification of Pests with Residual Neural Network Based on Transfer Learning

【图像修复】论文阅读笔记 ----- 《Image inpainting based on deep learning: A review》

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)