计算机视觉注意力机制应用

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yunxinan/article/details/83472657

attention—OCR
首先同样学习一门技术的同时学习背后的历史,计算机是非常讲究实现性科学。所以我们必须研究历史来完善技术的演化便于我们理解和仍然存在的技术问题进行论证。
最早成大脑成像机制winner-take-all的建模方法来实现这个过程,那么怎么可以使得计算机拥有自主学习注意力的机制那么我们就要研究神经网络的图像的机制,我个人非常讨厌现在很多书没有解释说明数字图像,虽然很多书都有对图像概念性描述,但是图像的表示,图像的知识表示我只在一本比较旧的书看到过,很多书没有对位图、矢量图、索引图相关技术细节做深入研究知识,如果工程基础好这些在项目中可以反推,但是我估计很多书的作者都不会这么干。
软注意力问题,通过滤波器的通道关注区域,这个在感受视野和RPN及ROI都有很好体现,这种网络生产的关键区域书可以微分的,通过微分的注意力可以传个神经网络技术梯度并且反省传播利用范数的方案指导这种反馈来学习注意力权重。
强注意力问题是关注于焦点或角点来衍射一个区域更加注重变换和动态性和随机的预测过程,强注意力过程不可微分的注意力,因此可以考虑差分办法来解决问题缺陷实现增强,也有人用reinforcement learning方法来完成这项工作。
https://github.com/da03/Attention-OCR
今天有点累了 ,改天再写

猜你喜欢

转载自blog.csdn.net/yunxinan/article/details/83472657