Скучно читать газету: зрительное внимание модели RARE2012

Риш, Н., Mancaş, М., Duvinage, М., Mibulumukini, М., Госслин, Б., & Дютуа, Т. (2013). RARE2012: мульти-масштаб редкость на основе обнаружение заметности с его сравнительным статистическим анализом. Обработка сигнала: Изображение Связь 28 (6), 642-658. https://doi.org/10.1016/j.image.2013.03.009
 
Очень давно, гораздо раньше статьи он сегодня, в статье с помощью методов, в частности, я читал дальше.
Визуальный механизм внимания этой вещи мы заинтересованы в том , и это потому , что это полезно для него. Например, помогает оптимизировать человеко-машинный интерфейс, что позволяет пользователям использовать интерактивные кнопки более комфортных, реклама оценки дизайна, сжатие данных , видеоизображения, фокусируясь больше заинтересованы в сохранении информации об изображении. Робот зрительное восприятие и так на нем.
В общем определении зрительного внимания человека, я не знаю , что нет никаких исследований по биологии , чтобы понять , как это происходит, во всяком случае, к тому времени , эта статья была опубликована там нет падения. Но , вообще говоря, человеческое внимание можно определить как приоритизации входящих стимулов и избирательное внимание в котором часть естественной способности . Хорошо, есть предварительное определение также хорошо. Это вы делаете зрительное внимание на нем, мозг получает сигнал изображения не только своего рода сигнальной последовательности , чтобы быть таким образом.
В компьютерном зрении, изучение большей части механизма внимания зависит от «заметности карты» концепции, в буквальном переводе означает «заметность карту.» Проще говоря, «заметности карты» из входного сигнала любая одна модель, выполненная отображение результата отображения является то, что модель будет иметь более важное значение, чтобы получить сильный сигнал соответственно.
Таким образом, для визуального механизма внимания то, является входным изображением, человеческий глаз привлекает место более важный сигнал. Таким образом, объяснить механизм зрительного внимания, просто хочет, чтобы найти лучшую «заметность карту». Он должен быстро сказать нам входное изображение, те места, в системе восприятия является очень привлекательным.
По этой линии мысли, «заметность карты» в содержит два механизма. Один снизу вверх внимание, также известное как стимул инициативы или внешнего внимание. Другой сверху вниз, также известный как задача управляемого эндогенные или внимания, которое интегрирует конкретные знания (просмотрщик задача может иметь в каждом конкретном случае, типе модели сцены и тому подобное может быть определен объект ). RARE2012 чисто снизу вверх, так как тем лучше производительность метода снизу вверх. Полностью зависят от информации входного изображения, вам не нужно рассмотреть другие механизмы принятия решений, конечно, более высокую производительность пряного.
В статье сравниваются года популярные несколько способов сделать вывод, что их подход очень хорошо. Ха-ха-ха
Их метод:
-------------------------------------------------- -----------------------------------------
Первый алгоритм этапа:
Первый шаг: метод PCA первый основной компонент анализа, изображение отображается в три канала RGB три линейно независимых пространства. Разделяется на три канала, эти три канала, channal1 основном содержащей информацию яркости, и channal3 channal2 содержит информацию цветности. Но три канала информации независимы. Он выглядит как маленький три канала Ну ВПГ, HSV является легкость, оттенок и насыщенность. Но то, что я не знаю, специфическое разложение О, зависит от источника, статья не сказал.
Второй этап: расчет PCA редкости изображений трех каналов непосредственно. Эй, тут еще надо посмотреть на исходный код, размер изображения основной компонент анализа , чтобы получить вниз , я могу понять , что верхний разделения канала с использованием метода РСА является редактором делать? Независимо от того , что, так что это распределение три редкость. Делайте это находится в извлеченном изображении в более низкой функции цвета , конечно, также включает в себя распределение яркости характеристик.
Третий шаг: извлечение направления, а затем описанные выше три особенности на фигах канал изображения с помощью фильтров Габора. Габор фильтр Габор выбран потому, что мозг похож на процесс простого визуальной коры головного мозга нерв (V1) из.
Габора определяется следующим образом: 
Габор человек Зрительная система в ответ на визуальную стимуляцию простых клеток очень похожа. Она имеет хорошие характеристики с точки зрения локальной пространственной и частотной области информации извлеченного объекта. Габор вейвлет чувствительны к краю изображения, способна обеспечить хорошую характеристику направленности выбор и выбор масштаба, и нечувствительные изменения освещенности, можно обеспечить хорошую адаптацию к изменению освещенности.
D фильтр Габора формируется с помощью функции Габора , имеющей получить оптимальные свойства при локализованы пространственной и частотной области, и , таким образом можно описать соответствующую пространственную частоту (масштаб), пространственное положение и ориентацию селективного локальную информацию о конфигурации , Габора используется для извлечения изображения из пространственной ориентации и текстурных характеристик .
Статьи Габор соответственно входных восемь направлений, так что для ввода изображения, то, что будут в общей сложности 8 результатов. Это восемь выходов, чтобы быть интегрированы в выходное изображение.
Выход тот же угол в различных направлениях плавления:
В соответствии с уравнением (2) для восьми различных моделей коэффициента эффективности вычислений:
Фиг сортировать восемь направлений от размера ЕС. Каждый шаблон умножается на вес: я / Н. N = 8, я этот шаблон имеет место в ЕС. Бумага устанавливается порог, отфильтровывая малого шаблона EC:
Т = 0,3 является автором считается более разумной стоимости.
Фиг.8 затем сливают направление:
Таким образом, метод РСА channal1 три изображения, полученные, channal2 channal3 и экстрагируют через три Габора редкости направлении зерна на фиг.
-------------------------------------------------- -----------------------------------------
Второй этап:
Редкость механизм этой фазы rare2012 ключ, в конце концов, это название этой вещи.
Метод: в статистических частотных шкалах установить появляются пикселы.
n_in_i 是当前像素j的灰度值为i的概率(比例), n_in_i 就是根据rarity图的直方图得到的。这个公式说的有点不明不白的,S是啥?看起来是没有归一化的rarity图中的灰度最大值。不管怎样,它的思想就是统计图像中某一灰度出现的频率,认为是某一个灰度在局部区域出现的概率。这就是该像素的注意力得分,就是Attention()。
Fig. 2中给出了一个例子,输入左图,蓝色的区域在整幅图像中出现的概率较低,那么它在稀有度图中的值就偏高。
第二阶段中,对第一阶段得到的6张map计算attention。
-------------------------------------------------------------------------------------------
第三阶段:
对第二阶段得到的6张attention map进行融合操作。
首先是通道内融合,由channal1得到的颜色特征图纹理方向图计算attention后,进行融合。融合方法为:
就是EC和map点乘。这里出现了S哦,不过它是不是公式5中的S呢,这个要看下源码,论文中没说。N=2,为啥是2,哪里来的两张图,也不明白。
 
先不管这些地方,看最后,rare2012是如何得到最终的输出的:
根据第三阶段的融合操作,三个通道的图像最后输出了三个结果。
这三个结果再融合起来,就是最后的输出了。融合的方法就是第一阶段的第三步,融合gabor后的8张图像的方法。首先计算效率系数,然后排序,然后乘权重,阈值筛选。
rare2012是由rare2007和rare2011发展而来,每一次改进都带来的一些创新。性能更好,考虑的特征更全面。俺么rare2012结果如何?
对比结果中,上面是眼动监测的结果,也就是人眼实际的聚焦情况。下面是rare2012的结果。看起来挺好的嘛。
但是rare2012有时也有完全出错的时候。fig7中后面三个数据的结果,rare2012都错了。看来注意力机制还是要引入充分合理的自上而下的逻辑判断。
不过rare2012在当年对比同类模型,还是相当有优势的。当然论文中有定量的性能和准确率分析。
 
 

рекомендация

отwww.cnblogs.com/isYiming/p/12158923.html