选择性搜索算法

该文翻译整理自:selective search for object detection(c++ / python)


关于什么是HSV可以参考https://blog.csdn.net/hanshanbuleng/article/details/80383813

一、目标检测 VS 目标识别

目标识别(objec recognition)是指明一幅输入图像中包含那类目标。其输入为一幅图像,输出是该图像中的目标属于哪个类别(class probability)。而目标检测(object detection)除了要告诉输入图像中包含了哪类目前外,还要框出该目标的具体位置(bounding boxes)。

在目标检测时,为了定位到目标的具体位置,通常会把图像分成许多子块(sub-regions / patches),然后把子块作为输入,送到目标识别的模型中。分子块的最直接方法叫滑动窗口法(sliding window approach)。滑动窗口的方法就是按照子块的大小在整幅图像上穷举所有子图像块。这种方法产生的数据量想想都头大。和滑动窗口法相对的是另外一类基于区域(region proposal)的方法。selective search就是其中之一!

二、selective search算法流程


step0:生成区域集R,具体参见论文《Efficient Graph-Based Image Segmentation》

step1:计算区域集R里每个相邻区域的相似度S={s1,s2,…}
step2:找出相似度最高的两个区域,将其合并为新集,添加进R
step3:从S中移除所有与step2中有关的子集
step4:计算新集与所有子集的相似度
step5:跳至step2,直至S为空


三、相似度计算

论文考虑了颜色、纹理、尺寸和空间交叠这4个参数。

3.1、颜色相似度(color similarity)
将色彩空间转为HSV,每个通道下以bins=25计算直方图,这样每个区域的颜色直方图有25*3=75个区间。 对直方图除以区域尺寸做归一化后使用下式计算相似度:


3.2、纹理相似度(texture similarity)

论文采用方差为1的高斯分布在8个方向做梯度统计,然后将统计结果(尺寸与区域大小一致)以bins=10计算直方图。直方图区间数为8*3*10=240(使用RGB色彩空间)。


其中,是直方图中第个bin的值。

3.3、尺寸相似度(size similarity)


保证合并操作的尺度较为均匀,避免一个大区域陆续“吃掉”其他小区域。

例:设有区域a-b-c-d-e-f-g-h。较好的合并方式是:ab-cd-ef-gh -> abcd-efgh -> abcdefgh。 不好的合并方法是:ab-c-d-e-f-g-h ->abcd-e-f-g-h ->abcdef-gh -> abcdefgh。

3.4、交叠相似度(shape compatibility measure)



3.5、最终的相似度



四、OpenCV 3.3 实现了selective search

在OpenCV的contrib模块中实现了selective search算法。类定义为:

cv::ximgproc::segmentation::SelectiveSearchSegmentation
  
  


举例:


  
  
  1. #include "opencv2/ximgproc/segmentation.hpp"
  2. #include "opencv2/highgui.hpp"
  3. #include "opencv2/core.hpp"
  4. #include "opencv2/imgproc.hpp"
  5. #include <iostream>
  6. #include <ctime>
  7. using namespace cv;
  8. using namespace cv::ximgproc::segmentation;
  9. static void help() {
  10. std:: cout << std:: endl <<
  11. "Usage:" << std:: endl <<
  12. "./ssearch input_image (f|q)" << std:: endl <<
  13. "f=fast, q=quality" << std:: endl <<
  14. "Use l to display less rects, m to display more rects, q to quit" << std:: endl;
  15. }
  16. int main(int argc, char** argv) {
  17. // If image path and f/q is not passed as command
  18. // line arguments, quit and display help message
  19. if (argc < 3) {
  20. help();
  21. return -1;
  22. }
  23. // speed-up using multithreads
  24. // void cv::setUseOptimized(bool onoff), Enables or disables the optimized code.
  25. setUseOptimized( true);
  26. setNumThreads( 4);
  27. // read image
  28. Mat im = imread(argv[ 1]);
  29. // resize image
  30. int newHeight = 200;
  31. int newWidth = im.cols*newHeight/im.rows;
  32. resize(im, im, Size(newWidth, newHeight));
  33. // create Selective Search Segmentation Object using default parameters
  34. Ptr<SelectiveSearchSegmentation> ss = createSelectiveSearchSegmentation();
  35. // set input image on which we will run segmentation
  36. ss->setBaseImage(im);
  37. // Switch to fast but low recall Selective Search method
  38. if (argv[ 2][ 0] == 'f') {
  39. ss->switchToSelectiveSearchFast();
  40. }
  41. // Switch to high recall but slow Selective Search method
  42. else if (argv[ 2][ 0] == 'q') {
  43. ss->switchToSelectiveSearchQuality();
  44. }
  45. // if argument is neither f nor q print help message
  46. else {
  47. help();
  48. return -2;
  49. }
  50. // run selective search segmentation on input image
  51. std:: vector<Rect> rects;
  52. ss->process(rects);
  53. std:: cout << "Total Number of Region Proposals: " << rects.size() << std:: endl;
  54. // number of region proposals to show
  55. int numShowRects = 100;
  56. // increment to increase/decrease total number of reason proposals to be shown
  57. int increment = 50;
  58. while( 1) {
  59. // create a copy of original image
  60. Mat imOut = im.clone();
  61. // itereate over all the region proposals
  62. for( int i = 0; i < rects.size(); i++) {
  63. if (i < numShowRects) {
  64. rectangle(imOut, rects[i], Scalar( 0, 255, 0));
  65. }
  66. else {
  67. break;
  68. }
  69. }
  70. // show output
  71. imshow( "Output", imOut);
  72. // record key press
  73. int k = waitKey();
  74. // m is pressed
  75. if (k == 109) {
  76. // increase total number of rectangles to show by increment
  77. numShowRects += increment;
  78. }
  79. // l is pressed
  80. else if (k == 108 && numShowRects > increment) {
  81. // decrease total number of rectangles to show by increment
  82. numShowRects -= increment;
  83. }
  84. // q is pressed
  85. else if (k == 113) {
  86. break;
  87. }
  88. }
  89. return 0;
  90. }
上边代码git地址:https://code.csdn.net/guoyunfei20/selective_search_opencv_demo.git(运行需要安装OpenCV3.0以上 + contrib)


猜你喜欢

转载自blog.csdn.net/weixin_43489950/article/details/89076054