OpenCV的级联分类器训练

当以这种方式运行 opencv_createsamples 时，以下过程用于创建样本对象实例：给定的源图像围绕所有三个轴随机旋转。所选角度受-maxxangle,-maxyangle和-maxzangle限制。白噪声被添加到前景的强度中。如果指定-inv，则前景像素强度会反转。最后，将获得的图像放置到背景描述文件中的任意背景上，调整宽高为-w和-h，并存储到由命令行指定路径-vec。

正样本也可以从先前标记的图像集合中获得，这是构建稳定对象模型时所需的方式。这个集合是由一个类似于背景描述文件的文本文件来描述的。该文件的每一行对应一个图像。该行的第一个元素是文件名，然后是对象注释的数量，然后是描述对象边界矩形坐标（x、y、宽度、高度）的数字，描述文件如下。

目录结构：

/img
  img1.jpg
  img2.jpg
info.dat

info.dat中图像1包含一个矩形坐标，图像2包含2个矩形坐标，具体如下：

img/img1.jpg 1 140 100 45 45
img/img2.jpg 2 100 200 50 50 50 30 25 25

4、标注工具

OpenCV3.x以后，提供用于生成文件的开源注释工具-info，相关参数如下：

--annotations(必选): txt文件注释的路径，在里面存储注释；
--images(必选): 包含图像文件夹的路径；
--maxWindowHeight: 如果输入图像的高度大于这里限制的高度，会调整图像大小；
--resizeFactor：用于调整图像大小的因子；

命令行示例如下：

opencv_annotation --annotations=/xxx/annotations/file.txt --images=/xxx/image/

二、级联训练

在准备好正样本和负样本后，对弱分类器进行级联训练。opencv_traincascade命令按照功能用途划分。

1、通用参数

通用参数包括正负样本路径、正负样本数量、分类器输出路径、训练的级联阶段数，具体如下：

-data <cascade_dir_name>: 分类器的输出路径，文件夹需要提前创建；
-vec <vec_file_name>: 正样本文件路径；
-bg <background_file_name>: 负样本文件路径；
-numStages <number_of_stages>: 级联训练的阶段数；
-precalcValBufSize：预先计算的特征值的缓冲区大小(以 Mb 为单位)；
-precalcIdxBufSize：预先计算的特征索引的缓冲区大小(以 Mb 为单位);
-numThreads <max_number_of_threads>：训练使用的最大线程数；
-acceptanceRatioBreakValue：用于确定模型应保持学习的精度以及何时停止。默认为-1，禁用此功能。

2、级联参数

级联参数包括阶段类型、特征类型、样本宽高，具体如下：

-stageType <BOOST(默认)>: 阶段类型；
-featureType<{HAAR(默认), LBP}>: 特征类型：HAAR(Haar-like 特征)，LBP(局部二进制模式)；
-w <sampleWidth>：训练样本的宽度(以像素为单位)；
-h <sampleHeight>：训练样本的高度(以像素为单位)；

3、增强分类器参数

增强分类器参数包括分类器类型、最小命中率、最大误差率，具体如下：

-bt <{DAB, RAB, LB, GAB(默认)}>：增强分类器的类型：DAB(Discrete AdaBoost)，RAB (Real AdaBoost)，LB(LogitBoost)，GAB(Gentle AdaBoost)；
-minHitRate：分类器每个阶段的最小期望命中率；
-maxFalseAlarmRate：分类器每个阶段的最大期望误差率；
-weightTrimRate：是否使用修正权重，建议值为 0.95；
-maxDepth <max_depth_of_weak_tree>：弱树的最大深度，建议值为1；
-maxWeakCount <max_weak_tree_count>：每个级联阶段的弱树的最大数量；

4、Haar-like特征参数

Haar-like特征参数主要是指定特征集类型，具体如下：

-mode <BASIC(默认) | CORE | ALL>：选择训练中使用的 Haar 特征集的类型。其中BASIC 仅使用直立功能，而 ALL 使用直立和 45 度旋转功能集；

三、可视化级联分类器

可视化级联分类器用于在训练过程中，看到实时训练数据视图。OpenCV提供opencv_visualisation应用程序，相关命令如下：

--image(必选): 图像模型的路径；
--model(必选): 训练模型的路径；
--data(可选): 如果提供提前创建的数据文件夹，将存储每个阶段结果；

命令行示例如下：

opencv_visualisation --image=/data/object.png --model=/data/model.xml --data=/data/result/