版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiaomifanhxx/article/details/81171096
上篇博客为大家介绍了在使用深度学习框架时,调节什么样的参数才能够使得训练出来的参数更具有鲁棒性以及其准确率更高。下面将给大家介绍YOLOV2配置文件,我们可以从中看到上篇博客中很多方法YOLOV2都有用到。
[net]
# Testing
batch=1
subdivisions=1
# Training
# batch=64 #每batch个样本更新一次参数
# subdivisions=8 #如果内存不够大,通常将一个batch分为subdivisions份,在darknet中会将batch/subdivisions认为成batch
height=416 #输入图片的高度
width=416 #输入图片的宽度
channels=3 #输入图片的通道数
momentum=0.9 #动量(其用来做参数的更新,调参用的)
decay=0.0005 #权重衰减正则化,为了防止过拟合
angle=0 #图片旋转的角度,来生成更多的训练样本
saturation = 1.5 #调整饱和度,来产生更多的训练样本
exposure = 1.5 #调整曝光度,来产生更多的训练样本
hue=.1 #调整色度,。。。。。。。
learning_rate=0.001 #学习率,即训练的时候初始值
burn_in=1000 ??
max_batches = 80200 #训练的最高次数,即batches数量,到达该值停止训练
policy=steps #学习率更新的方法(随步数进行衰减)
steps=40000,60000 #在40000,60000的时候进行调整学习率
scales=.1,.1 #每次更改的学习率为上一个学习率*scales,为当前步的学习率
[convolutional] #卷积层
batch_normalize=1 #在训练初始,进行batch_normalize,其能够防止过拟合,规范化模型
filters=32 #卷积后输出的特征图个数
size=3 #卷积核的尺寸
stride=1 #卷积的步长
pad=1 #当pad为0时,padding由padding的参数决定,反之,当pad为1时,padding大小为size/2
activation=leaky #使用的激活函数
[maxpool] #池化层
size=2 #池化的核的大小
stride=2 #池化的步长
#################
[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky
[maxpool]
size=2
stride=2
[route] #使用的是Fine-Grained Features
layers=-9 #将上个卷积层的输出导入到network中(自己认为就是将该层前9层的得到的featuremap取到)
[convolutional]
batch_normalize=1
size=1
stride=1
pad=1
filters=64
activation=leaky
[reorg] #将上个卷积层的输入与最后输出的featuremap做concat(阅读YOLOV2论文后,我认为该层就是passthrough层,将两层的featuremap做一个concat)
stride=2
[route] #进行将两层的featuremap做concat
layers=-1,-4
[convolutional]
batch_normalize=1
size=3
stride=1
pad=1
filters=1024
activation=leaky
[convolutional]
size=1
stride=1
pad=1
filters=35 #region的前一个filters的数量是根据种类以及anchor来确定的:filters=anchor_boxnum*(class+5)
activation=linear
[region]
anchors = 1.3221, 1.73145, 3.19275, 4.00944, 5.05587, 8.09892, 9.47112, 4.84053, 11.2364, 10.0071#anchor boxes的尺度比
bias_match=1
classes=2 #目标种类个数
coords=4 #每个box的坐标
num=5 #anchor的数量
softmax=1 #使用softmax来作为激活函数
jitter=.3 #通过抖动增加噪声,防止过拟合
rescore=1 #非0时进行重新打分
object_scale=5
noobject_scale=1
class_scale=1
coord_scale=1
absolute=1
thresh = .6
random=1
参考博文: https://blog.csdn.net/jiachen0212/article/details/79792387