AlexeyAB DarkNet YOLOv3框架解析与应用实践（三）

ImageNet分类

您可以使用Darknet为1000级ImageNet挑战赛分类图像。如果你还没有安装Darknet，你应该先安装。

使用预先训练的模型分类

下面是安装Darknet、下载分类权重文件和在图像上运行分类器的命令：

git clone https://github.com/pjreddie/darknet.git

cd darknet

make

wget https://pjreddie.com/media/files/darknet19.weights

./darknet classifier predict cfg/imagenet1k.data cfg/darknet19.cfg darknet19.weights data/dog.jpg

本例使用Darknet19模型，您可以在下面阅读更多有关它的信息。运行此命令后，您将看到以下输出：

ayer filters size input output

0 conv 32 3 x 3 / 1 256 x 256 x 3 -> 256 x 256 x 32 0.113 BFLOPs

1 max 2 x 2 / 2 256 x 256 x 32 -> 128 x 128 x 32

2 conv 64 3 x 3 / 1 128 x 128 x 32 -> 128 x 128 x 64 0.604 BFLOPs

3 max 2 x 2 / 2 128 x 128 x 64 -> 64 x 64 x 64

4 conv 128 3 x 3 / 1 64 x 64 x 64 -> 64 x 64 x 128 0.604 BFLOPs

5 conv 64 1 x 1 / 1 64 x 64 x 128 -> 64 x 64 x 64 0.067 BFLOPs

6 conv 128 3 x 3 / 1 64 x 64 x 64 -> 64 x 64 x 128 0.604 BFLOPs

7 max 2 x 2 / 2 64 x 64 x 128 -> 32 x 32 x 128

8 conv 256 3 x 3 / 1 32 x 32 x 128 -> 32 x 32 x 256 0.604 BFLOPs

9 conv 128 1 x 1 / 1 32 x 32 x 256 -> 32 x 32 x 128 0.067 BFLOPs

10 conv 256 3 x 3 / 1 32 x 32 x 128 -> 32 x 32 x 256 0.604 BFLOPs

11 max 2 x 2 / 2 32 x 32 x 256 -> 16 x 16 x 256

12 conv 512 3 x 3 / 1 16 x 16 x 256 -> 16 x 16 x 512 0.604 BFLOPs

13 conv 256 1 x 1 / 1 16 x 16 x 512 -> 16 x 16 x 256 0.067 BFLOPs

14 conv 512 3 x 3 / 1 16 x 16 x 256 -> 16 x 16 x 512 0.604 BFLOPs

15 conv 256 1 x 1 / 1 16 x 16 x 512 -> 16 x 16 x 256 0.067 BFLOPs

16 conv 512 3 x 3 / 1 16 x 16 x 256 -> 16 x 16 x 512 0.604 BFLOPs

17 max 2 x 2 / 2 16 x 16 x 512 -> 8 x 8 x 512

18 conv 1024 3 x 3 / 1 8 x 8 x 512 -> 8 x 8 x1024 0.604 BFLOPs

19 conv 512 1 x 1 / 1 8 x 8 x1024 -> 8 x 8 x 512 0.067 BFLOPs

20 conv 1024 3 x 3 / 1 8 x 8 x 512 -> 8 x 8 x1024 0.604 BFLOPs

21 conv 512 1 x 1 / 1 8 x 8 x1024 -> 8 x 8 x 512 0.067 BFLOPs

22 conv 1024 3 x 3 / 1 8 x 8 x 512 -> 8 x 8 x1024 0.604 BFLOPs

23 conv 1000 1 x 1 / 1 8 x 8 x1024 -> 8 x 8 x1000 0.131 BFLOPs

24 avg 8 x 8 x1000 -> 1000

25 softmax 1000

Loading weights from darknet19.weights...Done!

data/dog.jpg: Predicted in 0.769246 seconds.

42.55%: malamute

22.93%: Eskimo dog

12.51%: Siberian husky

2.76%: bicycle-built-for-two

1.20%: mountain bike

Darknet在加载配置文件和权重时显示信息，然后对图像进行分类并打印图像的前10个类。海藻是一种混合品种的狗，但她有很多软弱无力，所以我们认为这是一个成功的！

您也可以尝试使用其他图像，如秃鹰图像：

./darknet classifier predict cfg/imagenet1k.data cfg/darknet19.cfg darknet19.weights data/eagle.jpg

生成：

...

data/eagle.jpg: Predicted in 0.707070 seconds.

84.68%: bald eagle

11.91%: kite

2.62%: vulture

0.08%: great grey owl

0.07%: hen

不错！

如果未指定图像文件，则在运行时将提示您输入图像。这样，您就可以在一行中对多个对象进行分类，而无需重新加载整个模型。使用命令：

./darknet classifier predict cfg/imagenet1k.data cfg/darknet19.cfg darknet19.weights

然后您将得到一个提示，如下所示：

....

25: Softmax Layer: 1000 inputs

Loading weights from darknet19.weights...Done!

Enter Image Path:

每当你厌倦了分类图像，你可以使用Ctrl-C退出程序。

在ImageNet上验证

到处都可以看到这些验证集编号。也许你想再检查一下这些模型的实际工作情况。我们来吧！

首先需要下载验证图像和cls loc注释。你可以把它们弄到这里，但你得记帐！下载完所有内容后，您应该有一个包含ILSVRC2012_bbox_val_v3.tgz和ILSVRC2012_img_val.tar的目录。首先我们打开包装：

tar -xzf ILSVRC2012_bbox_val_v3.tgz

mkdir -p imgs && tar xf ILSVRC2012_img_val.tar -C imgs

现在我们有了图像和注释，但我们需要标记图像，以便Darknet能够评估其预测。我们使用这个bash脚本来实现这一点。它已经在脚本/子目录中了。我们只需再次获取并运行它：

wget https://pjreddie.com/media/files/imagenet_label.sh

bash imagenet_label.sh

这将生成两个内容：一个名为labeled/的目录，其中包含指向图像的重命名符号链接；另一个名为inet.val.list的文件，其中包含标记图像的路径列表。我们需要将此文件移动到Darknet中的data/子目录：

mv inet.val.list <path-to>/darknet/data

现在你终于可以验证你的模型了！先把darknet重新make出来。然后运行验证例程，如下所示：

./darknet classifier valid cfg/imagenet1k.data cfg/darknet19.cfg darknet19.weights

注意：如果不使用OpenCV编译Darknet，那么就无法加载所有ImageNet图像，因为其中一些图像是stbúu image.h不支持的奇怪格式。

如果不使用CUDA编译，您仍然可以在ImageNet上验证，但这将需要相当长的时间。不推荐。预先训练的模型

这里有各种用于ImageNet分类的预训练模型。准确度在ImageNet上测量为单crop验证准确度。GPU计时是在Titan X上测量的，CPU计时是在单核Intel i7-4790K（4 GHz）上运行的。在OPENMP中使用多线程应该与cpu的比例成线性关系。

Alxnet

开始创新的模式！最初的模型是疯狂的分裂GPU的事情，所以这是一些后续工作的模型。

· Top-1 Accuracy: 57.0%

· Top-5 Accuracy: 80.3%

· Forward Timing: 3.1 ms/img

· CPU Forward Timing: 0.29 s/img

· cfg file

· weight file (238 MB)

Darknet参考模型

这个模型设计得很小但是很强大。它获得了与AlexNet相同的前1名和前5名的性能，但参数只有1/10。它主要使用卷积层，而没有在末端的大型完全连接层。它的速度大约是AlexNet在CPU上的两倍，这使得它更适合一些视觉应用。

· Top-1 Accuracy: 61.1%

· Top-5 Accuracy: 83.0%

· Forward Timing: 2.9 ms/img

· CPU Forward Timing: 0.14 s/img

· cfg file

· weight file (28 MB)

VGG-16

牛津大学的视觉几何小组为ILSVRC-2014比赛开发了VGG-16模型。它具有很高的分类精度和广泛的应用前景。我把这个版本改编自Caffe预先训练的模型。它被训练为另外6个阶段，以适应特定于darknet的图像预处理（而不是平均减法darknet调整图像介于-1和1之间）。

· Top-1 Accuracy: 70.5%

· Top-5 Accuracy: 90.0%

· Forward Timing: 9.4 ms/img

· CPU Forward Timing: 4.36 s/img

· cfg file

· weight file (528 MB)

Extraction

开发了这个模型作为GoogleNet模型的一个分支。它不使用“初始”模块，只使用1x1和3x3卷积层。

· Top-1 Accuracy: 72.5%

· Top-5 Accuracy: 90.8%

· Forward Timing: 4.8 ms/img

· CPU Forward Timing: 0.97 s/img

· cfg file

· weight file (90 MB)

Darknet19

我修改了提取网络，使之更快更准确。这个网络是一种融合了darknet参考网络和特征提取以及众多论文（如网络中的网络、初始和批量规范化）的思想。

· Top-1 Accuracy: 72.9%

· Top-5 Accuracy: 91.2%

· Forward Timing: 6.2 ms/img

· CPU Forward Timing: 0.87 s/img

· cfg file

· weight file (80 MB)

Darknet19 448x448

我用一个更大的输入图像大小448x448，为10多个时期训练了Darknet19。该模型性能明显更好，但速度较慢，因为整个图像更大。

· Top-1 Accuracy: 76.4%

· Top-5 Accuracy: 93.5%

· Forward Timing: 11.0 ms/img

· CPU Forward Timing: 2.96 s/img

· cfg file

· weight file (80 MB)

Resnet 50

出于某种原因，人们喜欢这些网络，即使他们是如此缓慢。

· Top-1 Accuracy: 75.8%

· Top-5 Accuracy: 92.9%

· Forward Timing: 11.4 ms/img

· CPU Forward Timing: 1.13 s/img

· cfg file

· weight file (87 MB)

Resnet 152

出于某种原因，人们喜欢这些网络，即使他们是如此缓慢。

· Top-1 Accuracy: 77.6%

· Top-5 Accuracy: 93.8%

· Forward Timing: 28.6 ms/img

· CPU Forward Timing: 3.31 s/img

· cfg file

· weight file (220 MB)

Densenet 201

我Densenet！他们是如此深沉，如此疯狂，工作如此出色。像Resnet一样，仍然很慢，因为它们有很多层，但至少它们工作得很好！

· Top-1 Accuracy: 77.0%

· Top-5 Accuracy: 93.7%

· Forward Timing: 32.6 ms/img

· CPU Forward Timing: 1.38 s/img

· cfg file

· weight file (67 MB)

AlexeyAB DarkNet YOLOv3框架解析与应用实践（三）

猜你喜欢