深度学习与 C++ 的爱恨情仇

本文涉及的相关教程和代码：

CPP-Call-Tensorflow
C++ 调用Python(TensorFlow)程序
https://github.com/BIGBALLON/CPP-Call-Tensorflow

需要c++资料加入小编c/c++编程群：825414254

深度学习与 C++ 的爱恨情仇

Caffe2-Tutorial
使用Caffe2 Python API建立并训练LeNet,并正确存weight
使用Caffe2 Python API建立并训练ResNet, 不使用lmdb, 并正确存取带有BN的weight
使用Caffe2 C++ API 读取预训练model并进行预测
使用Caffe2 Python API 进行 Multi-GPU训练
将 Caffe 的 weight 转化为 Caffe2 的 weight, 并使用Caffe2 C++进行读取与预测
将 PyTorch 的 weight 转化为 Caffe2 的 weight, 并使用Caffe2 C++进行读取与预测
https://github.com/BIGBALLON/Caffe2-Tutorial

PyTorch-CPP
使用PyTorch C++ API (Libtorch) 读取预训练model并进行预测
https://github.com/BIGBALLON/PyTorch-CPP

OK，下面开始讲故事，不想听故事的可以直接把代码抱走，不用客气，请随意啦。

0. 初识 Deep Learning

大约1年半前至2年前的样子，选修了学校的 Deep Learning and Practice，第一次接触深度学习，记得那时候大家用的多半是TensorFlow，第一个作业是实现 NIN(Network In Network)，弄了半天因为initial的问题死活train不起来，神奇的舍友推荐我加一下BN试试，搞了半天TensorFlow有N个batch_normal的函数就是不知道怎么用，于是神奇的舍友又推荐我用一个叫做Keras的东西，我靠，BN只要一行。更神奇的是，加完BN后train得飞起，于是乎就寄信去问助教，可不可以用BN，第二天助教课得到得答复是，BN是 homework2 要求使用的trick，当时没别的，就觉得舍友好猛，啥都懂。

噢，跑偏了，回来回来。后来我们有一个需求，需要在C++中调用keras(tf)，查了一下有好多种方法，选了原生支持的方法，就加个头文件Python.h，然后瞎一顿搞就好了，

代码见 CPP-Call-Tensorflow：https://github.com/BIGBALLON/CPP-Call-Tensorflow

深度学习与 C++ 的爱恨情仇

1. Caffe2 与 C++

不经意间，身边的朋友几乎清一色都转向了PyTorch，而因为对 C++ 有特殊的需求，Lab的学长们还在使用Caffe。唔，然后Caffe2就出来了，原生支持 Python 和 C++。于是我们就转向了 Caffe2

三种做法：

最直接的是用Caffe2 Python API 建network并完成训练，导出model，再用 C++ 进行加载与使用
当然，后来也会用Caffe2 Python API 拉出network，直接导出，在C++ 端完成所有的后续工作，包括训练，以及训练好后的导出model，inference等等。
最暴力的是直接放弃Caffe2 Python API，完全使用 C++ 完成建network，training，inference等所有的工作。

中间也遇到些许小坑，说出来你可能不信，Caffe2刚出来的时候，整个issue区问最多的问题就是weight怎么存和weight怎么读。后来都在问带有BN的network weight怎么存，当然更多的人是在问Caffe2为什么那么难装，哈哈。

深度学习与 C++ 的爱恨情仇

当然Caffe2 还有一个好处，能够将 Caffe的 weight 轻易地转化为 Caffe2 的 weight

不知不觉，Caffe2 猛然间和PyTorch合并了，PyTorch0.4 出现了，与此同时一个叫做ONNX(Open Neural Network Exchange)的东西，它也lei le。于是我们可以将weight 在不同的DL framework间相互转换。其中ONNX对Caffe2的支持也非常好。于是我们又有了新的做法：

在PyTorch下进行训练，然后通过ONNX导出model，再将onnx model 转化为Caffe2 model。

值得吐槽的地方是，自从Caffe2 与 PyTorch合并后，官方的文档也长期不更新了，可以观察到Github上面关于Caffe2的issue也常常没有人回复，Caffe2的C++端进行了很大幅度的修改，官方也没有任何的文档说明，你想用的话就自己遇坑自己解决就对了。

在此期间也学会了一个小技巧：

通常情况下，你的程序就算是编译好，也无法直接从copy到其他机器上运行，因为你的程序需要用到cuda，cudnn，caffe2等等。怎么办，把它们打包起来，一起带走：

以Ubuntu16.04为例，首先先安装这两个工具：

sudo apt install chrpath patchelf

然后进行打包操作，假设你的程序名字叫做 test， shell文件 pack.sh 如下

ldd test | grep "=> /" | awk '{print $3}' | xargs -I '{}' cp -v '{}' .
rm libcuda.so*
rm libnvidia-fatbinaryloader.so*
rm libc.so.6
ls -1 lib* | xargs -t -n1 patchelf --set-rpath .
cp /lib/x86_64-linux-gnu/libc.so.6 .
strip test
chrpath -r . test

打包前
┌─[bg@bg-cgi] - [~/Documents/czf/debug] - [2019-01-19 01:49:54]
└─[0] ls
pack.sh test
打包后
┌─[bg@bg-cgi] - [~/Documents/czf/debug] - [2019-01-19 01:50:21]
└─[0] ls
libatk-1.0.so.0 libfontconfig.so.1 libgraphite2.so.3 libk5crypto.so.3 libopencv_highgui.so.2.4 libschroedinger-1.0.so.0 libusb-1.0.so.0 libXcursor.so.1
libavcodec-ffmpeg.so.56 libfreetype.so.6 libgsm.so.1 libkeyutils.so.1 libopencv_imgproc.so.2.4 libselinux.so.1 libutil.so.1 libXdamage.so.1
libavformat-ffmpeg.so.56 libgcc_s.so.1 libgssapi_krb5.so.2 libkrb5.so.3 libopenjpeg.so.5 libshine.so.3 libuuid.so.1 libXdmcp.so.6
libavutil-ffmpeg.so.54 libgcrypt.so.20 libgtkglext-x11-1.0.so.0 libkrb5support.so.0 libopen-pal.so.13 libSM.so.6 libv4l1.so.0 libXext.so.6
libbluray.so.1 libgdkglext-x11-1.0.so.0 libgtk-x11-2.0.so.0 libleveldb.so.1 libopen-rte.so.12 libsnappy.so.1 libv4l2.so.0 libXfixes.so.3
libbz2.so.1.0 libgdk_pixbuf-2.0.so.0 libHalf.so.12 liblmdb.so.0 libopus.so.0 libsoxr.so.0 libv4lconvert.so.0 libXinerama.so.1
libcaffe2_gpu.so libgdk-x11-2.0.so.0 libharfbuzz.so.0 libltdl.so.7 liborc-0.4.so.0 libspeex.so.1 libva.so.1 libXi.so.6
libcaffe2.so libgflags.so.2 libhogweed.so.4 liblzma.so.5 libp11-kit.so.0 libssh-gcrypt.so.4 libvorbisenc.so.2 libxml2.so.2
libcairo.so.2 libgio-2.0.so.0 libhwloc.so.5 libmodplug.so.1 libpango-1.0.so.0 libstdc++.so.6 libvorbis.so.0 libXmu.so.6
libcom_err.so.2 libglib-2.0.so.0 libibverbs.so.1 libmp3lame.so.0 libpangocairo-1.0.so.0 libswresample-ffmpeg.so.1 libvpx.so.3 libXrandr.so.2
libcrystalhd.so.3 libglog.so.0 libICE.so.6 libmpi_cxx.so.1 libpangoft2-1.0.so.0 libswscale-ffmpeg.so.3 libwavpack.so.1 libXrender.so.1
libc.so.6 libGL.so.1 libicudata.so.55 libmpi.so.12 libpangox-1.0.so.0 libtasn1.so.6 libwebp.so.5 libXt.so.6
libcublas.so.8.0 libGLU.so.1 libicuuc.so.55 libm.so.6 libpcre.so.3 libtbb.so.2 libX11.so.6 libxvidcore.so.4
libcudnn.so.7 libgme.so.0 libidn.so.11 libnettle.so.6 libpixman-1.so.0 libthai.so.0 libx264.so.148 libz.so.1
libcurand.so.8.0 libgmodule-2.0.so.0 libIex-2_2.so.12 libnuma.so.1 libpng12.so.0 libtheoradec.so.1 libx265.so.79 libzvbi.so.0
libdatrie.so.1 libgmp.so.10 libIlmImf-2_2.so.22 libnvidia-glcore.so.410.78 libpthread.so.0 libtheoraenc.so.1 libXau.so.6 pack.sh
libdc1394.so.22 libgnutls.so.30 libIlmThread-2_2.so.12 libnvidia-tls.so.410.78 libraw1394.so.11 libtiff.so.5 libxcb-render.so.0 test
libdl.so.2 libgobject-2.0.so.0 libjasper.so.1 libnvrtc.so.8.0 libresolv.so.2 libtwolame.so.0 libxcb-shm.so.0
libexpat.so.1 libgomp.so.1 libjbig.so.0 libogg.so.0 librtmp.so.1 libudev.so.1 libxcb.so.1
libffi.so.6 libgpg-error.so.0 libjpeg.so.8 libopencv_core.so.2.4 librt.so.1 libunwind.so.8 libXcomposite.so.1

可以看到需要的库文件都打包进来了，而且程序执行的时候不会再去系统的路径中找，而是直接在当前目录找，把整个文件夹copy到其他机器去吧，现在你可以随意地执行它了。

上述Caffe2的使用(C++ inference，caffe转caffe2，pytorch转caffe2)，

代码见 Caffe2-Tutorial

2. PyTorch 与 C++

随着PyTorch不断的完善，身边弃坑TF，投奔PyTorch的朋友就没有再回来的了。随着PyTorch1.0的发布，C++ 似乎有了新的曙光，现在我们可以这么做：

在PyTorch python 端训练model，并通过jit导出，然后使用PyTorch C++ API 编写需要的应用，编译即可上线。代码见 PyTorch-CPP
完全在PyTorch C++ API中拉net，training，inference等，say goodbye for python 。

深度学习与 C++ 的爱恨情仇

3. Deep Learning 与 C++ 的未来

Deep Learning 发展到现在，C++ 方面还是不能够随心所欲地coding，希望在未来半年到一年内还会有新的突破。期待一下能像写python一样随心所欲地写 C++ 程序！！

深度学习 与 C++ 的爱恨情仇

猜你喜欢

深度学习与 C++ 的爱恨情仇