网上有pytorch、tensorflow等框架实现的很多，但是使用caffe复现的几乎没有；或许是因为caffe框架逐渐没落了么？没办法，只要自己动手丰衣足食了！过程有点麻烦。。。。。。。。。。。。。。。。。
补充说明一下复现平台：Jetson-TX2、Ubuntu16.04 LTS
1 模型转换（模型已经上传百度云，在github上有链接，嫌麻烦的话，可以跳过该部分）

可以借助一个模型转换的工具：https://github.com/marvis/pytorch-caffe-darknet-convert；（需要安装pytorch，安装自行百度解决）
但是这个github上介绍的是基于yolo与yolov2的，有以下几点需要注意：
1）、这两个weights的存储方式与yolov3的存储方式有点不同；
2）、yolov3上有upsample层在之前的版本上没有；
因此针对这些不同点我重新写了一个darknet2caffe.py的文件
[html]view plain copy
<code class="language-html">import sys  
sys.path.append('/home/ss/caffe/python')  
import caffe  
import numpy as np  
from collections import OrderedDict  
from cfg import *  
from prototxt import *  
  
def darknet2caffe(cfgfile, weightfile, protofile, caffemodel):  
    net_info = cfg2prototxt(cfgfile)  
    save_prototxt(net_info , protofile, region=False)  
  
    net = caffe.Net(protofile, caffe.TEST)  
    params = net.params  
  
    blocks = parse_cfg(cfgfile)  
  
    #Open the weights file  
    fp = open(weightfile, "rb")  
  
    #The first 4 values are header information   
    # 1. Major version number  
    # 2. Minor Version Number  
    # 3. Subversion number   
    # 4. IMages seen   
    header = np.fromfile(fp, dtype = np.int32, count = 5)  
  
    #fp = open(weightfile, 'rb')  
    #header = np.fromfile(fp, count=5, dtype=np.int32)  
    #header = np.ndarray(shape=(5,),dtype='int32',buffer=fp.read(20))  
    #print(header)  
    buf = np.fromfile(fp, dtype = np.float32)  
    #print(buf)  
    fp.close()  
  
    layers = []  
    layer_id = 1  
    start = 0  
    for block in blocks:  
        if start >= buf.size:  
            break  
  
        if block['type'] == 'net':  
            continue  
        elif block['type'] == 'convolutional':  
            batch_normalize = int(block['batch_normalize'])  
            if block.has_key('name'):  
                conv_layer_name = block['name']  
                bn_layer_name = '%s-bn' % block['name']  
                scale_layer_name = '%s-scale' % block['name']  
            else:  
                conv_layer_name = 'layer%d-conv' % layer_id  
                bn_layer_name = 'layer%d-bn' % layer_id  
                scale_layer_name = 'layer%d-scale' % layer_id  
  
            if batch_normalize:  
                start = load_conv_bn2caffe(buf, start, params[conv_layer_name], params[bn_layer_name], params[scale_layer_name])  
            else:  
                start = load_conv2caffe(buf, start, params[conv_layer_name])  
            layer_id = layer_id+1  
        elif block['type'] == 'connected':  
            if block.has_key('name'):  
                fc_layer_name = block['name']  
            else:  
                fc_layer_name = 'layer%d-fc' % layer_id  
            start = load_fc2caffe(buf, start, params[fc_layer_name])  
            layer_id = layer_id+1  
        elif block['type'] == 'maxpool':  
            layer_id = layer_id+1  
        elif block['type'] == 'avgpool':  
            layer_id = layer_id+1  
        elif block['type'] == 'region':  
            layer_id = layer_id + 1  
        elif block['type'] == 'route':  
            layer_id = layer_id + 1  
        elif block['type'] == 'shortcut':  
            layer_id = layer_id + 1  
        elif block['type'] == 'softmax':  
            layer_id = layer_id + 1  
        elif block['type'] == 'cost':  
            layer_id = layer_id + 1  
    elif block['type'] == 'upsample':  
        layer_id = layer_id + 1  
        else:  
            print('unknow layer type %s ' % block['type'])  
            layer_id = layer_id + 1  
    print('save prototxt to %s' % protofile)  
    save_prototxt(net_info , protofile, region=True)  
    print('save caffemodel to %s' % caffemodel)  
    net.save(caffemodel)  
  
def load_conv2caffe(buf, start, conv_param):  
    weight = conv_param[0].data  
    bias = conv_param[1].data  
    conv_param[1].data[...] = np.reshape(buf[start:start+bias.size], bias.shape);   start = start + bias.size  
    conv_param[0].data[...] = np.reshape(buf[start:start+weight.size], weight.shape); start = start + weight.size  
    return start  
  
def load_fc2caffe(buf, start, fc_param):  
    weight = fc_param[0].data  
    bias = fc_param[1].data  
    fc_param[1].data[...] = np.reshape(buf[start:start+bias.size], bias.shape);   start = start + bias.size  
    fc_param[0].data[...] = np.reshape(buf[start:start+weight.size], weight.shape); start = start + weight.size  
    return start  
  
  
def load_conv_bn2caffe(buf, start, conv_param, bn_param, scale_param):  
    conv_weight = conv_param[0].data  
    running_mean = bn_param[0].data  
    running_var = bn_param[1].data  
    scale_weight = scale_param[0].data  
    scale_bias = scale_param[1].data  
  
      
     
    scale_param[1].data[...] = np.reshape(buf[start:start+scale_bias.size], scale_bias.shape); start = start + scale_bias.size  
    #print scale_bias.size  
    #print scale_bias  
  
    scale_param[0].data[...] = np.reshape(buf[start:start+scale_weight.size], scale_weight.shape); start = start + scale_weight.size  
    #print scale_weight.size  
  
    bn_param[0].data[...] = np.reshape(buf[start:start+running_mean.size], running_mean.shape); start = start + running_mean.size  
    #print running_mean.size  
  
    bn_param[1].data[...] = np.reshape(buf[start:start+running_var.size], running_var.shape); start = start + running_var.size  
    #print running_var.size  
  
    bn_param[2].data[...] = np.array([1.0])  
    conv_param[0].data[...] = np.reshape(buf[start:start+conv_weight.size], conv_weight.shape); start = start + conv_weight.size  
    #print conv_weight.size  
  
    return start  
  
def cfg2prototxt(cfgfile):  
    blocks = parse_cfg(cfgfile)  
  
    layers = []  
    props = OrderedDict()   
    bottom = 'data'  
    layer_id = 1  
    topnames = dict()  
    for block in blocks:  
        if block['type'] == 'net':  
            props['name'] = 'Darkent2Caffe'  
            props['input'] = 'data'  
            props['input_dim'] = ['1']  
            props['input_dim'].append(block['channels'])  
            props['input_dim'].append(block['height'])  
            props['input_dim'].append(block['width'])  
            continue  
        elif block['type'] == 'convolutional':  
            conv_layer = OrderedDict()  
            conv_layer['bottom'] = bottom  
            if block.has_key('name'):  
                conv_layer['top'] = block['name']  
                conv_layer['name'] = block['name']  
            else:  
                conv_layer['top'] = 'layer%d-conv' % layer_id  
                conv_layer['name'] = 'layer%d-conv' % layer_id  
            conv_layer['type'] = 'Convolution'  
            convolution_param = OrderedDict()  
            convolution_param['num_output'] = block['filters']  
            convolution_param['kernel_size'] = block['size']  
            if block['pad'] == '1':  
                convolution_param['pad'] = str(int(convolution_param['kernel_size'])/2)  
            convolution_param['stride'] = block['stride']  
            if block['batch_normalize'] == '1':  
                convolution_param['bias_term'] = 'false'  
            else:  
                convolution_param['bias_term'] = 'true'  
            conv_layer['convolution_param'] = convolution_param  
            layers.append(conv_layer)  
            bottom = conv_layer['top']  
  
            if block['batch_normalize'] == '1':  
                bn_layer = OrderedDict()  
                bn_layer['bottom'] = bottom  
                bn_layer['top'] = bottom  
                if block.has_key('name'):  
                    bn_layer['name'] = '%s-bn' % block['name']  
                else:  
                    bn_layer['name'] = 'layer%d-bn' % layer_id  
                bn_layer['type'] = 'BatchNorm'  
                batch_norm_param = OrderedDict()  
                batch_norm_param['use_global_stats'] = 'true'  
                bn_layer['batch_norm_param'] = batch_norm_param  
                layers.append(bn_layer)  
  
                scale_layer = OrderedDict()  
                scale_layer['bottom'] = bottom  
                scale_layer['top'] = bottom  
                if block.has_key('name'):  
                    scale_layer['name'] = '%s-scale' % block['name']  
                else:  
                    scale_layer['name'] = 'layer%d-scale' % layer_id  
                scale_layer['type'] = 'Scale'  
                scale_param = OrderedDict()  
                scale_param['bias_term'] = 'true'  
                scale_layer['scale_param'] = scale_param  
                layers.append(scale_layer)  
  
            if block['activation'] != 'linear':  
                relu_layer = OrderedDict()  
                relu_layer['bottom'] = bottom  
                relu_layer['top'] = bottom  
                if block.has_key('name'):  
                    relu_layer['name'] = '%s-act' % block['name']  
                else:  
                    relu_layer['name'] = 'layer%d-act' % layer_id  
                relu_layer['type'] = 'ReLU'  
                if block['activation'] == 'leaky':  
                    relu_param = OrderedDict()  
                    relu_param['negative_slope'] = '0.1'  
                    relu_layer['relu_param'] = relu_param  
                layers.append(relu_layer)  
            topnames[layer_id] = bottom  
            layer_id = layer_id+1  
        elif block['type'] == 'maxpool':  
            max_layer = OrderedDict()  
            max_layer['bottom'] = bottom  
            if block.has_key('name'):  
                max_layer['top'] = block['name']  
                max_layer['name'] = block['name']  
            else:  
                max_layer['top'] = 'layer%d-maxpool' % layer_id  
                max_layer['name'] = 'layer%d-maxpool' % layer_id  
            max_layer['type'] = 'Pooling'  
            pooling_param = OrderedDict()  
            pooling_param['kernel_size'] = block['size']  
            pooling_param['stride'] = block['stride']  
            pooling_param['pool'] = 'MAX'  
            if block.has_key('pad') and int(block['pad']) == 1:  
                pooling_param['pad'] = str((int(block['size'])-1)/2)  
            max_layer['pooling_param'] = pooling_param  
            layers.append(max_layer)  
            bottom = max_layer['top']  
            topnames[layer_id] = bottom  
            layer_id = layer_id+1  
        elif block['type'] == 'avgpool':  
            avg_layer = OrderedDict()  
            avg_layer['bottom'] = bottom  
            if block.has_key('name'):  
                avg_layer['top'] = block['name']  
                avg_layer['name'] = block['name']  
            else:  
                avg_layer['top'] = 'layer%d-avgpool' % layer_id  
                avg_layer['name'] = 'layer%d-avgpool' % layer_id  
            avg_layer['type'] = 'Pooling'  
            pooling_param = OrderedDict()  
            pooling_param['kernel_size'] = 7  
            pooling_param['stride'] = 1  
            pooling_param['pool'] = 'AVE'  
            avg_layer['pooling_param'] = pooling_param  
            layers.append(avg_layer)  
            bottom = avg_layer['top']  
            topnames[layer_id] = bottom  
            layer_id = layer_id+1  
        elif block['type'] == 'region':  
            if True:  
                region_layer = OrderedDict()  
                region_layer['bottom'] = bottom  
                if block.has_key('name'):  
                    region_layer['top'] = block['name']  
                    region_layer['name'] = block['name']  
                else:  
                    region_layer['top'] = 'layer%d-region' % layer_id  
                    region_layer['name'] = 'layer%d-region' % layer_id  
                region_layer['type'] = 'Region'  
                region_param = OrderedDict()  
                region_param['anchors'] = block['anchors'].strip()  
                region_param['classes'] = block['classes']  
                region_param['num'] = block['num']  
                region_layer['region_param'] = region_param  
                layers.append(region_layer)  
                bottom = region_layer['top']  
            topnames[layer_id] = bottom  
            layer_id = layer_id + 1  
  
        elif block['type'] == 'route':  
            route_layer = OrderedDict()  
        layer_name = str(block['layers']).split(',')  
        #print(layer_name[0])  
        bottom_layer_size = len(str(block['layers']).split(','))  
        #print(bottom_layer_size)  
        if(1 == bottom_layer_size):  
                prev_layer_id = layer_id + int(block['layers'])  
                bottom = topnames[prev_layer_id]  
                #topnames[layer_id] = bottom  
        route_layer['bottom'] = bottom  
        if(2 == bottom_layer_size):  
        prev_layer_id1 = layer_id + int(layer_name[0])  
        #print(prev_layer_id1)  
        prev_layer_id2 = int(layer_name[1]) + 1  
        print(topnames)  
        bottom1 = topnames[prev_layer_id1]  
        bottom2 = topnames[prev_layer_id2]  
        route_layer['bottom'] = [bottom1, bottom2]  
        if block.has_key('name'):  
                route_layer['top'] = block['name']  
                route_layer['name'] = block['name']  
            else:  
                route_layer['top'] = 'layer%d-route' % layer_id  
                route_layer['name'] = 'layer%d-route' % layer_id  
        route_layer['type'] = 'Concat'  
        print(route_layer)  
        layers.append(route_layer)  
        bottom = route_layer['top']  
        print(layer_id)  
            topnames[layer_id] = bottom  
        layer_id = layer_id + 1  
  
    elif block['type'] == 'upsample':  
        upsample_layer = OrderedDict()  
        print(block['stride'])  
        upsample_layer['bottom'] = bottom  
        if block.has_key('name'):  
                upsample_layer['top'] = block['name']  
                upsample_layer['name'] = block['name']  
            else:  
                upsample_layer['top'] = 'layer%d-upsample' % layer_id  
                upsample_layer['name'] = 'layer%d-upsample' % layer_id  
        upsample_layer['type'] = 'Upsample'  
        upsample_param = OrderedDict()  
        upsample_param['scale'] = block['stride']  
        upsample_layer['upsample_param'] = upsample_param  
        print(upsample_layer)  
        layers.append(upsample_layer)  
        bottom = upsample_layer['top']  
        print('upsample:',layer_id)  
            topnames[layer_id] = bottom  
        layer_id = layer_id + 1  
  
        elif block['type'] == 'shortcut':  
            prev_layer_id1 = layer_id + int(block['from'])  
            prev_layer_id2 = layer_id - 1  
            bottom1 = topnames[prev_layer_id1]  
            bottom2= topnames[prev_layer_id2]  
            shortcut_layer = OrderedDict()  
            shortcut_layer['bottom'] = [bottom1, bottom2]  
            if block.has_key('name'):  
                shortcut_layer['top'] = block['name']  
                shortcut_layer['name'] = block['name']  
            else:  
                shortcut_layer['top'] = 'layer%d-shortcut' % layer_id  
                shortcut_layer['name'] = 'layer%d-shortcut' % layer_id  
            shortcut_layer['type'] = 'Eltwise'  
            eltwise_param = OrderedDict()  
            eltwise_param['operation'] = 'SUM'  
            shortcut_layer['eltwise_param'] = eltwise_param  
            layers.append(shortcut_layer)  
            bottom = shortcut_layer['top']  
   
            if block['activation'] != 'linear':  
                relu_layer = OrderedDict()  
                relu_layer['bottom'] = bottom  
                relu_layer['top'] = bottom  
                if block.has_key('name'):  
                    relu_layer['name'] = '%s-act' % block['name']  
                else:  
                    relu_layer['name'] = 'layer%d-act' % layer_id  
                relu_layer['type'] = 'ReLU'  
                if block['activation'] == 'leaky':  
                    relu_param = OrderedDict()  
                    relu_param['negative_slope'] = '0.1'  
                    relu_layer['relu_param'] = relu_param  
                layers.append(relu_layer)  
            topnames[layer_id] = bottom  
            layer_id = layer_id + 1             
              
        elif block['type'] == 'connected':  
            fc_layer = OrderedDict()  
            fc_layer['bottom'] = bottom  
            if block.has_key('name'):  
                fc_layer['top'] = block['name']  
                fc_layer['name'] = block['name']  
            else:  
                fc_layer['top'] = 'layer%d-fc' % layer_id  
                fc_layer['name'] = 'layer%d-fc' % layer_id  
            fc_layer['type'] = 'InnerProduct'  
            fc_param = OrderedDict()  
            fc_param['num_output'] = int(block['output'])  
            fc_layer['inner_product_param'] = fc_param  
            layers.append(fc_layer)  
            bottom = fc_layer['top']  
  
            if block['activation'] != 'linear':  
                relu_layer = OrderedDict()  
                relu_layer['bottom'] = bottom  
                relu_layer['top'] = bottom  
                if block.has_key('name'):  
                    relu_layer['name'] = '%s-act' % block['name']  
                else:  
                    relu_layer['name'] = 'layer%d-act' % layer_id  
                relu_layer['type'] = 'ReLU'  
                if block['activation'] == 'leaky':  
                    relu_param = OrderedDict()  
                    relu_param['negative_slope'] = '0.1'  
                    relu_layer['relu_param'] = relu_param  
                layers.append(relu_layer)  
            topnames[layer_id] = bottom  
            layer_id = layer_id+1  
        else:  
            print('unknow layer type %s ' % block['type'])  
            topnames[layer_id] = bottom  
            layer_id = layer_id + 1  
  
    net_info = OrderedDict()  
    net_info['props'] = props  
    net_info['layers'] = layers  
    return net_info  
  
if __name__ == '__main__':  
    import sys  
    if len(sys.argv) != 5:  
        print('try:')  
        print('python darknet2caffe.py tiny-yolo-voc.cfg tiny-yolo-voc.weights tiny-yolo-voc.prototxt tiny-yolo-voc.caffemodel')  
        print('')  
        print('please add name field for each block to avoid generated name')  
        exit()  
  
    cfgfile = sys.argv[1]  
    #net_info = cfg2prototxt(cfgfile)  
    #print_prototxt(net_info)  
    #save_prototxt(net_info, 'tmp.prototxt')  
    weightfile = sys.argv[2]  
    protofile = sys.argv[3]  
    caffemodel = sys.argv[4]  
    darknet2caffe(cfgfile, weightfile, protofile, caffemodel)</code>  
转换之后，就会得到yolov3.prototxt与yolov3.caffemodel.
2 搭建caffe环境

首先caffe环境搭建自行百度解决，其次需要了解Yolov3里面有shortcut、route、upsample、yolo等这些层是caffe不支持的，但是shortcut可以用eltwise替换，route可以用concat替换，yolo只能自己写，upsample可以添加。这里添加upsample这一层的代码，代码地址：链接：https://pan.baidu.com/s/13GpoYoqKSCeFX0m0ves_fQ 密码：bwrd
添加过程：把upsample_layer.hpp 放在include/caffe/layers下面；
把upsample_layer.cpp与upsample_layer.cu放在src/caffe/layers下面；
往自己的caffe.proto里面添加UpsampleParameter相关参数；可以参考我上传的caffe.proto；
然后重新编译；编译成功之后就可以加载yolov3.prototxt与yolov3.caffemodel运行；
代码下载地址：https://github.com/ChenYingpeng/caffe-yolov3
补充说明：Windows也可以只要搭建了相应的环境，代码都是基于c/c++的，可以直接编译使用，自己已经测试过；
基于caffe框架复现yolov3目标检测

1 模型转换（模型已经上传百度云，在github上有链接，嫌麻烦的话，可以跳过该部分）

2 搭建caffe环境

猜你喜欢