ncnn 之图优化 - 代码天地

ncnn 之图优化

其他 2019-06-27 15:18:14 阅读次数: 0

最近，ncnn release了新版本，该版本其中一个亮点是增加了图优化，目的是使得前向图结构更加简洁，运行速度可以加快。下面来逐一分析：

　　对于连续两个算子能否合并成一个算子，需要符合特定的条件。

(1)XXX-batchnorm

int fuse_convolution_batchnorm(); // group1
int fuse_convolutiondepthwise_batchnorm();
int fuse_deconvolution_batchnorm();
int fuse_deconvolutiondepthwise_batchnorm();
int fuse_innerproduct_batchnorm();

(2)XXX-activation

int fuse_convolution_activation(); // group2
int fuse_convolutiondepthwise_activation();
int fuse_deconvolution_activation();
int fuse_deconvolutiondepthwise_activation();
int fuse_innerproduct_activation();

(3)batchnorm-scale

(4)innerproduct-dropout

扫描二维码关注公众号，回复： 6647197 查看本文章

　　以conv+batchnorm为例

int NetOptimize::fuse_convolution_batchnorm(){

　　const int layer_count = layers.size();

　　// 遍历所有层

　　for(int i=0; i<layer_count; i++){

　　　　// 找Convolution层

　　　　if(layers[i]->type != "Convolution")

　　　　　　continue;

　　　　// Convolution - BatchNorm

　　　　int top_blob_index = layers[i]->tops[0];

　　　　int j = i + 1;

　　　　for(;j<layer_count;j++){

　　　　　　// 在确定conv情况下，寻找bn

　　　　　　if(layers[j]->type != "BatchNorm")

　　　　　　　　continue;

　　　　　　// bn的blob非唯一即不符合要求

　　　　　　if(layers[j]->bottoms.size() != 1)

　　　　　　　　continue;

　　　　　　// 寻找conv_bn可以连接成功的pair

　　　　　　if(layers[j]->bottoms[0] == top_blob_index)

　　　　　　　　break; // 寻找成功

　　　　}

　　　　// 边界条件, 越界则继续下一层迭代

　　　　if(j == layer_count)

　　　　　　continue;

　　　　// fuse "Convolution - BatchNorm" to "Convolution"

　　　　// 经过上述筛选， <i, j>表示一个<con_id, bn_id>对，可以进行合并

　　　　ncnn::Convolution* convolution = (ncnn::Convolution*)layers[i];

　　　　ncnn::BatchNorm* batchnorm = (ncnn::BatchNorm*)layers[j];

　　　　fprintf(stderr, "fuse_convolution_batchnorm %s %s \n", convolution->name.c_str(), batchnorm->name.c_str());

　　　　// =======> code segment begin

　　　　{

　　　　　　int channels = batchnorm->channels;

　　　　　　float eps = batchnorm->eps;

　　　　　　// a = bias - slope * mean / sqrt(var + eps)

　　　　　　// b = slope / sqrt(var + eps)

　　　　　　// value = value * b + a

　　　　　　std:: vector<float> a(channels);

　　　　　　std:: vector<float> b(channels);

　　　　　　// 这里吐槽一下ncnn，都什么鬼命名？！！！ a,b完全没有任何可读性.....

　　　　　　for(int i=0; i< channels; i++){

　　　　　　　　float sqrt_var = sqrt(batchnorm->var_data[i] + eps);

　　　　　　　　a[i] = batchnorm->bias_data[i] - batchnorm->slope_data[i] * batchnorm->mean_data[i] / sqrt_var;

　　　　　　　　b[i] = batchnorm->slope_data[i] / sqrt_var;

　　　　　　}

　　　　　　if(convolution->bias_term ==0){

　　　　　　　　// init bias as zero

　　　　　　　　convolution->bias_term = 1;

　　　　　　　　convolution->bias_term = ncnn::Mat(channels);

　　　　　　　　convolution->bias_data.fill(0.f);

　　　　　　}

　　　　　　// 跨度

　　　　　　const int weight_per_outch = convolution->weight_data_size / channels;

　　　　　　float* weight = convolution->weight_data;

　　　　　　float* bias = convolution->bias_data;

　　　　　　for(int i=0; i<channels; i++){

　　　　　　　　float* conv_weight_outch = weight + weight_per_outch * i;

　　　　　　　　for(int j=0; j<weight_per_outch; j++){

　　　　　　　　　　conv_weight_outch[j] *= b[i]; // 二维展开逐一相乘

　　　　　　　　}

　　　　　　　　bias[i] += a[i];

　　　　　　}

　　　　}

　　　　// =======> code segment end

　　　　

　　　　// 修改相关的layer 关系

　　　　int top_blob_index_final = batchnorm->tops[0]; // 记录batchnorm的输出blob

　　　　convolution->tops[0] = top_blob_index_final; // 将convolution的输出blob设置为原来batchnorm的输出blob

　　　　blobs[top_blob_index_final].product = i; // 将blob的生产者layer改变为conv而不再是原来的bn

　　　　batchnorm->type = "ncnnfused"; // 修改原始layer的层属性

　　}

}

猜你喜欢

转载自www.cnblogs.com/jianfeifeng/p/11097021.html

ncnn 之图优化

NCNN深度学习框架之Optimize优化器

ncnn之yolov2

NCNN量化之ncnn2table和ncnn2int8

ncnn之七：ncnn量化(post-training quantization)三部曲 - ncnn2table

ncnn之八：ncnn量化(post-training quantization)三部曲 - ncnn2int8

ncnn之六：ncnn量化(post-training quantization)三部曲 - ncnnoptimize

ncnn之五：参数和模型文件结构

NCNN部署例程 mxnet-gluoncv之simple_pose

ncnn编译之Debug win32版本

人脸检测：MTCNN人脸及特征点检测--NCNN优化

初试ncnn

ncnn编译

ncnn笔记

ncnn tensorrt

ncnn rotation

ncnn的softmax

ncnn之一：ncnn概述

嵌入式深度学习之NCNN交叉编译Arm Linux

基于Android studio3.6的JNI教程之ncnn之目标检测YOLOV3

基于Android studio3.6的JNI教程之ncnn之分类之squeezenet

基于Android studio3.6的JNI教程之ncnn之目标检测ssd

基于Android studio3.6的JNI教程之ncnn之语义分割ENet

腾讯优图NCNN框架在windows下的vs2013配置

重构ncnn，腾讯优图开源新一代移动端推理框架TNN

【Matting】MODNet：实时人像抠图模型-NCNN C++量化部署

神经网络压缩剪枝量化嵌入式计算优化NCNN mobilenet squeezenet shufflenet

网站性能优化之雪碧图制作

深度图优化之ThreadDepthCleaner

ncnn编译安装-20190415 ncnn编译安装

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)