深度学习模型压缩方法概述

一,模型压缩技术概述

1.1,模型压缩问题定义

因为嵌入式设备的算力和内存有限,因此深度学习模型需要经过模型压缩后,方才能部署到嵌入式设备上。

模型压缩问题的定义可以从 3 角度出发:

  1. 模型压缩的收益:

    • 计算: 减少浮点运算量(FLOPs),降低延迟(Latency
    • 存储: 减少内存占用,提高 GPU/NPU 计算利用率
  2. 公式定义模型压缩问题: m i n P o l i c

猜你喜欢

转载自blog.csdn.net/qq_20986663/article/details/129203892