深度学习准召

准确率（Precision）和召回率（Recall）是两个用来评价一个模型的好坏的指标，它们有不同的意义：

准确率（Precision）：准确率是在所有被模型判断为正例的样本中，有多少是真正的正例。换句话说，它测量了模型的精度，即模型做出的正预测有多少是正确的。

大白话：准确率告诉我们，当模型说某个样本是正例时，有多大概率它真的是正例。高准确率表示模型很少会错误地把负例错分成正例，但它可能会漏掉一些真正的正例。
召回率（Recall）：召回率是在所有真正的正例中，有多少被模型成功地找出来。它衡量了模型的查全率，即模型有多大概率找到了所有的正例。

大白话：召回率告诉我们，模型有多大概率找出了所有的正例，不漏掉任何一个。高召回率表示模型很少会漏掉真正的正例，但它可能会把一些负例误认为正例。
这两个指标通常存在权衡关系，提高准确率可能会降低召回率，反之亦然。具体应用取决于任务的性质和需求：

当需要确保不错过任何一个正例且可以容忍一些误报时，重点关注召回率。
当需要确保模型的正预测尽可能准确时，重点关注准确率。
在不同的应用中，可以根据具体情况来选择合适的指标，并根据需求调整模型，以取得最合适的平衡。

昇腾小知识：

（国产化需求）

AscendSpeed

AscendSpeed是一个开源的分布式训练加速库，用于在昇腾芯片上开发大模型。它提供了一些优化特性，可以帮助开发者在昇腾上迁移模型或进行开发，以获得更好的性能。目前，AscendSpeed已经支持了LLaMA2、Baichuan、Bloom等主流大模型，并且已经正式开源。

此外，AscendSpeed还通过Adapter方式支持Pytorch框架，开发者只需要下载社区版本的Pytorch和对应版本的Torch-NPU，即可在昇腾上进行模型开发。这样，开发者可以直接在PyTorch 2.1上基于昇腾进行模型开发。

需要注意的是，AscendSpeed主要用于在昇腾芯片上开发大模型，并提供了一些优化特性，以获得更好的性能。它与DeepSpeed和Megatron-LM等分布式加速库有一些相似之处，但也有一些区别。如果开发者不想改动训练脚本，仍然想使用DeepSpeed和Megatron-LM，也是可以支持的，但需要通过Adapter的方式进行支持。

AscendIE

AscendIE是华为公司开发的一种深度学习推理引擎，用于在华为昇腾芯片上进行高效的模型推理。与TensorRT和OpenVINO类似，AscendIE旨在优化深度学习模型的推理性能，提高模型在昇腾芯片上的运行效率。

TensorRT是由NVIDIA开发的推理引擎，专门用于优化和加速深度学习模型的推理过程。它通过网络层融合、精度校准和动态图优化等技术，提供了高性能和低延迟的推理能力，适用于在NVIDIA GPU上进行模型推理。

OpenVINO是英特尔开发的一套深度学习推理工具库，旨在优化和加速深度学习模型的推理过程。它支持多种硬件平台，包括英特尔的CPU、集成显卡、神经计算棒等，提供了高性能和低功耗的推理能力。

与TensorRT和OpenVINO类似，AscendIE也是一种专门用于优化和加速深度学习模型推理的引擎。它针对华为昇腾芯片进行了优化，提供了高性能和低功耗的推理能力。通过使用AscendIE，开发者可以在昇腾芯片上获得更好的模型推理性能和效率。

需要注意的是，TensorRT、OpenVINO和AscendIE都是针对特定硬件平台进行优化的推理引擎。它们在优化技术、支持的硬件平台和开发者工具等方面可能有所不同。开发者在选择推理引擎时，应根据自己的硬件平台和需求进行评估和选择。

AscendSpeed

AscendIE

猜你喜欢