玩转NVIDIA Jetson （29）---浅谈jetson nano上的CPU绑定 - 代码天地

玩转NVIDIA Jetson （29）---浅谈jetson nano上的CPU绑定

移动开发 2023-04-10 08:29:30 阅读次数: 0

背景

在jetson nano上应用LSTM onnx格式的推理文件时，遇到了推理速度波动很大的问题，快的时候几个毫秒，慢的时候几十个毫秒。最重要的是在我们的应用中无法忽略这种波动，我们希望它能稳定在某个时间值下面，使得我们可以进行下一步的工程设计。

破题

在测试了输入数据，模型batch size及其他超参数都没有效果以后，基本排除了是模型计算带来的差异，几天没有进展，突然有一天早上将目光转移到是否是由于推理时发生了CPU核心的变换，导致计算的不稳定，于是测试了将python部分的代码绑定到固定的CPU核心上，果然解决了这个问题。

步骤

如果是独立运行的python文件，可以参考以下代码

import os
import psutil

# 绑定 CPU 核心
def set_cpu_affinity(core):
    pid = os.getpid()
    p = psutil.Process(pid)
    p.cpu_affinity([core])
    print("Python process running on CPU:", os.sched_getcpu())

# 示例函数
def my_function():
    set_cpu_affinity(1)
    # 进行其他操作

这段代码需要psutil包的支持，jetson下的conda环境中直接使用

conda install psutil

如果是C/C++调用python函数做推理，在C程序中使用下面代码绑定核心

#include <sched.h>
cpu_set_t cpuset;
CPU_ZERO(&cpuset);
CPU_SET(1, &cpuset);
sched_setaffinity(0, sizeof(cpuset), &cpuset);

总结

根据问题，找到原因，因地制宜

猜你喜欢

转载自blog.csdn.net/huiyuanliyan/article/details/129137618

玩转NVIDIA Jetson （29）---浅谈jetson nano上的CPU绑定

玩转NVIDIA Jetson （23）--- jetson nano 添加swap内存

玩转NVIDIA Jetson （21）--- jetson isolcpus

玩转NVIDIA Jetson （22）--- jetson clocks的使用

nvidia jetson nano 换源

玩转Jetson nano系列（1）：Jetson nano编译安装ncnn

玩转NVIDIA Jetson （28）--- jetson clocks对tensorRT推理速度的影响

玩转NVIDIA Jetson （27）--- jetson系统时间问题

玩转NVIDIA Jetson （25）--- jetson 安装pytorch和torchvision

玩转NVIDIA Jetson （24）--- jetson docker非sudo使用

Nvidia Jetson Nano 安装Qt5

NVIDIA Jetson Orin Nano 开箱测评

NVIDIA Jetson Nano安装和使用Anaconda

nvidia jetson nano如何正确安装onnx

性能测评 | Nvidia新品JETSON XAVIER NX、JETSON TX2和JETSON NANO

性能测评 | Nvidia新品JETSON XAVIER NX与JETSON TX2和JETSON NANO

玩转Jetson Nano之安装pytorch

[Nvidia Jetson ]设备-Nvidia Jetson Nano刷机安装EMMC镜像(不使用sdkmanager工具)

在Jetson Nano上编译FastDeploy

在Jetson Nano上安装Caffe

jetson

NVIDIA-Jetson / redtail

NVIDIA Jetson命令使用

NVIDIA Jetson Jetson Nano刷机+ROS安装+深度学习配置

玩转NVIDIA Jetson AGX Xavier（2）--- Jetson系列产品简介

[Jetson Nano]Jetson Nano快速入门

【Jetson Nano】Jetson Nano安装/卸载Teamviewer

Jetson Nano Creating a Human Pose Estimation Application with NVIDIA DeepStream

nvidia jetson nano如何安装cuda版的pytorch

在Nvidia Jetson Nano上运行Pytorch 1.0 和 Fast.ai 1.0

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)