Tabla de contenido
1. Introducción
Hay dos herramientas que se utilizan comúnmente para analizar el rendimiento de los programas CUDA, nvprof y Visual Profiler.
Visual Profiler es una herramienta de análisis gráfico que puede mostrar la línea de tiempo de la actividad de la CPU y la GPU en la aplicación, y analizar e identificar automáticamente oportunidades potenciales de optimización.
nvprof también es una herramienta para probar y optimizar el rendimiento de los programas CUDA. Y nvprof no tiene una interfaz gráfica visual, pero puede recopilar, ver y analizar datos desde la línea de comandos.
2. Cómo usar
2.1 Configuración antes de su uso
Primero confirme si nvprof está instalado correctamente.
nvprof -V
Si la instalación es correcta, imprimirá la versión y el modelo del nvprof que instaló
nvprof: NVIDIA (R) Cuda command line profiler
Copyright (c) 2012 - 2019 NVIDIA Corporation而
Release version 10.2.89 (21)
2.2 Cómo utilizar
nvprof ./a.out
Tenga en cuenta que pueden surgir los siguientes problemas durante el uso
The user does not have permission to profile on the target device
Esto se debe a permisos insuficientes, que se pueden solucionar con permisos sudo:
sudo nvprof ./a.out
Si la línea de comando informa el siguiente error:
sudo: nvprof: command not found
Algunas declaraciones en el archivo del sistema deben comentarse:
sudo visudo
Comente la siguiente declaración y guarde
Defaults env_reset
Defaults mail_badpass
Defaults secure_path="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/snap/bin"
Luego use el comando para ejecutar el programa nvprof normalmente:
sudo nvprof ./a.out