1はじめに
CUDAプログラムのパフォーマンスを分析するために一般的に使用される2つのツール、nvprofとVisualProfilerがあります。
Visual Profilerは、アプリケーションのCPUおよびGPUアクティビティのタイムラインを表示し、潜在的な最適化の機会を自動的に分析および特定できるグラフィカル分析ツールです。
nvprofは、CUDAプログラムのパフォーマンスをテストおよび最適化するためのツールでもあります。また、nvprofには視覚的なグラフィカルインターフェイスはありませんが、コマンドラインからデータを収集、表示、分析できます。
2.使用方法
2.1使用前の構成
まず、nvprofが正しくインストールされているかどうかを確認します。
nvprof -V
インストールが正しければ、インストールしたnvprofのバージョンとモデルが出力されます。
nvprof: NVIDIA (R) Cuda command line profiler
Copyright (c) 2012 - 2019 NVIDIA Corporation而
Release version 10.2.89 (21)
2.2使用方法
nvprof ./a.out
使用中に以下の問題が発生する可能性があることに注意してください
The user does not have permission to profile on the target device
これは、sudo権限で解決できる不十分な権限が原因です。
sudo nvprof ./a.out
コマンドラインで次のエラーが報告された場合:
sudo: nvprof: command not found
システムファイル内の一部のステートメントはコメントアウトする必要があります。
sudo visudo
次のステートメントをコメントアウトして保存します
Defaults env_reset
Defaults mail_badpass
Defaults secure_path="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/snap/bin"
次に、コマンドを使用してnvprofプログラムを正常に実行します。
sudo nvprof ./a.out