最近、この場合nvprofパフォーマンスCUDA、ノートの要約レコードを使用して、次の処理を実行している必要:
- 一般的な使用コマンド:(メモリブロックが分析、リードを許可しないように配置されているため)--unified-メモリー・プロファイリングのPython run.pyのOFF nvprofリファレンス:https://docs.nvidia.com/cuda/profiler-users -guide / index.htmlを#統一-メモリ-プロファイリング
参考リンク:
https://blog.csdn.net/yinhuier/article/details/80551268 (簡易チュートリアル)
https://docs.nvidia.com/cuda/profiler-users-guide/index.html (NVIDIA公式サイトのチュートリアル)
https://gist.github.com/sonots/5abc0bccec2010ac69ff74788b265086 (日本のエンジニアは、文書を書くために)
更新滞在、よりcnblogs.com/xuyaowenに注意を払うしてください。あなたのための助けがある場合は、クリックするか、従って〜してください!