CUDA C 最佳实践:应用程序性能分析【读书笔记】

版权声明:涉猎过的知识都像是不断汇入大海的涓涓细流,你怎么知道是哪条汇入的溪流让海洋成为海洋呢【转载请注明出处】 https://blog.csdn.net/panda1234lee/article/details/83756424

以下为长截图,CSDN 限定了图片长度,请点击查看原图

gprof:

gprof 支持的选项:

-b 不再输出统计图表中每个字段的详细描述。

-q 只输出函数的调用图(Call graph的那部分信息)。

-p 只输出函数的时间消耗列表。

-e Name 不再输出函数Name 及其子函数的调用图(除非它们有未被限制的其它父函数)。可以给定多个 -e 标志。一个 -e 标志只能指定一个函数。

-E Name 不再输出函数Name 及其子函数的调用图,此标志类似于 -e 标志,但它在总时间和百分比时间的计算中排除了由函数Name 及其子函数所用的时间。

-f Name 输出函数Name 及其子函数的调用图。可以指定多个 -f 标志。一个 -f 标志只能指定一个函数。

-F Name 输出函数Name 及其子函数的调用图,它类似于 -f 标志,但它在总时间和百分比时间计算中仅使用所打印的例程的时间。可以指定多个 -F 标志。一个 -F 标志只能指定一个函数。-F 标志覆盖 -E 标志。

-z 显示使用次数为零的例程(按照调用计数和累积时间计算)。

延伸阅读:

Linux下C++ 性能测试工具GPROF()入门教程 

nvcc 官方文档

猜你喜欢

转载自blog.csdn.net/panda1234lee/article/details/83756424