如何介绍在CUDA内核发布过程中执行了多少个说明
我想知道在发布过程中在CUDA内核中执行了多少个FP32和INT32说明。有什么方法可以通过Nvidia Nsight Compute对其进行介绍?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
我想知道在发布过程中在CUDA内核中执行了多少个FP32和INT32说明。有什么方法可以通过Nvidia Nsight Compute对其进行介绍?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
对于Nsight Compute,
示例:
请注意,Nsight Compute的最新版本为较新的(计算能力7.0及更高)GPU。
For nsight compute, the relevant metrics are as follows:
Example:
Note that recent versions of Nsight Compute are intended to be used on Volta and newer (compute capability 7.0 and higher) GPUs only.