cuda:Reduction的sdk示例中的有效带宽
在reduction.pdf中,通过7个步骤介绍了缩减方法,共有16777216个元素,第1步中,有效带宽为2.083GB/S,2.083GB/S是怎么出来的?第二步带宽4.854GB/s是怎么出来的?
in the reduction.pdf ,it introduces the reduction method through 7 steps ,there are 16777216 elements,in the 1th step,the effective bandwidth is 2.083 GB/S,how 2.083GB/S come out? and how the 2th step bandwidth 4.854GB/s come out?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
带宽数字是使用缩减输入数据中的字节数除以执行时间来计算的(注意有 2^22 个整数 = 16777216 字节)。 SDK 中
reduction/doc
中附带的 pdf 第 10 页清楚地显示了计算结果。The bandwidth figures are calculated using the number of bytes in the reduction input data divided by the execution time (note there are 2^22 integers = 16777216 bytes). The calculation is clearly shown on page 10 of the pdf that ships in the SDK in
reduction/doc
.