当前位置：文江博客话题详情

cuda中的float与int

发布于 2024-09-14 19:21:20 字数 111 浏览 4 评论 0原文

在 CUDA 中使用 float 代替 int 更好吗？

浮动是否会减少银行冲突并确保合并？（或者与此无关？）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

七七 2024-09-21 19:21:21

读取共享内存时的 Bank 冲突与读取的数据量有关。因此，由于 int 和 float 大小相同（至少我认为它们在所有 CUDA 平台上都是如此），因此没有区别。

合并通常指的是全局内存访问——同样，这与读取的字节数有关，而不是与数据类型有关。

回复收藏 0 原文

于我来说 2024-09-21 19:21:21

int 和 float 都是四个字节，因此在合并您的数据时使用它们没有任何区别（如果您以相同的方式访问它们）。全局内存访问或共享内存访问上的存储体冲突。

话虽如此，使用 float 可能会获得更好的性能，因为设备旨在尽可能快地处理它们，int 通常用于控制和索引等。因此性能较低。当然，它实际上比这更复杂 - 如果除了浮点数什么都没有，那么整数硬件将闲置，这将是一种浪费。

回复收藏 0 原文

邮友 2024-09-21 19:21:21

存储体冲突和合并都与内存访问模式有关（扭曲内的线程是否以统一的步幅读/写到不同的位置）。因此，这些问题与数据类型（float、int、double 等）无关。

请注意，数据类型确实对计算性能有影响。单精度浮点比双精度等更快。GPU 中强大的 FPU 通常意味着进行定点计算是不必要的，甚至可能是有害的。

回复收藏 0 原文

末が日狂欢 2024-09-21 19:21:21

查看 CUDA 开发人员指南的“数学函数”部分。使用设备运行时函数（内部函数）可以为各种类型提供更好的性能。您可以在更少的时钟周期内在一个操作中执行多个操作。

对于C.1节的一些功能，设备运行时组件中存在一个不太准确但更快的版本；它有相同的名字
以 __ 为前缀（例如 __sinf(x)）..编译器有一个选项
(-use_fast_math ) 强制表中的每个函数编译为其内在对应项...有选择地替换数学函数
仅在值得的情况下通过调用内部函数进行调用
性能提升以及属性更改（例如减少）
准确性和不同的特殊情况处理是可以容忍的。