将纹理与 CUDA 中的固定映射内存绑定

发布于 2024-08-28 18:00:00 字数 434 浏览 5 评论 0原文

我试图将零拷贝映射的主机内存绑定到纹理，但看起来这是不可能的。

这是一个代码示例：

float* a;
float* d_a;
cudaSetDeviceFlags(cudaDeviceMapHost);
cudaHostAlloc( (void **)&a, bytes, cudaHostAllocMapped);
cudaHostGetDevicePointer((void **)&d_a,  (void *)a, 0);

texture<float, 2, cudaReadModeElementType> tex;
cudaBindTexture2D( 0, &tex, d_a, &channelDesc, width, height, pitch);

是否建议您使用固定内存并将其复制到绑定到纹理的设备内存？

原文

I was trying to bind a host memory that was mapped for zero-copy to a texture, but it looks like it isn't possible.

Here is a code sample:

float* a;
float* d_a;
cudaSetDeviceFlags(cudaDeviceMapHost);
cudaHostAlloc( (void **)&a, bytes, cudaHostAllocMapped);
cudaHostGetDevicePointer((void **)&d_a,  (void *)a, 0);

texture<float, 2, cudaReadModeElementType> tex;
cudaBindTexture2D( 0, &tex, d_a, &channelDesc, width, height, pitch);

Is it recommended that you used pinned memory and just copy it over to device memory that is bind to texture?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

忘年祭陌 2024-09-04 18:00:00

这是可能的，但您必须确保音高正确对齐 - 至少 64B 粒度。我在 cudaDeviceProp 中没有看到您可以使用的对齐要求。 cudaDeviceProp::textureAlignment 将为您提供不错的指导 - 这是纹理基地址的对齐要求，而不是间距；但我认为对齐要求比音高对齐要求更严格。

不幸的是，没有 cudaHostAllocPitch() 来为您处理这个问题。

公平警告：我已经对主机内存中的一维纹理进行了大量的定向性能测试，而且速度很慢。 Tesla 级硬件的速度为 2G/s，Fermi 级硬件的速度为 0.5 G/s。我没有理由相信 2D 纹理会更快。

回复收藏 0 原文

~没有更多了~