cuda

cuda

文章 23 浏览 77

我应该创建多个 OpenCL 内核以避免条件语句吗?

在 OpenCL 中,我有一个需要对复杂且真实的数据进行操作的内核。我可以放入一个条件语句来调用正确的代码行来处理这个问题,或者我可以有两个调用的内…

夜光 2024-10-01 04:58:26 4 0

当我使用略多于 64kb 的常量缓存时,为什么我的内核不会失败? (OpenCL/CUDA)

我对使用常量缓存的内核进行了一些测试。如果我使用 16,000 个浮点数 (16,000 * 4KB = 64KB),那么一切都会顺利运行。如果我使用16,200,它仍然运行顺…

梦开始←不甜 2024-10-01 04:49:54 7 0

如何解决依赖OpenCV的GPU程序编译问题?

如何解决这个编译问题呢? 1&gttmpxft_00001548_00000000-14_buildSURFDescriptorsGPU.ii 1&gtCompiling... 1&gtgetMatchesGPU.cpp 1&gtutils.cpp 1&g…

几味少女 2024-10-01 02:56:25 1 0

在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(汽车、人)的工作代码示例?

在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(计算机视觉的一部分)的工作代码?提前非常感谢。…

寄人书 2024-10-01 01:57:39 3 0

在 CUDA C 中实现 X^i * Y 的和(i=0 到 k)

我正在寻找技巧或研究论文来帮助我计算 X^i * Y 的总和(i=0 到 k),或更明确地说,Y + X^1 * Y +...+ X^k * CUDA C 中的 Y。其中 X 是 N×N 矩阵,Y …

绿光 2024-10-01 01:30:50 1 0

用于 MD5 加密的 Nvidia CUDA 或 ATI Stream?

当我看到一些我不知道的有关 ATI 的统计数据时,我正准备购买 Nvidia GTX 470。 ATI 卡上的流是否能更好地执行加密和解密所需的数学运算?…

柠檬色的秋千 2024-09-30 21:28:19 4 0

从常规 C++ 调用 CUDA 代码代码 - 整理出外部“C”

我试图从单独编译的 C++ 文件调用 CUDA(主机)函数: sample.cpp C++ 文件: extern "C" void cuda_function(int a, int b) int main(){ //statement…

我的奇迹 2024-09-30 19:56:07 6 0

如何在 Linux 中读取 CUDA .cubin 二进制文件?

我正在尝试获取 CUDA 程序中每个内核的每个线程的寄存器数量。这将帮助我使用 CUDA 占用计算器 (http://developer.download.nvidia.com/compute/cuda/…

与往事干杯 2024-09-30 19:17:56 1 0

CUDA优化问题

这是一个简单的程序: void multiply(const int* v_in, const int* w_in, int n_v, int n_w, int* w_out) { for(int i=0 i&ltn_w i++) { int sum=0 fo…

罗罗贝儿 2024-09-30 19:07:20 2 0

OpenCL/CUDA 中每种内存访问类型有多少内存延迟周期?

我浏览了编程指南和最佳实践指南,其中提到全局内存访问需要 400-600 个周期。我没有看到太多其他内存类型,如纹理缓存、常量缓存、共享内存。寄存器…

山人契 2024-09-30 18:44:46 5 0

cuda控制发散

假设我有 3 个共享内存阵列:ab c。我不确定以下线程安排是否会导致控制发散, if (threadIdx &lt 64) { if (threadIdx == 1) for (int i = 0 i &lt N…

趴在窗边数星星i 2024-09-30 16:49:05 3 0

请推荐一款用于GPU编程的显卡

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 这个问题似乎不是关于特定的编程问题、…

纸伞微斜 2024-09-30 15:57:45 3 0

是否有可能在 F Sharp 下使用 CUDA 编写 GPU 应用程序?

我对使用 F# 进行数值计算感兴趣。如何在 F# 下使用 NVIDIA 的 CUDA 标准访问 GPU?…

你丑哭了我 2024-09-29 22:43:45 6 0

大型矩阵的 CUDA 矩阵乘法中断

我有以下矩阵乘法代码,使用 CUDA 3.2 和 VS 2008 实现。我在 Windows Server 2008 r2 enterprise 上运行。我正在运行 Nvidia GTX 480。以下代码可以…

美人如玉 2024-09-29 21:36:51 4 0

MySQL 与 CUDA 的实现

我是一名高年级本科生,专业是CS。目前我正在上计算机体系结构课程。我们需要做一个项目。我想做一些与 CUDA 相关的事情,与串行实现相比,计算性能将…

江南月 2024-09-29 20:00:55 4 0
更多

推荐作者

留蓝

文章 0 评论 0

18790681156

文章 0 评论 0

zach7772

文章 0 评论 0

Wini

文章 0 评论 0

ayeshaaroy

文章 0 评论 0

初雪

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文