当前位置：文江博客话题详情

使用 CUDA 实现、python (pycuda) 或 C++ 处理图像？

发布于 2024-10-17 03:46:51 字数 114 浏览 5 评论 0原文

我正在做一个使用 CUDA 处理图像的项目。该项目只是图像的加法或减法。

请问您的专业意见，哪个最好，这两个有什么优缺点？

我感谢大家的意见和/或建议，因为这个项目对我来说非常重要。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

深巷少女 2024-10-24 03:46:51

一般答案：没关系。使用您更熟悉的语言。

但是请记住，pycuda 只是 CUDA C 接口的包装器，因此它可能并不总是最新的，而且它还增加了另一个潜在的错误来源，……

Python 非常擅长快速原型设计，所以我' d 个人选择Python。如果需要，您可以稍后切换到 C++。

回复收藏 0 原文

他不在意 2024-10-24 03:46:51

如果管道的其余部分使用 Python，并且您已经使用 Numpy 来加速，那么 pyCUDA 是加速昂贵操作的良好补充。但是，根据图像的大小和程序流程，使用 pyCUDA 可能不会获得太多加速。在 PCI 总线上来回传递数据会产生延迟，而这种延迟只能通过大数据量来弥补。

对于您的情况（加法和减法），pyCUDA 中有内置运算，您可以利用它们来发挥自己的优势。然而，根据我的经验，使用 pyCUDA 来做一些重要的事情需要首先了解 CUDA 的工作原理。对于没有 CUDA 知识的人来说，pyCUDA 可能是一个陡峭的学习曲线。

回复收藏 0 原文

凌乱心跳 2024-10-24 03:46:51

看看openCV，它包含很多图像处理函数和所有加载/保存的帮助程序/显示图像并操作相机。

它现在还支持 CUDA，一些图像处理功能已在 CUDA 中重新实现，它为您提供了一个很好的框架来实现您自己的功能。

回复收藏 0 原文

寂寞陪衬 2024-10-24 03:46:51

亚历克斯的回答是正确的。包装所消耗的时间是最少的。请注意，PyCUDA 有一些不错的元编程结构，用于生成可能有用的内核。

如果您所做的只是添加或减去图像的元素，那么您可能根本不应该使用 CUDA。通过 PCI-E 总线来回传输所需的时间将使您从并行性中节省的时间相形见绌。

任何时候处理 CUDA 时，考虑 CGMA 比率（计算与全局内存访问比率）都是很有用的。您的加法/减法只是 2 次内存访问（1 次读和 1 次写）的 1 次浮点运算。从 CUDA 的角度来看，这最终非常糟糕。

回复收藏 0 原文

~没有更多了~

关于作者

醉南桥

暂无简介

文章

25 人气

关注发私信

友情链接

文江博客

使用 CUDA 实现、python (pycuda) 或 C++ 处理图像？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

使用 CUDA 实现、python (pycuda) 或 C++ 处理图像？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。