PyCUDA:查询设备状态(特别是内存)
PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。
谁能向我指出以这种方式查询设备的任何示例?
是否可以/如何检查设备状态(例如在 malloc/memcpy 和内核启动之间)以实现某些机器动态操作? (我希望能够以“友好”的方式处理支持多个内核的设备。
PyCUDA's documentation mentions Driver Interface calls in passing, but I'm a bit think and can't see how to get information such as 'SHARED_SIZE_BYTES' out of my code.
Can anyone point me to any examples of querying the device in this way?
Is it possible to / How do I check the device state (eg between malloc/memcpy and kernel launch) to implement some machine-dynamic operations? (I want to be able to deal with devices that support multiple kernels in a 'friendly' way.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
对于其他遇到此问题的人,请花半小时阅读 CUDA API 一方面,以及 PyCUDA 文档 在另一个中创造奇迹。它比我最初的实验表明的要简单得多。
运行时内核信息
传入的惰性惰性代码
示例输出
静态设备信息
传入的惰性惰性代码 >
输出示例
Just for anyone else coming across this, spending half an hour with the CUDA API in one hand, and the PyCUDA documentation in another does wonders. Its much simpler than my initial experiments indicated.
Runtime Kernel Info
Incoming lazy lazy code
Example Output
Static Device Info
Incoming lazy lazy code
Example Output