当在另一个 GPU 而不是 0 中运行时,带有 cuda 的 openMP 会出现分段错误
我正在使用 cuda 并使用 openMP 进行并行线程:
#pragma omp parallel
{
unsigned int cpu_thread_id = omp_get_thread_num();
cudaSetDevice(cpu_thread_id);
if(cpu_thread_id==0)
{
// call kernel function
}
}
即使我有 4 个 GPU,它也始终使用 cpu_thread_id=0 工作。所以当我将cpu_thread_id更改为另一个数字1,2和3进行测试时。我得到:分段错误。出现这个错误,我不知道为什么会出现这个问题。
你注意到什么了吗?
提前致谢
I am working with cuda and using openMP for parallel threading:
#pragma omp parallel
{
unsigned int cpu_thread_id = omp_get_thread_num();
cudaSetDevice(cpu_thread_id);
if(cpu_thread_id==0)
{
// call kernel function
}
}
It is always working with cpu_thread_id=0 even I have 4 gpus. So when I change the cpu_thread_id to another number 1,2, and 3 for testing. I got: segmentation fault. with this error, I have no idea why it the problem.
Did you notice any thing?
Thanks in advance
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我在线程之间添加了一个互斥锁,它可以工作。我不知道为什么会这样...
I added a mutex in between the threads and it works. I dont know why it is like that...