多线程利用多核,cpu利用率却上不去?
想请教一个问题,我现在在做一个程序性能优化,因为他们原来的是没有多线程的,所以用每个节点起多个进程的方式来利用多个cpu核,现在我把它线程化,可是有4个cpu的节点上起4个线程却cpu的利用率达不到100%,而是大概60%左右晃,如果起一个线程可以达到25%(因为是4个cpu核)。这4个线程做的同样的工作,只是针对不同的数据而作计算(也就是按某种方式分开计算),不同线程之间不相关,没有互斥锁和同步之类的东西,cpu利用率上不去这会是什么原因呢?比如内存分配上的或者cache换入换出之类的会影响吗?麻烦大侠有时间帮我分析一下,谢谢^_^
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(8)
我看了题目后的第一感觉是同步和互斥的问题。虽然LZ说没有这些,但是也许每个线程调用的其他系统或者库函数里有类似的机制。你能保证没调用任何系统或者库里带锁之类的函数么?
除了同步之外,另外一个可能是瓶颈在其他地方。比如I/O。以前单线程的时候体现不出来。现在CPU利用率高了,结果I/O部分相应慢了,造成不能把CPU利用到100%。
可以用TOP看看具体的信息,其他有一项似乎是I/O等待的时间。
或者用OPROFILE之类的工具看。或者直接分析代码。
我用strace追踪之后发现有互斥锁,您知道的可能有互斥锁的函数都有哪些呢,我里面调用了好多数学函数
这个我就不清楚了。用STRACE似乎可以看出来有没有调用和同步相关的函数吧?常见的有SPIN_LOCK, SEMAPHORE之类的。
CPU利用率是每个核 单独算的吧?
楼主可以试试用 pthread_attr_setaffinity_np()接口将四个线程分别绑定到四个核上,这样就一个线程只在一个核上跑。充分利用。
看你的具体任务类型.
相信我,如果你C不是非常牛B的话,别写线程了,你玩儿不起,MPI是廉价的选择。
1、CPU 是什么類型的
2、線程亂序效率
3、指令對寄存器使用
4、數據互鎖