Python 中的快速方法调用调度

发布于 2024-09-04 12:51:12 字数 891 浏览 5 评论 0原文

对于我的项目的某些部分，我需要一个进程本地调度系统，它允许我将方法执行延迟几秒钟。我这个系统有数千个“客户端”，因此每次延迟都使用 threading.Timer 是一个坏主意，因为我很快就会达到操作系统线程限制。我实现了一个仅使用一个线程进行时序控制的系统。

主要思想是保留排序的任务（time + func + args + kwargs）队列并使用单个 threading.Timer 来调度/取消该队列头部的执行。这个方案有效，但我对性能不满意。大约 2000 个客户端每大约 10 秒调度一次虚拟任务，导致该进程占用 40% 的 CPU 时间。查看探查器输出，我发现所有时间都花费在 new threading.Timer 的构造、启动上，特别是新线程的创建上。

我相信有更好的方法。现在我考虑重写LightTimer，以便有一个由threading.Event控制的执行线程和多个set()的定时线程事件。例如：

我安排一个任务在 10 秒内调用。任务被添加到队列中。计时线程 #1 在 event.set() 之前启动 time.sleep(10)
然后我安排一个任务在 11 秒内调用。任务被添加到队列中。定时线程什么也没有发生，它会在唤醒后注意到新的任务。
然后我安排一个任务在 5 秒内调用。该任务被添加到队列中。计时线程 #2 启动 time.sleep(5) 因为 #1 已经睡眠了更长的时间间隔。

我希望你已经明白了这个想法。对于这种方式，你怎么看？有更好的办法吗？也许我可以利用一些linux系统特性来做出最佳解决方案？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

日久见人心 2024-09-11 12:51:12

您可以使用的另一种实现是使用 time.time() 方法来计算每个排队函数应执行的绝对时间。将此时间和要调用的函数放入对象包装器中，该包装器使用执行时间来覆盖比较运算符以确定顺序。然后使用 heapq 模块来维护最小堆。这将为您提供一个高效的数据结构，其中堆的元素 0 始终是您的下一个事件。

实现实际调用的一种方法是使用单独的线程来执行回调。堆需要使用互斥体进行保护，并且您可以使用条件变量来实现调度。在无限循环中，只需查找下一次执行函数（堆的元素 0）并使用条件变量的 wait() 方法，并将超时设置为下一次执行时间。如果新插入的函数应该在堆中最早的函数之前发生，那么您的堆插入方法可以使用条件变量的 notify() 方法提前唤醒调度线程。