使用 ThreadPool.GetAvailableThreads 来限制服务执行的工作量是否可以接受？

发布于 2024-10-20 01:35:10 字数 543 浏览 7 评论 0原文

我有一项服务可以非常快速地轮询队列以检查是否有更多需要完成的“工作”。队列中的工作总是多于单个工作人员可以处理的数量。我想确保当服务已经达到最大容量时，单个工作人员不会抢占太多工作。

假设我的工作线程每 N(ms) 从队列中获取 10 条消息，并使用并行库在不同线程上并行处理每条消息。工作本身IO量很大。许多 SQL Server 查询甚至 Azure 表存储（http 请求）都是针对单个工作单元进行的。

使用 TheadPool.GetAvailableThreads() 是否是限制服务可以获取的工作量的正确方法？

我发现我可以访问可用的 WorkerThreads 和 CompletionPortThreads。对于IO重的进程，是不是看有多少个CompletionPortThreads可用比较合适？我相信 1000 是每个进程可用的数量，无论 CPU 数量如何。

更新 - 了解我正在使用的队列是 Azure 队列可能很重要。因此，每个检查消息的请求都是作为异步 http 请求发出的，该请求会返回接下来的 10 条消息。（并且要花钱）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

羁客 2024-10-27 01:35:10

我不认为使用 IO 完成端口是计算抓取多少的好方法。

我认为理想的情况是当下一组到达时您就用完了工作，因此您的积压工作永远不会超出您可以合理处理的范围。

为什么不跟踪处理一个作业需要多长时间以及获取作业需要多长时间，并根据这些情况调整每次获取的工作量，并使用合适的最小/最大值来阻止事情变得疯狂（如果您有一个）真正便宜或真正昂贵的工作很少吗？

您还需要计算出合理的最佳并行度 - 我不清楚它是否真的是 IO 重的，还是只是“异步请求重的”，即您花费了大量的时间只是等待对复杂查询的响应，这本身对于您的服务资源来说是廉价的。

回复收藏 0 原文

魂ガ小子 2024-10-27 01:35:10

我一直在相同的环境中解决几乎相同的问题。我最终为每个 WorkerRole 提供了一个内部工作队列，作为 BlockingCollection<> 实现。有一个线程监视该队列 - 当项目数量变少时，它会从 Azure 队列请求更多项目。它始终要求最大项目数 32，以降低成本。如果队列为空，它还会自动退避。

然后我有一组我自己启动的工作线程。它们坐在一个循环中，从内部工作队列中拉出项目。工作线程的数量是我优化负载的主要方法，因此我将其设置为 .cscfg 文件中的选项。我目前每个工作线程运行 35 个线程，但该数字取决于您的情况。

我尝试使用 TPL 来管理工作，但我发现管理负载更加困难。有时，TPL 会并行化不足，机器会感到无聊，有时会过度并行化，当项目仍在工作时，Azure 队列消息可见性会过期。

这可能不是最佳解决方案，但它似乎对我来说工作正常。

回复收藏 0 原文