当前位置：文江博客话题详情

Python：并行运行多个查询并完成第一个查询

发布于 2024-11-17 23:42:59 字数 407 浏览 1 评论 0原文

我尝试创建一个对多个站点执行查询的 Python 脚本。该脚本运行良好（我使用 urllib2），但仅适用于一个链接。对于多个站点，我一个接一个地发出多个请求，但它不是很强大。

并行运行多个查询并在查询返回特定字符串时停止其他查询的理想解决方案（我猜是线程）是什么？

我发现了这个问题，但我还没有找到如何更改它以停止剩余的线程...： Python urllib2.urlopen()速度很慢，需要更好的方法来读取多个网址

提前谢谢您！

（抱歉，如果我用英语犯了错误，我是法国人^^）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

半步萧音过轻尘 2024-11-24 23:42:59

您可以使用 Twisted 来同时处理多个请求。在内部，它将使用 epoll（或 iocp 或 kqueue，具体取决于平台）来有效地获取 tcp 可用性通知，这比使用线程更便宜。一旦一个请求匹配，您就取消其他请求。

这里是 Twisted http 代理教程。

回复收藏 0 原文

泡沫很甜 2024-11-24 23:42:59

通常这是用以下模式实现的（抱歉，我的Python技能不太好）。

您有一个名为 Runner 的类。这个类有一个长时间运行的方法，它可以获取您需要的信息。此外，它还有一个 Cancel 方法，该方法以某种方式中断长时间运行的方法（您可以使 url request 对象成为类成员字段，因此 cancel 类会调用 request.terminate() 的等效项）。

长时间运行的方法需要接受一个回调函数，在完成时发出信号。

然后，在启动多个线程之前，创建该类的所有这些对象的实例，并将它们保存在列表中。在同一个循环中，您可以启动这些长时间运行的方法，并传递主程序的回调方法。

并且，在回调方法中，您只需遍历所有线程类的列表并调用它们的取消方法。

请使用任何 Python 特定实现来编辑我的答案:)

回复收藏 0 原文