webmagic 如何实现我的这个需求

发布于 2021-11-24 20:42:39 字数 366 浏览 696 评论 3

@黄亿华

我有一个文本,每行一个url,如何用webmagic多线程抓取.

并且每个url抓到的结果仅仅是一个String 的键值对,比如这样:

============

shanghai, 1000

beijing, 455

...

====================

这个url文本可以多线程?

这个保存结果的pipline可以多线程?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

白龙吟 2021-11-26 20:09:17

懂了,谢谢 @ywooer

千笙结 2021-11-26 18:28:07

在启动爬虫之前,先解析文本中的url到数组或集合中,然后通过addUrls加入到队列中,再然后启动爬虫就可以了。

英雄似剑 2021-11-25 18:19:43

例如:Spider.create(new XXXProcessor()).addUrl({"url1","url2","url3"}).thread(N).run();

N代表线程数

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文