如果提高pyspider fetcher数量的上限

发布于 2022-09-05 23:30:04 字数 148 浏览 16 评论 0

已经分布式部署
master启动两个fetcher,processor
slave启动两个fetcher,processor
但是webui上显示processor能到100+(最多也就103),但fetcher还是最多到100个.
请问是否还需要其他配置.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

瑾夏年华 2022-09-12 23:30:04

在源码的文档中找到答案
@cli.command()
@click.option('--xmlrpc/--no-xmlrpc', default=False)
@click.option('--xmlrpc-host', default='0.0.0.0')
@click.option('--xmlrpc-port', envvar='FETCHER_XMLRPC_PORT', default=24444)
@click.option('--poolsize', default=100, help="max simultaneous fetches")
@click.option('--proxy', help="proxy host:port")
@click.option('--user-agent', help='user agent')
@click.option('--timeout', help='default fetch timeout')
@click.option('--phantomjs-endpoint', help="endpoint of phantomjs, start via pyspider phantomjs")
@click.option('--splash-endpoint', help="execute endpoint of splash: http://splash.readthedocs.io/...e")
@click.option('--fetcher-cls', default='pyspider.fetcher.Fetcher', callback=load_cls,

          help='Fetcher class to be used.')
不…忘初心 2022-09-12 23:30:04

我觉得题主提到了webui,应该是指队列的大小。
@click.option('--queue-maxsize', envvar='QUEUE_MAXSIZE', default=100,

          help='maxsize of queue')

你在run.py搜索一下 queue-maxsize 然后改一下,默认是100的

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文