pyspider +mongodb 多个爬虫 result 如何指定 collection 名称
如题,我现在需要爬取多个网站的内容,但是结果结构是一样的。现在的配置resultdb 是一个db,每个爬虫的结果分别是不同的集合。而我想把这些结果保存到指定db下的指定集合,这个如何设置。请大侠帮我解答下。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
自带的 resultdb 只是用来展示 preview 结果的,如果你更改了结构,这个功能就无效了。所以你需要拿到结果后,自己建库自己处理怎么存储。
http://docs.pyspider.org/en/latest/Working-with-Results/