php有没有功能完整的网页数据采集开源项目呢
请问有没有开源的工具来采集网页的数据
比如要包含连续规则抓取,例如先抓取分页信息,从中获取详情页,从详情页抓取真正需要的dom字段
包含最后自定义存到数据库,
包含可以伪造ip等
包含自动队列机制,自动延迟
等等
谢谢
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
请问有没有开源的工具来采集网页的数据
比如要包含连续规则抓取,例如先抓取分页信息,从中获取详情页,从详情页抓取真正需要的dom字段
包含最后自定义存到数据库,
包含可以伪造ip等
包含自动队列机制,自动延迟
等等
谢谢
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
有,你可以试试【神箭手云爬虫开发平台。】
神箭手云爬虫是一个帮助JS开发者快速开发爬虫系统的SaaS服务平台。神箭手提供上手简单,灵活开放的云爬虫开发框架,让开发者只需要在线写几行js代码就可以实现一个爬虫。并且爬虫将自动运行在云服务器上,爬取速度更快,效率更高。
phpcrawler,php爬虫,php采集器,多进程,多线程
phpQuery