pyspider从文件中导入批量url
现在有一批没有规律的url,在文件中存储。
希望抓取每个url对应的页面,并从中提取特定的内容。
对于每个url,不需要递归抓取。
请问要怎么通过pyspider实现?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
现在有一批没有规律的url,在文件中存储。
希望抓取每个url对应的页面,并从中提取特定的内容。
对于每个url,不需要递归抓取。
请问要怎么通过pyspider实现?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
可以存到数据库里 用数据库读取
但是你这些url怎么加载呢 页面元素也是不一样的吧