webmagic网络爬虫将爬取到的内容保存到本地文件夹,怎么把本地文件夹路径存到数据库中

发布于 2021-12-03 00:32:41 字数 284 浏览 674 评论 2

使用webmagic爬取数据,将网页标题,作者,评论数,点赞数等存储到数据库中,

将网页具体内容存储到本地文件夹,通过

Spider.create(new StoreXXPage()).addUrl("https://www.oschina.net/blog?classification=428609").addPipeline(new FilePipeline("D://webmagic")).run();这种形式。

怎么获取到这个(new FilePipeline("D://webmagic")?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

情场扛把子 2021-12-04 14:57:34

通过获取指定目录的文件的日期来区分可以实现,但有没有什么方法直接在生成的时候就赋值?

离不开的别离 2021-12-03 23:20:38

可以通过FildPipeline存储名称来定义,再在PROCESS里存储数据库的名字统一起来。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文