如何利用scrapy爬取网站中的图片并替代原来的图片?

发布于 2022-09-06 19:27:51 字数 186 浏览 15 评论 0

针对某个网址我想:
1、将所有的图片下载到自己的服务器上
2、将原网页的图片路径替换成自己服务器上的图片路径
3、将图片替换后的带标签的原网页保存到数据库中。

现在我已经第1、3步都已经没问题,其中下载图片用的是ImagesPipeline,但是我不知道怎样进行图片的替换。望大神给予思路或者提供一些参考代码,不胜感谢~~

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

冷月断魂刀 2022-09-13 19:27:52

网页其实就是一段html字符串咯,那替换里面的值就很简单啦
下载图片的时候记录一下图片原本的路径
保存图片的时候记录一下图片保存的路径
htmlStr.replace('原网页路径/图片.jpg', '服务器路径/图片.jpg')

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文