python 爬虫 文字和图片如何保存为一种文件格式

发布于 2022-09-01 18:57:29 字数 118 浏览 21 评论 0

大概设想是这样的
爬虫爬取的文字和图片一起保存为哪种格式,能看到文字和图片。
比如pdf 文字和图片共存,但是图片的位置如何控制,还请大神指点。
或者有其他更好的方法,欢迎指点。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

故事↓在人 2022-09-08 18:57:29

提供一个方式,使用html来展示。

压抑⊿情绪 2022-09-08 18:57:29

可以试试这个,web-html-to-pdf-python

先保存成html,然后再转成pdf

你可能的意思是提取一些有用的信息和图片,然后转成pdf,这样的话可以先试试生成html,然后转成pdf。但是生成html的过程应该很麻烦。

分分钟 2022-09-08 18:57:29

爬下来先保存成 HTML,给 img 标签定义为 block 元素,这样在保证性能的同时基本能适应绝大部分情况。有了 HTML 想转成别的格式就很简单了。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文