python mysql 抓取入库乱码

发布于 2022-08-29 19:00:20 字数 171 浏览 29 评论 0

试了很多办法都无法解决
requests 获取
BeautifulSoup 解析
MySQLdb 入库
页面编码是 ISO-8859-1
数据库 编码是统一使用 utf8
目标内容直接写到文本中,可以正常显示

但是入库后就是乱码

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

菩提树下叶撕阳。 2022-09-05 19:00:20

BeautifulSoup 解析的时候得utf-8

不一样的天空 2022-09-05 19:00:20

问题已经解决了,原因是requests 获取的response 编码有些情况下不准确,强制解码 可是作为unicode 使用,但是入库时会出现异常,跟其他组件没有关系。

办法就是使用 chardet 再次检测 reponse.content的编码,指定给response

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文