python+selenium+PhantomJS抓取网页数据时,数据保存为csv,有的网页数据没问题,有的成为乱码,求解?

发布于 2022-09-03 08:44:55 字数 498 浏览 17 评论 0

问题

抓取IT之家评论时,将评论数据以csv格式保存,每条新闻的评论保存为一个csv文件,前13条新闻全部没问题,中文正常显示,但是后面的每条新闻的评论数据却变成了乱码。在运行的时候我查看保存的文件发现在数据开始写入csv文件时(未写完),显示正常,但是第二次点开文件时却发现变成了乱码。

开始写入时
图片描述

数据保存完毕后
图片描述

之后的数据都无法正常保存了。这到底是怎么回事?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

萌能量女王 2022-09-10 08:44:55

试一下这样行不行

import codecs
with codecs.open(fname, 'w', 'utf-8') as fp

还有一个可能是你抓到数据的encoding被系统认为是iso-8859-1
如果是的话,改成utf-8就可以了

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文