python+selenium+PhantomJS抓取网页数据时，数据保存为csv，有的网页数据没问题，有的成为乱码，求解？

发布于 2022-09-03 08:44:55 字数 498 浏览 19 评论 0

问题

抓取IT之家评论时，将评论数据以csv格式保存，每条新闻的评论保存为一个csv文件，前13条新闻全部没问题，中文正常显示，但是后面的每条新闻的评论数据却变成了乱码。在运行的时候我查看保存的文件发现在数据开始写入csv文件时（未写完），显示正常，但是第二次点开文件时却发现变成了乱码。

图

开始写入时
图片描述

数据保存完毕后
图片描述

之后的数据都无法正常保存了。这到底是怎么回事？

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

萌能量女王 2022-09-10 08:44:55

试一下这样行不行

import codecs
with codecs.open(fname, 'w', 'utf-8') as fp

还有一个可能是你抓到数据的encoding被系统认为是iso-8859-1
如果是的话，改成utf-8就可以了

回复收藏 0

~没有更多了~

关于作者

只为守护你

暂无简介

文章

703 人气

关注发私信

牛↙奶布丁

文章 0 评论 0

关注

COSO

文章 0 评论 0

关注

落叶

文章 0 评论 0

关注

暗地喜欢

文章 0 评论 0

关注

qq_i8qOEG

文章 0 评论 0

关注

qq_Wl4Sbi

文章 0 评论 0

友情链接

文江博客

python+selenium+PhantomJS抓取网页数据时，数据保存为csv，有的网页数据没问题，有的成为乱码，求解？

问题

图

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签