python3 如何批量将gbk格式文本转换为unicode或者utf8格式

发布于 2022-09-01 19:07:02 字数 99 浏览 14 评论 0

在用python3处理文本文件时,出现因gbk格式而产生的错误,如何使用python在预处理文件的时候转换gbk文本编码格式为unicode或utf8,或者是否有更优的处理方法?谢谢!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

淡紫姑娘! 2022-09-08 19:07:02

如果你的文件不太大的话:

for f in sys.argv[1:]:
  with open(f, encoding='gb18030') as fobj:
    content = fobj.read()
  with open(f, 'w', encoding='utf-8') as fobj:
    fobj.write(content)
黒涩兲箜 2022-09-08 19:07:02

unicode_string=gbk_bytes.decode('gbk').encode('utf-8')

另外“因gbk格式而产生的错误”是什么?

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文