Python 编码问题

发布于 2024-09-08 02:18:17 字数 157 浏览 4 评论 0原文

为什么我会遇到这个问题？我该如何解决它？

UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 24: unexpected code byte

谢谢

原文

Why am I getting this issue? and how do I resolve it?

UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 24: unexpected code byte

Thank you

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

§普罗旺斯的薰衣草 2024-09-15 02:18:17

在某个地方，也许是巧妙地，您要求 Python 将字节流转换为字符“字符串”。

不要将字符串视为“字节”。字符串是数字列表，每个数字在 Unicode 中都有约定的含义。（#65=拉丁大写A。#19968=汉字“一”/“第一”）。

有许多方法可以将 Unicode 实体列表编码为字节流。 Python 假设您的字节流是特定此类方法（称为“UTF-8”）的结果。

但是，您的字节流包含与该方法不对应的数据。因此引发了错误。

您需要弄清楚字节流的编码，并告诉 Python 该编码。

重要的是要知道您使用的是 Python 2 还是 3，以及导致此异常的代码，以查看字节来自何处以及处理它们的适当方法是什么。

如果是读取文件，您可以显式处理读取的字节。但您必须确定文件编码。

如果它来自源代码一部分的字符串，那么 Python 会假设源文件的“错误”...也许 $LC_ALL 或 $LANG 需要待设置。现在是牢固理解编码概念、文本编辑器如何选择编码进行编写以及您的语言和操作系统的标准的好时机。

回复收藏 0 原文

挽心 2024-09-15 02:18:17

除了 Joe 所说的之外， chardet 是一个有用的工具，可以检测源数据。

回复收藏 0 原文

三人与歌 2024-09-15 02:18:17

某处有一个编码为“Windows-1252”（或“cp1252”）的纯字符串，其中包含“右单引号”（'）而不是撇号（'）。这可能来自您阅读的文件，甚至来自您的 Python 源文件；您可以运行 Python 2.x 并在脚本开头附近有一个 # -*-coding: utf8 -*- 行，或者您也可以运行 Python 3.x。

你没有提供足够的数据；但是，某处有一个 cp1252 编码的字符串，您尝试（显式或隐式）将其解码为 utf-8 形式的 unicode。这行不通。

请向我们提供更多信息，我们将再次尝试为您提供帮助。

乔·科伯格的回答让我想起了我的一个旧答案，有些人发现它很有帮助：Python UnicodeDecodeError - 我是否误解了编码？

回复收藏 0 原文

~没有更多了~