在 Python 中处理 Unicode 的最佳方法

发布于 2024-12-06 14:43:27 字数 153 浏览 1 评论 0原文

有人有跨 python 应用程序处理 Unicode 字符的链接或最佳实践吗?或者我们需要到处转换字符串?

[编辑] 目前,我们正在将 urlencode 中发布的所有内容转换为 utf-8,但我想知道是否有更好的方法来处理这个问题,而不是调用encode('UTF-8')

Anyone has a link or best practices for handling Unicode characters across python applications? or we need to convert the strings all over the place?

[EDIT]
Currently we are converting everything we post in urlencode to utf-8 but im wondering if there is a better way to handle that instead of calling encode('UTF-8')

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

憧憬巴黎街头的黎明 2024-12-13 14:43:27

您需要做的主要事情是理解 unicode。认识到Python中的str存储字节,而unicode对象存储字符;它们是不同的事物,不应被视为可以互换。所有文本字符串都应该始终是 unicode 对象;其他一切都是二进制数据。

有关更多信息,请查看我的文章在 Python 中正确使用 Unicode。

The main thing you need to do is understand unicode. Realise that a str in Python stores bytes, while a unicode object stores characters; they are distinct things, and shouldn't be treated as interchangeable. All your text strings should always be unicode objects; everything else is binary data.

For more, check out my article on getting Unicode right in Python.

转身以后 2024-12-13 14:43:27

请参阅有关 unicode 的 Python 文档

简而言之:在内部仅适用于 unicode 对象。如果您需要与外界对话,请在输入时尽早使用 .decode() ,并在输出时尽可能晚地使用 .encode()

See Python documentation on unicode.

In short: internally only work with unicode objects. If you need to talk to outside world, .decode() as early as you can on input and .encode() as late as you can on output.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文