utf-8 加问号
我有一个网站,通过使用 utf-8 将用户输入解码为 unicode 来显示用户输入。然而,用户输入可以包含二进制数据,这显然并不总是能够被 utf-8“解码”。
我正在使用 Python,并且收到一条错误消息:
“utf8”编解码器无法解码位置 0 中的字节 0xbf:意外的代码字节。您传入了 '\xbf\xcd...
是否有一种标准有效的方法将那些无法解码的字符转换为问号?
如果答案使用Python,那将是最有帮助的。
I have a site that displays user input by decoding it to unicode using utf-8. However, user input can include binary data, which is obviously not always able to be 'decoded' by utf-8.
I'm using Python, and I get an error saying:
'utf8' codec can't decode byte 0xbf in position 0: unexpected code byte. You passed in '\xbf\xcd...
Is there a standard efficient way to convert those undecodable characters into question marks?
It would be most helpful if the answer uses Python.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
尝试:
请参阅此处以供参考
Try:
See here for reference
我认为您正在寻找的是:
它应该删除无效字节而不是引发异常
I think what you are looking for is:
which should drop invalid bytes rather than raising exception