当前位置：文江博客话题详情

Python Markdown 模块因 unicode 转换、utf-8 而卡住

发布于 2024-11-10 07:25:56 字数 249 浏览 3 评论 0原文

我正在使用 web2py 的 markdown 模块来处理标记的文本。问题是，人们正在提交带有智能引号、特殊字符等的内容，我需要将它们替换为等效字符。

我有这样的文字：'\n\r\n上校的脸色有点苍白。 \xe2\x80\x9c但是，\xe2\x80" 请原谅我的大胆，先生 \xe2\x80" 我们现在要去 Uvar' 我

如何确保像在markdown 内部的文本不会抛出错误？文字处理程序插入的花哨的特殊引号是正常原因，但似乎有很多字符是一个问题。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

锦上情书 2024-11-17 07:25:56

当解码为 UTF-8 时，\xe2\x80\x9c 是 U+201C 左双引号（“智能引号”）。两次出现的 \xe2\x80" 不是有效的 UTF-8 序列，并且 " （“哑”引号）的存在是可疑的。您似乎遇到了损坏问题或编码问题，或两者兼而有之。在开始用哑引号替换智能引号之前，我们需要解决这个问题。

“人们提交东西”到底怎么样？ unicode(txt, 'utf-8') 在 markdown 之前经历了哪些转换？

回复收藏 0 原文

~没有更多了~