关于python2编码问题

发布于 2022-09-13 01:03:43 字数 255 浏览 24 评论 0

我在使用python2来爬虫的时候,获取到中文的编码形式是\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31类似这样的,但是就我所知\x在python2里应该是表示utf-8,形式应该是类似\xE5\x85\x84\xE5\xBC\x9F\xE9\x9A\xBE\xE5\xBD\x93 \xE6\x9D\x9C\xE6\xAD\x8C这样的,所以我想知道我第一句的这个是使用的什么编码,感谢大家

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

流星番茄 2022-09-20 01:03:43

仔细看,或者用pycharm看,或者用python2解释器打印出来就明白了。
\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31
%69%14%5cD7%1c"1a%02%61%67%61%34%681
只有前面两个十六进制数字是真的转义字符,后面的的确就是两个普通数字而已。
\x25 就是 %
另外 \x00 这样的并不是utf-8编码或是别的什么特定的编码,单纯只是一种转义字符,\x00-\xff代表0-255的byte。编码需要指定或者猜测。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文