为什么这个字符串赋值给了一个变量,就不能转码了
取出这个‘\xe7\x9b\xb8\xe5\x85\xb3\xe7\xbb\x93\xe6\x9e\x9c\xe7\xba\xa60\xe4\xb8\xaa’字符串是可以在这后面加.encode("raw_unicode_escape").decode("utf-8"),实现转码的。但是在原来的字符串变量里就不行。。。
import re
import requests
response=requests.get('http://so.eastmoney.com/web/s?keyword=000850&pageindex=1')
r=re.findall('<div class="count">((?:.|n)*?)<',str(response.content))
print(r[0].encode("raw_unicode_escape").decode("utf-8"))
print(type(r[0]))
print('xe7x9bxb8xe5x85xb3xe7xbbx93xe6x9ex9cxe7xbaxa60xe4xb8xaa'.encode("raw_unicode_escape").decode("utf-8"))
结果是
\xe7\x9b\xb8\xe5\x85\xb3\xe7\xbb\x93\xe6\x9e\x9c\xe7\xba\xa60\xe4\xb8\xaa
相关结果约0个
为啥这个r[0]就不能直接变成这种格式啊
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
闲着没事找了一下,真找到了个方法