Python字符转化问题

发布于 2022-09-06 11:58:33 字数 438 浏览 12 评论 0

https://www.noscodespromo.com...
爬取这个页面的时候,已经字符转义
(头部
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
也对源码进行decode("windows-1252").encode("utf-8")
)
但就是正则匹配的时候相关字符还是被转了
求高手指教

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我不在是我 2022-09-13 11:58:33

原文不就是这个字符吗?

回复收藏 0

最舍不得你 2022-09-13 11:58:33

您好，您下载的源码也是乱码的吗？
你可以试试去掉encode('utf-8')看好不好用。

# -*- coding:utf-8 -*-

from urllib import request

html = request.urlopen('https://www.noscodespromo.com/store/videdressing.com')
print(html.read().decode('windows-1252'))

我在python3.x试了一下，源码没什么问题，如下：

源码没问题的话，正则应该不会出错吧。