utf8的网页为什么还有十六进制的字符呢?
在学校图书馆的网页:http://opac.lib.ustc.edu.cn/opac/top100.php
如上图所示,"verilog(31)" 在网页源码中是“verilog (31)”
1.请问这是为什么啊?
2.请问怎么把它们转码成可读的utf8文字?
非常感谢~~
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
那这个怎么解码?
转义了所有的文字,可以避免有html语义的尖括号、引号等。
搞明白了~用python3的html.parser可以做到~哈哈哈