转换&到&;在Python中
我正在用 Python 开发一个简单的爬虫。目的是创建一个 sitemap.xml。 (您可以在这里找到 alpha 版本:http://code.google.com/p/sitemappy /) 我注意到,如果我生成包含非 HTML 实体(例如 &)的 URL 的 xml,则该 xml 不会验证,并且不会被 Google 网站站长工具接受。 有没有一种快速的方法来编码 URL 的查询字符串部分?
谢谢你!
马泰奥
I'm working on a simple crawler in Python. The aim is to create a sitemap.xml.
(you can find the very alpha version here: http://code.google.com/p/sitemappy/)
I noticed that if I generate the xml with URLs containing non HTML entities (such as &), the xml doesn't validate and it isn't accepted by Google Webmaster Tools.
Is there a quick way to encode the querystring part of the URLs?
Thank you!
Matteo
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
cgi.escape
来救援:快速交互式检查:
cgi.escape
to the rescue:Quick interactive check:
Saxutils 有一个针对 XML 实体的转义函数:
Saxutils has an escaping function for XML entities: