BeautifulSoup 删除尾随空格?
显然,由于某种原因,使用 Soup.text 会删除尾随空格。例如:
In [1]: from BeautifulSoup import BeautifulSoup as Soup
In [2]: print Soup('<a href=''>a </a>').text+ 'a'
aa
这是有意的行为吗?有什么方法可以阻止它发生吗?
编辑:所需的输出是
a a
Apparently using Soup.text removes trailing whitespace for some reason. For example:
In [1]: from BeautifulSoup import BeautifulSoup as Soup
In [2]: print Soup('<a href=''>a </a>').text+ 'a'
aa
Is this intended behaviour and is there any way to stop it happening?
Edit: the desired output is
a a
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
可能是因为 HTML 中删除了尾随空格
Maybe it comes from the fact that trailing whitespaces are eliminated in HTML