提取元素并插入空格

发布于 2024-11-17 03:41:53 字数 381 浏览 1 评论 0原文

我在 python 中使用 BeautifulSoup 解析 html

我不知道如何在提取文本元素时插入空格

这是代码:

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')
print soup.text

然后输出是

这是示例

但我想在其中插入一个空格,例如

是的,就是例子

如何插入空格?

im parsing html using BeautifulSoup in python

i dont know how to insert a space when extracting text element

this is the code:

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')
print soup.text

then output is

thisisexample

but i want to insert a space to this like

yes is example

how do i insert a space?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

不知在何时 2024-11-24 03:41:54

使用 getText 代替:

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')

print soup.getText(separator=u' ')
# u'this is example'

Use getText instead:

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')

print soup.getText(separator=u' ')
# u'this is example'
别再吹冷风 2024-11-24 03:41:54

如果您的 Beautifulsoup 版本没有 getText 那么您可以这样做:

In [26]: ' '.join(soup.findAll(text=True))
Out[26]: u'this is example'

If your version of Beautifulsoup does not have getText then you could do this:

In [26]: ' '.join(soup.findAll(text=True))
Out[26]: u'this is example'
南汐寒笙箫 2024-11-24 03:41:54

人们可能还想与 strip 参数一起使用

bs = BeautifulSoup("<html>this<b>is  </b>example</html>")
print(bs.get_text())  # thisis  example
print(bs.get_text(separator=" "))  # this is   example
print(bs.get_text(separator=" ", strip=True))  # this is example

One may want to use also with strip argument

bs = BeautifulSoup("<html>this<b>is  </b>example</html>")
print(bs.get_text())  # thisis  example
print(bs.get_text(separator=" "))  # this is   example
print(bs.get_text(separator=" ", strip=True))  # this is example
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文