使用 BeautifulSoup 查找顶级标签

发布于 2024-11-30 14:04:01 字数 472 浏览 0 评论 0原文

我正在看一些 BeautifulSoup 。在这种情况下,我的树如下所示:

soup = "<table class="myTable"><tr>...</tr></table>"

当我调用以下命令时:

soup.findAll(attrs={'class':'myTable'})

当我期望返回顶级标记时,​​我没有返回任何内容。但是,如果我要搜索的标签不在顶层,如下所示:

soup = "<body><table class="myTable"><tr>...</tr></table></body>"

然后我会找到该表。我想我错过了一些明显的东西。如果我不是,有没有办法找到所有内容,包括顶级标签?

I have some BeautifulSoup I'm looking at. In this case, my tree looks like this:

soup = "<table class="myTable"><tr>...</tr></table>"

When I call the following:

soup.findAll(attrs={'class':'myTable'})

I don't have anything returned, when I would expect that top level tag to be returned. But if the tag I'm searching for isn't in the top level, like the following:

soup = "<body><table class="myTable"><tr>...</tr></table></body>"

Then I do find the table. I assume I'm missing something obvious. If I'm not, is there a way to have find everything including the top level tag?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

溺深海 2024-12-07 14:04:01

我无法重现该问题。我认为找到顶级标签应该有效:

In [92]: import BeautifulSoup
In [94]: soup=BeautifulSoup.BeautifulSoup('<table class="myTable"><tr>...</tr></table>')

In [95]: soup.findAll(attrs={'class':'myTable'})
Out[95]: [<table class="myTable"><tr>...</tr></table>]

I can't reproduce the problem. I think finding the top-level tags should work:

In [92]: import BeautifulSoup
In [94]: soup=BeautifulSoup.BeautifulSoup('<table class="myTable"><tr>...</tr></table>')

In [95]: soup.findAll(attrs={'class':'myTable'})
Out[95]: [<table class="myTable"><tr>...</tr></table>]
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文