问题...BeautifulSoup 解析
<h2 class="sectionTitle">BACKGROUND</h2>
Mr. Paul J. Fribourg has bla bla</span>
<div style="margin-top:8px;">
<a href="javascript:void(0)" onclick="show_more(this);">Read Full Background</a>
</div>
我想从Paul先生那里提取信息给blabla
有些网页在 Paul 先生前面有
,所以我可以使用
FindNext('p')
但是,有些网页没有
就像上面的例子一样。
这是我的代码,当有
时
background = bs2.find(text=re.compile("BACKGROUND"))
bb= background.findNext('p').contents
但是当我没有
我如何提取信息?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
从您给我们的示例中很难看出,但在我看来,您可以在
h2
之后获取下一个节点。在此示例中,Lewis Carroll 有一个p
-aragraph 标签,而您的朋友 Paul 只有一个结束span
标签:以下评论:
您可以,当然,希望检查版权声明,等等...
It's hard to tell from the example you have given us, but it looks to me that you could just get the next node after an
h2
. In this example, Lewis Carroll has ap
-aragraph tag and your friend Paul has only a closingspan
tag:Following comments:
You may, of course, wish to check copyright notices, et cetera...
您没有提供足够的信息来识别您的字符串:
向我们展示一个名称前面没有
的 HTML 示例?
You're not giving enough information to be able to recognize your string:
Show us a HTML example when it does not have
<p>
in front of name?