如何用Beautiful Soup取得两个标签间的所有内容?
<h4>描述1</h4>
<p>text</p>
<p>text</p>
<p>text</p>
<h4>描述2</h4>
<p>text</p>
<p>text</p>
<p>text</p>
<span>asdf</span>
<h4>描述3</h4>
<pre>
4
1
1
2
2</pre>
<p>text</p>
<h4>描述4</h4>
<p>text</p>
<pre>
1
2</pre>
HTML代码如上,如何取得两个<h4>
之间的内容?如:
- 第一次要取得“描述1”和“描述2”之间的所有内容
- 第二次要取得“描述2”和“描述3”之间的所有内容
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
假设所有 h4 标签是同级, 你可以调用
next_siblings
枚举它的所有同级元素, 如输出结果
r = requests.get(url,headers=headers)
html = r.text
soup = BeautifulSoup(,'html.parser')
result1 = soup.find_all('h4')[0:1]
result2 = soup.find_all('h4')[1:2]