使用 BeautifulSoup 在 python 中提取链接标签之间的文本
我有这样的 html 代码:
我需要提取“a”标签之间的文本(链接描述)。我需要一个数组来存储这些内容,例如:
a[0] = "My HomePage"
a[1] = "Sections"
我需要使用 BeautifulSoup 在 python 中执行此操作。
请帮助我,谢谢!
I have an html code like this:
<h2 class="title"><a href="http://www.gurletins.com">My HomePage</a></h2>
<h2 class="title"><a href="http://www.gurletins.com/sections">Sections</a></h2>
I need to extract the texts (link descriptions) between 'a' tags. I need an array to store these like:
a[0] = "My HomePage"
a[1] = "Sections"
I need to do this in python using BeautifulSoup.
Please help me, thank you!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
你可以这样做:
You can do something like this:
print [a.findAll(text=True) for a in soup.findAll('a')]
print [a.findAll(text=True) for a in soup.findAll('a')]
以下代码提取“a”标签之间的文本(链接描述)并存储在数组中。
The following code extracts text (link descriptions) between 'a' tags and stores in an array.