如何使用python抓取网页中的超链接
我有一个网页,其中的结构类似于
<div>
<ul>
<li class=tree>
<a> </a>
</li>
</ul>
</div>
现在我想获取所有这些超链接并放入 python 中的文本文件
I have web page in which i have the structure like
<div>
<ul>
<li class=tree>
<a> </a>
</li>
</ul>
</div>
NOw i want to grab all those hyperlinks and put in text file in python
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
使用 BeautifulSoup
Use BeautifulSoup
您可以使用模块
xml.dom.minidom
,但如果这是一个问题,它不会移植到某些版本的 python3 中。You can use the module
xml.dom.minidom
, though it is not ported to certain versions of python3 if that is an issue.