文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
Beautiful Soup 解析部分文档
如果仅仅需要查找文档中的 <a>
标签那么就没必要对整个文档进行解析,因为这浪费内存和时间。 SoupStrainer
类可以定义文档的某部分内容,这样搜索就可以只解析在 SoupStrainer
中定义过的内容,这称之为部分解析。
要执行部分解析,则需要给 BeautifulSoup
构造函数提供一个 parse_only
关键字参数,该参数的值是一个 SoupStrainer
实例。
SoupStrainer
类的构造时,它接受的参数与典型的 BeautifulSoup.find_all()
方法相同的参数,包括: name
、 attrs
、 recursive
、 text
、 **kwargs
等。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论