xpath过滤元素怎么写
python新手,问题比较初级,各位大佬轻喷。
需要爬点数据,有个xpath问题请教下各位大佬,如下面html代码所示,
有<span class="media-caption__text"></span>
标签就获取它内部文本,没有就获取<figcaption></figcaption>
内部的文本,但是必须要过滤掉<span class="off-screen"></span>
html代码如下所示:
<figcaption class="media-caption">
<span class="off-screen">Image caption</span>
<span class="media-caption__text"> 纽约市是美国疫情的“震中”。 </span>
</figcaption>
或者
<figcaption class="media-with-caption__caption">
<span class="off-screen"></span>
失业中的美国青年:泪水、恐惧与不安
</figcaption>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
为什么不用代码逻辑呢。。。
用xpath的话感觉很丑