如何编写 XPath 来捕获未标记的文本
我试图从网站上删除客户评论,并遇到了一个有趣的设置。
<div class="Review">
<img class="stars" etc>
<b>ReviewerName</b>
- yyyy-mm-dd
<br/>
<p>Review</p>
<a>was this helpful links</a>
<hr/>
<br/>
<!-- Repeat above for additional reviews. -->
</div>
我一生都无法想出一个能够捕获日期 (- yyyy-mm-dd
) 的 XPath,因为它周围没有 HTML 格式。有人有解决办法吗?
乔恩
I'm trying to scrap customer reviews from a site and ran into an interesting set-up.
<div class="Review">
<img class="stars" etc>
<b>ReviewerName</b>
- yyyy-mm-dd
<br/>
<p>Review</p>
<a>was this helpful links</a>
<hr/>
<br/>
<!-- Repeat above for additional reviews. -->
</div>
For the life of me I can't come up with an XPath that will capture the date (- yyyy-mm-dd
), as there is no HTML formatting around it. Anyone have a solution?
Jon
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
假设这样的结构:
以下 xpath 选择日期
yyyy-mm-dd
Assuming a structure like this:
The following xpath selects the date
yyyy-mm-dd