表格元素抓取疑问?为什么需要多余的tbody
如下的表格:
<table itemprop="ingredients">
<tr>
<td class="name has-border">
<a href="/category/4541/">
鲢鱼
</a>
</td>
<td class="unit has-border">
</td>
</tr>
<tr>
<td class="name has-border">
植物油
</td>
<td class="unit has-border">
</td>
</tr>
</table>
欲抓取每行第一个td的内容。
开始是这样写的:
@ExtractBy("//table[@itemprop="ingredients"]/tr/td[1]/allText()")
怎么也获取不到数据
结果改成这样,却成功了。
@ExtractBy("//table[@itemprop="ingredients"]/tbody/tr/td[1]/allText()")
但源码中明明没有tbody啊,有人知道原委吗?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
其实
没有tbody也会出问题!
你建一个表格,不加tbody,浏览器审查元素就会看到默认加了tbody