@黄亿华 你好,想跟你请教个问题:webmagic有解析<table>的方法么,返回 table中所有tr和td 的值??
xpath怎么获取<td>的文本呢?有的td里还有其他标签 ,能用一个xpaht获取么?
比如如下的表格:
<table itemprop="ingredients"> <tr> <td class="name has-border"> <a href="/category/4541/"> 鲢鱼 </a> </td> <td class="unit has-border"> </td> </tr> <tr> <td class="name has-border"> 植物油 </td> <td class="unit has-border"> </td> </tr></table>
抓取 鲢鱼、植物油
@ExtractBy("//table[@itemprop="ingredients"]/tbody/tr/td[1]/allText()")
注意: 一定要有tbody 即使源码没有。
另外需要用allText,否则鲢鱼抓取不到
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(1)
比如如下的表格:
<table itemprop="ingredients">
<tr>
<td class="name has-border">
<a href="/category/4541/">
鲢鱼
</a>
</td>
<td class="unit has-border">
</td>
</tr>
<tr>
<td class="name has-border">
植物油
</td>
<td class="unit has-border">
</td>
</tr>
</table>
抓取 鲢鱼、植物油
@ExtractBy("//table[@itemprop="ingredients"]/tbody/tr/td[1]/allText()")
注意: 一定要有tbody 即使源码没有。
另外需要用allText,否则鲢鱼抓取不到