webmagic表格爬行问题
有一个如下的TABEL,要获得每一行TR的TD中的内容:
<div id="table_Head">
<table width="100%>
<thead> ....</thead>
<tbody id="tenderProjectTab">
<tr style=“font-size:13px"><td>abc<td></tr>
......
</tbody>
</table>
</div>
如果用XPATH的话,我这样的话,只能取到<tbody id="tenderProjectTab"></tbody>
,但我期望拿到的是<tbody>中所有的<TR>标签的集合呀,然后再循环用JSOUP去获得TR中的每个TD内容呢。
page.putField("content", page.getHtml().xpath("//div[@class='table_Head']/table[@width='100%']/tbody[@id='tenderProjectTab']").all());
要如何处理呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
引用来自“名字真不好起”的评论
1. xpath("//tbody[@id=tenderProjectTab]/tr").nodes()
2. page.getHtml().$("#tenderProjectTab>tr").nodes()
1. xpath("//tbody[@id=tenderProjectTab]/tr").nodes()
2. page.getHtml().$("#tenderProjectTab>tr").nodes()
引用来自“戴帽子的狗”的评论
xpath /tbody[id=tenderProjectTab]//tr 拿不到么?
如果是很复杂的问题就不懂,如果是简单的用jquery?