webmagic表格爬行问题

发布于 2021-11-29 13:17:18 字数 685 浏览 763 评论 4

有一个如下的TABEL,要获得每一行TR的TD中的内容:
<div id="table_Head">
<table width="100%>

<thead> ....</thead>
<tbody id="tenderProjectTab">
<tr style=“font-size:13px"><td>abc<td></tr>

......

</tbody>

</table>

</div>

如果用XPATH的话,我这样的话,只能取到<tbody id="tenderProjectTab"></tbody>
,但我期望拿到的是<tbody>中所有的<TR>标签的集合呀,然后再循环用JSOUP去获得TR中的每个TD内容呢。

          page.putField("content", page.getHtml().xpath("//div[@class='table_Head']/table[@width='100%']/tbody[@id='tenderProjectTab']").all());

要如何处理呢?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

虐人心 2021-12-05 16:45:53

引用来自“名字真不好起”的评论

1. xpath("//tbody[@id=tenderProjectTab]/tr").nodes()

2. page.getHtml().$("#tenderProjectTab>tr").nodes()

北笙凉宸 2021-12-05 16:41:20

1. xpath("//tbody[@id=tenderProjectTab]/tr").nodes()

2. page.getHtml().$("#tenderProjectTab>tr").nodes()

冷默言语 2021-12-05 14:37:51

引用来自“戴帽子的狗”的评论

xpath  /tbody[id=tenderProjectTab]//tr  拿不到么?

终陌 2021-12-05 02:15:34

如果是很复杂的问题就不懂,如果是简单的用jquery?

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文