webmagic有解析<table>的方法么,返回 table中所有tr和td 的值??

发布于 2021-11-25 07:07:50 字数 231 浏览 821 评论 1

@黄亿华 你好,想跟你请教个问题:webmagic有解析<table>的方法么,返回 table中所有tr和td 的值??

xpath怎么获取<td>的文本呢?有的td里还有其他标签 ,能用一个xpaht获取么?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

千笙结 2021-11-25 19:55:43

比如如下的表格:

<table itemprop="ingredients">
    <tr>
        <td class="name has-border">
            <a href="/category/4541/">
                鲢鱼
            </a>
        </td>
        <td class="unit has-border">
        </td>
    </tr>
    <tr>
        <td class="name has-border">
            植物油
        </td>
        <td class="unit has-border">
        </td>
    </tr>
</table>

抓取 鲢鱼、植物油

@ExtractBy("//table[@itemprop="ingredients"]/tbody/tr/td[1]/allText()")

注意: 一定要有tbody 即使源码没有。

另外需要用allText,否则鲢鱼抓取不到

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文