webmagic 如何使用xpath获取 <a>的内部值
@黄亿华 刚开始接触爬虫,请教一个简单的问题:在使用webmagic 时 page.putField("title", page.getHtml().xpath("/html/body/table[5]/tbody/tr[5]/td[1]").toString()); 获取到的信息是【<td height="33"><a href="http://www.chinabond.com.cn/jsp/include/EJB/yhxx.jsp?Banks=0001" onclick="window.open(this.href,'','scrollbars=no,width=500,height=330');return false;"> 工商银行 </a></td>】;但是实际上只想得到【工商银行】这个结果,请问xpath如何修改,谢谢!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
"//div[@class='authi'][1]",没测试过,不知道是不是支持这个语法....
想请教一下,<div class="authi">,xpath如何获取这类div中的第一个呢?@黄亿华 谢谢
管用,谢谢!
/html/body/table[5]/tbody/tr[5]/td[1]/a/text()