Groovy htmlunit getByXPath
我目前正在使用 HtmlUnit 尝试从页面中获取 href,但遇到了一些麻烦。
XPath 是:
/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a
在网页上,它看起来像:
<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>
在我的代码中,我正在执行:
hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")
但是,这会返回其中的所有内容,而不仅仅是我想要的 url。
有人可以解释一下我必须添加什么才能获取 href 吗? (而且它也不以 .html 结尾)
I'm currently using HtmlUnit to attempt to grab an href out of a page and am having some trouble.
The XPath is:
/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a
On the webpage it looks like:
<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>
In my code I am doing:
hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")
However, this is returning everything in there instead of just the url that I want.
Can someone explain what I must add to get the href? (also it doesn't end with .html)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您正在选择
a
。您想要选择a/@href
。You are selecting the
a
. You want to select thea/@href
.