Groovy htmlunit getByXPath

发布于 2024-10-04 03:03:47 字数 565 浏览 4 评论 0原文

我目前正在使用 HtmlUnit 尝试从页面中获取 href,但遇到了一些麻烦。

XPath 是:

/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a    

在网页上,它看起来像:

<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>

在我的代码中,我正在执行:

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")

但是,这会返回其中的所有内容,而不仅仅是我想要的 url。

有人可以解释一下我必须添加什么才能获取 href 吗? (而且它也不以 .html 结尾)

I'm currently using HtmlUnit to attempt to grab an href out of a page and am having some trouble.

The XPath is:

/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a    

On the webpage it looks like:

<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>

In my code I am doing:

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")

However, this is returning everything in there instead of just the url that I want.

Can someone explain what I must add to get the href? (also it doesn't end with .html)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

断念 2024-10-11 03:03:47

您正在选择a。您想要选择a/@href

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']/@href")

You are selecting the a. You want to select the a/@href.

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']/@href")
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文