从网站列表中抓取返回基于 Xpath 的空结果

发布于 2025-01-11 23:32:24 字数 544 浏览 0 评论 0原文

因此,我试图从该网站上删除职位列表 https://www.dsdambuster.com/careers。

我有以下代码:

url = "https://www.dsdambuster.com/careers"
page = requests.get(url, verify=False)
tree = html.fromstring(page.content)
path = '/html/body/div[1]/section/div/div/div[2]/div[1]/div/div[2]/div/div[9]/div[1]/div[3]/div[*]/div[1]/a[*]/div/div[1]/div'
 
jobs = tree.xpath(xpath)

for job in jobs:
    Title = (job.text)
    print(Title)

不太确定为什么它不起作用......

So I'm trying to scrape the job listing off this site https://www.dsdambuster.com/careers .

I have the following code:

url = "https://www.dsdambuster.com/careers"
page = requests.get(url, verify=False)
tree = html.fromstring(page.content)
path = '/html/body/div[1]/section/div/div/div[2]/div[1]/div/div[2]/div/div[9]/div[1]/div[3]/div[*]/div[1]/a[*]/div/div[1]/div'
 
jobs = tree.xpath(xpath)

for job in jobs:
    Title = (job.text)
    print(Title)

not too sure why it wouldnt work...

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

穿越时光隧道 2025-01-18 23:32:24

我在这里看到两个问题:

  1. 您使用的是非常糟糕的 XPath。它极其脆弱且不可靠。
    而不是
'/html/body/div[1]/section/div/div/div[2]/div[1]/div/div[2]/div/div[9]/div[1]/div[3]/div[*]/div[1]/a[*]/div/div[1]/div'

请使用

'//div[@class="vf-vacancy-title"]'
  1. 您可能错过了等待/延迟。
    我不熟悉您在这里使用的方式,但是对于我熟悉的 Selenium,您需要等待元素完全加载,然后才能提取其文本内容。

I see 2 issues here:

  1. You are using very bad XPath. It is extremely fragile and not reliable.
    Instead of
'/html/body/div[1]/section/div/div/div[2]/div[1]/div/div[2]/div/div[9]/div[1]/div[3]/div[*]/div[1]/a[*]/div/div[1]/div'

Please use

'//div[@class="vf-vacancy-title"]'
  1. You are possibly missing a wait / delay.
    I'm not familiar with the way you are using here, but with Selenium that I do familiar with, you will need to wait for the elements completely loaded before extracting their text contents.
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文