xpath 查询的制定?

发布于 2024-10-27 22:58:26 字数 555 浏览 4 评论 0原文

嘿, 我有一个 html 页面,其中包含例如以下标签:

<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p>

<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p>

现在我使用 python 中的 scrapy 框架编写了一个爬虫,其中我使用 cxxpath 查询来查找 foruri 标签,如 //@foruri ,其中应该给我 foruri 标签,无论它出现在什么地方,但问题是它不会产生 http:

那么请帮助我获取它吗?

Hey,
I have a html page which contains for example the following tags :

<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p>

<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p>

Now I wrote a crawler using the scrapy framework in python,in which i used the cxxpath query to find the foruri tag as //@foruri which should give me the foruri tag where ever it is present, but the problem is it does not yield http:

So help me in getting it?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

甜味超标? 2024-11-03 22:58:26

假设您希望提取所有

foruri 属性标签:

hxs.select('//p/@foruri').extract()

Assuming you wish to extract the foruri attribute of all <p> tags:

hxs.select('//p/@foruri').extract()
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文