xpath 查询的制定?
嘿, 我有一个 html 页面,其中包含例如以下标签:
<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p>
<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p>
现在我使用 python 中的 scrapy 框架编写了一个爬虫,其中我使用 cxxpath 查询来查找 foruri 标签,如 //@foruri
,其中应该给我 foruri
标签,无论它出现在什么地方,但问题是它不会产生 http:
那么请帮助我获取它吗?
Hey,
I have a html page which contains for example the following tags :
<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p>
<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p>
Now I wrote a crawler using the scrapy framework in python,in which i used the cxxpath query to find the foruri tag as //@foruri
which should give me the foruri
tag where ever it is present, but the problem is it does not yield http:
So help me in getting it?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
假设您希望提取所有
的 foruri 属性标签:
Assuming you wish to extract the foruri attribute of all <p> tags: