返回介绍

14.6. xpath

发布于 2024-02-10 15:26:30 字数 1002 浏览 0 评论 0 收藏 0

14.6. xpath

14.6.1. 逻辑运算符

14.6.1.1. and

	
>>> response.xpath('//span[@class="time" and @id="news-time"]/text()').extract()
['2017-10-09 09:46']				
	
	

14.6.1.2. or

	
//*[@class='foo' or contains(@class,' foo ') or starts-with(@class,'foo ') or substring(@class,string-length(@class)-3)=' foo']				
	
	

14.6.2. function

14.6.2.1. text()

	
>>> response.xpath('//title/text()').extract_first()
'Netkiller ebook - Linux ebook'				
	
	

14.6.2.2. contains()

contains() 匹配含有特定字符串的 class

	
//*[contains(@class,'foo')]
	
	
	
>>> response.xpath('//ul[contains(@class, "topnews_nlist")]/li/h2/a/@href|//ul[contains(@class, "topnews_nlist")]/li/a/@href').extract()	
	
	

内容匹配

	
>>> response.xpath('//div[@id="epContentLeft"]/h1[contains(text(),"10")]/text()').extract()
['美联储10月起启动渐进式缩表 维持基准利率不变']					
	
	

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文