python 爬虫的xpath 问题

发布于 2022-09-12 00:09:02 字数 1254 浏览 18 评论 0

image.png

我用xpath 这样写

leftData=htmlResult.xpath('//td[contains(@align,"left")]/text()')

最后的结果是这样 :

['\r\n\t\t\t\t\t\t\t  21060\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t    \r\n\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t  \r\n\t\t\t\t\t\t\t  \t\t\t', '\r\n\t\t\t\t\t\t\t  乙烯基乙炔\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  Vinyl acetylene;Buten-3-yne\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \r\n          C', 'H', ';CH', '\r\n\t\t\t\t\t\t\t  52.04\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  -118℃  沸点:5℃\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  相对密度(水=1)0.71;\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \r\n\t\t\t\t\t  ', '\r\n\t\t\t\t\t\t\t  \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  稳定\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  气态(常温)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  4(易燃气体)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  在工业上是很需要的烯炔烃化合物,用于制备合成橡胶的单体2-氯丁二燃-[1,3]等\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  ']

根本没有这个"<-5℃" 这个数据集,求人指教,谢谢!

我觉得我写的没有问题,但是这个数据没有匹配到,不知道为啥!

网址 :https://china.guidechem.com/datacenter/msds/c/733.html

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

星光不落少年眉 2022-09-19 00:09:02

/html/body/div[2]/div[4]/div[2]/table/tbody/tr/td[3]/table/tbody/tr[10]/td[2]

救赎№ 2022-09-19 00:09:02

你应该查看xpath解析器版本,早期版本类似大小于号这种可能被xpath解析引擎当作html标签容错给忽略掉,从而导致你按照正常的xpath搜索有可能查找不到,请翻阅对应版本的官方指引,一般作特殊处理。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文