我可以使用 nokogiri 获取 html 元素吗?
我对 nokogiri 有疑问,我需要从页面获取 HTML 元素,并获取每个元素的 xpath。 问题是我不知道如何用 nokogiri 做到这一点。 HTML 代码是随机的,因为我必须解析来自不同网站的多个页面。
I have a doubt about nokogiri, I need to get the HTML elements from a page, and get the xpath for each one. The problem is that I can't realize how to do it with nokogiri. The HTML code is random, because I've to parse several pages, from different websites.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
如果您询问如何搜索节点,则可以使用 CSS 或 XPath 表达式,如下所示:
如果您询问如何在找到节点后检索其规范的 XPath 表达式,则可以使用
Node#path
像这样:If you are asking how to search for a node, you may use either CSS or XPath expressions, like so:
If you are asking how, once you've found a node, you can retrieve the canonical XPath expression for it, you may use
Node#path
like so:如果您询问如何获取页面中每个 HTML 元素的 XPath,那么以下内容应该会有所帮助。 这将打开并解析页面,然后打印出每个元素的 XPath。
If you are asking how to get the XPath for each HTML element in a page, then the following should help. This will open and parse a page and then print out the XPath for each element.