当前位置：文江博客话题详情

我可以使用 nokogiri 获取 html 元素吗？

发布于 2024-07-22 11:15:27 字数 116 浏览 3 评论 0原文

我对 nokogiri 有疑问，我需要从页面获取 HTML 元素，并获取每个元素的 xpath。问题是我不知道如何用 nokogiri 做到这一点。 HTML 代码是随机的，因为我必须解析来自不同网站的多个页面。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

看春风乍起 2024-07-29 11:15:27

如果您询问如何搜索节点，则可以使用 CSS 或 XPath 表达式，如下所示：

require 'rubygems'
require 'nokogiri'
require 'open-uri'

doc = Nokogiri::HTML(open("http://slashdot.com/"))

node_found_by_css = doc.css("h1").first
node_found_by_xpath = doc.xpath("/html/body//h1").first

如果您询问如何在找到节点后检索其规范的 XPath 表达式，则可以使用Node#path 像这样：

puts node_found_by_css.path # => "/html/body/div[3]/div[1]/div[1]/h1"

If you are asking how to search for a node, you may use either CSS or XPath expressions, like so:

require 'rubygems'
require 'nokogiri'
require 'open-uri'

doc = Nokogiri::HTML(open("http://slashdot.com/"))

node_found_by_css = doc.css("h1").first
node_found_by_xpath = doc.xpath("/html/body//h1").first

If you are asking how, once you've found a node, you can retrieve the canonical XPath expression for it, you may use Node#path like so:

puts node_found_by_css.path # => "/html/body/div[3]/div[1]/div[1]/h1"

回复收藏 0 原文

远山浅 2024-07-29 11:15:27

如果您询问如何获取页面中每个 HTML 元素的 XPath，那么以下内容应该会有所帮助。这将打开并解析页面，然后打印出每个元素的 XPath。

require 'rubygems'
require 'nokogiri'
require 'open-uri'

doc = Nokogiri::HTML(open("http://slashdot.com/"))
doc.traverse {|node| puts node.path }

If you are asking how to get the XPath for each HTML element in a page, then the following should help. This will open and parse a page and then print out the XPath for each element.

require 'rubygems'
require 'nokogiri'
require 'open-uri'

doc = Nokogiri::HTML(open("http://slashdot.com/"))
doc.traverse {|node| puts node.path }

回复收藏 0 原文

~没有更多了~

关于作者

萌面超妹

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

我可以使用 nokogiri 获取 html 元素吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

我可以使用 nokogiri 获取 html 元素吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。