Rails:解析具有相同路径名的 XML 文档
我有一个包含同名路径的文档。例如: xml_doc = Nokogiri::XML(response.body) photo = xml_doc.xpath('person').xpath('photos').xpath('photo').xpa…
使用 Nokogiri 获取 HTML 中的 div 列表以及先前的标头
我正在尝试提取其 class =“child”的 DIV 列表,并将“child”与出现在其之前的 class =“header”的 DIV 相关联。 例如: HEADER A CHILD A.1 CHILD…
从表中的类名创建动态变量,将 td 值移动到该行的数组或哈希中?
我是一名业余程序员,想要从与此网站类似的网站上抓取数据:http://www.highschoolsports.net/massey/" rel="nofollow">http://www.highschoolsports.…
如何获取tag.contents
我有这个 XML: John Smith 并用 Nokogiri 解析它: # I get the record from the whole document ... fields = record.xpath("f") for field in field…
删除inner_html中的注释
我有一些使用 Nokogiri 的代码,我试图在不获取注释的情况下获取 inner_html 。 html = Nokogiri::HTML(open(@sql_scripts_url[1])) #using first val…
确定两个 Nokogiri 节点是否等效
想象一下,您有代表以下两个文档中的 元素的 Nokogiri 节点: Hello Hello 从 DOM 的角度来看,这两个节点是等效的。我想有效地检测到这一点,但是 No…
通过 nokogiri 或 hpricot 进行屏幕抓取
我正在尝试获取给定 xpath 的实际值。我在sample.rb 文件中有以下代码 require 'rubygems' require 'nokogiri' require 'open-uri' doc = Nokogiri::H…
使用 nokogiri 提取 HTML 标签之间的文本
我有这样的 HTML: Header is here Header 2 is here Extract me! Extract me too! Next Header 2 not interested not interested Header 2 is here E…
使用 nokogiri n Ruby on Rails 分别获取折扣前和折扣后的价格
我正在尝试学习废品这些值,我将其放入两个不同的任务中: 从整个文本中获取 35.00 从整个文本中获取 42.00 下面是 html: $35.00 - $42.00 我用来获…
Nokogiri 保持 HTML 实体不变
我希望 Nokogiri 保持 HTML 实体不变,但它似乎正在将实体转换为实际的符号。例如: Nokogiri::HTML.fragment('®').to_s 结果为: "®" 似乎没有什…
Ruby Nokogiri 获取纯文本文件
我正在尝试使用此代码从 http Web 服务器获取 .sql 文件。 Nokogiri::HTML(open($sql_file,:http_basic_authentication=>[@usr, @pwd])) 但我确实得到…
XPATH 选择带有属性和文本的节点
给定(无需对 XML 命名进行注释): 3100 production 0100 test 如何构造 XPATH 来选择具有属性“model”的节点和使用 Ruby Nokogiri 的文本 3100 我…
禁用 Nokogiri 中的错误纠正
我正在处理许多格式错误的 HTML 页面。至少,我认为它们格式错误,因为当我在 Nokogiri 中解析它们然后执行 to_html 时,元素不再正确显示。然而,当…
无法为变量赋值:未定义方法“[]”;对于 nil:NilClass (NoMethodError)
我完全被这个问题难住了。 我有以下代码: puts block.at_xpath("*/img")["width"].to_i 但是当我将其更改为时, width = block.at_xpath("*/img")["w…