OS X Lion,尝试安装 Nokogiri - libxml2 丢失
sudo gem install nokogiri Building native extensions. This could take a while... ERROR: Error installing nokogiri: ERROR: Failed to build ge…
解析:我可以获取Nokogiri中嵌入CSS背景的URL吗?
我正在解析的 HTML 包含表格中带有内联 CSS 的图像,我可以使用 Nokogiri 来确定 URL 组件吗,这是我想要解析的代码片段: tldr:我想获取.png 在此 h…
使用 Ruby 抓取外部 javascript 文件
我需要抓取几个 URL 并将其内容抓取到数据库中。 爬取的数据必须包含 HTML 以及外部 CSS 和 JS 文件。 我使用Nokogiri毫无问题地获取CSS,但无法轻松…
如何从 Mechanize::Page 的搜索方法获取 Mechanize 对象?
我正在尝试抓取一个只能依靠类和元素层次结构来找到正确节点的网站。但是使用 Mechanize::Page#search 返回 Nokogiri::XML::Element 我无法使用它来填…
查找 xml 页面中的重复项
我正在尝试使用 ruby 和 nokogiri 在 Web 服务调用返回的 xml 中查找重复项。 我从下面的代码中得到的输出是这样的: found duplicate["1", "1"] …
使用 Rails 和 Nokogiri 修改具有多个文本的 XML
我正在寻找可以修改 Ruby 中的 .docx 文件的东西。在这里,在这段代码中我对 xml 文件进行了修改。 仅修改一次元素,但想将所有元素 "FirstName" 替换…
OSX Lion 与 Ubuntu 10.04 上的 Nokogiri xml 解析
我正在运行这个 ruby 脚本: require "rubygems" require "nokogiri" xml = "" parsed = Nokogiri.parse(xml) p parsed 当我在 OSX Lion (ruby 1.…
Nokogiri 帮助没有空格
我有以下代码: #/usr/bin/env ruby require 'rubygems' require 'nokogiri' require 'open-uri' require 'cora' require 'eat' #require 'timeout' d…
在 Rails 应用程序中扩展 nokogiri
我按如下方式扩展了 Nokogiri::HTML:Document 类以添加名为 on_same_line? 的函数? module Nokogiri module HTML class Document def on_same_line?(…
如何获取表单的选择选项文本和值?
我正在尝试使用 Nokogiri 来抓取表单的 select 元素。 例如: Blue Green 我想要 1 =>; '蓝色', 2 =>; 'Green' 等。 我尝试使用 at_css 和 xpath 但一…
如何使用 Nokogiri 去除 HTML 标签之间的间隙?
假设我有这种标记: Some text Some text hello 我需要确保在开始 标记之后和任何封闭的文本内容之前没有空格。使用 Nokogiri 实现这一目标的最佳方法…
如何使用包装 HTML 未标记文本使用 Nokogiri 标记?
我必须将 HTML 文档解析为不同的新文件。问题是有些文本节点没有用 "" 标签包裹,而是在末尾有 "" 标签每个段落。 我想使用 Nokogiri 用 标签包装此文…