在方法调用中使用 ruby 块
下面的代码可以完美运行。 @doc = open(link) { |f| Hpricot(f) } 但我想使用以下代码,它似乎与 Hpricot 块配合得不好(例如 @doc 是 TempFile 对象…
如何使用 Hpricot 删除 div 内的特定内容
我有以下 html 结构 asdasdasdas asdasdasdas asdasdasdas asdasdasdas Content to be excluded 我需要的是,当我搜索 div id="rn_answertext" 时,我…
hpricot:从 URL 获取图像并解析元素
我正在尝试获取页面内图像的确切 URL,然后下载它。我还没有到达下载点,因为我正在尝试隔离图像的 URL。这是代码: #!/usr/bin/ruby -w require 'rub…
Hpricot - 未定义的方法“to_sym”对于 nil:NilClass
我最近做了一次捆绑更新,最终破坏了很多东西。我无法解决的问题之一是使用 hpricot 来格式化文本。 之前有 hpricot 用户遇到过这个 to_sym for nilCl…
使用 hpricot 构建 flashvar 数组
我之前曾使用 hpricot 从某些 HTML 标签内的网站获取内容,但是我正在尝试构建此页面上找到的所有 flashvar 的数组 http://view-source:http://megavi…
如何查找“”中的href元素值用红宝石标记
我的目标是找到谷歌搜索结果中的第一个结果并收集站点链接,所以我构建了这个脚本: require 'hpricot' require 'open-uri' require 'mechanize' quer…
Ruby:清理 HTML、使用 Hpricot 还是仅使用正则表达式?
我希望对 HTML 进行一些基本的清理。基本上想要创建一个允许的标签白名单并拒绝其他任何内容。 在这种情况下,Hpricot 值得吗?它是否有一个我忽略的…
Ruby Hpricot XML 解析 ARIN 文档
我正在尝试解析此 ARIN xml 文档。我想获取 orgRef 标记内的“name”属性,当我用 Hpricot 解析它时,它没有按照我的预期执行 false1998-04-18T00:00:…
Ruby Mechanize 表抓取无法捕获整行
我正在尝试用 mechanize 抓取一个表格网站。 我想刮第二行。 当我运行: agent.page.search('table.ea').search('tr')[-2].search('td').map{ |n| n.t…
Hpricot XML 文本搜索
Hpricot + Ruby XML 解析和逻辑选择。 目标:找到作者鲍勃写的所有标题。 我的 XML 文件: Book1 march 1 2010 Bob book2 october 4 2009 Bill book3 …
加载 hpricot gem 时出现问题
我在加载 hpricot gem 时遇到问题。 我在 rake 任务中使用它,并在其中放入 require "hpricot" 。 但它不会加载并显示错误消息:no such file to load…
例如,Hpricot 中使用的除数符号是什么?
在 Hpricot 文档(位于 https://github.com/hpricot/hpricot)中有一个文档。搜索()方法。然后文档继续说“快捷方式是使用除数”: (doc/"p.posted"…
什么是“终止对象”,为什么我不能调用它的方法?
我定期收到此异常: NotImplementedError: method `at' called on terminated object 在这行代码上: next if Hpricot(html).at('a') 此错误意味着什…
如何在 Windows、Ruby 1.8.7、Rails 2.3.8 上安装 Facets,出现 hpricot 错误
当我尝试从 rubygems 安装facets gem 时,出现此错误: Using facets (2.8.4) Installing hpricot (0.8.3) with native extensions c:/Ruby187/li…
如何使用
从网页中提取文本使用 Hpricot 标签?
我正在尝试使用 Hpricot 和 Ruby 解析 HTML 文件,但在提取“自由浮动”文本时遇到问题,该文本未包含在 等标签中。 require 'hpricot' text = <