Netbeans 中的 hpricot
我正在尝试在 JRuby 中使用 hpricot。 我的问题如下。如果我有这个代码: #!ruby require 'hpricot' require 'open-uri' # load the RedHanded home p…
使用 Hpricot (Ruby on Rails) 抓取隐藏的 HTML(当visible = false 时)
我遇到了一个问题,不幸的是我似乎无法超越,不幸的是,我也只是 Ruby on Rails 的新生儿,不幸的是,因此 我试图抓取网页的问题数量如下: http://ww…
Html / 脚本使用 Hpricot (Ruby On Rails) 抓取 Google 地图
我在抓取代码以提取我正在创建的 Web MashUp 的信息时遇到问题。 基本上,我试图从以下位置抓取代码: http://yellowpages.com.mt/Meranti-Ltd-In-Mal…
获取 Hpricot 中元素的类型
我想遍历元素的子元素并仅过滤文本或 span 元素,例如: element.children.select {|child| child.class == String || child.element_type == 'span' …
Hpricot 带索引循环?
我有以下 HTML 文档: Some text Some other text Some more text 如何使用 Hpricot 在列表项上循环并在每个项目的开头插入一些新的 HTML,以便我得到…
使用 hpricot 解析 XML,获取属性
我的 xml: http://www.google.ru/ig/api?weather=Chelyabinsk 例如如何获取城市数据?不是inner_html,只是城市数据、邮政编码等属性。…
为什么 Twitter API 在生产中返回 400 错误?
我有一个在本地运行得非常好的 Twitter 应用程序 - 它搜索关键字,然后使用 Hpricot 来解析 xml 来获取每个用户的信息,例如 Hpricot(open("http://tw…
如何在 Nokogiri 中进行正则表达式搜索以匹配特定开头的文本?
鉴于: require 'rubygems' require 'nokogiri' value = Nokogiri::HTML.parse(<<-HTML_END) " A Foo B C Bar D E F " HTML_END 我想做一些类似于 Hpr…
使用 Ruby 从 HTML 文档中删除文本
有很多关于如何使用 Ruby 从文档中删除 HTML 标签的示例,Hpricot 和 Nokogiri 都有 inside_text 方法,可以轻松快速地为您删除所有 HTML。 我想做的…
在 hpricot/nokogiri 中搜索 h2 元素之前的所有元素
我正在尝试解析维基词典条目以检索所有英语定义。我能够检索所有定义,问题是某些定义是其他语言的。我想做的是以某种方式仅检索具有英文定义的 HTML …
使用 JRuby(Hpricot?)使用 等标签解析 XML
我试图在 JRuby 中使用一些带有如下元素的遗留 XML: content 我一直在使用 Hpricot,但 Hpricot 的面向 HTML 的快捷方式对我不利:doc.search("//wit…
Rails 控制器中 Hpricot 超时错误
嘿——我正在编写一个使用 digg API 的基本 Rails 应用程序。我试图解析 digg 的 api 使用 hpricot 提供的 xml 数据,但是在测试页面时,浏览器会挂起…
使用 Hpricot 查找节点在其父节点内的字符索引
假设我有以下 HTML: html = Four score and seven years ago 我想用 Hpricot 解析它: doc = Hpricot(html) 找到 节点: node = doc.at('b') 然后获…