Hpricot 解析 URI 中的特殊字符时出错
我正在编写一个 ruby 脚本来从雅虎获取历史股票价格,使用 Hpricot 来解析页面。这基本上是直截了当的:网址是“http://finance.yahoo.com/q/ hp?…
如何使用 Hpricot 从 html 中删除事件属性?
我想从 html 中删除 dom 事件属性列表?怎么办?喜欢: before = "abc" after = clean_it(before) // after => "abc" DOM_EVENT_TO_BE_REMOVE = "oncl…
使用 html 块加载 hpricot 元素
有没有办法将一段 html 加载到 Hpricot::Doc 对象中? 我正在尝试解析页面中自定义标签内的各种 html 块。 所以如果我有: here is some stuff one tw…
在 Ruby 中使用 Hpricot 更新单个 XML 实体?
我将使用 Hpricot 来处理 XML 文件。我想随机显示文件中的一些引言,然后我想跟踪每个引言的显示频率。 我是否可以使用 Hpricot 更新 XML 文件中的单…
在 Hpricot 中将 id 与正则表达式进行匹配的最佳方法是什么?
使用 apricot,可以很容易地看到如何使用 CSS 选择器提取具有给定 id 或类的所有元素。是否可以根据这些元素的某些属性是否与某些正则表达式匹配来从…
Netbeans 中的 hpricot
我正在尝试在 JRuby 中使用 hpricot。 我的问题如下。如果我有这个代码: #!ruby require 'hpricot' require 'open-uri' # load the RedHanded home p…
使用 Hpricot (Ruby on Rails) 抓取隐藏的 HTML(当visible = false 时)
我遇到了一个问题,不幸的是我似乎无法超越,不幸的是,我也只是 Ruby on Rails 的新生儿,不幸的是,因此 我试图抓取网页的问题数量如下: http://ww…
Html / 脚本使用 Hpricot (Ruby On Rails) 抓取 Google 地图
我在抓取代码以提取我正在创建的 Web MashUp 的信息时遇到问题。 基本上,我试图从以下位置抓取代码: http://yellowpages.com.mt/Meranti-Ltd-In-Mal…
获取 Hpricot 中元素的类型
我想遍历元素的子元素并仅过滤文本或 span 元素,例如: element.children.select {|child| child.class == String || child.element_type == 'span' …
Hpricot 带索引循环?
我有以下 HTML 文档: Some text Some other text Some more text 如何使用 Hpricot 在列表项上循环并在每个项目的开头插入一些新的 HTML,以便我得到…
使用 hpricot 解析 XML,获取属性
我的 xml: http://www.google.ru/ig/api?weather=Chelyabinsk 例如如何获取城市数据?不是inner_html,只是城市数据、邮政编码等属性。…