Ruby Hpricot RegEx 将
替换为'
有人可以告诉我如何使用 Hpricot & 将这行 Javascript 转换为 Ruby吗?正则表达式? // Replace all doubled-up tags with tags, and remove fonts. v…
hpricot 解析问题
我有一个如下所示的 XML: What is the right way to use hpricot to extact just 'http:// /www.someweb.com/something.png'?我能得到的最接近的是…
我可以使用 Hpricot 查找任何/大多数网站的主要文章文本吗?
Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进此问题?通过编辑这篇文章来更新问题,使其仅关…
如何用 ruby 字符串替换节点?
我正在尝试将 HTML 文件中的所有 标记替换为 rails 标记。 我想做的是这样的: doc = open("myfile.html") { |f| Hpricot(f) } imgs = doc.search("//…
hpricot 的编码问题
当尝试在 ruby 1.9 中使用 hpricot 抓取网页时,我收到以下编码错误: Encoding::CompatibilityError: incompatible character encodings: ASCII-…
在 Xpath 搜索中转义冒号
我将 Hpricot 与 selenium 一起使用,我有这个 html 输入元素: 我试图用这个 Xpath 表达式获取这个值: source = Hpricot(@selenium.get_html_source…
使用 Hpricot 抓取具有异步响应的页面
我正在尝试抓取页面,但初始响应正文中没有任何内容,因为内容是异步输入的,例如苹果网站上的搜索结果: http://www.apple.com/uk/search/?q=searchi…
Ruby:网页的计算样式
我正在使用 Hpricot 解析 html 页面,但需要获取每个元素的计算样式。例如,如果我有一个 h1 Hpricot 元素,并且该页面的外部 CSS 具有为 h1 定义的背…
如何使用 Hpricot 删除 html 元素的样式属性?
像这样: Hello world just do it 我想删除每个元素的“style”属性。我想要这样的结果: Hello world just do it 如何使用 hpricot 来做到这一点? …
删除<字体>使用 hpricot 进行标记字体>
像这样的html: "[font color="#FF0000"]test [font color="#FF0000"]Hello world[/font][/font]" 我想替换字体标签结果像这样: test Hello world 谢…
如何让 Hpricot 与 HTML5 完美配合?
我正在使用 Hpricot 来解析主题文件。然而,我注意到,如果我将有效的 HTML5 文档输入 Hpricot(),它会自动关闭 HTML5 标签(如 ),并与 DOCTYPE 混…
hpricot 使用 java 吗?
我刚刚注意到很多 hpricot 代码都是用 java 编写的... alt text http://img697.imageshack.us/img697/7447/picture2yw.png 我听说JRuby在处理正则表达…
如何使用内部文本获取元素(Watir、Nokogir、Hpricot)
我一直在用 Watir、Nokogir 和 Hpricot 进行实验。所有这些都使用自上而下的方法,这是我的问题。即他们使用元素类型来搜索元素。我想在不知道元素类…