来自 RSS 的 Hpricot 空链接元素

发布于 2024-12-19 02:57:26 字数 469 浏览 3 评论 0原文

我目前正在 Ruby 中使用 Hpricot 解析 RSS 提要。

除 元素外,所有元素都是可检索的。

这就是我正在做的事情:

当我执行 ("/link").inspect 时,guid 有效,而链接失败。检查它说它是一个空元素。尽管如果您查看提要,所有项目都具有带有值的链接元素。

doc = Hpricot.parse(open("http://www.highways.gov.uk/rssfeed/rss.xml"))   
(doc/:item).each do |xml_product|
  puts xml_product.search("/guid").first.children.first.raw_string
  puts xml_product.search("/link").first.children.first.raw_string
end

对可能出什么问题有什么想法吗?

I'm currently parsing an RSS feed using Hpricot in Ruby.

All the elements are retrievable, except the element.

This is what I'm doing:

The guid works, whereas the link fails, when I do ("/link").inspect it says it's an empty element. Although if you look at the feed, all the items have link elements with values.

doc = Hpricot.parse(open("http://www.highways.gov.uk/rssfeed/rss.xml"))   
(doc/:item).each do |xml_product|
  puts xml_product.search("/guid").first.children.first.raw_string
  puts xml_product.search("/link").first.children.first.raw_string
end

Any thoughts on what could be wrong?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

晌融 2024-12-26 02:57:26

这里的问题是您尝试检索的格式错误的 xml:

<link />http://www.trafficengland.co.uk/map.aspx?isTrafficAlert=true&lat=53.4363602900352&lon=-2.31328109635184

因此,当您准备 /link 查询时,您会收到 NoMethod 错误,因为 link 元素为空。

更新

这似乎是hpricot的问题。尝试使用 nokogiri 代替:

require 'nokogiri'
require 'open-uri'

doc = Nokogiri::XML(open("http://www.highways.gov.uk/rssfeed/rss.xml"))   
doc.xpath("//item").each_with_index do |xml_product|
  puts xml_product.xpath('guid').text
  puts xml_product.xpath('link').text
end
# =>
     391532
     http://www.trafficengland.co.uk/map.aspx?....
     ....

The problem here is malformed xml that you try to retrieve:

<link />http://www.trafficengland.co.uk/map.aspx?isTrafficAlert=true&lat=53.4363602900352&lon=-2.31328109635184

Hence when you prepare /link query you get NoMethod error because link elements are empty.

UPDATE

It seems to be problem of hpricot. Try nokogiri instead:

require 'nokogiri'
require 'open-uri'

doc = Nokogiri::XML(open("http://www.highways.gov.uk/rssfeed/rss.xml"))   
doc.xpath("//item").each_with_index do |xml_product|
  puts xml_product.xpath('guid').text
  puts xml_product.xpath('link').text
end
# =>
     391532
     http://www.trafficengland.co.uk/map.aspx?....
     ....
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文