当前位置：文江博客话题详情

hpricot 中的分段错误

发布于 2024-07-22 20:28:11 字数 119 浏览 8 评论 0原文

我正在使用 hpricot 来读取 HTML。我遇到了分段错误错误，我用 google 搜索，有人说升级到最新版本的 Ruby。我使用的是 Rails 2.3.2 和 ruby 1.8.7。如何解决这个错误？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

南汐寒笙箫 2024-07-29 20:28:11

我试图解析其中包含许多 unicode 字符的 html 页面，但 Hpricot 一直崩溃。最后，我使用了 sanitize 中的猴子补丁，并将其放入我的 Rails 应用程序的environment.rb 中。自从我添加此补丁以来，没有发生过任何崩溃：

http://github.com/rgrove/sanitize/blob/1e1dc9681de99e32dc166f591343dfa60fc1f648/lib/sanitize/monkeypatch/hpricot.rb

回复收藏 0 原文

你丑哭了我 2024-07-29 20:28:11

如果您可以自由选择 HTML 解析库，请切换它。
为什么，Hpricot 的创建者最近发帖说，现在你最好使用 Nokogiri 而不是 HPricot。

您还可以看看 HTTParty。

回复收藏 0 原文

情归归情 2024-07-29 20:28:11

我遇到了同样的段错误问题，但遗憾的是无法咨询戴夫上面引用的问题，即使通过谷歌缓存 - 从我一直在谷歌搜索的 parse.rb 段错误与编码实体或替代字符集（重音）有关也许是字符）

清理库遇到了同样的问题并在这里发布了一个猴子补丁：
http://github.com/rgrove/sanitize/ blob/1e1dc9681de99e32dc166f591343dfa60fc1f648/lib/sanitize/monkeypatch/hpricot.rb

回复收藏 0 原文

舞袖。长 2024-07-29 20:28:11

这似乎是错误列表中的一个突出问题。我经历过。我的理论是与文件中的 HTML 结构或错误/损坏的字符有关，但我还没有找到确切的位置。

以下是问题的链接：

回复收藏 0 原文

苹果你个爱泡泡 2024-07-29 20:28:11

根据我的记忆，自从我大约一年前上次使用它以来：

Hpricot 将属性存储在固定大小的缓冲区中，并且某些框架在文档属性中生成非常长的哈希值。您可以在解析之前设置一些静态字段，以便您设置此缓冲区的大小。

我记得它在网页上的文档中相当突出，尽管现在它已经消失了。

回复收藏 0 原文

怪我闹别瞎闹 2024-07-29 20:28:11

好吧，根据你自己的问题，我会说“升级到最新版本的 Ruby”。然而，我也遇到了 hpricot 段错误的问题，这似乎与我对线程的使用有关。

回复收藏 0 原文

苏佲洛 2024-07-29 20:28:11

在 ruby 1.8.5 上尝试使用 hpricot -v 0.6.161

这对我有用。

回复收藏 0 原文

~没有更多了~

关于作者

装迷糊

暂无简介

文章

26 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

hpricot 中的分段错误

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（7）

关于作者

相关话题

热门标签