如何让 Hpricot 与 HTML5 完美配合?

发布于 2024-09-02 02:42:47 字数 219 浏览 3 评论 0原文

我正在使用 Hpricot 来解析主题文件。然而,我注意到,如果我将有效的 HTML5 文档输入 Hpricot(),它会自动关闭 HTML5 标签(如

),并与 DOCTYPE 混淆代码>.

Hpricot 是否有任何扩展,或者我需要设置一个标志,以允许正确解析 HTML5 文档?

I am using Hpricot to parse a theme file. I have noticed, however, that if I feed a valid HTML5 document into Hpricot(), it auto-closes HTML5 tags (like <section>), and messes with the DOCTYPE.

Are there any extensions to Hpricot, or perhaps a flag I need to set, that will allow HTML5 documents to be parsed correctly?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

潦草背影 2024-09-09 02:42:47

我知道它可以解决直接问题,但我建议您尝试 Nokogiri http://nokogiri.org/ 作为在您的问题帖子的一些评论中提到。我在解析任何 HTML/XML(如结构化文本)(包括 HTML5)时没有遇到任何问题。

I know it kind of works around the direct question but I would suggest you try Nokogiri http://nokogiri.org/ as mentioned in some of the comments on your question post. I've had no issues with it parsing any HTML/XML like structured text, including HTML5.

暗喜 2024-09-09 02:42:47

我认为 Hpricot 的 to_original_html 方法正是您所要做的寻找。

从文档,to_original_html

尝试保留文档的原始 HTML,只为已更改的元素输出新标签。

I think Hpricot's to_original_html method is exactly what you're looking for.

From the docs, to_original_html

Attempts to preserve the original HTML of the document, only outputing new tags for elements which have changed.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文