禁用 Nokogiri 中的错误纠正

发布于 2024-12-07 16:41:10 字数 243 浏览 0 评论 0原文

我正在处理许多格式错误的 HTML 页面。至少,我认为它们格式错误,因为当我在 Nokogiri 中解析它们然后执行 to_html 时,元素不再正确显示。然而,当我用 Hpricot 解析它们时,它们显示正确。

我宁愿不使用 Hpricot,因为似乎不可能将 Hpricot::Elem 实例添加到文档中(不将它们转换为字符串,添加,然后再次解析)。

我可以禁用 Nokogiri 的纠错功能,以便保留 HTML 使其更接近其编写方式吗?

I'm working with a number of malformed HTML pages. At least, I presume they're malformed because when I parse them in Nokogiri and then execute to_html, elements don't appear correctly anymore. When I parse them with Hpricot, however, they display correctly.

I'd rather not use Hpricot because it appears to be impossible to add Hpricot::Elem instances to a document (without converting them to strings, adding, then parsing again).

Can I disable Nokogiri's error correction so that I can preserve the HTML closer to the way it was written?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

请持续率性 2024-12-14 16:41:10

您的 XHTML 不是有效的 XHTML。如果我从 http://pastie.org/2638305 复制内容,请将它们另存为“foo.xhtml”并然后尝试在 Chrome 中打开它们,我看到:

此页面包含以下错误:
第 768 行第 39 列错误:属性构造错误

如果我查看第 768 行,我会看到(截断):

<img src="..." alt="Talk to us now!"http://wholesaleinsurance.net/>

如您所见,这显然在语法上无效。

您声称您通过 validator.w3.org 运行了该页面,但是当我对您的馅饼内容执行此操作时,我得到:

检查此文档是否符合 XHTML 1.0 Strict 时发现错误!
结果:15 个错误,3 个警告

那么...您的实际内容不是您放入馅饼中的内容吗?

Your XHTML is not valid XHTML. If I copy the contents from http://pastie.org/2638305, save them as 'foo.xhtml' and then attempt to open them in Chrome, I see:

This page contains the following errors:
error on line 768 at column 39: attributes construct error

If I look on line 768 then I see (truncated):

<img src="..." alt="Talk to us now!"http://wholesaleinsurance.net/>

As you can see, that is clearly not syntactically valid.

You claim that you ran the page through validator.w3.org, but when I do that with the contents of your pastie I get:

Errors found while checking this document as XHTML 1.0 Strict!
Result: 15 Errors, 3 warning(s)

So...is your actual content not what you put in the pastie?

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文