如何配置 nekohtml 解析器以正确关闭锚标记?

发布于 2024-12-09 11:16:43 字数 588 浏览 1 评论 0原文

我正在使用 nekohtml 解析器来解析我的 html 代码。有时我在使用锚标记时犯了这样的错误,内容是这样写的。

abc

之后通过 nekohtml 解析我希望内容像这样更正。

abc

对于要实现此目的,请帮助配置 nekohtml 解析。

更新:

在我尝试将设置设置为

parser.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

后这是没有用的。我没有给出我预期的结果。它返回与我给定的相同的 html 内容

I'm using the nekohtml parser to parse my html code. Sometime my mistake while using anchor tag the content has been written like this.

<a href="http://abc.com"><a href="http://abc.com">abc</a></a>

After parsing throough the nekohtml i want the content to corrected like this.

<a href="http://abc.com"></a><a href="http://abc.com">abc</a>

For this to achieve please help to configure the nekohtml parsing.

Update:

After i tried with settings as

parser.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

it is of no use. i doesn't give the result as i expected. it returns the same html content as i given

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

假装爱人 2024-12-16 11:16:43

需要设置一个 balance-tags 功能来指定 NekoHTML 解析器是否应尝试平衡已解析文档中的标签。

config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

来自文档:

  • 平衡标签通过添加缺少的父元素、使用可选结束标签自动关闭元素以及更正不平衡的内联元素标签来修复许多常见错误。为了将 HTML 文档作为 XML 进行处理,不应关闭此功能。提供此功能是为了增强应用程序的性能,这些应用程序只关心特定元素、属性和/或内容的外观,而不管文档的结构是否不正确。

Need to set a balance-tags feature that specifies if the NekoHTML parser should attempt to balance the tags in the parsed document.

config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

from the docs:

  • Balancing the tags fixes up many common mistakes by adding missing parent elements, automatically closing elements with optional end tags, and correcting unbalanced inline element tags. In order to process HTML documents as XML, this feature should not be turned off. This feature is provided as a performance enhancement for applications that only care about the appearance of specific elements, attributes, and/or content regardless of the document's ill-formed structure.
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文