Stax Parser 解析 CDATA 值

发布于 2024-09-25 22:36:43 字数 334 浏览 1 评论 0原文

我正在使用 Stax 实现 SJSXP1.0。因此,它一直运行良好,但现在面临着一个奇怪的问题。

正在解析的 XML 包含格式错误的 HTML 片段作为某些标记的值。这些值包含在 CDATA 部分中,因为我们希望解析器不会解析 CDATA(就像我们之前使用的 DOM 解析器的情况一样)。但是当我们使用 STax 时,parser.next() 方法失败,如下所示 javax.xml.stream.XMLStreamException:[行,列]处的解析错误:[1374,10] 消息:元素类型“col”的结束标记必须以“>”结尾delimiter

有没有办法告诉解析器完全忽略 CDATA 标签并将它们作为值读取

I am using Stax Implementation SJSXP1.0. As such it has been working great but facing a wierd issue now.

The XML being parsed contain malformded HTML snippets as values of some of the tags. These values are enclosed in CDATA section as we expected CDATA not to be parsed by the parser (as was the case for us with DOM parser which we used sometime back). But when we use STax, parser.next() method fails as following
javax.xml.stream.XMLStreamException: ParseError at [row,col]:[1374,10]
Message: The end-tag for element type "col" must end with a '>' delimiter

Is there a way for me to tell the parser to ignore CDATA tags completely and just read them as values

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

各空 2024-10-02 22:36:43

我认为不可能以这种方式改变解析器的行为,因为 XML 格式本身嵌入在解析器中,你不能用它做任何事情。但这并不妨碍您捕获异常并围绕它制定一些逻辑。

I think there is no possibility to change parser behavior in that way, cause XML format itself is embedded in the parser and you cannot do anything with that. But this doesn't preclude you from catching the exception and making some logic around it.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文