如何通过在属性周围添加引号来清理用于 Java 解析的 XML 文件

发布于 2024-11-06 13:23:13 字数 480 浏览 0 评论 0原文

我有一系列 xml 文件,看起来像这样:

<ROOT>
    <F P=100> Some text here </F>
    <F P=101> More text </F>
    ...
</ROOT>

我试图使用标准 DOM 方式解析 xml,但由于 P 的属性值没有用引号引起来,Java 抱怨道。

我尝试使用 JTidy 来清理它,但因为我的 xml 不是 HTML,Tidy 会抛出错误,抱怨它无法识别标签 < /code> 等等

那么,还有其他方法可以做到这一点吗?或者,我想我可以使用正则表达式,因为唯一不带引号的属性出现在 标记中。有什么想法吗?

提前致谢

I have a series of xml files that looks something like this:

<ROOT>
    <F P=100> Some text here </F>
    <F P=101> More text </F>
    ...
</ROOT>

I'm trying to parse the xml using the standard DOM way, but because the attribute values for P are not in quotes, Java complains.

I tried using JTidy to clean it up, but because my xml isn't HTML, Tidy throws errors complaining that it doesn't recognize the tags <ROOT> and <F> etc.

So, is there another way to do this? Alternatively, I guess I could use regex since the only attributes without quotes occur in the <F> tags. Any thoughts on either?

Thanks in advance

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

£烟消云散 2024-11-13 13:23:13

我所要做的就是设置 tidy.setXmlTags(true) 以便 tidy 将输入视为 XML 而不是 HTML

– sheldon

All I had to do was set tidy.setXmlTags(true) so that tidy treats the input as XML and not HTML

– sheldon

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文