当前位置：文江博客话题详情

XML DOM libxml2 xerces Java

来自 java 的 libxml2

发布于 2024-09-19 03:55:56 字数 1008 浏览 16 评论 0原文

这个问题有点相关 Java 中小型、简单文档的最快 XML 解析器但还有一些细节。

我正在开发一个需要解析许多（数十百万）小型（大约 300k）xml 文档的应用程序。当前的实现使用 xerces-j，在 1.5 GHz 机器上每个 xml 文档大约需要 2.5 毫秒。我想提高这个性能。我看到这篇文章

http ://www.xml.com/pub/a/2007/05/16/xml-parser-benchmarks-part-2.html

声称 libxml2 的解析速度比任何 java 解析器快一个数量级。我不确定我是否相信，但这引起了我的注意。 有人尝试过从 jvm 使用 libxml2 吗？如果是这样，它比 java dom 解析（xerces）更快吗？ 我想我仍然需要我的 java dom 结构，但我猜测从 c 结构的 dom 复制到 java-dom 应该不用多久。我必须有 java-dom - 在这种情况下 sax 不会帮助我。

更新：我刚刚为 libxml2 编写了一个测试，它并不比 xerces 快……尽管我的 C 编码能力非常生疏。

更新我在这里扩大了问题的范围：为什么 sax 解析比dom解析？ stax 是如何运作的？我对抛弃 dom 的可能性持开放态度。

谢谢

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

怼怹恏 2024-09-26 03:55:57

在 Java 中，StAX JSR-173 通常被认为是最快的解析方法XML。 StAX 有多种实现，Woodstox 实现通常被认为速度很快。

为了提高性能，我会避免使用 DOM。你用 XML 做什么？如果您最终将其作为对象处理，则应该考虑 OXM 解决方案。标准是 JAXB JSR-222。 JAXB 实现，例如 MOXy（我是技术负责人）甚至允许您执行以下操作：可以提高性能的部分映射：

http://bdoughan .blogspot.com/2010/09/xpath-based-mapping-geocode-example.html

回复收藏 0 原文

微暖i 2024-09-26 03:55:57

首先，你的问题不包含问题。你想知道什么？

我想您正在使用 JNI 将 c-dom 转换为 java-dom。我不知道是否有官方数字，但根据我的经验，c+JNI 通常比直接在 java 中执行要慢。

如果你真的想加快处理速度，请尝试摆脱 dom（为什么需要它？也许我们可以一起想一个解决方案）。如果所有 xml 文件具有相同的架构，请使用您自己的专用数据模型（和 SAX 解析器）。

如果您只使用 xml 的子集（即没有命名空间，只有很少的属性），请考虑编写自己的解析器来直接生成更高效的 java 对象（但我不建议这样做）。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

櫻之舞

文章 0 评论 0

弥枳

文章 0 评论 0

m2429

文章 0 评论 0

寻找一个思念的角度

文章 0 评论 0

野却迷人

文章 0 评论 0

我怀念的。

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文