用于 XML 的 java api - 带磁盘备份的 dom 处理
我有一个大的 XML 文档(50G+)需要处理。加载这个到普通的dom(saxon)需要160G以上。没有那么多 RAM 或交换空间。
有没有提供基于HA磁盘的DOM树的库? Java 有什么东西吗?
I have a large XML document (50G+) to process. Loading this to normal dom (saxon) require more than 160G. Not that much RAM or swap space.
Is there any library that provides h a disk based DOM tree? Any thing for Java?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
不,据我所知,所有 DOM 实现都是内存限制的。
您应该使用流解析器,例如 StAX 或 Xpp3。
No, afaik all DOM implementations are memory bound.
You should use a streaming parser like StAX or Xpp3.