使用 XMLBeans 或 EMF 部分加载 xml 文件

发布于 2025-01-06 02:22:41 字数 521 浏览 0 评论 0原文

目前我正在使用 EMf 读取约 400 个 xml 文件。每个文件大约有 100.000 行,由描述性数据(~10%,类似 ID 和对其他元素的引用)和真实数据(~90%,长字符串/文本)组成。

我的问题是当我读取所有文件时出现 OutOfMemoryExceptions。我的解决这个问题的想法是:仅加载 ID 等,如果用户尝试访问当前未加载的数据,它将在后台加载。

关于如何使用 EMF 或 XMLBeans 实现这一点有什么想法吗?

编辑:

我的 XML 具有以下结构:

<A>
 <B>
  <C></C>
  <C></C>
 </B>
 <B>
  <C></C>
 </B>
</A>

我想在任何情况下加载根节点。在此示例中,我想跳过节点 C,以便我的对象树如下所示

A
|-B
\-B

currently i'm using EMf to read ~400 xml files. Each file has about 100.000 lines and consists of descriptive Data (~10%, something like IDs and reference to other elements) and real Data (~90%, long strings/texts).

My Problem is when i read all files i get OutOfMemoryExceptions. My idea to solve this: only load the IDs etc. and if the user tries to access data that is currently not loaded it will be loaded in the background.

Any idea on how to achieve this with EMF or XMLBeans?

edit:

my XML has this structure:

<A>
 <B>
  <C></C>
  <C></C>
 </B>
 <B>
  <C></C>
 </B>
</A>

I want to load the root node in any case. In this example i want to skip the nodes C so that my Object tree looks like this

A
|-B
\-B

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

转身泪倾城 2025-01-13 02:22:41

对于大型 XML 文件,最好使用流式 XML 解析器,而不是立即读取整个文件并从中构建 DOM 的解析器。最新且最好的方法是使用 StaX(XML 流 API)。您可能还听说过 SAX

For large XML files, you're much better off using a streaming XML parser instead of one that reads the whole file in at once and builds a DOM from it. The latest and greatest way to do that is using StaX (Streaming API for XML) from Sun/Oracle. You also may have heard about SAX.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文