处理内存中的大型 XML 文档

发布于 2025-01-04 17:08:12 字数 362 浏览 3 评论 0原文

我需要在内存中保存大量 XML（很可能会使用 Oracle Coherence 作为分布式缓存）。期望在内存中保存 100,000 个 XML。这些 XML 相当大 - 大约。每个 250KB。其他系统会请求这些 XML - 它们仅请求与它们相关的部分 XML。此外，他们将要求更改 XML 的内容。负载约为每分钟 300 个此类请求，在检索和更新之间或多或少均匀分布。需要注意的是，XML 不是结构化的，因此我不会为它们提供 XSD，但我确实有提取和更新 XML 的算法。

我的问题是什么会产生更好的性能：将 XML 按原样保留在内存中，并使用 XQuery 甚至使用编码过程从其中提取所有数据和更新，或者将 XML 转换为对象，在其中操作它们代码，然后在其他系统请求时将它们转换回 XML？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我的鱼塘能养鲲 2025-01-11 17:08:12

您有 100,000 个 250 KB 的文档。这使得大约。 24 GB 原始数据。如果您将其放入内存中并希望能够对其进行处理、过滤或更新，您将拥有额外的溢出系数（假设为 10）。那么您最终会获得所需的 240 GB 内存容量。

因此，如果您有足够的可用内存，那么这当然是存放它的最佳位置。但是您需要有一个后备策略（如果节点数量超出内存会发生什么？），如果您不想丢失更新，情况会变得更加复杂：如果机器出现故障会发生什么？如果更新内存：什么时候将更新刷新到磁盘？还有更多的事情需要思考。

然而，回答你的第二个问题：是否转变成物体？大多数人都倾向于使用 PHP、Ruby、Java、“.NET”等将 XML 转换为对象，甚至将 XML 存储在 SQL 数据库中。如果您想听到诚实的答案：如果您没有足够的时间和金钱可以浪费，请不要这样做。对象引入了额外需要的分析、设计、解析、编组、测试、维护的大量开销……事实上，这完全消除了 XML 的灵活性，而且我发现这一点一直被低估。根据我使用 XML 和 XQuery 的经验，在我上面列出的事情上，平均可以节省 80% 左右。

另外，如果您将灵活的 XML 数据强行放入对象中，那么如果您的数据结构发生变化，您将面临一场噩梦。

您可能想查看 28msec's Scalable Database forflexible data 这是云中的 PAAS。在那里，您可以获得开箱即用所需的一切（包括负载平衡、自动恢复、持久性管理、复制、备份、自动故障转移、缩放、弹性、内存管理、分片……）。

这只是我个人的观点，但也许它至少有助于您解决问题的更多方面。

回复收藏 0 原文