当前位置：文江博客话题详情

如何在数据库中最好地存储大型 JSON 文档（2+ MB）？

发布于 2024-08-15 20:06:59 字数 164 浏览 3 评论 0原文

在数据库中存储大型 JSON 文件的最佳方法是什么？我了解 CouchDB，但我很确定它不支持我将使用的大小的文件。

我不愿意从磁盘上读取它们，因为读取然后更新它们需要时间。该文件是一个包含约 30,000 个元素的数组，因此我认为当我尝试选择所有元素时，将每个元素单独存储在传统数据库中会杀了我。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

千里故人稀 2024-08-22 20:06:59

我在 CouchDB 中有很多超过 2megs 的文档，它可以很好地处理它们。这些限制已经过时了。

唯一需要注意的是，默认的 javascript 视图服务器有一个相当慢的 JSON 解析器，因此对于大型文档，视图生成可能需要一段时间。您可以将我的 Python 视图服务器与基于 C 的 JSON 库（jsonlib2、simplejson、yajl）一起使用或者使用内置的 erlang 视图，它甚至不会影响 JSON 序列化，并且视图生成会非常快。

回复收藏 0 原文

去了角落 2024-08-22 20:06:59

如果您打算一次访问一个（或多个）特定元素，则无法将大型 JSON 分解为传统的数据库行和列。

如果您想一次性访问它，您可以将其转换为 XML 并将其存储在数据库中（甚至可以压缩 - XML 具有高度可压缩性）。大多数数据库引擎都支持存储 XML 对象。然后，您可以一次性读取它，如果需要，可以使用 SAX 等前向读取方法或任何其他高效的 XML 读取技术将其转换回 JSON。

但正如 @therefromhere 评论的那样，你总是可以将它保存为一个大字符串（我会再次检查压缩它是否会增强任何东西）。

回复收藏 0 原文

一紙繁鸢 2024-08-22 20:06:59

这里你实际上没有多种选择，你可以使用诸如memcached之类的东西将它们缓存在RAM中，或者将它们推送到磁盘上，并使用databsae（RDBMS，例如PostgreSQL/MySQL或DOD，例如沙发数据库）。唯一真正的替代方案是混合系统，将最常访问的文档缓存在 memcached 中以供阅读，这就是许多网站的运作方式。

2+MB 对于数据库来说并不是什么大问题，只要您有足够的 RAM，它们就会足够智能地进行缓存并有效地使用您的 RAM。您是否有访问这些文档的时间和频率以及您必须为多少用户提供服务的频率模式？

回复收藏 0 原文

~没有更多了~