存储大量数据：数据库还是文件系统？

发布于 2024-08-18 06:49:29 字数 214 浏览 8 评论 0原文

假设我的应用程序创建、存储和检索大量条目（数千万）。每个条目具有可变数量的不同数据（例如，某些条目仅具有几个字节，例如ID/标题，而某些条目可能具有兆字节的补充数据）。每个条目的基本结构相同，并且采用 XML 格式。

条目是任意创建和编辑的（很可能是通过附加，而不是重写）。

将条目作为单独的文件存储在文件系统中，同时在数据库中保留必要的索引集与将所有内容保存在数据库中是否有意义？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冬天旳寂寞 2024-08-25 06:49:29

这实际上取决于您将如何使用它。数据库可以处理表中的条目比大多数人想象的要多，特别是在适当的索引的情况下。另一方面，如果您不打算使用关系数据库提供的功能，则可能没有太多理由使用它。

好吧，概括得够多了。无论如何，鉴于数据库最终归结为“磁盘上的文件”，我不会太担心“正确的做法”是什么。如果数据库的主要目的只是有效地检索这些文件，我认为保持数据库条目较小并查找文件路径而不是实际数据是完全可以的 - 特别是因为您的文件系统在检索数据方面应该非常有效给定特定位置。

如果您感兴趣，这实际上是搜索引擎的常见数据存储模式 - 索引将存储索引数据和指向磁盘上存储数据的指针，而不是将所有内容存储在索引中。

回复收藏 0 原文

秋千易 2024-08-25 06:49:29

我肯定会将数据存储在文件系统上，并将哈希存储在数据库中的路径。

回复收藏 0 原文

凶凌 2024-08-25 06:49:29

好吧，根据您的成本，MS SQL Server 具有可以创建的所谓“主 XML 索引”，甚至可以在非结构化数据上创建。这允许您编写 XQuery 来搜索列，数据库将为您提供帮助。

如果数据中存在任何一致性，或者可以将其放入模式中，那么您可能会看到这样做的好处。

如果您有大量二进制数据（例如图像等），我是否建议您将它们剥离出来并将它们放置在其他地方，例如文件系统。或者，如果您使用 2008，则有一种名为“Filestream”（欢呼@Marc_s）的类型，它允许您索引、存储和保护您写下的所有文件，并使用 NTFS API 检索它们（即快速块传输），但仍然保留它们作为列保存在数据库中。

如果您的应用程序对搜索 XML 数据有很大的要求，那么拥有数据库可能会为您提供良好的抽象层和扩展性，而这意味着您不必这么做。

只是我的2c。

回复收藏 0 原文