将文档作为 Blob 存储在数据库中 - 有什么缺点吗？

发布于 2024-07-08 00:30:18 字数 399 浏览 15 评论 0原文

我的文档管理系统的要求是：

必须通过简单地复制目录、文件等来防止盗窃。
必须能够防止传统病毒感染（物理文件的感染）必须
能够快速检索
存储库必须对临时人员不可见（目录）浏览用户等。

我决定将所有文档（和扫描图像）作为 blob 存储在数据库中，到目前为止，我的体验非常好，文档检索也快得令人眼花缭乱 - 它满足上面的所有标准，甚至还有还有一些额外的优点，例如自动存储文档及其相关实体、轻松快速地搜索内容、消除围绕打开和命名文档等的各种用户活动等。

我的问题是 - 有什么严重的问题吗？在这种设计和实施中我忽略了风险或事情吗？

编辑注意：DB 是 PostgreSQL，可以很好地处理 BLOBS 并且扩展性非常好。环境是多用户。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

好多鱼好多余 2024-07-15 00:30:19

我经常听说使用 blob 的主要缺点是，超过一定大小时，文件系统在存储和检索大文件方面要高效得多。听起来您已经在您的要求列表中考虑到了这一点。

这里有一个很好的参考资料（PDF），涵盖了优点和缺点斑点。

回复收藏 0 原文

极度宠爱 2024-07-15 00:30:19

根据我的经验，一些问题是：

速度与文件系统上有文件。
缓存。 IMO 网络服务器
会做更好的缓存工作
静态内容。 DB将做一个
干得也不错，但如果数据库也是
处理各种其他查询，
不要指望那些大文档
长时间保持缓存。你
本质上必须转移
文件两次。一旦从数据库到
Web 服务器，然后是 Web 服务器
客户端。
内存限制。在我的上一份工作中，我们的数据库中有一个 40MB 的 PDF，并且日志文件中不断出现 Java OutOfMemoryErrors。我们最终意识到，由于 Hibernate ORM 中的设置，整个 80MB PDF 不仅被读入堆一次，而且两次（如果对象是可变的，它会在内存中创建一个副本以进行编辑）。 PDF 流式传输回用户后，堆就被清理了，但是为了流式传输文档而一次从堆中吸出 80MB 是一个很大的打击。了解您的代码以及如何使用内存！

您的网络服务器应该能够处理您的大部分安全问题，但是如果文档很小并且数据库还没有承受很大的负载，那么我认为将它们放在数据库中并不是什么大问题。

回复收藏 0 原文

狂之美人 2024-07-15 00:30:19

我刚刚开始研究 SQL Server 2008 的 BLOB FILESTREAMing，并且遇到了一个巨大的限制（IMO）——它只能与集成安全性一起使用。如果不使用 Windows 身份验证连接到数据库服务器，则无法读取/写入 BLOB。许多应用程序环境无法使用Windows身份验证。当然不是在异构环境中。

必须存在更好的存储 BLOB 的解决方案。最佳实践是什么？

回复收藏 0 原文

晨敛清荷 2024-07-15 00:30:19

这篇文章涵盖了大部分问题。如果您使用的是 SQL Server 2008，请查看 Paul Randal 讨论的新 FILESTREAM 类型的使用此处。

回复收藏 0 原文

清风疏影 2024-07-15 00:30:19

这取决于数据库类型。 Oracle 还是 SQL Server？请注意一个缺点 - 恢复单个文档。

回复收藏 0 原文

盛装女皇 2024-07-15 00:30:19

根据我的经验，在 SQL Server 和 Oracle 中将内容文件存储为 blob 可以在小型数据库和少量登录用户的情况下正常工作。
ECM 系统将它们分开并使用单独的服务来传输内容。根据文件的大小，同时检索大文件可能会影响服务器资源。由于恢复时间长且无法从存档中检索文档，具有大量文件集的数据库存档会出现问题。

如果这些文件是公司记录，并且这是记录的权威副本，则您可能会遇到合规性和保留管理问题，尤其是在存档文件时。搜索和版本控制也可能成为未来的一个大问题。

您可能想要研究具有某种 API 的 ECM 系统，而不是重新发明轮子。

回复收藏 0 原文