当前位置：文江博客话题详情

文档管理系统-数据库设计

发布于 2024-10-11 16:14:43 字数 495 浏览 8 评论 0原文

我正在用 Java 编写自己的文档管理系统 (DMS)（可用的系统不支持满足我的需求）。

这些文件应按照合格的 DublinCore 元数据标准进行描述。在我看来，最简单的方法是将键值对打包到具有 XML 表示形式的 RDF 模型中。

要存储所有文档的元数据，我有两个想法（文档文件将存储在文件系统中）：

将所有文档的所有元数据存储在单个 XML 文件中
为每个文档创建一个 XML 文件文档并将其存储在文件系统或 RDBMS（如 Java 的 H2 数据库引擎）中，键值数据库无法解决此问题，因为一个文档的键不是唯一的。

由于（许多）文档相互链接，第一种方法可能更适合分析数据，但第二种方法可能要快得多。

您会推荐哪种解决方案？或者还有更好的解决方案吗？

斯特凡

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

甜尕妞 2024-10-18 16:14:43

我不知道你的分析是如何工作的，但是如果你需要内存中的完整图形来进行分析，那么使用varie1（将所有文档的所有元数据存储在单个XML文件中），因为你不会得到任何好处（但只会得到好处）在这种情况下，来自变体 2 的额外工作）。

添加

如果变体 2 的额外工作不是太多，那么我推荐变体 2，因为它更可扩展。

您可以通过只编写一个小的 xml 文件而不是一个大的文件来更新或添加文档元数据
，这取决于您使用的 xml 解析器，但在某些情况下，解析一些较小的 xml 文件比解析一个大的文件更快（但这强烈取决于数据量）。

回复收藏 0 原文

睡美人的小仙女 2024-10-18 16:14:43

您是否考虑过使用 MongoDB 和 GridFS？ http://www.mongodb.org/display/DOCS/GridFS+Specification

您可以将文档以二进制形式直接存储在 MongoDB 中，甚至可以以您想要的任何格式存储该特定文件的关联元数据。即使文档具有相同的名称，它也能够存储它们，并且会生成自己的唯一 ID。

回复收藏 0 原文

神爱温柔 2024-10-18 16:14:43

顺便说一句：即使它不属于您的问题：请查看 JCR （Java Content存储库）实现如 JackRabbit。您可以使用它来存储文档，也许还可以存储元数据。

回复收藏 0 原文

半透明的墙 2024-10-18 16:14:43

我会研究像 Couch DB 这样的 NO SQL 文档解决方案，看看它是否可以帮助您。

我不喜欢文件系统解决方案；那里没有任何抽象可以帮助你。

回复收藏 0 原文

平定天下 2024-10-18 16:14:43

如果您总是访问所有文档，那么您的方法不会比其他方法慢。但我推荐第二种方法。在分析数据时，您需要读取所有文档，因此无论它们在不同文件中还是在一个文件中都没有区别......

回复收藏 0 原文

~没有更多了~

关于作者

暮凉

暂无简介

0 文章

0 评论

24 人气

关注发私信

Gabu-gabumon

文章 0 评论 0

关注

qq_CgiN62

文章 0 评论 0

关注

荔枝明

文章 0 评论 0

关注

赏烟花じ飞满天

文章 0 评论 0

关注

独守阴晴ぅ圆缺

文章 0 评论 0

关注

¤→小豸慧

文章 0 评论 0

友情链接

文江博客

文档管理系统-数据库设计

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签