当前位置：文江博客话题详情

XML database-design Java xml-parsing file-exists

JAVA：文件存在与搜索大型 xml 数据库

发布于 2024-12-28 08:50:12 字数 515 浏览 1 评论 0原文

我对 Java 编程很陌生，正在编写我的第一个桌面应用程序，该应用程序采用唯一的 isbn 并首先检查它是否已全部准备好保存在本地数据库中，如果是，则它只是从本地数据库读取，如果它不是从 isbndb.com 请求数据并将其输入到数据库中，而是本地数据库采用 XML 格式。现在我想知道的是，在检查条目是否全部准备好时，以下两种方法中哪一种会产生最少的开销。

方法 1.) 文件存在。

在创建所述数据库条目时，应用程序将为每个 isbn 编号创建一个名为 isbn number.xml（即 3846504937540.xml）的单独文件，并且在检查时将使用文件存在方法来检查是否使用用户提供的 isbn 准备好条目存在。

方法 2.) SAX XML 解析器。

所有条目都将输入到一个大型 XML 文件中，在检查现有条目时，将使用 SAX XML 解析器来解析该文件，然后将用户提供的 isbn 与 XML DB 中的条目进行检查是否匹配。

笔记：随着时间的推移，生成的条目可能会达到数千个。

任何信息将不胜感激。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

逐鹿 2025-01-04 08:50:12

我认为你的方法都不是那么好。我强烈建议使用 DBMS 来存储数据。如果您的系统上没有 DBMS，或者您想要一个可以在没有安装 DBMS 的系统上运行的应用程序，请查看使用 SQLite。您可以通过 David Crawshaw 的 SQLiteJDBC 在 Java 中使用它。

就您的两种方法而言，第一种方法会产生大量文件混乱，更不用说维护和一致性问题了。一旦您拥有大量条目，第二种方法就会很慢，因为您基本上必须为每个查询读取（平均）一半的数据库。使用 DBMS，您可以通过为需要快速查找的信息定义索引来避免这种情况。 DBMS 将自动维护索引。

回复收藏 0 原文

轻许诺言 2025-01-04 08:50:12

我不太喜欢依赖文件系统来完成该任务：我不知道您的应用程序有多重要，但这些 xml 文件可能会发生很多事情:) 另外，如果文件夹变得非常非常大，您需要考虑将这些文件拆分为某些分层文件夹结构，以获得良好的性能。

另一方面，如果您需要频繁更新，我不明白为什么使用 xml 文件作为数据库。

我将使用关系数据库，并在表中为每个条目添加一条新记录，并在 isbn_number 列上添加索引。

如果您有数千条记录，您很可能会使用 sqlite，并且您可以将其替换为更多强大的非嵌入式数据库（如果您需要的话），无需（或很少:)）代码修改。

回复收藏 0 原文

好多鱼好多余 2025-01-04 08:50:12

我认为你最好使用 DBMS 而不是你的两种方法。

回复收藏 0 原文

野侃 2025-01-04 08:50:12

如果您希望检查存在性的开销最少，那么选项 1 可能就是您想要的，因为它是直接查找。在最坏的情况下，每次解析 XML 进行检查都需要遍历整个 XML 文件。虽然您可以使用选项 2 进行缓存，但这比选项 1 更复杂。

不过，使用选项 1 时，您需要注意一个目录下可以存储的文件数量是有限的，因此您可能必须存储 XML多层文件（例如/xmldb/38/46/3846504937540.xml）。

也就是说，从长远来看，您的选择都不是存储数据的好方法，您会发现随着数据的增长，它们变得相当具有限制性并且难以管理。

人们已经推荐使用 DBMS，我同意。最重要的是，我建议您研究基于文档的数据库（例如 MongoDB）作为您的数据库。

回复收藏 0 原文

凝望流年 2025-01-04 08:50:12

扩展您的数据库表，使其不仅包含 XML 字符串，还包含 ISBN 编号。
然后根据 ISBN 列选择 XML 列。

查询：Java转义，“从cacheTable中选择XMLString，其中isbn='”+ isbn +“'”

另一种方法可能是使用ORM，例如Hibernate< /strong>.
在 ORM 中，您不是将整个 XML 文档保存在一列中，而是为每个元素和属性使用不同的列，甚至可以将文档拆分为多个表，以实现更简单的长期设计。

回复收藏 0 原文

~没有更多了~

关于作者

顾北清歌寒

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

知足的幸福

文章 0 评论 0

我一向站在原地

文章 0 评论 0

慕烟庭风

文章 0 评论 0

秉忠贞之诚守退让之实

文章 0 评论 0

小兔几

文章 0 评论 0

mb_3y7WUgWY

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文