按需将数据从文件加载到集合的最有效方法是什么？

发布于 2024-08-25 03:18:53 字数 567 浏览 9 评论 0原文

我正在开发一个java项目，该项目将允许用户解析可能有数千行的多个文件。解析的信息将存储在不同的对象中，然后将这些对象添加到集合中。

由于 GUI 不需要一次加载所有这些对象并将它们保留在内存中，因此我正在寻找一种从文件加载/卸载数据的有效方法，以便仅在用户请求时将数据加载到集合中。

我现在只是评估选项。我还考虑过以下情况：将数据子集加载到集合中并将其呈现在 GUI 上之后，重新加载先前观察到的数据的最佳方法是。重新运行解析器/填充集合/填充 GUI？或者可能找到一种方法将集合保存到内存中，或者序列化/反序列化集合本身？

我知道如果执行某种数据过滤，加载/卸载数据子集可能会变得很棘手。假设我根据 ID 进行过滤，因此我的新子集将包含来自之前分析的两个子集的数据。这不会有问题，因为我在内存中保留了整个数据的主副本。

我读到，谷歌集合在处理大量数据时非常有效且高效，并且提供了简化许多事情的方法，因此这可能提供了一种替代方案，让我可以将集合保留在内存中。这只是一般性的谈论。使用什么集合的问题是一个单独且复杂的问题。

您知道针对此类任务的一般建议是什么吗？我想听听您对类似情况做了什么。

如果需要，我可以提供更多细节。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

燕归巢 2024-09-01 03:18:53

您可以将数据库嵌入到应用程序中，例如 HSQLDB。这样，您可以第一次解析文件，然后使用 SQL 执行简单和复杂的查询。

HSQLDB（HyperSQL 数据库）是
领先的 SQL 关系数据库引擎
用Java编写的。它有一个 JDBC 驱动程序
并支持几乎完整的 ANSI-92 SQL
（BNF树格式）加上很多SQL：2008
增强功能。它提供了一个小而快速的
提供内存中的数据库引擎
以及基于磁盘的表和支持
嵌入式和服务器模式。
此外，它还包括诸如
作为命令行 SQL 工具和 GUI
查询工具。

回复收藏 0 原文

日记撕了你也走了 2024-09-01 03:18:53

如果您有大量数据、大量文件，并且内存不足，则可以对文件进行初始扫描以对其建立索引。如果文件按换行符分为记录，并且您知道如何读取记录，则可以按字节位置索引记录。稍后，如果您想读取一组特定的索引，您将进行快速查找以找到需要读取的字节范围，并从文件的输入流中读取这些字节范围。当你不再需要这些物品时，它们将被GCed。您永远不会在堆中容纳比您需要的更多的项目。

这将是一个简单的解决方案。我相信您可以找到一个库来为您提供更多功能。

回复收藏 0 原文

~没有更多了~