Java 内存有限环境中的智能缓冲

发布于 2024-11-24 08:57:18 字数 601 浏览 2 评论 0原文

亲爱的 StackOverflowers，

我正在编写一个应用程序，用于对二进制文件中的大量整数进行排序。我需要尽快完成此操作，主要的性能问题是磁盘访问时间，因为我进行了大量读取，这会显着减慢算法速度。

执行此操作的标准方法是用某种类型的缓冲对象（BufferedInputStream 等）填充约 50% 的可用内存，然后将整数从缓冲对象传输到整数数组中（这会占用剩余的可用空间））并对数组中的整数进行排序。将排序后的块保存回磁盘，重复该过程，直到整个文件被拆分为排序后的块，然后将这些块合并在一起。对块进行排序的策略仅利用 50% 的可用内存，因为数据本质上是重复的（50% 用于缓存，50% 用于阵列，同时它们存储相同的数据）。

我希望我可以通过编写自己的缓冲类来优化算法的这个阶段（对块进行排序），该类允许将数据直接缓存到 int 数组中，以便该数组可以占用所有可用空间，而不仅仅是 50%它，这将使该阶段的磁盘访问次数减少 2 倍。问题是我不知道从哪里开始。

编辑：本质上，我想找到一种通过仅对文件执行一次读取来填充整数数组的方法。另一个限制是数组必须使用大部分可用内存。

如果我所做的任何陈述是错误的或至少看起来是错误的，请纠正我，

任何帮助表示赞赏，

问候

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

山有枢 2024-12-01 08:57:20

您可能想查看 Java NIO 库，特别是文件通道和 Int 缓冲区。

回复收藏 0 原文

表情可笑 2024-12-01 08:57:20

你没有给出很多提示。但我想到了两件事。首先，如果你有很多整数，但没有那么多独特的值，桶排序可能是解决方案。

其次，当我听到这个词（好的术语）时，我的脑海中尖叫着：外部磁带排序。在早期的计算机时代（即石器时代），数据依赖于磁带，并且很难对分布在多个磁带上的数据进行排序。这与你的情况非常相似。事实上，合并排序是当时最常用的排序，据我所知，Knuths TAOCP 有一个关于它的很好的章节。关于缓存、缓冲区等的大小，可能有一些很好的提示。

回复收藏 0 原文