当前位置：文江博客话题详情

使用较小的物理内存对 10 亿个整数进行排序

发布于 2024-12-01 19:32:24 字数 223 浏览 0 评论 0原文

想要对 10 亿个整数进行排序，而我的系统只有 1 GB RAM。最快、最有效的排序方法是什么？

假设我们在文本文件中输入了一个每行一个整数。
我们正在使用java程序来排序。
我已指定 RAM，因为我们无法在 RAM 中保存所有输入整数。

更新： 整数是 7 位数字。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

寂寞陪衬 2024-12-08 19:32:24

整数是 7 位数字。

所以只有一千万个可能的值。

您有 1GB 内存。创建一个计数器数组，每个计数器对应一个可能的值。

通读一次文件，对计数器进行计数。

完成后，根据最终计数器值输出数字。

每个数字最多可以出现 10 亿次。所以32位计数器就足够了。这意味着 10M x 4 字节 = 40M 字节数组。

回复收藏 0 原文

初吻给了烟 2024-12-08 19:32:24

最简单的方法是将输入分解为适合内存的较小文件并对每个文件进行排序，然后合并结果。

Guido van Rossum 对做事有很好的描述这在Python中虽然显然不是同一种语言，但原理是相同的。

回复收藏 0 原文

注定孤独终老 2024-12-08 19:32:24

您指定对十亿个 7（十进制）数字进行排序。

如果没有重复项，您可以使用基数排序在内存中以 10⁷ 位进行排序。由于必须有重复项（10⁷ 小于 10⁹），因此您可以使用（例如）10⁷ 8 的数组来实现基数排序位计数器，使用 HashMap 来处理相对较少的计数器溢出情况。或者只是一个由 10⁷ 32 位计数器组成的数组。

另一种更通用的方法（适用于任何类型的值）是将文件拆分为 N 个较小的子文件，对内存中的每个子文件进行排序，然后对排序后的子文件执行 N 路合并。

回复收藏 0 原文

一刻暧昧 2024-12-08 19:32:24

使用具有 40 亿个可能值的 BitSet 会占用 512 MB。只需设置您看到的所有 int 值并按顺序写出它们（它们是自然排序的）

这仅在您不关心重复项时才有效。

如果计算重复项很重要，我仍然会考虑使用内存映射文件进行计数，或者使用已排序的数据子部分的合并排序。（我相信后者是预期的答案）

我最近以不到 1000 英镑的价格购买了一台 24 GB 的 PC，因此除非受到托管解决方案的限制，否则几 GB 并不算多。（或使用移动设备）

回复收藏 0 原文

空‖城人不在 2024-12-08 19:32:24

假设每个整数恰好出现一次，您可以读取文件，并且对于您找到的每个数字设置一位 - 位数组必须保存 10000000 位 - 这仅使用 1,28 MB RAM，应该可用...之后读取所有整数，您只需遍历数组并输出设置位的数字...

回复收藏 0 原文

~没有更多了~

关于作者

琉璃繁缕

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

使用较小的物理内存对 10 亿个整数进行排序

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

使用较小的物理内存对 10 亿个整数进行排序

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。