如何在 2MB RAM 中对 100 万个 32 位整数进行排序？

发布于 2024-07-06 20:31:52 字数 117 浏览 7 评论 0原文

请提供您选择的语言的代码示例。

更新：对外部存储没有设置限制。

示例：通过网络接收/发送整数。本地磁盘有足够的空间用于保存中间结果。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我很坚强 2024-07-13 20:31:52

将问题分成足够小的部分以适合可用内存，然后使用合并排序将它们组合起来。

回复收藏 0 原文

失去的东西太少 2024-07-13 20:31:52

对 2MB 中的一百万个 32 位整数进行排序Guido van Rossum 使用 Python 构建 RAM

回复收藏 0 原文

や莫失莫忘 2024-07-13 20:31:52

100 万个 32 位整数 = 4 MB 内存。

您应该使用某种使用外部存储的算法对它们进行排序。例如，合并排序。

回复收藏 0 原文

一指流沙 2024-07-13 20:31:52

您需要提供更多信息。有什么额外的存储空间可用？你应该将结果存储在哪里？

否则，最普遍的答案是：
1. 将前半部分数据加载到内存（2MB），用任意方法排序，输出到文件。
2.将后半部分数据加载到内存中（2MB），用任意方法排序，保留在内存中。
3. 使用合并算法将已排序的两半进行合并，并将完整的已排序数据集输出到文件中。

回复收藏 0 原文

三月梨花 2024-07-13 20:31:52

这篇有关外部排序的维基百科文章提供了一些有用的信息。

回复收藏 0 原文

那请放手 2024-07-13 20:31:52

双锦标赛排序与多阶段合并

#!/usr/bin/env python
import random
from sort import Pickle, Polyphase


nrecords = 1000000
available_memory = 2000000 # number of bytes
    #NOTE: it doesn't count memory required by Python interpreter 

record_size = 24 # (20 + 4) number of bytes per element in a Python list
heap_size = available_memory / record_size 
p = Polyphase(compare=lambda x,y: cmp(y, x), # descending order
              file_maker=Pickle, 
              verbose=True,
              heap_size=heap_size,
              max_files=4 * (nrecords / heap_size + 1))

# put records
maxel = 1000000000
for _ in xrange(nrecords):
    p.put(random.randrange(maxel))

# get sorted records
last = maxel
for n, el in enumerate(p.get_all()):
    if el > last: # elements must be in descending order
        print "not sorted %d: %d %d" % (n, el ,last)
        break
    last = el

assert nrecords == (n + 1) # check all records read

Dual tournament sort with polyphased merge

#!/usr/bin/env python
import random
from sort import Pickle, Polyphase


nrecords = 1000000
available_memory = 2000000 # number of bytes
    #NOTE: it doesn't count memory required by Python interpreter 

record_size = 24 # (20 + 4) number of bytes per element in a Python list
heap_size = available_memory / record_size 
p = Polyphase(compare=lambda x,y: cmp(y, x), # descending order
              file_maker=Pickle, 
              verbose=True,
              heap_size=heap_size,
              max_files=4 * (nrecords / heap_size + 1))

# put records
maxel = 1000000000
for _ in xrange(nrecords):
    p.put(random.randrange(maxel))

# get sorted records
last = maxel
for n, el in enumerate(p.get_all()):
    if el > last: # elements must be in descending order
        print "not sorted %d: %d %d" % (n, el ,last)
        break
    last = el

assert nrecords == (n + 1) # check all records read

回复收藏 0 原文