Java - Collections.sort() 性能

发布于 2024-09-02 14:51:29 字数 348 浏览 0 评论 0原文

我正在使用 Collections.sort() 对元素实现 Comparable 接口的 LinkedList 进行排序，因此它们按自然顺序排序。在 javadoc 文档中，该方法使用 mergesort 算法，该算法具有 n*log(n) 性能。

我的问题是是否有更有效的算法来对我的 LinkedList 进行排序？

该列表的大小可能非常大，并且排序也将非常频繁。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

短暂陪伴 2024-09-09 14:51:29

O(N log N) 渐进性非常好。也就是说，存在线性时间O(N) 非比较排序，例如计数排序和桶排序。例如，当您要对数百万个整数进行排序，但它们在 1..10 之间时，这很有用。

此外，如果列表“几乎排序”，则在某些情况下，二次插入排序实际上会更好。

这是否适用，甚至是否值得实施，取决于您的分析结果。我想说，除非它表明这种类型是瓶颈，否则不要担心。

另请参阅

相关问题

有 O(n) 整数排序算法吗？

回复收藏 0 原文

ゃ人海孤独症 2024-09-09 14:51:29

如果您说列表将“非常频繁”地排序，那么您应该考虑始终以排序状态保存列表，例如使用树而不是 LinkedList。也许如果您没有任何重复的值并且不需要任何列表操作，您甚至可以使用一些SortedSet而不是List （因为你一直在对它们进行排序）。检查 TreeSet SortedSet 实现的类。

此实现为基本操作（添加、删除和包含）提供有保证的 log(n) 时间成本。

如果你想迭代这个“列表”（实际上是一个集合），你可以使用该类的迭代器。

按升序返回此集合中元素的迭代器。

如果列表中有重复的值，则必须使用一些技巧（例如将值放入一个新类中，该类还具有一些用于对相等对象进行排序的增量）

回复收藏 0 原文

筱武穆 2024-09-09 14:51:29

没有比 n*log(n) 更好的通用排序算法。而且这个速度相当快。一般来说，我的意思是您的数据没有特殊属性。

回复收藏 0 原文

怪我鬧 2024-09-09 14:51:29

我正在试验大型数据集（GB 的数据）并实现了合并排序（有一个很好的例子@googlecode）。然而，我使用 Collection.sort() 来预先排序我的临时缓冲区，根据我的经验，Collection.sort() 在一定的数据阈值下会变得非常慢。使用 96MB 的辅助缓冲区，我可以在大约 30 秒内对其中一个缓冲区进行排序（注意：这在很大程度上取决于您使用的比较器 - 我使用带有相当复杂的列解析器的自定义列布局），但是将其增加到 128MB 块大小时间跳到了3分钟多。这与我可以观察到的较小块的线性（或接近线性）行为无关。这具有如此大的影响，以至于在几乎（？）所有情况下，具有较小缓冲区的合并排序都比使用 128MB 缓冲区的内存排序更快。简而言之：合并排序是处理超过 100MB 边界的大型数据集的方法。我无法真正回答为什么会这样，这些数字甚至可能与机器相关（我的是 2.6GHz i7 和 16GB 内存的 OS-X）。

回复收藏 0 原文