中位数选择的最佳中位数 - 3 个元素块与 5 个元素块？

发布于 2024-09-27 15:09:40 字数 610 浏览 10 评论 0原文

我正在研究一种基于选择算法的快速排序变体实现来进行选择一个好的枢轴元素。传统观点似乎是将数组分为 5 个元素块，取每个元素的中值，然后对所得中值递归应用相同的分块方法以获得“中值的中值”。

让我困惑的是选择 5 元素块而不是 3 元素块。对于 5 元素块，在我看来，您执行 n/4 = n/5 + n/25 + n/125 + n/625 + ... 5 中位数运算，而对于 3 元素块，您执行 n/2 = n/3 + n/9 + n/27 + n/81 + ... 3 中位数运算。由于每个中位数 5 是 6 次比较，每个中位数 3 是 2 次比较，因此会使用中位数 5 和 n 进行 3*n/2 比较 使用中位数 3 进行比较。

谁能解释一下这种差异，以及使用 5 元素块的动机是什么？我不熟悉应用这些算法的通常做法，所以也许有某种方法可以削减一些步骤，但仍然“足够接近”中位数以确保良好的枢轴，并且该方法更适用于 5 元素块？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

谁的年少不轻狂 2024-10-04 15:09:40

原因是，通过选择 3 个块，我们可能会失去 O(n) 时间算法的保证。

对于 5 块，时间复杂度为

T(n) = T(n/5) + T(7n/10) + O(n)

对于 3 块，时间复杂度为

T(n) = T(n /3) + T(2n/3) + O(n)

看看这个： http://www.cs.berkeley.edu/~luca/w4231/fall99/slides/l3.pdf

回复收藏 0 原文

恋你朝朝暮暮 2024-10-04 15:09:40

我相信这与确保“良好”的分裂有关。划分为 5 个元素块可确保最坏情况下的划分为 70-30。标准论证是这样的：在 n/5 块中，至少一半的中位数 >= 中位数中位数，因此至少有一半的 n/5 块至少有 3 个元素（5 的 1/2）>=中位数，这给出了 3n/10 分割，这意味着另一个分区是 最坏情况下>7n/10。

这就给出了 T(n) = T(n/5) + T(7n/10) + O(n) 。

由于 n/5 + 7n/10 1，最坏情况的运行时间是O(n)。

选择 3 元素块使得：至少一半的 n/3 块至少有 2 个元素 >=中位数，因此这给出了 n/3< /code> 分割，或者在最坏的情况下为 2n/3。

这就给出了 T(n) = T(n/3) + T(2n/3) + O(n) 。

在这种情况下，n/3 + 2n/3 = 1，因此在最坏的情况下它会减少到O(n log n)。

回复收藏 0 原文

別甾虛僞 2024-10-04 15:09:40

您可以使用大小为 3 的块！是的，我和你一样感到惊讶。 2014 年（你在 2010 年问过）有一篇论文展示了如何做到这一点。

这个想法如下：而不是做 median3，partition，median3，partition，...，你做 median3、median3、分区、median3、median3、分区，...。在论文中，这被称为“重复步骤算法”。

因此，而不是：

T(n) <= T(n/3) + T(2n/3) + O(n)
T(n) = O(nlogn)

得到：

T(n) <= T(n/9) + T(7n/9) + O(n)
T(n) = Theta(n)

所述文章是 Select with Groups of 3 or 4 Takes Linear Time by K . Chen 和 A. Dumitrescu (2014, arxiv)，或以 3 人为一组进行选择或4（2015年，作者主页）。

PS：A. Alexandrescu（D 语言名人！）的快速确定性选择展示了如何实现以上甚至更有效。

You can use blocks of size 3! Yes, I'm as surprised as you are. In 2014 (you asked in 2010) there came a paper which shows how to do so.

The idea is as follows: instead of doing median3, partition, median3, partition, ..., you do median3, median3, partition, median3, median3, partition, ... . In the paper this is called "The Repeated Step Algorithm".

So instead of:

T(n) <= T(n/3) + T(2n/3) + O(n)
T(n) = O(nlogn)

one gets:

T(n) <= T(n/9) + T(7n/9) + O(n)
T(n) = Theta(n)

The said article is Select with Groups of 3 or 4 Takes Linear Time by K. Chen and A. Dumitrescu (2014, arxiv), or Select with groups of 3 or 4 (2015, author's homepage).

PS: The Fast Deterministic Selection by A. Alexandrescu (of D language fame!) which shows how to implement the above even more efficiently.

回复收藏 0 原文

~没有更多了~

关于作者

梦里南柯

暂无简介

文章

24 人气

关注发私信

友情链接

文江博客

中位数选择的最佳中位数 - 3 个元素块与 5 个元素块？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

中位数选择的最佳中位数 - 3 个元素块与 5 个元素块？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。