当前位置：文江博客话题详情

什么是排序算法的稳定性以及为什么它很重要？

发布于 2024-08-07 06:22:06 字数 31 浏览 5 评论 0原文

我很好奇，为什么稳定性在排序算法中重要或不重要？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

最笨的告白 2024-08-14 06:22:06

如果具有相同键的两个对象在排序输出中出现的顺序与它们在要排序的输入数组中出现的顺序相同，则称排序算法是稳定。有些排序算法本质上是稳定的，如插入排序、合并排序、冒泡排序等。而有些排序算法则不然，如堆排序、快速排序等。

背景：“稳定”排序算法保持具有相同排序键的项目按顺序排列。假设我们有一个包含 5 个字母的单词列表：

peach
straw
apple
spork

如果我们仅按每个单词的第一个字母对列表进行排序，则稳定排序将产生：

apple
peach
straw
spork

在不稳定排序算法中，straw< /code> 或 spork 可以互换，但在稳定的情况下，它们保持相同的相对位置（也就是说，因为 straw 出现在 spork 之前）在输入中，它也出现在 spork 之前）。

我们可以使用此算法对单词列表进行排序：按第 5 列、然后是 4、然后是 3、然后是 2、然后是 1 进行稳定排序。
最后，它会被正确排序。说服自己这一点。（顺便说一句，该算法称为基数排序）

现在回答您的问题，假设我们有一个名字和姓氏的列表。我们被要求“按姓氏，然后按名字”排序。我们可以首先按名字排序（稳定或不稳定），然后按姓氏进行稳定排序。经过这些排序后，列表主要按姓氏排序。但是，如果姓氏相同，则按名字排序。

你不能以同样的方式堆叠不稳定的排序。

A sorting algorithm is said to be stable if two objects with equal keys appear in the same order in sorted output as they appear in the input array to be sorted. Some sorting algorithms are stable by nature like Insertion sort, Merge Sort, Bubble Sort, etc. And some sorting algorithms are not, like Heap Sort, Quick Sort, etc.

Background: a "stable" sorting algorithm keeps the items with the same sorting key in order. Suppose we have a list of 5-letter words:

peach
straw
apple
spork

If we sort the list by just the first letter of each word then a stable-sort would produce:

apple
peach
straw
spork

In an unstable sort algorithm, straw or spork may be interchanged, but in a stable one, they stay in the same relative positions (that is, since straw appears before spork in the input, it also appears before spork in the output).

We could sort the list of words using this algorithm: stable sorting by column 5, then 4, then 3, then 2, then 1.
In the end, it will be correctly sorted. Convince yourself of that. (by the way, that algorithm is called radix sort)

Now to answer your question, suppose we have a list of first and last names. We are asked to sort "by last name, then by first". We could first sort (stable or unstable) by the first name, then stable sort by the last name. After these sorts, the list is primarily sorted by the last name. However, where last names are the same, the first names are sorted.

You can't stack unstable sorts in the same fashion.

回复收藏 0 原文

初熏 2024-08-14 06:22:06

稳定的排序算法是按照相同元素在输入中出现的顺序对相同元素进行排序的算法，而不稳定的排序可能无法满足这种情况。 - _{^{我感谢我的算法讲师 Didem Gozupek 提供了对算法的见解}}。

由于一些反馈称有些人不明白演示文稿的逻辑，我再次需要编辑问题。 它说明了对第一个元素进行排序。另一方面，您也可以考虑由键值对组成的插图。

稳定的排序算法：

插入排序
合并排序
冒泡排序
Tim 排序计数
排序
元
块排序四
排序库排序
鸡尾酒调酒器排序
Gnome 排序
奇偶排序

不稳定排序算法：

堆排序
选择排序
Shell 排序
快速排序
Introsort（受快速排序影响）
树排序
循环排序
Smoothsort
锦标赛排序（以堆排序为准）

回复收藏 0 原文

情魔剑神 2024-08-14 06:22:06

排序稳定性是指具有相同键的记录在排序前后保持其相对顺序。

因此，当且仅当您要解决的问题需要保留相对顺序时，稳定性才重要。

如果您不需要稳定性，您可以使用库中的快速、内存消耗算法，例如堆排序或快速排序，然后就不用管它了。

如果你需要稳定性，那就更复杂了。稳定的算法比不稳定的算法具有更高的大 O CPU 和/或内存使用率。因此，当您拥有大型数据集时，您必须在 CPU 和内存之间做出选择。如果 CPU 和内存都受到限制，就会遇到问题。一个好的折衷稳定算法是二叉树排序； Wikipedia 文章有一个基于 STL 的极其简单的 C++ 实现。

通过将原始记录号添加为每条记录的最后一位键，可以将不稳定的算法变成稳定的算法。

回复收藏 0 原文

记忆消瘦 2024-08-14 06:22:06

这取决于你做什么。

想象一下，您有一些带有名字和姓氏字段的人员记录。首先，您按名字对列表进行排序。如果您随后使用稳定算法按姓氏对列表进行排序，您将得到一个按名字和姓氏排序的列表。

回复收藏 0 原文

陪你到最终 2024-08-14 06:22:06

稳定性如此重要有几个原因。一是，如果不需要通过交换两条记录来交换它们，则可能会导致内存更新，页面被标记为脏，并且需要重新写入磁盘（或其他慢速介质）。

回复收藏 0 原文

仙女 2024-08-14 06:22:06

如果具有相同键的两个对象在排序输出中出现的顺序与它们在输入未排序数组中出现的顺序相同，则称排序算法是稳定的。有些排序算法本质上是稳定的，如插入排序、合并排序、冒泡排序等。而有些排序算法则不然，如堆排序、快速排序等。

但是，任何不稳定的给定排序算法都可以修改为稳定的。可以有特定于排序算法的方法来使其稳定，但一般来说，任何本质上不稳定的基于比较的排序算法都可以通过更改键比较操作来修改为稳定，以便两个键的比较将位置视为一个具有相同键的对象的因子。

参考：
http://www.math.uic.edu/ 〜leon/cs-mcs401-s08/handouts/stability.pdf
http://en.wikipedia.org/wiki/Sorting_algorithm#Stability

回复收藏 0 原文

可爱暴击 2024-08-14 06:22:06

我知道对此有很多答案，但对我来说，这个答案，作者：Robert Harvey，总结得更清楚：

稳定排序是一种保留输入集原始顺序的排序，其中[不稳定]算法不区分两个或多个项目。

来源

回复收藏 0 原文

情仇皆在手 2024-08-14 06:22:06

一个类似的例子是经典的 Excel，它限制一次只能排序 3 列。要对 6 列进行排序，先对最不重要的 3 列进行排序，然后对最重要的 3 列进行排序。

稳定基数排序的一个典型示例是卡片排序器，用于按以 10 为基数的数字列的字段进行排序。卡片按从最低有效数字到最高有效数字排序。每次通过时，都会读取一副纸牌，并根据该列中的数字将其分为 10 个不同的纸牌。然后将 10 个卡片箱按顺序放回输入料斗（“0”张卡片先，“9”张卡片最后）。然后下一列完成另一遍，直到所有列都排序完毕。实际的卡片分类机有超过 10 个仓，因为一张卡上有 12 个区域，一列可能是空白的，并且存在误读仓。要对字母进行排序，每列需要 2 遍，第 1 遍用于数字，第 2 遍用于 12 11 区域。

后来（1937年）出现了卡片整理（合并）机，可以通过比较字段来合并两副卡片。输入是两副已经排序的牌，一副主牌和一副更新牌。整理者将两副牌合并成一个新的母版箱和一个存档箱，该箱体可以选择用于主版副本，以便新的主版箱只有在出现重复项时才会有更新卡。这可能是原始（自下而上）合并排序背后的思想的基础。

回复收藏 0 原文