当前位置：文江博客话题详情

Minimax 的 Alpha-beta 剪枝

发布于 2024-12-11 16:19:54 字数 679 浏览 0 评论 0原文

我花了一整天的时间尝试实现极小极大，但没有真正理解它。现在，我想我了解极小极大值的工作原理，但不了解 alpha-beta 剪枝。

这是我对极小极大的理解：

生成所有可能的移动的列表，直到深度限制。
评估游戏场地对于底部每个节点的有利程度。
对于每个节点（从底部开始），如果层数为 max，则该节点的分数是其子节点的最高分数。如果层数为min，则该节点的得分为其子节点的最低得分。
如果您想要获得最高分数，请执行得分最高的移动；如果您想要获得最低分数

我对alpha-beta剪枝的理解是，如果父层是min并且你的节点的分数高于最低分数，那么你可以剪枝它，因为它不会影响结果。

然而，我不明白的是，如果你能计算出一个节点的分数，你将需要知道比该节点低一层的所有节点的分数（以我对极小极大的理解）。这意味着您仍将使用相同数量的 CPU 功率。

有人可以指出我做错了什么吗？这个答案（为白痴解释的Minimax）帮助我理解了minimax，但我不明白 alpha beta 修剪有什么帮助。

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情域 2024-12-18 16:19:54

要了解 Alpha-Beta，请考虑以下情况。轮到白棋了，白棋试图使分数最大化，黑棋则试图使分数最小化。

白棋评估棋步 A、B、C，发现 C 的最佳得分为 20。现在考虑评估棋步 D 时会发生什么：

如果白棋选择 D 棋，我们需要考虑黑棋的反击。早期，我们发现黑色可以捕获白色皇后，并且由于丢失了皇后，该子树的最低分数为 5。然而，我们并没有考虑到所有黑人的反击。是否值得检查其余部分？不。

我们不在乎黑棋是否能得到低于 5 的分数，因为白棋走“C”可以将分数保持在 20。黑棋不会选择分数高于 5 的反击棋，因为他试图将分数最小化。得分，并且已经找到了得分为 5 的棋步。对于白棋来说，一旦 D 的 MIN（到目前为止为 5）低于 C（肯定是 20），棋步 C 就会优先于棋步 D。因此，我们“修剪”树的其余部分，弹出一个级别并评估白棋 E、F、G、H... 直到最后。

希望有帮助。

回复收藏 0 原文

肤浅与狂妄 2024-12-18 16:19:54

您不需要评估节点的整个子树来决定其值。 Alpha Beta 修剪使用两个动态计算的边界 alpha 和 beta 来限制节点可以采用的值。

Alpha 是通过博弈树的另一条路径保证最大玩家（无论最小玩家做什么）的最小值。该值用于在最小化级别执行截止（修剪）。当最小玩家发现最小节点的分数必然小于 alpha 时，它不需要评估该节点的任何更多选择，因为最大玩家已经有更好的移动（具有值 alpha 的移动）。

Beta 是保证最小玩家的最大值，用于在最大化级别执行截止。当最大玩家发现最大节点的分数必然大于 beta 时，它可以停止评估该节点的任何更多选择，因为最小玩家不会允许它采取这条路径，因为最小玩家已经有了一条路径这保证了 beta 值。

我写了一篇关于 Alpha Beta 剪枝的详细解释，它的伪代码和一些改进：http: //kartikkukreja.wordpress.com/2014/06/29/alphabetasearch/

回复收藏 0 原文

孤云独去闲 2024-12-18 16:19:54

对mimimax（非常）简短的解释：

您（棋盘位置的评估者）可以选择下n步棋。您尝试所有这些并将棋盘位置交给（对手）评估员。
- 对手评估新的棋盘位置（对于他来说，对手方） - 通过做本质上相同的事情，递归调用（他的对手）评估器，除非已达到最大深度或某些其他条件并且静态评估器是调用 - 然后选择最大评估并将评估发送回给您。
您选择具有这些评估最小值的移动。该评估是您一开始必须评估的棋盘的评估。

对α-β-修剪的（非常）简短的解释：

您（棋盘位置的评估者）可以选择下n步棋。您一一尝试所有这些，并将董事会位置提供给（对手）评估员 - 但您也传递了您当前的评估（您的董事会）。
- 对手评估新的棋盘位置（对于他来说，是对手方）并将评估结果发送回给您。但他是怎么做到的呢？他可以选择下 m 步棋。他尝试了所有这些，并将新的棋盘位置（一一）提供给（他的对手）评估者，然后选择最大的一个。
- 关键步骤：如果他返回的任何评估值大于您给他的最小值，则可以肯定他最终将返回至少那么大的评估值（因为他想要最大化）。而且您肯定会忽略该值（因为您想要最小化），因此他停止了对尚未评估的董事会的任何更多工作。
您选择具有这些评估最小值的移动。该评估是您一开始必须评估的棋盘的评估。

回复收藏 0 原文

木緿 2024-12-18 16:19:54

这是一个简短的答案 - 您可以知道节点的值，而无需计算其所有子节点的精确值。

一旦我们知道从父节点玩家的角度来看，子节点不能比先前评估的兄弟节点更好，我们就可以停止评估子子树。 至少是这么糟糕。

回复收藏 0 原文

于我来说 2024-12-18 16:19:54

我认为你的问题暗示了对评估函数的误解

如果你能算出一个节点的得分，你就需要知道比该节点低一层的所有节点的得分（按照我对极小极大的理解）

我不完全确定你的意思在那里，但听起来不对。 评估函数 (EF) 通常是非常快速的、静态位置评估。这意味着它只需要查看一个位置并从中得出“结论”。（IOW，您并不总是将分支评估为n层）

现在很多时候，评估确实是静态的，这意味着位置评估函数是完全确定性的。 这也是评估结果易于缓存的原因（因为每次评估职位时它们都是相同的）。

现在，对于例如国际象棋，通常与上述有相当多的明显/隐蔽的偏差：

根据游戏上下文，位置可能会被不同地评估（例如，确切的位置是否在游戏过程中较早出现；移动了多少步）没有典当移动/捕获发生，过路和易车机会）。解决这个问题的最常见的“技巧”是将该状态实际合并到“位置”中¹
通常会为游戏的不同阶段（开局、中间、结束）选择不同的 EF ）；这会产生一些设计影响（更改 EF 时如何处理缓存评估？当不同层的 EF 不同时如何进行 alpha/beta 修剪？）

说实话，我不知道常见的国际象棋引擎如何解决后者（我只是在我的玩具引擎中避免使用它）

我会参考以下在线资源：