国际象棋的统计方法？

发布于 2024-08-30 12:42:47 字数 407 浏览 14 评论 0原文

阅读Google 如何解决翻译问题让我开始思考。是否有可能通过分析数百万盘棋并很大程度上（完全？）基于统计数据确定最佳可能的走法来构建强大的国际象棋引擎？有几个这样的国际象棋数据库（这个是一款拥有 450 万局游戏的游戏），并且可以使用相关因素（例如参与棋手的评分、游戏的年龄（考虑国际象棋理论的改进）等因素）对相同（或镜像或反射）位置的走法进行加权有什么理由说明这不是构建国际象棋引擎的可行方法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

年华零落成诗 2024-09-06 12:42:47

类似的事情已经完成：这是打开书籍的基本概念。

由于游戏的性质，计算机人工智能在一开始就表现得很糟糕，因为有很多可能性，而最终目标仍然遥遥领先。当战术可能性开始形成时，它开始向中间改进，并且可以在最终游戏中完美发挥，远远超出大多数人的能力。

为了帮助人工智能在一开始就做出好的动作，许多引擎依赖于打开书籍：基本上是统计得出的动作流程图。许多高评分玩家之间的比赛被分析，推荐被硬编码到“书本”中，虽然位置仍在“书本”中，但AI甚至不“思考”，只是按照“书本”进行操作”说。

有些人还可以记住开卷（这就是费舍尔发明他的随机国际象棋变体的主要原因，这样记忆空缺的效率就会大大降低）。部分原因在于，有时一开始就会采取非常规的举动，并不是因为它是历史上统计上最好的举动，而是恰恰相反：它不是一个“已知”的位置，并且可以采取你的对手（人类或计算机）“从书中”。

另一方面，有一个名为 endgame tablebase 的东西，它基本上是一个数据库之前分析过残局位置。由于先前对位置进行了详尽的搜索，因此人们可以使用它来实现完美的游戏：给定任何位置，人们可以立即决定是赢、输还是平，以及实现/避免结果的最佳方式是什么。

不过，在国际象棋中，这样的事情只适用于开局和残局。中间游戏的复杂性使得游戏变得有趣。如果下棋只要查表就能下，那么棋局就不会那么刺激、有趣、有深度了。

回复收藏 0 原文

妖妓 2024-09-06 12:42:47

好吧，450 万款游戏仍然只涵盖了所有可能游戏中非常小的（无穷小的）一部分。

虽然您会有大量的获胜和失败头寸，但这会留下将其减少到一组可用参数的问题。这是一个非常古老的问题，神经网络作为标准方法。但神经网络并没有赢得国际象棋锦标赛。

回复收藏 0 原文

留蓝 2024-09-06 12:42:47

这种一般策略已在多种游戏中进行过尝试。人们经常通过让计算机自己玩来生成一个适当大的游戏数据库。快速互联网搜索会出现http:// www.cs.princeton.edu/courses/archive/fall06/cos402/papers/chess-RL.pdf - 它建立在双陆棋之前的工作基础上。不过，在国际象棋中，强力前瞻对于计算机来说非常有效，而且一般来说，当您可以混合所有先前已知的有关问题的信息，而不是尝试从数据中重新学习时，统计数据会更有效。我注意到，在这个链接中，计算机了解了前瞻底部的评估函数，而不是整个过程。

回复收藏 0 原文

长安忆 2024-09-06 12:42:47

有一种类似的方法在计算机 Go 中运行得非常好 - UCT 方法。它不使用一组已知的游戏，而是玩大量随机游戏，同时保留统计数据，这些统计数据会导致更高的获胜率。它从当前位置开始执行此操作。

统计数据保存在移动树中（类似于极小极大中使用的树），并影响下一个要玩的随机游戏的选择 - 获胜率较高的移动会被更频繁地选择。树的生长也是由游戏引导的——通常每个游戏都会给树添加一片叶子。这导致人们更深入地探索有希望的道路。

回复收藏 0 原文

轮廓§ 2024-09-06 12:42:47

我喜欢这个想法，但考虑到自然语言句子的上下文需要的元素比棋盘位置的上下文少得多（尽管这些句子的元素，即单词，可能来自比国际象棋游戏的元素更大的集合，即游戏棋子、骑士、棋子等）
此外，多语言语料库的可用性（各种语言的各种性质的文档）远远超过了人们可以以数字形式找到的国际象棋游戏的数量，特别是考虑到对于国际象棋分析，人们需要整个游戏，因此出于翻译目的，人们可以独立于文本的其余部分使用每个句子。

因此，除了游戏的开局部分（当棋盘位置相对于其他游戏没有太多机会偏离时）之外，需要引入的国际象棋游戏数量一些统计意义必须是天文数字......

必须运行，但我会回来对可能的国际象棋游戏数量进行具体估计（绝对数量，以及合理游戏的子集），并且应该有效证明450万款游戏是一个相对较小的样本。

回复收藏 0 原文

笑着哭最痛 2024-09-06 12:42:47

国际象棋中大约有 10¹²³ 博弈树，其中数据库中有大约 4.5 × 10⁶ 。我们可以忽略博弈树，只考虑状态空间复杂性，其合法状态介于 10⁴³ 和 10⁵⁰ 之间。假设该数据库中的所有游戏都有独特的走法，并且每场游戏平均有 1000 个走法，这为我们提供了 4.5 × 10⁹ 状态。采用估计的可能状态下限 10⁴³，仅覆盖所有状态的 4.5 × 10^-34。我不知道排除旋转或反射的独特棋盘位置的总数是多少，但这只会将其减少两倍左右，这并不是很有帮助。

您需要将更多领域知识添加到统计引擎中，并找出两个给定棋盘位置之间的相似程度，因为您有十分之一³⁵的机会找不到匹配的棋盘位置（包括反射和旋转）。我认为这里最大的关键是找到两个给定的董事会职位有何相似之处。这将包含更多的领域知识，而不仅仅是简单的转换。

尽管如此，这是一个值得进一步探索的好主意，尽管考虑到国际象棋的复杂性和围绕它的兴趣，我怀疑以前已经尝试过它。

回复收藏 0 原文

梦屿孤独相伴 2024-09-06 12:42:47

我会说是的，它可以工作。还没有人真正成功地尝试过，但为什么不使用统计方法来寻找“模式”呢？我不考虑存储整个棋盘，因为要存储的棋盘位置多得天文数字，而只是寻找特定的模式。

寻找模式

典型的国际象棋程序会对公认的模式进行评估并给予奖励，例如良好的防守兵或开放的车线，另一方面对双兵等给予惩罚。

此类模式可以在 64 位掩码中高效编程。您将拥有重要位置的位掩码和这些位置中预期片段的位掩码。每个模式都需要时间来匹配，因此找到有影响的模式非常重要。这就是谷歌统计方法的用武之地。它可以运行“历史”游戏并寻找模式。找到模式后，它必须计算该模式的权重，并查看改进的评估是否超过开销。

我认为这将是一个相当庞大的项目，对于博士论文来说甚至太多了。

回复收藏 0 原文

ペ泪落弦音 2024-09-06 12:42:47

机器学习最近取得了长足的进步，特别是在 Google 团队使用 ML 击败围棋冠军之后。现在国际象棋也证明了这一点。看看麻省理工学院技术评论中的文章，https://www.technologyreview.com/s/541276/deep-learning-machine-teaches-itself-chess-in-72-hours-plays-at-international -master/

ML 的深度学习是对旧的神经网络自调整 AI 算法的增强。赖的演示并没有教机器国际象棋的基本规则，也没有关心游戏的结果。他只需向机器输入大量游戏数据库，机器就会计算出其余部分并以合理的“人类”水平进行游戏。

我认为两大改进是通过教它规则来提高它的效率，然后通过向它提供游戏的实际结果来指导它。
然后，与当前的国际象棋冠军、像 Stockfish 这样的引擎一起训练！ :-)

回复收藏 0 原文

时光与爱终年不遇 2024-09-06 12:42:47

类似于击败人类大师玩家的 GO 程序的深度学习算法可能是杀手。但这需要很高的成本。然而，人们可以使用从 GO 中学到的深度学习模式并应用
它到国际象棋。

回复收藏 0 原文

微凉 2024-09-06 12:42:47

我没有看到提到的一件事是考虑数据库中游戏中玩家的评分。一些具有良好分贝百分比的开局是由于更好的玩家倾向于获胜并且很少谈论开局的价值的结果。

事实上，我认为数据库只适合一件事，那就是表明哪些动作是流行的。除此之外，你对数据的解释确实超出了它的价值。

同样，计算机分析仅显示计算机与计算机游戏的最佳结果。人与人之间的游戏是不同的，你不应该过于依赖计算机分析。

数据库和计算机分析都很有趣，但它们很容易被误解。提防。

回复收藏 0 原文

烟织青萝梦 2024-09-06 12:42:47

Chinmay，

我知道这是一个老话题，但这是我最近一直在探索的一个话题。上面回答的大多数人并没有真正明白你的问题。我认为，是的，有必要分析过去的大量比赛来制定建议的行动。它会涵盖所有可能的动作吗？不，显然不是。但它涵盖了真实游戏中的所有真实动作。人类（或其他计算机算法）必须开始玩非常奇怪的动作才能摆脱困境。所以，你不可能建立一个一直获胜的“完美”算法，但如果它赢了很多，比如说 >2200 FIDE 评级，那也不错，对吧？如果你结合开局和残局，而不仅仅是依赖过去的着法分析，它就会成为一个更好的引擎。

可能的棋盘位置数量多得天文数字，但它是有限的，如果你删除愚蠢的位置，它的数量就会大大减少。是否可以将 4、5 或 6 个单人棋子排成一列？是的，在真实的游戏中会发生这种情况吗？对此表示怀疑。将基本的国际象棋大脑纳入你的逻辑中，以应对对手“超出规则”的情况。例如，Micro Max 只有几百行代码。如果对手愚蠢地阻止你的行动，他们可能可以通过简单的引擎击败。

回复收藏 0 原文

~没有更多了~