什么模型最适合实时策略游戏的优化？

发布于 2024-09-30 00:51:43 字数 712 浏览 13 评论 0原文

最近有一篇文章讨论了如何使用遗传算法来优化《星际争霸 II》中的“构建顺序”。

http://lbrandy. com/blog/2010/11/using-genic-algorithms-to-find-starcraft-2-build-orders/

星际争霸比赛的初始状态是预先确定的且恒定的。与国际象棋一样，比赛早期阶段做出的决定会对棋手在比赛中后期的表现产生长期影响。因此，各种开放可能性或“建造订单”正在接受严格的研究和审查。在上述文章发表之前，计算机辅助构建订单创建可能不像最近那么受欢迎。

我的问题是...遗传算法真的是优化构建顺序建模的最佳方法吗？

构建顺序是一系列操作。有些操作有先决条件，例如“在创建建筑 C 之前需要建筑 B，但您可以随时拥有建筑 A”。所以染色体可能看起来像 AABAC。

我想知道遗传算法是否真的是解决这个问题的最佳方法。尽管我对这个领域不太熟悉，但我很难将基因的概念硬塞到一个由一系列动作组成的数据结构中。这些不是可以像头和脚一样混合搭配的独立选择。那么繁殖和杂交之类的东西有什么价值呢？

我认为无论国际象棋人工智能使用什么都会更合适，因为任何给定时间的选择数组在某种程度上都可以被视为树状。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

罗罗贝儿 2024-10-07 00:51:43

虽然我对这个领域不太熟悉，但我很难将基因的概念硬塞到一个由一系列动作组成的数据结构中。这些不是可以像头和脚一样混合搭配的独立选择。那么繁殖和杂交之类的东西有什么价值呢？

嗯，这是一个非常好的问题。也许星际争霸中的前几个动作确实可以以几乎任何顺序执行，因为与敌人的接触并不像国际象棋中那样立即，因此记住前几个动作的顺序并不像国际象棋那样重要。就是要知道前面几个动作中包含了哪些动作。但这个链接似乎暗示着其他情况，这意味着“基因”确实并不那么适合交换，除非我在编码中遗漏了一些狡猾的东西。

总的来说，看看您提供的链接，我认为遗传算法对于这种情况来说是一个糟糕的选择，它可以在某些部分进行精确的数学建模，而搜索树可以在其他部分扩展。它们很可能比对可能性空间进行详尽的搜索更好，但也可能不是——特别是考虑到存在多个群体，而较贫穷的群体只是浪费处理时间。

然而，我所说的“糟糕的选择”是指相对于更合适的方法来说，它的效率低下；这并不是说它仍然不能在一秒之内产生 98% 的最佳结果。在这种情况下，计算机的强力是有用的，正确地建模搜索空间通常比使用最有效的算法更重要。

回复收藏 0 原文

愛上了 2024-10-07 00:51:43

正如 TaslemGuy 指出的那样，遗传算法不能保证是最优的，尽管它们通常会给出良好的结果。

为了获得最佳结果，您必须搜索所有可能的操作组合，直到找到通过树状表示的最佳路径。然而，在《星际争霸》中做到这一点很困难，因为实现目标有很多不同的途径。在国际象棋中，您将棋子从 e2 移动到 e4，然后对手移动。在《星际争霸》中，您可以在瞬间移动一个单位 x 或 x+1 或 x+10 或...

国际象棋引擎可以查看棋盘的许多不同方面（例如，它有多少棋子以及对手有多少棋子），指导其搜索。如果它知道大多数可用的操作比其他操作更糟糕，那么它可以忽略它们。

对于构建订单创建者来说，只有时间才是真正重要的。是建造另一架无人机来更快地获取矿物更好，还是立即启动产卵池更快？不像国际象棋那样简单。

此类决策很早就发生了，因此您必须搜索每种替代方案才能得出结论，然后才能做出更好的决定，这将需要很长时间。
如果我自己编写一个构建顺序优化器，我可能会尝试制定一个启发式方法来估计当前状态的好坏程度（接近目标状态），就像国际象棋引擎所做的那样：

Score = a*(Buildings_and_units_done/Buildings_and_units_required) - b*Time_elapsed - c*Minerals - d*Gas + e*Drone_count - f*Supply_left

这试图保持分数平局完成百分比以及星际争霸常识（保持较低的资源，建造无人机，不要建造超出你需要的供应）。当然，变量 a 到 f 需要调整。

在您获得可以在一定程度上估计情况价值的启发式方法之后，我将使用最佳优先search 或IDDFS 来搜索可能性树。

编辑：

我最近发现了一篇论文，它实际上描述了星际争霸中的构建顺序优化，甚至是实时的。作者使用深度优先搜索和分支定界和基于技术树估计达到目标所需的最小工作量的启发式方法（例如小狗需要产卵池）以及收集所需矿物质所需的时间。

As TaslemGuy pointed out, Genetic Algorithms aren't guaranteed to be optimal, even though they usually give good results.

To get optimal results you would have to search through every possible combination of actions until you find the optimal path through the tree-like representation. However, doing this for StarCraft is difficult, since there are so many different paths to reach a goal. In chess you move a pawn from e2 to e4 and then the opponent moves. In StarCraft you can move a unit at instant x or x+1 or x+10 or ...

A chess engine can look at many different aspects of the board (e.g. how many pieces does it have and how many does the opponent have), to guide it's search. It can ignore most of the actions available if it knows that they are strictly worse than others.

For a build-order creator only time really matters. Is it better to build another drone to get minerals faster, or is it faster to start that spawning pool right away? Not as straightforward as with chess.

These kinds of decisions happen pretty early on, so you will have to search each alternative to conclusion before you can decide on the better one, which will take a long time.
If I were to write a build-order optimizer myself, I would probably try to formulate a heuristic that estimates how good (close the to the goal state) the current state is, just as chess engines do:

Score = a*(Buildings_and_units_done/Buildings_and_units_required) - b*Time_elapsed - c*Minerals - d*Gas + e*Drone_count - f*Supply_left

This tries to keep the score tied to the completion percentage as well as StarCraft common knowledge (keep your ressources low, build drones, don't build more supply than you need). The variables a to f would need tweaking, of course.

After you've got a heuristic that can somewhat estimate the worth of a situation, I would use Best-first search or maybe IDDFS to search through the tree of possibilities.

Edit:

I recently found a paper that actually describes build order optimization in StarCraft, in real time even. The authors use depth-first search with branch and bound and heuristics that estimate the minimum amount of effort required to reach the goal based on the tech tree (e.g. zerglings need a spawning pool) and the time needed to gather the required minerals.

回复收藏 0 原文

青瓷清茶倾城歌 2024-10-07 00:51:43

遗传算法可以是，有时也可以不是，最优或非最优解决方案。基于遗传算法的复杂性，有多少变异，组合的形式，以及遗传算法的染色体如何解释。

因此，根据人工智能的实施方式，遗传算法可能是最好的。

您正在寻找一种实现遗传算法的单一方法，而忘记了遗传编程、数学的使用、高阶函数等。遗传算法可以非常复杂，并且通过使用巧妙的组合系统进行杂交，非常智能。< br>
例如，神经网络经常通过遗传算法进行优化。

查找“基因编程”。它很相似，但使用树结构而不是字符行，这允许更复杂的交互，从而更好地繁殖。对于更复杂的事情，它们通常效果更好。

回复收藏 0 原文

风情万种。 2024-10-07 00:51:43

已经有一些研究使用分层强化学习来构建分层的操作顺序，从而有效地最大化奖励。我还没有找到太多实现这一想法的代码，但有几篇论文描述了基于 MAXQ 的算法，这些算法已用于明确处理实时策略游戏领域，例如此和

回复收藏 0 原文

爱，才寂寞 2024-10-07 00:51:43

这种遗传算法仅优化游戏的一个非常特定部分的策略：游戏的前几个构建动作的顺序。它还有一个非常具体的目标：尽快拥有尽可能多的蟑螂。

影响这个系统的唯一方面似乎是（我不是星际争霸玩家）：

各个单位的构建时间和
建筑物
允许的单位和建筑物给定可用的单位和建筑物
幼虫再生率。

这是一个相对有限、定义相对明确的问题，具有较大的搜索空间。因此，它非常适合遗传算法（以及相当多的其他优化算法）。完整的基因是一组特定的构建顺序，以第七条蟑螂结束。据我了解，你可以“玩”这个特定的基因，看看它完成的速度有多快，这样你就有了一个非常清晰的适应性测试。
您还对构建顺序有一些很好的限制，因此您可以比随机地更智能地组合不同的基因。

以这种方式使用的遗传算法是一个非常好的工具，可以为星际争霸游戏的第一阶段找到更优化的构建顺序。由于其随机性，它也擅长找到令人惊讶的策略，这可能是作者的另一个目标。

要使用遗传算法作为 RTS 游戏中的算法，您必须找到一种方法来编码对情况的反应，而不仅仅是简单的旧构建顺序。这还涉及正确识别情况，这本身就是一项艰巨的任务。然后你必须让这些基因玩数千场星际争霸游戏，相互对抗，（可能）与人类对抗，选择并组合胜利者（或长期失败者）。这也是遗传算法的一个很好的应用，但是在您进入遗传算法部分之前，它涉及解决相当多的非常困难的问题。