文章 0 浏览 7
我确实知道具有反向传播的前馈多层神经网络与强化学习一起使用,以帮助它概括我们的代理所做的动作。也就是说,如果我们有一个很大的状态空间,我们可…
我目前正在使用 Q-Learning 尝试教机器人如何在充满墙壁/障碍物的房间中移动。它必须从房间中的任何位置开始并到达目标状态(例如,可能是到达有门的…
我正在考虑在我正在构建的太空射击游戏中使用神经网络为我的敌人提供动力,我想知道;当网络没有一组明确的良好输出时,如何训练神经网络?…
我必须使用 Q Learning 做一些工作,关于一个必须在房子周围移动家具的人(基本上就是这样)。如果房子足够小,我可以有一个代表行动/奖励的矩阵,但…
对于一个人工智能类项目,我需要实现一个强化学习算法,该算法可以击败简单的俄罗斯方块游戏。 该游戏是用 Java 编写的,我们有源代码。 我了解强化学…
我最近读了很多关于强化学习的内容,我发现“强化学习:简介” 是一本出色的指南。 作者为许多工作示例提供了源代码,很有帮助。 在开始提问之前,我…
文章 0 评论 0
接受