reinforcement-learning

reinforcement-learning

文章 0 浏览 7

循环神经网络与强化学习一起使用时有什么用途?

我确实知道具有反向传播的前馈多层神经网络与强化学习一起使用,以帮助它概括我们的代理所做的动作。也就是说,如果我们有一个很大的状态空间,我们可…

季末如歌 2024-08-12 07:33:48 17 0

改善 Q-Learning

我目前正在使用 Q-Learning 尝试教机器人如何在充满墙壁/障碍物的房间中移动。它必须从房间中的任何位置开始并到达目标状态(例如,可能是到达有门的…

天涯离梦残月幽梦 2024-08-11 23:11:47 19 0

如何利用神经网络解决“软”问题解决方案?

我正在考虑在我正在构建的太空射击游戏中使用神经网络为我的敌人提供动力,我想知道;当网络没有一组明确的良好输出时,如何训练神经网络?…

萌︼了一个春 2024-08-08 09:32:59 19 0

Q-Learning 的泛化函数

我必须使用 Q Learning 做一些工作,关于一个必须在房子周围移动家具的人(基本上就是这样)。如果房子足够小,我可以有一个代表行动/奖励的矩阵,但…

梦过后 2024-08-07 03:17:20 19 0

强化学习的良好实施?

对于一个人工智能类项目,我需要实现一个强化学习算法,该算法可以击败简单的俄罗斯方块游戏。 该游戏是用 Java 编写的,我们有源代码。 我了解强化学…

草莓味的萝莉 2024-07-17 02:25:41 17 0

我如何运行萨顿和巴顿的“强化学习”? Lisp 代码?

我最近读了很多关于强化学习的内容,我发现“强化学习:简介” 是一本出色的指南。 作者为许多工作示例提供了源代码,很有帮助。 在开始提问之前,我…

滴情不沾 2024-07-13 01:31:52 19 0
更多

推荐作者

狼性发作

文章 0 评论 0

美煞众生

文章 0 评论 0

黑凤梨

文章 0 评论 0

慕巷

文章 0 评论 0

virou

文章 0 评论 0

两仪

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文