dqn

dqn

文章 0 浏览 1

Keras-rl ValueRror“模型具有多个输出。 DQN期望具有单个输出的模型。

有什么方法可以解决此错误?我有一个具有15x15输入网格的模型,可导致两个输出。每个输出具有15个可能的值,即X或Y坐标。我之所以这样做,是因为它比…

中二柚 2025-02-06 01:49:44 6 0

如何使目标尺寸等于我的DQN代码中的输入大小?

大家!当我进行DQN编程时,我遇到了一些问题。这个错误说 “用户保证:使用目标大小(Torch.Size([32,32]))与输入大小不同(Torch.Size([32,1])…

人生戏 2025-02-05 18:23:33 4 0

ValueError:检查输入时的错误:预期Input_Input具有4个维度,但具有形状的数组(1,1,2)

I am trying to create a Flappy Bird AI with Convolutional Layers and Dense Layers, but at the "Train" step (Function fit()) I get the follow…

黑寡妇 2025-02-05 06:39:13 4 0

TF代理在培训强化学习后为所有测试状态采取相同的措施

我正在尝试创建一个自定义的Pyenvironment,以使代理商学习最佳小时,以将通知发送给用户,以基于单击前7天发送的通知获得的奖励。 培训完成后,即使…

一抹苦笑 2025-01-27 17:12:03 6 0

深钢筋学习1步TD不融合

获得1步TD(时间差异)预测以与神经网络收敛的预测是否有一些技巧?该网络是使用Relu的简单馈送向前网络。我已经通过以下方式进行了网络来进行Q学习:…

盛夏已如深秋| 2025-01-27 16:11:17 6 0

为什么要为NAN记录的keras-rl2 dqn代理的平均值和MAE

从,但是只记录了奖励和数量的步骤,并且错误指标都是NAN, memory = SequentialMemory(limit=1000000, window_length=WINDOW_LENGTH) processor = At…

濫情▎り 2025-01-25 14:11:30 5 0

TensorFlow,使用`tf.tensor`作为python`BOOL了

raise errors.OperatorNotAllowedInGraphError( tensorflow.python.framework.errors_impl.OperatorNotAllowedInGraphError: using a `tf.Tensor` as…

羁绊已千年 2025-01-23 14:55:19 4 0

DQN型号(游戏:Atari Pongnoframeskip)不学习

我正在尝试实施乒乓球的DQN模型。但是,即使在大约1000集之后,它仍然像随机活动一样执行。 CNN培训似乎并不能改善代理。 这是我的主要代码: 我创建…

小伙你站住 2025-01-22 20:27:55 7 0

TF代理_ACTION_SPEC:如何为离散动作空间定义正确的形状?

方案1 我的自定义环境具有以下 _ACTION_SPEC : self._action_spec = array_spec.BoundedArraySpec( shape=(highestIndex+1,), dtype=np.int32, minim…

紧拥背影 2025-01-22 11:08:21 5 0

DQN模型无法正确显示预期的分数

我正在研究游戏“ Cartpole-V1”的DQN培训模型。在此模型中,系统没有提醒终端中的任何错误信息。但是,结果评估变得更糟。这是输出数据: episode: 8…

指尖凝香 2025-01-21 18:39:20 5 0

稳定的基线3-设置“手动” q_values

我所做的是, 我正在使用稳定基线3中的DQN算法进行两个玩家板类型游戏。在此游戏中,有40个动作可用,但是一旦制定了,就无法再做一次。 我用对手训练…

羁拥 2025-01-17 20:33:56 7 0

无法以数组形状分配内存来创建强化学习模型

我正在尝试为 mario 环境创建 DQN 模型。但是当我尝试创建模型时,它给了我这个错误: 内存错误:无法为形状为 (1000000, 1, 4, 240, 256) 和数据类型…

被你宠の有点坏 2025-01-15 22:32:04 5 0
更多

推荐作者

转角预定愛

文章 0 评论 0

玩物

文章 0 评论 0

qq_dEbOhs

文章 0 评论 0

陆九渊

文章 0 评论 0

qq_ScZtKg

文章 0 评论 0

权谋诡计

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文