dqn

投稿关注

文章 0 浏览 1

Keras-rl ValueRror“模型具有多个输出。 DQN期望具有单个输出的模型。

有什么方法可以解决此错误？我有一个具有15x15输入网格的模型，可导致两个输出。每个输出具有15个可能的值，即X或Y坐标。我之所以这样做，是因为它比…

中二柚 2025-02-06 01:49:44 6 0

如何使目标尺寸等于我的DQN代码中的输入大小？

大家！当我进行DQN编程时，我遇到了一些问题。这个错误说 “用户保证：使用目标大小（Torch.Size（[32,32]））与输入大小不同（Torch.Size（[32,1]）…

人生戏 2025-02-05 18:23:33 4 0

ValueError：检查输入时的错误：预期Input_Input具有4个维度，但具有形状的数组（1，1，2）

I am trying to create a Flappy Bird AI with Convolutional Layers and Dense Layers, but at the "Train" step (Function fit()) I get the follow…

黑寡妇 2025-02-05 06:39:13 4 0

TF代理在培训强化学习后为所有测试状态采取相同的措施

我正在尝试创建一个自定义的Pyenvironment，以使代理商学习最佳小时，以将通知发送给用户，以基于单击前7天发送的通知获得的奖励。培训完成后，即使…

一抹苦笑 2025-01-27 17:12:03 6 0

深钢筋学习1步TD不融合

获得1步TD（时间差异）预测以与神经网络收敛的预测是否有一些技巧？该网络是使用Relu的简单馈送向前网络。我已经通过以下方式进行了网络来进行Q学习：…

盛夏已如深秋| 2025-01-27 16:11:17 6 0

为什么要为NAN记录的keras-rl2 dqn代理的平均值和MAE

从，但是只记录了奖励和数量的步骤，并且错误指标都是NAN， memory = SequentialMemory(limit=1000000, window_length=WINDOW_LENGTH) processor = At…

濫情▎り 2025-01-25 14:11:30 5 0

TensorFlow，使用`tf.tensor`作为python`BOOL了

raise errors.OperatorNotAllowedInGraphError( tensorflow.python.framework.errors_impl.OperatorNotAllowedInGraphError: using a `tf.Tensor` as…

羁绊已千年 2025-01-23 14:55:19 4 0

DQN型号（游戏：Atari Pongnoframeskip）不学习

我正在尝试实施乒乓球的DQN模型。但是，即使在大约1000集之后，它仍然像随机活动一样执行。 CNN培训似乎并不能改善代理。这是我的主要代码：我创建…

小伙你站住 2025-01-22 20:27:55 7 0

TF代理_ACTION_SPEC：如何为离散动作空间定义正确的形状？

方案1 我的自定义环境具有以下 _ACTION_SPEC ： self._action_spec = array_spec.BoundedArraySpec( shape=(highestIndex+1,), dtype=np.int32, minim…

紧拥背影 2025-01-22 11:08:21 5 0

DQN模型无法正确显示预期的分数

我正在研究游戏“ Cartpole-V1”的DQN培训模型。在此模型中，系统没有提醒终端中的任何错误信息。但是，结果评估变得更糟。这是输出数据： episode: 8…

指尖凝香 2025-01-21 18:39:20 5 0

稳定的基线3-设置“手动” q_values

我所做的是，我正在使用稳定基线3中的DQN算法进行两个玩家板类型游戏。在此游戏中，有40个动作可用，但是一旦制定了，就无法再做一次。我用对手训练…

羁拥 2025-01-17 20:33:56 7 0

无法以数组形状分配内存来创建强化学习模型

我正在尝试为 mario 环境创建 DQN 模型。但是当我尝试创建模型时，它给了我这个错误：内存错误：无法为形状为 (1000000, 1, 4, 240, 256) 和数据类型…

被你宠の有点坏 2025-01-15 22:32:04 5 0

共 1 页
1

友情链接

文江博客

dqn

Keras-rl ValueRror“模型具有多个输出。 DQN期望具有单个输出的模型。

如何使目标尺寸等于我的DQN代码中的输入大小？

ValueError：检查输入时的错误：预期Input_Input具有4个维度，但具有形状的数组（1，1，2）

TF代理在培训强化学习后为所有测试状态采取相同的措施

深钢筋学习1步TD不融合

为什么要为NAN记录的keras-rl2 dqn代理的平均值和MAE

TensorFlow，使用`tf.tensor`作为python`BOOL了

DQN型号（游戏：Atari Pongnoframeskip）不学习

TF代理_ACTION_SPEC：如何为离散动作空间定义正确的形状？

DQN模型无法正确显示预期的分数

稳定的基线3-设置“手动” q_values

无法以数组形状分配内存来创建强化学习模型

热门标签

推荐作者

转角预定愛

玩物

qq_dEbOhs

陆九渊

qq_ScZtKg

权谋诡计

友情链接