第 2 页 - stable-baselines

stable-baselines

文章 0 浏览 1

是否有可能在A2C稳定的基线3中暴露重播缓冲液以包括人类的判断？

我正在使用 stable-baselines3 中的 A2C (Advantage Actor Critic) 框架 (包链接在这里）用于解决奖励为+1或0的强化问题的包。我有一个自动机制来将奖…

帝王念 2025-01-20 23:20:08 4 0

属性错误：“框”对象没有属性“形状”；在科拉布

我厌倦了在 colab 中使用 stable-baselines3 加载模型，使用以下代码： !pip install stable-baselines3[extra] from stable_baselines3 import DQN f…

栀梦 2025-01-20 07:46:30 4 0

为什么 Stable-Baselines3valuate_policy() 函数永远无法完成？

我已经使用OpenAI健身房和稳定的Baselines创建了自己的自定义环境3。一旦训练了代理，我将尝试使用stable_baselines3.common.evaluation的estaiute_po…

爱殇璃 2025-01-20 01:05:52 6 0

错误运行模型在本地机器上训练

我使用Lambda Labs Cloud Service的GPU实例培训了增强学习模型。我用于培训的库是Stable_baselines3。当我尝试在本地计算机上运行模型时，我会收到以…

人│生佛魔见 2025-01-18 04:33:05 4 0

稳定的基线3-设置“手动” q_values

我所做的是，我正在使用稳定基线3中的DQN算法进行两个玩家板类型游戏。在此游戏中，有40个动作可用，但是一旦制定了，就无法再做一次。我用对手训练…

羁拥 2025-01-17 20:33:56 8 0

StableBaselines-3 DDPG + HER 多重处理

我正在阅读有关 HER 的文档以及 stable-baselines3 网站中有关多重处理的文档但是，当我尝试训练时，它会抛出错误！有没有使用 replay_buffer 进行…

淡笑忘祈一世凡恋 2025-01-15 22:42:15 3 0

无法以数组形状分配内存来创建强化学习模型

我正在尝试为 mario 环境创建 DQN 模型。但是当我尝试创建模型时，它给了我这个错误：内存错误：无法为形状为 (1000000, 1, 4, 240, 256) 和数据类型…

被你宠の有点坏 2025-01-15 22:32:04 6 0

stable_baselines模块错误-> “gym.logger”没有属性“MIN_LEVEL”

我正在尝试使用 stable_baselines，但我尝试使用的任何模型都会给我带来相同的错误：模块“gym.logger”没有属性“MIN_LEVEL” 我已从他们的网站附加…

遮云壑 2025-01-14 02:51:35 4 0

重新训练 PPO1 模型以及将 Ternsorflow 与 SB2 一起使用时出现问题

我是稳定基线和 RL 的新手。我想做的是：从计算机加载之前训练过的模型，然后从上次训练结束的位置开始重新训练它。为此，我在policy_fn()中加载之前…

百善笑为先 2025-01-13 20:06:32 4 0

如何让强化学习同时从多个状态-动作对中学习？

我用的是稳定基线3。SB3中的model.learn函数是根据状态生成一个动作，然后获得奖励，然后训练模型。但是，如果我有多个由（旧）模型生成的状态-动作-…

掩于岁月 2025-01-12 09:47:27 2 0

稳定基线动作空间

如何在稳定的基线上拥有多个动作空间。我的动作空间是离散和盒子的组合。我尝试过gym.spaces.Tuple([gym.spaces.Discrete(5),gym.spaces.Box(low=0.00…

極樂鬼 2025-01-10 01:34:02 3 0

共 2 页
上一页
1
2

友情链接

文江博客

stable-baselines

是否有可能在A2C稳定的基线3中暴露重播缓冲液以包括人类的判断？

属性错误：“框”对象没有属性“形状”；在科拉布

为什么 Stable-Baselines3valuate_policy() 函数永远无法完成？

错误运行模型在本地机器上训练

稳定的基线3-设置“手动” q_values

StableBaselines-3 DDPG + HER 多重处理

无法以数组形状分配内存来创建强化学习模型

stable_baselines模块错误-> “gym.logger”没有属性“MIN_LEVEL”

重新训练 PPO1 模型以及将 Ternsorflow 与 SB2 一起使用时出现问题

如何让强化学习同时从多个状态-动作对中学习？

稳定基线动作空间

热门标签

推荐作者

浪子阿飞

JK.Yang

人间不值得

静待花开

只涨不跌

污浊的双黑

友情链接