stable-baselines

stable-baselines

文章 0 浏览 1

是否有可能在A2C稳定的基线3中暴露重播缓冲液以包括人类的判断?

我正在使用 stable-baselines3 中的 A2C (Advantage Actor Critic) 框架 (包链接在这里)用于解决奖励为+1或0的强化问题的包。我有一个自动机制来将奖…

帝王念 2025-01-20 23:20:08 4 0

属性错误:“框”对象没有属性“形状”;在科拉布

我厌倦了在 colab 中使用 stable-baselines3 加载模型,使用以下代码: !pip install stable-baselines3[extra] from stable_baselines3 import DQN f…

栀梦 2025-01-20 07:46:30 4 0

为什么 Stable-Baselines3valuate_policy() 函数永远无法完成?

我已经使用OpenAI健身房和稳定的Baselines创建了自己的自定义环境3。一旦训练了代理,我将尝试使用stable_baselines3.common.evaluation的estaiute_po…

爱殇璃 2025-01-20 01:05:52 6 0

错误运行模型在本地机器上训练

我使用Lambda Labs Cloud Service的GPU实例培训了增强学习模型。我用于培训的库是Stable_baselines3。 当我尝试在本地计算机上运行模型时,我会收到以…

人│生佛魔见 2025-01-18 04:33:05 4 0

稳定的基线3-设置“手动” q_values

我所做的是, 我正在使用稳定基线3中的DQN算法进行两个玩家板类型游戏。在此游戏中,有40个动作可用,但是一旦制定了,就无法再做一次。 我用对手训练…

羁拥 2025-01-17 20:33:56 8 0

StableBaselines-3 DDPG + HER 多重处理

我正在阅读有关 HER 的文档以及 stable-baselines3 网站中有关多重处理的文档 但是,当我尝试训练时,它会抛出错误! 有没有使用 replay_buffer 进行…

淡笑忘祈一世凡恋 2025-01-15 22:42:15 3 0

无法以数组形状分配内存来创建强化学习模型

我正在尝试为 mario 环境创建 DQN 模型。但是当我尝试创建模型时,它给了我这个错误: 内存错误:无法为形状为 (1000000, 1, 4, 240, 256) 和数据类型…

被你宠の有点坏 2025-01-15 22:32:04 6 0

stable_baselines模块错误-> “gym.logger”没有属性“MIN_LEVEL”

我正在尝试使用 stable_baselines,但我尝试使用的任何模型都会给我带来相同的错误: 模块“gym.logger”没有属性“MIN_LEVEL” 我已从他们的网站附加…

遮云壑 2025-01-14 02:51:35 4 0

重新训练 PPO1 模型以及将 Ternsorflow 与 SB2 一起使用时出现问题

我是稳定基线和 RL 的新手。我想做的是: 从计算机加载之前训练过的模型,然后从上次训练结束的位置开始重新训练它。为此,我在policy_fn()中加载之前…

百善笑为先 2025-01-13 20:06:32 4 0

如何让强化学习同时从多个状态-动作对中学习?

我用的是稳定基线3。SB3中的model.learn函数是根据状态生成一个动作,然后获得奖励,然后训练模型。但是,如果我有多个由(旧)模型生成的状态-动作-…

掩于岁月 2025-01-12 09:47:27 2 0

稳定基线动作空间

如何在稳定的基线上拥有多个动作空间。我的动作空间是离散和盒子的组合。我尝试过gym.spaces.Tuple([gym.spaces.Discrete(5),gym.spaces.Box(low=0.00…

極樂鬼 2025-01-10 01:34:02 3 0
更多

推荐作者

浪子阿飞

文章 0 评论 0

JK.Yang

文章 0 评论 0

人间不值得

文章 0 评论 0

静待花开

文章 0 评论 0

只涨不跌

文章 0 评论 0

污浊的双黑

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文