tf-agent

tf-agent

文章 0 浏览 2

tfagents顺序网络中Conv1D输入形状的问题

我已经使用tfagent创建了一个交易环境 env = TradingEnv(df=df.head(100000), lkb=1000) tf_env = tf_py_environment.TFPyEnvironment(env) ,并通过…

和我恋爱吧 2025-02-08 17:06:01 4 0

如何存储TF代理' python中的大查询中的轨迹对象,并将其作为轨迹对象检索

我想将轨迹从TF代理保存到一个大查询表中,并希望根据需要再次将它们回到Python中。 在Python数据框中,将轨迹保存为轨迹对象。但是,我不确定如何保…

内心荒芜 2025-02-05 05:33:42 5 0

使用TensorFlow-Adent保存模型时出错

我正在尝试使用TensorFlow-Agent保存模型。首先,我定义以下内容: collect_policy = tf_agent.collect_policy saver = PolicySaver(collect_policy, …

彩虹直至黑白 2025-02-05 04:13:07 5 0

TF代理在培训强化学习后为所有测试状态采取相同的措施

我正在尝试创建一个自定义的Pyenvironment,以使代理商学习最佳小时,以将通知发送给用户,以基于单击前7天发送的通知获得的奖励。 培训完成后,即使…

一抹苦笑 2025-01-27 17:12:03 7 0

如何在tf_agents中编写自定义策略

我想在TF_AGENTS中使用上下文强盗代理(线性刺激采样剂)。 我正在使用自定义环境,奖励延迟​​了3天。因此,用于训练,观察结果是从保存的历史表(3…

在巴黎塔顶看东京樱花 2025-01-26 04:19:03 6 0

TF代理_ACTION_SPEC:如何为离散动作空间定义正确的形状?

方案1 我的自定义环境具有以下 _ACTION_SPEC : self._action_spec = array_spec.BoundedArraySpec( shape=(highestIndex+1,), dtype=np.int32, minim…

紧拥背影 2025-01-22 11:08:21 6 0

py_environment 'time_step'与“time_step_spec”不匹配- 但我看不出有什么区别

我正在尝试创建一个自定义的TF代理环境来进行交易。当我尝试通过调用 utils.validate_py_environment(环境,情节= 1)来验证它时,我会得到一个value…

爺獨霸怡葒院 2025-01-19 22:06:39 5 0
更多

推荐作者

882123719

文章 0 评论 0

朦胧时间

文章 0 评论 0

alipaysp_DQOPIT9H5Y

文章 0 评论 0

眼藏柔

文章 0 评论 0

微信用户

文章 0 评论 0

寻梦旅人

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文