tfagents顺序网络中Conv1D输入形状的问题
我已经使用tfagent创建了一个交易环境 env = TradingEnv(df=df.head(100000), lkb=1000) tf_env = tf_py_environment.TFPyEnvironment(env) ,并通过…
如何存储TF代理' python中的大查询中的轨迹对象,并将其作为轨迹对象检索
我想将轨迹从TF代理保存到一个大查询表中,并希望根据需要再次将它们回到Python中。 在Python数据框中,将轨迹保存为轨迹对象。但是,我不确定如何保…
使用TensorFlow-Adent保存模型时出错
我正在尝试使用TensorFlow-Agent保存模型。首先,我定义以下内容: collect_policy = tf_agent.collect_policy saver = PolicySaver(collect_policy, …
TF代理在培训强化学习后为所有测试状态采取相同的措施
我正在尝试创建一个自定义的Pyenvironment,以使代理商学习最佳小时,以将通知发送给用户,以基于单击前7天发送的通知获得的奖励。 培训完成后,即使…
TF代理_ACTION_SPEC:如何为离散动作空间定义正确的形状?
方案1 我的自定义环境具有以下 _ACTION_SPEC : self._action_spec = array_spec.BoundedArraySpec( shape=(highestIndex+1,), dtype=np.int32, minim…
py_environment 'time_step'与“time_step_spec”不匹配- 但我看不出有什么区别
我正在尝试创建一个自定义的TF代理环境来进行交易。当我尝试通过调用 utils.validate_py_environment(环境,情节= 1)来验证它时,我会得到一个value…
- 共 1 页
- 1