文章 0 浏览 3
虽然我知道 SARSA 是政策性的,而 Q-learning 是离策略,当查看他们的公式时,(对我来说)很难看出这两种算法之间的任何区别。 根据强化学习:简介(…
文章 0 评论 0
接受