文江博客开发文档 Parl 中文文档 v2.2 文章详情

文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

框架结构

发布于 2024-06-23 17:58:49 字数 990 浏览 0 评论 0 收藏 0

https://www.wenjiangs.com/wp-content/uploads/2024/docimg5/abstractions.png

PARL的目标是构建一个可以完成复杂任务的智能体。以下是用户在逐步构建一个智能体的过程中需要了解到的结构：

Model 用来定义前向 ( Forward )网络，这通常是一个策略网络 ( Policy Network )或者一个值函数网络 ( Value Function )，输入是当前环境状态 ( State )。
Algorithm 定义了具体的算法来更新前向网络 ( Model )，也就是通过定义损失函数来更新 Model 。一个 Algorithm 包含至少一个 Model 。
Agent 负责算法与环境的交互，在交互过程中把生成的数据提供给 Algorithm 来更新模型 ( Model )，数据的预处理流程也一般定义在这里。

提示：请访问教程和 API 文档以获取更多关于基础类的信息。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文