当前位置：文江博客话题详情

强化学习的良好实施？

发布于 2024-07-17 02:25:41 字数 564 浏览 17 评论 0原文

对于一个人工智能类项目，我需要实现一个强化学习算法，该算法可以击败简单的俄罗斯方块游戏。该游戏是用 Java 编写的，我们有源代码。我了解强化学习理论的基础知识，但想知道 SO 社区中是否有人有此类事情的实践经验。

对于在俄罗斯方块游戏中实施强化学习，您推荐的读物是什么？
是否有任何好的开源项目可以完成类似的事情值得一试？

编辑：越具体越好，但欢迎有关该主题的一般资源。

跟进：

认为如果我发布跟进就更好了。

这是我最终为未来的学生提供的解决方案（代码和文章）:)。

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

山人契 2024-07-24 02:25:41

看看 2009 年 RL 竞赛。问题域之一是俄罗斯方块游戏。前年也出现过俄罗斯方块问题。这是52页最终报告< /a> 来自当年的第五名决赛入围者，其中详细介绍了代理的工作原理。

回复收藏 0 原文

我爱人 2024-07-24 02:25:41

Heaton Research 电子书非常擅长解释神经网络网络概念（带代码）。第 4 章专门介绍机器学习和网络的各种训练方法。有一个可下载的库和示例应用程序供您查看。

回复收藏 0 原文

无远思近则忧 2024-07-24 02:25:41

这是一本关于该主题的好书：

机器学习和数据挖掘：原理和算法简介
作者：Igor Kononenko、Matjaz Kukar（2007 年 6 月）

另请查看这些开源项目：

回复收藏 0 原文

水晶透心 2024-07-24 02:25:41

TD-Gammon、gnubackgammon 或任何其他类似项目在游戏领域取得了巨大成功。

萨顿与 Barto 的书《强化学习：简介》还有一些其他案例研究。

回复收藏 0 原文

羁拥 2024-07-24 02:25:41

这个问题确实很老了，但对于 2018 年阅读此文章的人来说，如果您对现有 RL 算法的可靠参考感兴趣，我强烈建议您使用 OpenAI Baselines。这些算法是由 OpenAI 的一群真正了解这些东西的员工实现的，并且经过了广泛的微调和调试。

公平地说，俄罗斯方块不需要这些，但现在我怀疑家庭作业问题可能涉及一些更复杂的环境。

https://github.com/openai/baselines

更新：

2019年，我还推荐 rlpyt：

< a href="https://github.com/astooke/rlpyt" rel="nofollow noreferrer">https://github.com/astooke/rlpyt

回复收藏 0 原文

以可爱出名 2024-07-24 02:25:41

这并不是专门针对强化学习的，但是斯坦福大学在 Youtube 上的机器学习上有一系列精彩的讲座< /a> 和 iTunes。

该链接指向第一堂课，大约需要 30 分钟才能深入了解内容。

回复收藏 0 原文

谁人与我共长歌 2024-07-24 02:25:41

Burlap 是一个最新的 Java 库，它提供了许多常见强化学习算法的实现以及一些环境和有用的工具。

回复收藏 0 原文

陌伤ぢ 2024-07-24 02:25:41

我建议学习基于java的RL4J。
我正在使用这个，我很惊讶事情是如何顺利进行的，你甚至可以使用 Actor Critic 算法（称为 A3C）在强化学习算法中学习 LSTM 网络，

这是链接：
https://github.com/deeplearning4j/dl4j-examples/blob /master/rl4j-examples/

回复收藏 0 原文

几度春秋 2024-07-24 02:25:41

我注意到这个问题已经过时了（10 年前），现代 RL 框架和环境的集合在这里可能很有用。我为此创建了 GitHub 存储库，并打算定期更新它。

https://github.com/TheMTank/RL-code-resources

回复收藏 0 原文

~没有更多了~

关于作者

草莓味的萝莉

暂无简介

文章

482 人气

关注发私信

友情链接

文江博客

强化学习的良好实施？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（9）

关于作者

相关话题

热门标签

推荐作者

狼性发作

美煞众生

黑凤梨

慕巷

virou

两仪

友情链接

强化学习的良好实施？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（9）

关于作者

相关话题

热门标签

推荐作者

狼性发作

美煞众生

黑凤梨

慕巷

virou

两仪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。