Spark 2集群资源动态分配给正在运行的作业

发布于 2025-01-12 09:30:34 字数 362 浏览 5 评论 0原文

我们有一个 Spark 2 HDInsight 集群，具有 650 GB 和 195 个 Vcore。这是一个 9 个工作节点和 2 个头节点的集群。问题在于作业没有充分利用集群。例如，当我运行一项作业时，它仅使用 164 GB 内存，而我们有 650 GB 内存。我通过将 spark.executor.memory 从 10 GB 增加到 40 GB 解决了这个问题。 Spark.executor.instances 是 16 。但当我运行多个作业时，问题又出现了。首先发生的作业将使用整个集群直到完成。其他作业将仅处于运行模式，内存仅有 3 GB。要求是，当只有一个作业运行时，集群必须得到充分利用。如果有多个作业，则必须在作业之间共享资源（Ram 和 Vcore）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

没︽人懂的悲伤 2025-01-19 09:30:34

我建议您将纱线调度程序更改为容量调度程序。这样更利于资源共享。这将帮助您确保更好地共享资源。默认情况下，hadoop 是“先进先出”的。我非常不同意 100% 使用 HDInsight。您将执行程序增加到 40GB 的修复正是 3GB 的新作业无法进入集群的原因。（仅仅因为您分配了 40GB 并不意味着您的作业将使用它。）如果您想增加集群使用率，您可以考虑添加线程较少的执行程序以充分利用集群。这与容量调度程序和容量调度程序相结合。先发制人可能是获得更高性能和灵活性的答案。

回复收藏 0 原文

~没有更多了~