如何调查Spark中发生的Kryo缓冲区溢出？

发布于 2025-01-30 02:49:40 字数 567 浏览 2 评论 0原文

我遇到了Kryo缓冲区溢出异常，但是我真的不明白哪些数据比当前的缓冲区大小还需要更多。我已经有spark.kryoserializer.buffer.max设置为256MB，甚至在数据集项目上应用的to绳，这应该比Kryo所需的要大得多，却要小于（每个项目）。

我知道我可以增加此参数，现在我会增加此参数，但是我认为这不是一个好习惯，可以在不调查发生的事情时简单地增加资源（与我得到OOM相同并简单地增加RAM分配的情况相同）。不检查什么需要更多的RAM）

=＆gt;因此，是否有一种方法可以调查沿火花DAG执行的缓冲区中放置的内容？

我在Spark UI中找不到任何东西。

请注意， Kryo Serialialser如何在Spark 中分配缓冲液不是同一问题。它询问它是如何工作的（实际上没有人回答），我问如何调查。在上面的问题中，所有答案讨论要使用的参数，我知道要使用哪种参数，并且我确实通过增加参数来避免例外。但是，我已经消耗了太多的RAM，需要优化它，包括Kryo缓冲区。

原文

分享到QQ

分享到微博