当前位置：文江博客话题详情

迭代列表状态，有数百万张唱片

发布于 2025-02-02 18:59:11 字数 167 浏览 5 评论 0原文

我想将所有CDC记录存储在列表状态中，并在收到触发消息后将这些记录流式传输到各自的水槽。

列表状态可以成长为一百万个记录，keyedProcessfunction中的列表状态是否会导致内存问题？计划使用RockSDB状态后端存储该州。在这种情况下，流列表状态的正确方法是什么？

需要登录才能够评论，你可以免费注册一个本站的账号。

挽心 2025-02-09 18:59:12

关于listState的内存使用情况，此答案说明了如何与rocksdb状态后端一起使用内存： https://stackoverflow.com/a/666622888/19059974

看来整个列表似乎需要适合堆，因此根据您的元素大小，可能需要很多内存。

理想情况下，您希望将状态键入较小的分区，因此在增加任务并行性时可以扩散。另外，解决方法可能是使用mapState，它在迭代地图上迭代时似乎并未将所有内容加载到内存中。它将使用比listState的存储更多的存储空间，并且很可能附加不会那么快，但是应该让您使用更少的内存来迭代它。

~没有更多了~

暂无简介

文章

26 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0