是否需要检查点在流媒体工作中进行三角洲湖合并操作

发布于 2025-01-22 12:26:10 字数 314 浏览 5 评论 0原文

我有一个了解,对于a spark流媒体合并要有一个检查点位置指定在作业重新启动上不处理两次的内容(即使操作是愿意的,并且在示例笔记本)。正确吗?

I have an understanding that for a spark streaming merge it's helpful to have a checkpoint location specified to not process stuff twice on the job restart (even if the operation is idempotent and ins't mentioned in example notebook). Is it correct?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

何时共饮酒 2025-01-29 12:26:10

如果您没有指定检查点的位置,则每次将重新处理所有数据时。

If you don't specify the location of the checkpoint, each time all the data will be reprocessed.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文