使用kafka向elasticsearch导入数据,如何获取导入数据的进度以及错误的日志?

发布于 2022-09-06 02:37:32 字数 405 浏览 22 评论 0

我们目前采用的数据导入的框架是这样的:
clipboard.png

但是consumer是我们用kafka-python写的python代码,当程序崩溃的时候,有保护机制重新启动,但是有时会重复导入相同数据。
同时这个consumer还要更新数据导入的进度到es以及收集错误的日志。

想向大家咨询一下,大家一般都是用什么方式来确保数据完整,以及如何获取数据导入进度和错误日志的呢?

比如有没有使用kafka-connect-elasticsearch 或者 spark streaming?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

茶底世界 2022-09-13 02:37:32

这里同时,同步一个我在stackoverflow上的提问, 虽然给答案加了一分,但是目前回答并没有解决进度和错误日志的问题。地址: https://stackoverflow.com/que...

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文