当前位置：文江博客话题详情

在apache flink中使用水槽以阅读目的？

发布于 2025-02-01 08:54:22 字数 591 浏览 3 评论 0原文

我是Apache Flink（和Stackoverflow）的新手，我想知道处理以下方案的最佳实践：

我目前正在使用其他人的应用程序使用Kafkasource消费实时消息。如果这些消息中的键存在于我创建并可以访问的本地数据库中，则其中一些将需要进行转换。然后，此转换的消息需要一一发送到Kafkasink。

为了检查是否需要转换消息，我需要查看本地数据库中该特定消息的密钥是否存在（我必须查询本地数据库以查看每个消息以检查其密钥）。

什么是有效的方法？

我有2个想法：

打开与本地数据库的连接，并执行查询以查看我本地数据库中是否存在该消息的记录。对流中的每条消息重复此操作。
扩展了Flink RichSinkFunction并通过该连接打开连接，并使用Invoke方法执行查询。使用此RichSink重复流中的每条消息。

性能问题：我只想打开一次与本地数据库的连接。我认为方法＃1将打开并关闭每条消息的连接，而方法＃2只能打开并关闭连接一次。

更一般而言，为了阅读目的而在本地数据库中仅运行一些查询是否合适？我不会使用此RichSink实际将任何数据写入本地数据库。

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

胡渣熟男 2025-02-08 08:54:22

从Flink访问外部系统的首选方法是使用asyncFunction： https://nightlies.apache.org/flink/flink/flink/flink/flink-docs-stable/docs/datastream/datastream/operators/apoerators/ashyncio/

数据库可以处理负载并足够快以跟上流吞吐量。如果没有，您将需要从数据库中实现某种CDC流，并将其本地存储为Flink State。然后，让A ConnectedStream 因此，他们都可以在comap或coflatmap操作员中共享状态。

回复收藏 0 原文

把梦留给海 2025-02-08 08:54:22

connectedstream和asyncfunction是解决此类问题的首选方法。

如果您无法访问所有Flink抽象（例如，如果您在Flink的顶部有一些现有框架），但是您可以实例化FlatMapFunction您可以诉诸RichflatMapFunction - 如果您使用Open方法将其实例化，则只需维护与数据库的几个连接。

回复收藏 0 原文

~没有更多了~

关于作者

黯淡〆

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

在apache flink中使用水槽以阅读目的？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

在apache flink中使用水槽以阅读目的？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。