Google DataFlow可以连接到API数据源并将数据插入大查询

发布于 2025-01-23 02:52:27 字数 178 浏览 4 评论 0 原文

我们很少探索几种用例，在这些情况下，我们可能需要摄取SCADA/PIMS设备生成的数据。出于安全原因，我们不允许直接连接到OT设备或数据源。因此，此数据具有REST API，可用于消耗数据。请建议是否可以使用数据流或任何其他服务来捕获此数据并将其放入大查询或任何其他相关目标服务中。如果可能的话，请围绕此类要求分享任何相关的文档/链接。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

剧终人散尽 2025-01-30 02:52:27

是的！

这是您需要知道的：当您编写Apache Beam Pipeline时，您的处理逻辑将以您创建的 dofn 生活。这些功能可以调用您想要的任何逻辑。如果您的数据源是无界或大的，那么您将作者创作“可分割 dofn ”，可以由多个工具机并并行读取和检查点读取。您将需要弄清楚如何从REST API中准确地摄入，以及如何不压倒您的服务；这通常是最难的部分。

也就是说，您可能希望使用其他方法，例如将数据推入Cloud Pubsub。然后，您将使用Cloud DataFlow读取Cloud PubSub的数据。这将在您的设备和数据处理之间提供自然可扩展的队列。