google-cloud-dataflow

google-cloud-dataflow

文章 0 浏览 1

如何在数据流中执行后处理任务?执行管道后的后处理费用

我正在使用Apache Beam处理数据流,并且正在读取GCS存储桶中的输入文件。管道执行后,我想执行一些任务,例如将输入文件移动到其他GCS位置。 我编写了…

情话已封尘 2025-01-26 05:52:42 3 0

在云功能中触发云功能,该功能监视云存储和触发数据流

我在Python中创建了一个云功能,该云功能如果在云存储中创建或修改了任何文件,并且使用我在Apache Beam中创建的模板中的模板中触发了一个作业云并将…

偏闹i 2025-01-26 02:24:04 2 0

如何更新数据流的SDK版本

我使用模板(dataStream to BigQuery)创建了数据流作业。 一切都很好,但是当我打开DataFlow作业页面时,在横向作业信息窗格中,我想起了: 建议使用…

月牙弯弯 2025-01-26 01:36:25 3 0

可以将Apache Beam管道用于批量编排吗?

我是Apache Beam环境中的新手。 试图适合Apache Beam管道进行批处理编排。 我对批处理的定义如下如下 ==>一组工作, job ==>可以有一个或多个…

失退 2025-01-25 13:46:11 4 0

Beam to BigQuery默默地未能创建BigQuery桌子

我正在构建从PubSub到Beam(直接/DataFlow Runner)再到大查询的数据管道。今天,我们开始遇到问题,即Beam IO BigQuery连接器停止自动创建表,并且没…

无边思念无边月 2025-01-25 02:52:23 5 0

触发云存储 - 数据流

我现在从现在开始,需要一些帮助,我有一个自定义模型,我使用apache beam创建的管道创建了一条管道,该管道从存储桶中的文件夹中获取CSV文件,然后将…

感性 2025-01-25 00:50:53 6 0

在输出文件名中添加时间戳

我们有一个很长的管道,我们希望将时间戳添加到文件名中,以尽可能接近管道结束。 我们提出的解决方案是使用 filenamepolicy ,它似乎可以正常工作,…

傻比既视感 2025-01-24 11:15:23 5 0

如何使用Java从GCP存储桶中读取JSON文件

我正在尝试阅读一个JSON文件并将其映射到Gson对象,使用不起作用的Filereader疲倦阅读,也尝试了多种方式,但没有运气。 public static Response[] ge…

萌化 2025-01-24 00:52:52 4 0

动态查询to apache_beam.io.gcp.bigquery.readfrombigquery

我需要在Apache Beam管道中运行动态查询。该查询应根据消息中的值在运行时进行评估。 IE 从mytable中选择 *,其中mycolumn =<<动态值> 我…

诠释孤独 2025-01-23 23:33:25 4 0

Google DataFlow可以连接到API数据源并将数据插入大查询

我们很少探索几种用例,在这些情况下,我们可能需要摄取SCADA/PIMS设备生成的数据。 出于安全原因,我们不允许直接连接到OT设备或数据源。因此,此数…

猫九 2025-01-23 02:52:27 4 0

带有数据流的Apache Beam:flag' image_unknown_columns'对于writetobigquery不起作用

我正在使用Apache Beam(Python SDK版本2.37.0)和Google DataFlow构建流媒体管道,以编写我通过PubSub到BigQuery接收的一些数据。 我处理数据并最终…

梦年海沫深 2025-01-22 18:24:28 4 0

Google Cloud Platform-数据流从Python Web应用程序提交批处理作业。将分期文件写入Google Cloud Storage的间歇性访问问题

背景:我的Web应用程序使用创建的服务帐户调用数据流,在复活节周末之前,这很好。 但是从那时起,当作业提交并尝试在我的Google云存储存储桶上创建登…

青衫负雪 2025-01-22 15:59:43 3 0

GCP云功能 - 9分钟配额。我还有什么其他选择

我有一个Python代码,该代码读取API的数据并创建JSON(它不仅是一个简单的读取,也有相同的转换), 我需要将数据输入GCP(特别是云存储),并且需要…

苦行僧 2025-01-22 10:11:44 3 0

如何进行零停机时间升级和低延迟流GCP数据流?

我已经设置了用Python编写的自定义数据流程作业,该作业仅将图像(由PubSub消息Triggerd)从一个存储桶复制到另一个,然后发送HTTP请求。 它看起来像…

も星光 2025-01-21 14:05:34 3 0

python SDK代码示例Apache Beam中可分布的DOFNS

我正在用Python创建一个数据流管线,因为我想访问并跟踪处理的文件名。 一切正常,直到我的文件很小。在大型文件(GB的数据)上运行时,数据流作业不…

冷月断魂刀 2025-01-21 12:10:53 4 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文