dataflow

dataflow

文章 0 浏览 7

数据流 如何将 PubSub 消息写入 GCS 单独文件

我有一个场景,其中有一个流数据流。逻辑是从 PubSub 订阅中读取 json 数据 并对外部系统进行 api 调用。如果外部系统无法访问,我需要将 json 数据保…

宫墨修音 2025-01-14 05:12:42 5 0

Azure Synapse、SQL 池作为数据流中的源

我尝试使用 Azure Analitycs DataFlow 中的无服务器 SQL 池集成数据集作为源,但我不能。 SQL Pool 无法作为 DataFlow 中的源,但我不知道为什么? 有…

瑶笙 2025-01-14 00:44:39 4 0

使用动态表目标功能将 XML 数据流传输至 Bigquery(面临延迟问题)

我是数据流新手,并遇到了以下问题。 问题陈述:需要数据流作业 (Python) 将 XML 从 GCS 加载到 Bigquery(批量加载)。 Bigquery 中的目标表是动态的…

画尸师 2025-01-12 21:42:03 3 0

Azure 数据工厂数据流 - Parquet、架构和数据类型“任意”

我在 Azure 数据工厂中有一个数据流,它正在从 Parquet 文件读取数据。除了一个文件之外,它对所有文件都运行顺利。 数据流失败并出现错误:无法从文…

水晶透心 2025-01-12 03:52:10 4 0

如何使用python在数据流批处理管道中写入bigquery后执行独立函数?

我试图在成功加载到bigquery后将文件移动到不同的存储桶,但独立函数在管道启动之前执行如何计算独立函数“process()”的执行时间以在成功加载后运行…

方圜几里 2025-01-11 15:09:58 4 0

具有 apache beam 和运行时参数的动态路径

我正在创建一个管道模板,它接受一些输入文件并计算其上的单词数。到目前为止一切正常,但问题是我需要传递另一个参数(来自我调用模板的函数),该参…

始于初秋 2025-01-10 21:01:20 5 0

数据流代码无法使用 Dataflow Runner 执行,但可以在 DirectRunner 上正常运行

我的输入文件中有大约 20 列,但在输出文件(structural_cols)中,我只需要在 structured_cols_header 中指定的 10 列。应在输出文件中选择名称与 St…

寂寞笑我太脆弱 2025-01-09 16:26:49 2 0

Apache Beam DataFlow Runner 在启动期间写入数据存储/强制限制时抛出错误

我最近将 GCP 数据流上的管道从版本 2.27 更新到版本 2.34 使用 WriteToDataStore 连接器的管道由于以下错误而失败: Error message from worker: Tra…

向地狱狂奔 2025-01-09 11:34:41 6 0

为什么数据流编程不规范?

我编写了一个简单的遗传算法来进化字符串“helloworld”。我写了两次。第一次是用类来写的。第二次仅使用函数编写,其中遗传世界的整个状态从一个函数…

天生の放荡 2025-01-06 13:34:56 2 0

javac数据流分析的奇怪误报

我有以下形式的代码: class Test { private final A t; public Test() { for ( ... : ... ) { final A u = null; } t = new A(); } private class A …

信仰 2025-01-01 12:52:47 5 0

支持“增量计算”的编程工具链(甚至可能是 C/C++)

我想编写算法,为大数据集准备结果。然后,当每个数据集发生更改时,增量更新所有受影响的输出。 它被称为:增量计算。 是否有编程工具、库、编译器、…

桜花祭 2024-12-28 07:01:52 6 0

Python 中具有依赖关系的惰性数据流(类似电子表格)属性

我的问题如下:我有一些 python 类,它们具有从其他属性派生的属性;一旦计算完毕,就应该缓存它们,并且每次更改基本属性时,缓存的结果都应该失效。…

狂之美人 2024-12-19 00:12:27 5 0

SSIS:使用变量数据从 XML 源创建 CSV 文件

在 SSIS 中,我尝试使用来自 Web 服务的数据来创建 csv 文件。 在我的控制流中,我创建了一个 Web 服务任务,它将其输出保存到用户变量中。 当 Web 服…

红尘作伴 2024-12-17 09:49:05 2 0

SSIS 需要具有 2 个相同列标题的平面文件输出

我正在尝试使用 SSIS 平面文件目标,但无法想出解决方法来使输出文件具有命名为同一事物的两列。 我要求输出文件具有列标题: first1, last1, email, …

魔法唧唧 2024-12-12 07:13:17 4 0

SSIS:导入文件,有些带有列名,有些没有

或者可能是由于日志设备的配置不一致,我需要通过 SSIS 加载 csv 文件的集合,该集合有时会具有带有列名称的第一行,有时则不会。文件格式在其他方面…

烟花易冷人易散 2024-12-08 18:39:27 5 0
更多

推荐作者

佚名

文章 0 评论 0

今天

文章 0 评论 0

゛时过境迁

文章 0 评论 0

达拉崩吧

文章 0 评论 0

呆萌少年

文章 0 评论 0

孤者何惧

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文