使用列表或 pcollection 之间的区别

发布于 2025-01-18 11:36:23 字数 144 浏览 0 评论 0原文

我在 apache beam 中构建了一个管道,我只是对此感到好奇,将 ptransform 应用于列表和 pcollection 之间有什么区别,性能是否受此影响,或者只是 pcollection 是不可变的,这是一种不好的方法吗?使用 apache beam 接近管道?

Im building a pipeline in apache beam and I just got curious about this, whats the difference between applying a ptransform to a list and a pcollection, is the performance affected by this or is just that the pcollection is inmutable and is this a bad way to aproach a pipeline with apache beam?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

我的痛♀有谁懂 2025-01-25 11:36:23

根据定义,PCollection 是无界集合。不可变且无界

与列表的主要区别主要在于无界特性,并且当您流式传输数据(来自大文件或来自无界源,如 PubSub)时,它尤其强大。

By definition, a PCollection is a unbounded collection. Immutable, and unbounded.

The main difference with a list is mainly the unbounded characteristic and it's especially powerful when you are streaming data (from a large file, or from a unbounded source, like PubSub).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文