仅显示前20行

发布于 2025-01-26 14:39:04 字数 404 浏览 2 评论 0原文

我有一个流数据集。它从Kafka流读取并写入控制台。

 val outputStream = inputStream.writeStream.format("console")
                    .option("truncate", value = false)
                    .option("checkpointLocation", "checkpoint")

 outputStream.start()

 spark.streams.awaitAnyTermination()

但是,当有多个记录时,我会在控制台上收到一条消息: 仅显示前20个行

,仅显示20个记录。有没有办法检索所有记录?

火花版本:3.1.2

I have a streaming dataset. It reads from Kafka stream and writes into console.

 val outputStream = inputStream.writeStream.format("console")
                    .option("truncate", value = false)
                    .option("checkpointLocation", "checkpoint")

 outputStream.start()

 spark.streams.awaitAnyTermination()

However when there are more than one record, I get a message on console :
only showing top 20 rows

And it shows only 20 records. Is there a way to retrieve all records ??

Spark version : 3.1.2

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

[旋木] 2025-02-02 14:39:04

有一个选项numrows,例如:10000。

val outputStream = inputStream.writeStream.format("console")
                    .option("truncate", value = false)
                    .option("numRows",10000)
                    .option("checkpointLocation", "checkpoint")

There is an option numRows, for example: 10000.

val outputStream = inputStream.writeStream.format("console")
                    .option("truncate", value = false)
                    .option("numRows",10000)
                    .option("checkpointLocation", "checkpoint")
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文