我该如何解决:org.apache.spark.sql.AnalysisException:流数据帧/数据集不支持多个流聚合

发布于 2025-01-11 02:23:07 字数 527 浏览 5 评论 0原文

py4j.protocol.Py4JJavaError:调用 o170.start 时发生错误。 :org.apache.spark.sql.AnalysisException:流数据帧/数据集不支持多个流聚合;;

我收到以下代码的上述错误

timebasedkpi=df \
    .withWatermark("timestamp","10 minutes") \
    .groupBy(window("timestamp","1 minute","1 minute"),"country").agg(sum("total_cost").alias("volume_of_sales"),count("invoice_no").alias("OPM"))

dataQuery=timebasedkpi \
    .writeStream \
    .outputMode("Complete") \
    .format("console") \
    .trigger(processingTime="5 seconds") \
    .start()

py4j.protocol.Py4JJavaError: An error occurred while calling o170.start.
: org.apache.spark.sql.AnalysisException: Multiple streaming aggregations are not supported with streaming DataFrames/Datasets;;

I am getting the above error for the following code

timebasedkpi=df \
    .withWatermark("timestamp","10 minutes") \
    .groupBy(window("timestamp","1 minute","1 minute"),"country").agg(sum("total_cost").alias("volume_of_sales"),count("invoice_no").alias("OPM"))

dataQuery=timebasedkpi \
    .writeStream \
    .outputMode("Complete") \
    .format("console") \
    .trigger(processingTime="5 seconds") \
    .start()

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文