我在运行 Spark Streaming 时遇到问题。有人可以帮我吗?
I have a problem running Spark Streaming. Can someone please help me below?
由于您正在使用 /Filestore,我相信您正在使用 databricks。下面的代码将帮助您启动 Spark 流上下文。
如果您使用的是 databricks,请清除所有状态并运行以下代码。
from pyspark import SparkContext from pyspark.streaming import StreamingContext ssc = StreamingContext(spark.sparkContext, 1) dstream = ssc.textFileStream("<Folder/File location") dstream.saveAsTextFiles("<Destination folder/file location") ssc.start() ssc.awaitTermination()
我建议您开始使用 Spark 结构化流,而不是使用标准流选项。
https://spark.apache.org/docs/latest/结构化流编程指南.html
Since you are using /Filestore, I believe you are using databricks.Below code would help you to start a spark streaming context.
If you are using databricks, clear all the states and run the below code.
I would suggest you to start using spark structured streaming, instead of using standard streaming option.
https://spark.apache.org/docs/latest/structured-streaming-programming-guide.html
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(1)
由于您正在使用 /Filestore,我相信您正在使用 databricks。
下面的代码将帮助您启动 Spark 流上下文。
如果您使用的是 databricks,请清除所有状态并运行以下代码。
我建议您开始使用 Spark 结构化流,而不是使用标准流选项。
https://spark.apache.org/docs/latest/结构化流编程指南.html
Since you are using /Filestore, I believe you are using databricks.
Below code would help you to start a spark streaming context.
If you are using databricks, clear all the states and run the below code.
I would suggest you to start using spark structured streaming, instead of using standard streaming option.
https://spark.apache.org/docs/latest/structured-streaming-programming-guide.html