Spark运行的过程中产生RDD是如何记录下来的
在Spark的web ui中可以看到DAG图以及图中的RDD,这些RDD是如何被记录下来的?如下图:
图中包含的HadoopRDD和MapPartitionsRDD是如何得到的?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
在Spark的web ui中可以看到DAG图以及图中的RDD,这些RDD是如何被记录下来的?如下图:
图中包含的HadoopRDD和MapPartitionsRDD是如何得到的?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
每一个蓝色框代表一个算子,算子内部可能产生中间RDD。这你看看Spark源码就知道了