spark中分区是如何产生的
spark中的partition可以通过api来设置,如果不设置的会,系统会自动分区吗?分区的逻辑是什么?按照block,每个block来设置一个分区?
有没有人啊- -。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
spark中的partition可以通过api来设置,如果不设置的会,系统会自动分区吗?分区的逻辑是什么?按照block,每个block来设置一个分区?
有没有人啊- -。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
"Normally, Spark tries to set the number of partitions automatically based on your cluster. However, you can also set it manually by passing it as a second parameter to parallelize"文档是这么说的.
如果是HDFS读出来,一个block就是一个分区。如果从kafka读,一个kafka Partition就是一个分区……
会根据你的电脑的cpu核数自动分配