文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
3.3 Spark 技术原理篇
3.3.1 作业执行流程
图 15 spark 运行流程图
流程如下:
构建 Spark Application 的运行环境,启动 SparkContext
SparkContext 向资源管理器(可以是 Standalone,Mesos,Yarn)申请运行 Executor 资源,并启动 StandaloneExecutorbackend,
Executor 向 SparkContext 申请 Task
SparkContext 将应用程序分发给 Executor
SparkContext 构建成 DAG 图,将 DAG 图分解成 Stage、将 Taskset 发送给 Task Scheduler,最后由 Task Scheduler 将 Task 发送给 Executor 运行
Task 在 Executor 上运行,运行完释放所有资源
说明:Job=多个 stage,Stage=多个同种 task, Task 分为 ShuffleMapTask 和 ResultTask,Dependency 分为 ShuffleDependency 和 NarrowDependency
3.3.2 作业调度
DAG:Directed Acyclic Graph 有向无环图
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论