可以通过rpc协议获得hadoop job的相关信息吗

发布于 2021-11-27 19:26:05 字数 582 浏览 774 评论 1

最近阅读了一些有关yarn的资料,了解到yarn框架中的各个节点之间的通信协议,比如以下3个:
1、Client与RM之间的通信协议ApplicationClientProtocol
2、AM和RM之间的通信协议ApplicationMasterProtocol

3、AM和NM之间的通信协议ContainerManagementProtocol

据我所知,作业运行的相关信息都会保存在AM或RM节点,包括:
1、当前作业的进度
2、job含有的map、reduce个数
3、map的运行时间
4、merge、shuffle时间

等等

三个问题:
1、我能不能自己写一个client应用,通过上述的三个协议获取运行中的hadoop的所有如上描述的信息
2、浏览器访问master节点的8088端口,可以获得hadoop集群的相关信息,这个集成在hadoop中的web服务可以获得hadoop集群的所有信息,这个web服务是不是也是通过上述的rpc协议获取到集群信息的呢?
3、我可以通过访问ResourceManager、NodeManager获得集群资源的信息吗,如集群cpu、内存的使用?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

画骨成沙 2021-11-29 09:32:11

三个问题其实是一个问题,理论上,你只要熟悉了rpc的协议,你以上三个问题都可以解决。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文