hdfs资源同步问题
场景如下:
1.2个集群互不通信,只有2台主机可以通过sftp命令连接。
2.主机1上有个磁盘约50G,需要先从集群A上hdfs fs -get文件,然后通过sftp命令拉回到主机2上,由于hdfs文件约400G,所以需要分批执行
3.在主机2上使用hadoop -put命令上传到集群2
这样的自动化脚本应该怎么写,需要每周都执行一次
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
两个集群是不通的,我解决了,通过expect脚本来弄的
hadoop distcp 命令在copy