- 1.2 服务介绍
- 1.3.1 概念介绍
- 1.3.2 快速入门
- 1.3.3 申请Quota
- 1.3.4 集群环境
- 1.3.5 Fdsfuse介绍
- 1.3.6 Tensorflow中使用hdfs
- 1.4 客户端使用
- 1.4.1 安装命令行工具
- 1.4.2 使用命令行工具
- 1.4.3 使用Python SDK
- 1.4.4 使用Web控制台
- 1.5 TrainJob功能
- 1.5.1 训练任务组件和流程
- 1.5.2 上手Trainjob
- 1.5.3 使用GPU
- 1.5.4 使用FDS
- 1.5.5 使用Fuse
- 1.5.6 Trainjob高级功能
- 1.5.6.1 分布式训练
- 1.5.6.2 使用前置/后置命令
- 1.5.6.3 自动超参数调优
- 1.5.6.4 自动超参数调优Hpjob
- 1.5.6.5 自动超参数调优Hpjob
- 1.5.6.6 使用自定义镜像
- 1.5.6.7 使用TensorFlow模板应用
- 1.5.6.8 使用HDFS
- 1.5.6.9 使用HDFS FUSE
- 1.6 ModelService功能
- 1.6.1 模型服务使用流程
- 1.6.2 TensorFlow Serving介绍
- 1.6.3 使用GPU模型服务
- 1.6.4 使用多副本和负载均衡
- 1.6.5 在线服务的模型升级
- 1.6.6 模型服务监控
- 1.6.7 使用前置命令和后置命令
- 1.6.8 定制模型服务Docker镜像
- 1.6.9 使用客户端预测
- 1.6.9.1 使用通用gRPC客户端
- 1.6.9.2 使用Python客户端
- 1.6.9.3 使用Java客户端
- 1.6.9.4 使用Scala客户端
- 1.6.9.5 使用Golang客户端
- 1.6.9.6 使用C++客户端
- 1.7 DevEnv功能
- 1.7.1 开发环境使用流程
- 1.7.2 使用命令行管理开发环境
- 1.7.3 使用WEB控制台管理开发环境
- 1.7.4 高级功能
- 1.7.4.1 使用GPU开发环境
- 1.7.4.2 使用FDS FUSE存储
- 1.7.4.3 使用HDFS存储
- 1.7.4.4 使用HDFS FUSE存储
- 1.7.4.5 网络和安全
- 1.7.4.6 监控
- 1.7.4.7 定制开发环境Docker镜像
- 1.7.5 最佳实践
- 1.8 使用率监控
- 1.8.1 GPU使用率监控
- 1.9 TensorboardService功能
- 1.9.1 TensorBoard使用流程
- 1.9.2 TensorBoard介绍
- 1.10 API文档
- 1.10.1 签名规范
- 1.10.2 API文档
- 1.11 问题反馈
- 1.11.1 FAQ
- 1.11.2 技术支持
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
1.7.2 使用命令行管理开发环境
简介
Xiaomi Cloud-ML支持使用 cloudml
命令行管理开发环境。
第一步,初始化命令行工具,首次使用时执行初始化。
第二步,创建开发环境,使用命令行工具提交dev创建请求。
第三步,查看开发环境,开发环境经过排队-调度-创建过程后,进入running
状态,标识该实例创建完成。
第四步,登录开发环境,根据开发环境的IP和端口,SSH连接登录到开发环境。
第五步,进行开发测试,SSH连接到开发环境后,用户可以像使用本地机器一样,进行各种开发测试工作,包括软件安装,代码编写,训练,模型导出等。
第六步,关闭开发环境,开发环境实例使用完毕后,用户可以删除该实例。
初始化命令行工具
第一次使用命令行工具时,需要初始化Xiaomi Cloud-ML命令行工具环境。 对已经初始化过的命令行工具环境,再次执行初始化命令,会覆盖现有设置。
cloudml init
创建开发环境
cloudml dev create -n mydev -p mypassword
命令的参数可以使用cloudml dev create --help
查看,主要使用的参数包括:
-n
是必选参数,开发环境名称。-p
是必选参数,root用户的密码,同样也是SSH和Jupyter的登录密码。-F
是可选参数,表示使用的深度学习框架,可以使用cloudml framework list
查看系统预定义的框架。-V
是可选参数,表示使用的深度学习框架版本。-d
是可选参数,表示使用用户自定的容器镜像地址,注意不可与-F
和-V
同时使用。-c
是可选参数,实例的CPU核数,例如1,2,3,默认是0.5-M
是可选参数,实例的内存大小,例如500M,1G,默认是100M-g
是可选参数,实例的GPU数量,例如1,2,3,默认是0(即不使用GPU)-fe
是可选参数,挂载FDS存储的FDS机房地址,生态云武清机房的地址是cnbj2.fds.api.xiaomi.com
。-fb
是可选参数,挂载FDS存储的bucket名称。
查看开发环境
列出可以访问的所有开发环境
cloudml dev list
根据名称查看一个开发环境的详细信息,使用返回的SSH连接地址即可登录该实例
cloudml dev describe mydev
当开发环境创建失败,或者使用过程中发生crash,可以根据名称查看该开发环境的事件日志
cloudml dev events mydev
登录开发环境
在running
状态的开发环境,对外正常提供服务。用户可以根据上一步拿到的SSH地址连接到实例。
ssh -p 40001 root@10.0.0.2
进行开发测试
SSH连接到开发环境后,用户可以像使用本地机器一样,进行各种开发测试工作,包括软件安装,代码编写,训练,模型导出等。
删除开发环境
使用下列命令,根据开发环境的名称,删除不需要的开发环境。
cloudml dev delete mydev
休眠与重启开发环境
休眠功能与删除功能的区别是,休眠不删除当前环境,只是释放资源,会保存当前环境的数据和配置,需要时可重启。
cloudml dev stop mydev
cloudml dev restart mydev
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论