- 1.2 服务介绍
- 1.3.1 概念介绍
- 1.3.2 快速入门
- 1.3.3 申请Quota
- 1.3.4 集群环境
- 1.3.5 Fdsfuse介绍
- 1.3.6 Tensorflow中使用hdfs
- 1.4 客户端使用
- 1.4.1 安装命令行工具
- 1.4.2 使用命令行工具
- 1.4.3 使用Python SDK
- 1.4.4 使用Web控制台
- 1.5 TrainJob功能
- 1.5.1 训练任务组件和流程
- 1.5.2 上手Trainjob
- 1.5.3 使用GPU
- 1.5.4 使用FDS
- 1.5.5 使用Fuse
- 1.5.6 Trainjob高级功能
- 1.5.6.1 分布式训练
- 1.5.6.2 使用前置/后置命令
- 1.5.6.3 自动超参数调优
- 1.5.6.4 自动超参数调优Hpjob
- 1.5.6.5 自动超参数调优Hpjob
- 1.5.6.6 使用自定义镜像
- 1.5.6.7 使用TensorFlow模板应用
- 1.5.6.8 使用HDFS
- 1.5.6.9 使用HDFS FUSE
- 1.6 ModelService功能
- 1.6.1 模型服务使用流程
- 1.6.2 TensorFlow Serving介绍
- 1.6.3 使用GPU模型服务
- 1.6.4 使用多副本和负载均衡
- 1.6.5 在线服务的模型升级
- 1.6.6 模型服务监控
- 1.6.7 使用前置命令和后置命令
- 1.6.8 定制模型服务Docker镜像
- 1.6.9 使用客户端预测
- 1.6.9.1 使用通用gRPC客户端
- 1.6.9.2 使用Python客户端
- 1.6.9.3 使用Java客户端
- 1.6.9.4 使用Scala客户端
- 1.6.9.5 使用Golang客户端
- 1.6.9.6 使用C++客户端
- 1.7 DevEnv功能
- 1.7.1 开发环境使用流程
- 1.7.2 使用命令行管理开发环境
- 1.7.3 使用WEB控制台管理开发环境
- 1.7.4 高级功能
- 1.7.4.1 使用GPU开发环境
- 1.7.4.2 使用FDS FUSE存储
- 1.7.4.3 使用HDFS存储
- 1.7.4.4 使用HDFS FUSE存储
- 1.7.4.5 网络和安全
- 1.7.4.6 监控
- 1.7.4.7 定制开发环境Docker镜像
- 1.7.5 最佳实践
- 1.8 使用率监控
- 1.8.1 GPU使用率监控
- 1.9 TensorboardService功能
- 1.9.1 TensorBoard使用流程
- 1.9.2 TensorBoard介绍
- 1.10 API文档
- 1.10.1 签名规范
- 1.10.2 API文档
- 1.11 问题反馈
- 1.11.1 FAQ
- 1.11.2 技术支持
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
1.4.2 使用命令行工具
简介
我们基于Python SDK实现了命令行工具cloudml,可以方便使用访问Xiaomi Cloud-ML服务。
由于sdk的接口更新较快,命令的使用方式可以通过-h
选项获取最新的使用方法。
初始化配置文件
cloudml init
查看帮助
cloudml -h
TrainJob相关命令
列举训练job
cloudml jobs list
提交训练job
cloudml jobs submit -n linear1 -m trainer.task -u fds://cloud-ml-test/linear/trainer-1.0.tar.gz
命令行参数:
Required | Argument | Type | Example |
---|---|---|---|
Yes | -n --name | string | linear1 |
Yes | -m --module_name | string | trainer.task |
Yes | -u --trainer_uri | string | fds://cloud-ml-test/linear/trainer-1.0.tar.gz |
No | -f --filename | string | tensorflow.json {"job_name": "linear1", "module_name": "trainer.task", "trainer_uri": "fds://cloud-ml-test/linear/trainer-1.0.tar.gz"} |
No | -a --job_args | string | "--max_epochs 10 --optimizer sgd" |
No | -c --cpu_limit | int | 0.1 |
No | -M --memory_limit | string | 100M |
No | -g --gpu_limit | int | 1 |
No | -p --ps_count | int | 1 |
No | -w --worker_count | int | 1 |
No | -d --docker_image | string | cr.d.xiaomi.net/cloud-ml/tensorflow-gpu:1.6.0-xm1.0.0 |
No | -F --framework | string | tensorflow |
No | -V --framework_version | string | 0.11.0-xm1.0.0 |
查看训练job
cloudml jobs describe linear1
查看训练job日志
cloudml jobs logs linear1
删除训练job
cloudml jobs delete linear1
查看job创建日志
cloudml jobs events linear1
ModelService相关命令
列举model服务
cloudml models list
创建model服务
cloudml models create -n model1 -v v1 -u fds://cloud-ml-test/linear_model1
命令行参数:
Required | Argument | Type | Example |
---|---|---|---|
Yes | -n --name | string | model1 |
Yes | -v --version | string | v1 |
Yes | -u --model_uri | string | fds://cloud-ml-test/linear_model1 |
No | -c --cpu_limit | int | 0.1 |
No | -M --memory_limit | string | 100M |
No | -g --gpu_limit | int | 1 |
No | -d --docker_image | string | cr.d.xiaomi.net/cloud-ml/tensorflow-gpu:1.7.0-xm1.0.0 |
No | -F --framework | string | tensorflow |
No | -V --framework_version | string | 0.11.0-xm1.0.0 |
No | -r --replicas | int | 1 |
No | -a --model_args | string | --enable_batching=true |
No | -pc --prepare_command | string | print(time.time()) |
No | -fc --finsh_command | string | print(time.time()) |
查看model详情
cloudml models describe model1 v1
查看model服务日志
cloudml models logs model1 v1
删除model服务
cloudml models delete model1 v1
查看model创建日志
cloudml models events model1 v1
在线请求model服务
cloudml models predict model1 v1 -f data.json
命令行参数:
Required | Argument | Type | Example |
---|---|---|---|
Yes | -f --filename | string | data.json {"keys_dtype": "int32", "keys": [[10], [20]], "X_dtype": "float32", "X": [[10.0], [30.0]] } |
No | -t --timeout | int | 1 |
注意数据文件中所有key必须与export模型时参数相同,而且每个key需要多加一个"_dtype"来表示状态,格式与TensorFlow的dtype格式兼容。
DevEnv相关命令
列举dev环境
cloudml dev list
创建dev环境
cloudml dev create -n dev1 -p mypassword
命令行参数:
Required | Argument | Type | Example |
---|---|---|---|
Yes | -n --name | string | dev1 |
Yes | -p --password | string | mypassword |
No | -c --cpu_limit | int | 0.1 |
No | -M --memory_limit | string | 100M |
No | -g --gpu_limit | int | 1 |
No | -d --docker_image | string | cr.d.xiaomi.net/cloud-ml/tensorflow-gpu:1.7.0-xm1.0.0 |
No | -F --framework | string | tensorflow |
No | -V --framework_version | string | 0.11.0-xm1.0.0 |
查看dev环境
cloudml dev describe dev1
删除dev环境
cloudml dev delete dev1
查看dev创建日志
cloudml dev events dev1
TensorboardService相关命令
列举tensorboard
cloudml tensorboard list
创建tensorboard
cloudml tensorboard create -n tb1 -l fds://cloud-ml-test/linear_tensorboard1
命令行参数:
Required | Argument | Type | Example |
---|---|---|---|
Yes | -n --name | string | tb1 |
Yes | -l --logdir | string | fds://cloud-ml-test/linear_tensorboard1 |
No | -d --docker_image | string | cr.d.xiaomi.net/cloud-ml/tensorflow-gpu:1.7.0-xm1.0.0 |
No | -F --framework | string | tensorflow |
No | -V --framework_version | string | 0.11.0-xm1.0.0 |
查看tensorboard
cloudml tensorboard describe tb1
删除tensorboard
cloudml tensorboard delete tb1
查看tensorboard创建日志
cloudml tensorboard events tb1
其他命令
列举quota
cloudml quota list
列举framework
cloudml framework list
查看版本
cloudml -v
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论