- 第一部分:常用操作
- 第一部分:常用操作 - 1. 操作集群
- 第一部分:常用操作 - 2. 监控集群
- 第一部分:常用操作 - 3. 监控 OSD
- 第一部分:常用操作 - 4. 监控 PG
- 第一部分:常用操作 - 5. 用户管理
- 第一部分:常用操作 - 6. 增加/删除 Monitor
- 第一部分:常用操作 - 7. 增加/删除 OSD
- 第一部分:常用操作 - 8. 操作 Pool
- 第一部分:常用操作 - 9. 管理 Crushmap
- 第一部分:常用操作 - 10. 修改 MON IP
- 第一部分:常用操作 - 11. 修改集群配置
- 第一部分:常用操作 - 12. 日志和调试
- 第二部分:故障处理
- 第二部分:故障处理 - 1. 常见 MON 故障处理
- 第二部分:故障处理 - 2. 常见 OSD 故障处理
- 第二部分:故障处理 - 3. 常见 PG 故障处理
- 第二部分:故障处理 - 4. 全局 Ceph 节点宕机处理
- 第二部分:故障处理 - 5. 单个 Ceph 节点宕机处理
- 第三部分:Ceph 进阶
- 第三部分:Ceph 进阶 - 1. PG 和 PGP 的区别
- 第三部分:Ceph 进阶 - 2. Monitor 的备份和恢复
- 第三部分:Ceph 进阶 - 3. 修改 Cinder/Glance 进程的最大可用 FD
- 第三部分:Ceph 进阶 - 4. 更换 OSD Journal
- 第三部分:Ceph 进阶 - 5. 清空 OSD 的分区表后如何恢复
- 第三部分:Ceph 进阶 - 6. PG 卡在 active + remapped 状态
- 第三部分:Ceph 进阶 - 7. 查看 RBD 镜像的位置
- 第三部分:Ceph 进阶 - 8. 查看 RBD 镜像的实际大小
- 第三部分:Ceph 进阶 - 9. 统计 OSD 上 PG 的数量
- 第三部分:Ceph 进阶 - 10. 查看使用 RBD 镜像的客户端
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
第一部分:常用操作 - 3. 监控 OSD
某 OSD 的状态可以是在集群内( in
)或集群外( out
)、也可以是运行着的( up
)或不在运行的( down
)。如果一个 OSD 处于 up
状态,它也可以是在集群之内 in
(你可以读写数据)或者之外 out
。如果它以前是 in
但最近 out
了, Ceph 会把 PG 迁移到其他 OSD 上。如果某个 OSD out
了, CRUSH 就不会再分配 PG 给它。如果它 down
了,其状态也应该是 out
。默认在 OSD down
掉 300s 后会标记它为 out
状态。
注意:如果某个 OSD 状态为 down & in ,必定有问题,而且集群处于非健康状态。
OSD 监控的一个重要事情就是,当集群启动并运行时,所有 OSD 也应该是启动( up
)并在集群内( in
)运行的。用下列命令查看:
ceph osd stat
其结果会告诉你 osd map 的版本( eNNNN ),总共有多少个 OSD 、几个是 up
的、几个是 in
的。
osdmap e26753: 3 osds: 2 up, 3 in
如果处于 in
状态的 OSD 多于 up
的,用下列命令看看哪些 ceph-osd
守护进程没在运行:
ceph osd tree ::
ID WEIGHT TYPE NAME UP/DOWN REWEIGHT PRIMARY-AFFINITY
-1 0.05997 root default
-2 0.01999 host ceph01
0 0.01999 osd.0 up 1.00000 1.00000
-3 0.01999 host ceph02
1 0.01999 osd.1 up 1.00000 1.00000
-4 0.01999 host ceph03
2 0.01999 osd.2 down 1.00000 1.00000
如果有 OSD 处于 down 状态,请尝试启动该 OSD,启动命令见本手册第一部分 1. 操作集群。如果启动失败,请参考本手册第二部分 2. 常见 OSD 故障处理 中的相关部分进行处理。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论