返回介绍

第一部分:常用操作 - 3. 监控 OSD

发布于 2020-08-30 11:37:26 字数 2103 浏览 1312 评论 0 收藏 0


某 OSD 的状态可以是在集群内( in )或集群外( out )、也可以是运行着的( up )或不在运行的( down )。如果一个 OSD 处于 up 状态,它也可以是在集群之内 in (你可以读写数据)或者之外 out 。如果它以前是 in 但最近 out 了, Ceph 会把 PG 迁移到其他 OSD 上。如果某个 OSD out 了, CRUSH 就不会再分配 PG 给它。如果它 down 了,其状态也应该是 out 。默认在 OSD down 掉 300s 后会标记它为 out 状态。

注意:如果某个 OSD 状态为 down & in ,必定有问题,而且集群处于非健康状态。

OSD 监控的一个重要事情就是,当集群启动并运行时,所有 OSD 也应该是启动( up )并在集群内( in )运行的。用下列命令查看:

  1. ceph osd stat

其结果会告诉你 osd map 的版本( eNNNN ),总共有多少个 OSD 、几个是 up 的、几个是 in 的。

  1. osdmap e26753: 3 osds: 2 up, 3 in

如果处于 in 状态的 OSD 多于 up 的,用下列命令看看哪些 ceph-osd 守护进程没在运行:

  1. ceph osd tree ::
  2. ID WEIGHT TYPE NAME UP/DOWN REWEIGHT PRIMARY-AFFINITY
  3. -1 0.05997 root default
  4. -2 0.01999 host ceph01
  5. 0 0.01999 osd.0 up 1.00000 1.00000
  6. -3 0.01999 host ceph02
  7. 1 0.01999 osd.1 up 1.00000 1.00000
  8. -4 0.01999 host ceph03
  9. 2 0.01999 osd.2 down 1.00000 1.00000

如果有 OSD 处于 down 状态,请尝试启动该 OSD,启动命令见本手册第一部分 1. 操作集群。如果启动失败,请参考本手册第二部分 2. 常见 OSD 故障处理 中的相关部分进行处理。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文