返回介绍

第二部分:故障处理 - 5. 单个 Ceph 节点宕机处理

发布于 2020-08-30 11:37:27 字数 756 浏览 1220 评论 0 收藏 0


在某些情况下,如服务器硬件故障,造成单台 Ceph 节点宕机无法启动,可以按照本节所示流程将该节点上的 OSD 移除集群,从而达到 Ceph 集群的恢复。

5.1 单台 Ceph 节点宕机处理步骤

  1. 登陆 ceph monitor 节点,查询 ceph 状态:

    ceph health detail

  2. 将故障节点上的所有 osd 设置成 out,该步骤会触发数据 recovery, 需要等待数据迁移完成, 同时观察虚拟机是否正常:

    ceph osd out osd_id

  3. 从 crushmap 将 osd 移除,该步骤会触发数据 reblance,等待数据迁移完成,同时观察虚拟机是否正常:

    ceph osd crush remove osd_name

  4. 删除 osd 的认证: ceph auth del osd_name

  5. 删除 osd :ceph osd rm osd_id

5.2 恢复后检查步骤

  1. 检查 ceph 集群状态正常;
  2. 检查虚拟机状态正常;
  3. 楚天云人员检查虚拟机业务是否正常;
  4. 检查平台服务正常:nova、cinder、glance;
  5. 创建新卷正常;
  6. 创建虚拟机正常。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文