文江博客开发文档 Ceph 运维手册文章详情

文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

第二部分：故障处理 - 5. 单个 Ceph 节点宕机处理

发布于 2020-08-30 11:37:27 字数 756 浏览 1220 评论 0 收藏 0

在某些情况下，如服务器硬件故障，造成单台 Ceph 节点宕机无法启动，可以按照本节所示流程将该节点上的 OSD 移除集群，从而达到 Ceph 集群的恢复。

5.1 单台 Ceph 节点宕机处理步骤

登陆 ceph monitor 节点，查询 ceph 状态：
ceph health detail
将故障节点上的所有 osd 设置成 out，该步骤会触发数据 recovery, 需要等待数据迁移完成, 同时观察虚拟机是否正常：
ceph osd out osd_id
从 crushmap 将 osd 移除，该步骤会触发数据 reblance，等待数据迁移完成，同时观察虚拟机是否正常：
ceph osd crush remove osd_name
删除 osd 的认证： ceph auth del osd_name
删除 osd ：ceph osd rm osd_id

5.2 恢复后检查步骤

检查 ceph 集群状态正常；
检查虚拟机状态正常；
楚天云人员检查虚拟机业务是否正常；
检查平台服务正常：nova、cinder、glance；
创建新卷正常；
创建虚拟机正常。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文