TiDB Dashboard 集群诊断页面

发布于 2020-10-26 07:01:34 字数 2233 浏览 979 评论 0 收藏 0

集群诊断是在指定的时间范围内，对集群可能存在的问题进行诊断，并将诊断结果和一些集群相关的负载监控信息汇总成一个诊断报告。诊断报告是网页形式，通过浏览器保存后可离线浏览和传阅。

注意：
集群诊断功能依赖于集群中部署有 Prometheus 监控组件，参见 TiUP 或 TiDB Ansible 部署文档了解如何部署监控组件。若集群中没有部署监控组件，生成的诊断报告中将提示生成失败。

访问

可以通过以下两种方法访问集群诊断页面：

登录后，左侧导航条点击集群诊断（Cluster Diagnose）：
在浏览器中访问 http://127.0.0.1:2379/dashboard/（将 127.0.0.1:2379 替换为任意实际 PD 地址和端口）。

生成诊断报告

如果想对一个时间范围内的集群进行诊断，查看集群的负载等情况，可以使用以下步骤来生成一段时间范围的诊断报告：

设置区间的开始时间，例如 2020-05-21 14:40:00。
设置区间长度。例如 10 min 。
点击开始。

生成单个时间段的诊断报告

注意：
建议生成报告的时间范围在 1 min ~ 60 min 内，目前不建议生成超过 1 小时范围的报告。

以上操作会生成 2020-05-21 14:40:00 至 2020-05-21 14:50:00 时间范围的诊断报告。点击开始 (start) 后，会看到以下界面，生成进度 (progress) 是生成报告的进度条，生成报告完成后，点击查看报告 (View Full Report) 即可。

生成报告的进度