当前位置：文江博客话题详情

创建警报和最佳实践

发布于 2025-01-16 05:42:19 字数 650 浏览 0 评论 0原文

一些背景知识：我们已经设置了新的 grafana 安装并拥有 AWS Cloudwatch 和 AWS Cloudwatch。添加了 Prometheus 数据源。我导入了一些仪表板并根据我们的需要定制了它们。

其中之一是这个： https://grafana.com/grafana/dashboards/7587

在仪表板上我有显示器设置如下 - probe_success{instance=~"$target", job="$App"}

我们的环境由各种生产、登台和测试服务器组成（它们的主机名表明它们属于哪个环境）

例如： srv01-分期 srv01-生产

我正在尝试创建一个警报来仅监视生产服务器的 HTTP 响应。

我的警报代码如下： probe_success{job = “nameofjob”}

我的问题是，即使在我不想要的临时/测试环境中，这也会对所有失败发出警报。

我不相信我们可以在警报中使用变量 - 或者即使可以，我也无法让它工作。

总而言之：分段警报的最佳方法是什么，这样我就不会收到关于我们的暂存/测试环境问题的通知？

非常感谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

櫻之舞 2025-01-23 05:42:19

您可以通过显式设置与生产匹配的标签来仅触发生产指标：

probe_success{job="nameofjob", namespace="product"} 或 probe_success{job="nameofjob", server =~"prod-.*"} （服务器和命名空间是任意标签。命名空间在 kubernetes 环境中很常见）。

或者排除您不想要的环境，例如：

probe_success{job="nameofjob", namespace!~"staging|test"}

使用任何可以区分生产环境和其他环境的标签。如果您没有这样的标签，那么您应该添加一个。

一些可以帮助您的资源：

回复收藏 0 原文

~没有更多了~

关于作者

゛时过境迁

暂无简介

文章

24 人气

关注发私信

╰ゝ天使的微笑

文章 0 评论 0

关注

少女净妖师

文章 0 评论 0

关注

朱洁

文章 0 评论 0

关注

觉浅

文章 0 评论 0

关注

滥情空心

文章 0 评论 0

关注

hl1314520

文章 0 评论 0

友情链接

文江博客

创建警报和最佳实践

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签