如何通过警报实时监控Python脚本
我有很多 python 脚本在不同的机器上运行(PC 和服务器)。 这些 Python 脚本正在执行各种操作(抓取、处理 Excel 文件、调用 API 来存储数据等)。 …
忽略普罗米修斯查询中的特定标签集
我有一个带有 2 个标签的指标。两个标签都可以有 2 个值 A 或 B。 我想对所有值求和并排除 Label1=A 和 Label2=B 时的情况。 sum by (Label1,Label2)(…
我是否需要 Kibana/ Grafana,或者我可以使用 Google Cloud Operations OOTB 套件做同样的事情吗?
我有一个客户使用 Kibana 进行应用程序日志监控,现在正在迁移到 GCP,但问题是他们是否仍然需要 Kibana 进行应用程序日志监控、仪表板?或者他们可以…
如何将具有外部IP的主动代理连接到zabbix?
大家下午好,我在活动代理连接到服务器时遇到问题。之前没有问题,但是3台主机出现了问题。 配置代理: PidFile=/run/zabbix/zabbix_agentd.pid LogFi…
使用 Google Cloud Monitoring 数据源从 Grafana 检索 Cloud 数据流自定义计数器
我尝试使用 Google Cloud Monitoring 数据源将 Cloud Dataflow 作业中的自定义计数器读取到 Grafana 中,但无法做到这一点(我能够从 Stackdriver 监…
将时间序列中的间隔设置为 1 秒
我正在尝试使用 lucene 查询在 grafana 中显示来自弹性搜索的日志。它总体上有效,但我想将时间序列中的间隔设置为 1 秒,但从 grafana ui 看来我可以…
使用 Prometheus 监控 Pod 内部
我想知道是否可以使用 Prometheus 获取 Pod 内服务的指标。 我的意思不是监视 Pod,而是监视这些 Pod 内的进程。例如,容器内部运行有 apache 或 ngin…
Terraform Google Uptime 检查模块 - 如何指定区域
我想指定一个区域来运行正常运行时间检查。我指定了参数 selected_regions 并指定了值“北美”,但出现以下错误 我的 terraform 代码 resource "googl…
Prometheus远程写入mTLS
我正在尝试设置 Prometheus 到 Prometheus 指标流,我可以通过标志 --enable-feature=remote-write-receiver 来完成此操作。 但是我需要那里有 mTLS,…
如何读取 Windows“虚拟字节” Java 中的 Java 进程的性能计数器?
也许利用 jniwrap.jar 和 winpack.jar 这样我就不必推出自己的 JNI代码,如何读取 Java 服务的“虚拟字节”性能计数器?该服务将读取自己的性能计数器…
PCFAgent 查询需要哪些权限?
我正在使用我编写的一个小应用程序来查询 QM 上某些队列的状态。查询本身是使用 PCFAgent/PCFMessageAgent java 类完成的。 我的问题是:必须授予哪些…
如何在没有 SSH 隧道的情况下使用 Cacti 监控远程服务器?
Nagios 使用 NRPE 插件来监控远程进程。 所以你只需要在远程机器上打开一个端口。 对于 Cacti,您需要打开所有必需的端口,以便 shell 脚本可以检索数…