Nagios飞信报警不正常
我的nagios报警方式为飞信 现在的问题是有时候能报警,有时候就没有任何反应 麻烦路过的指点一二 谢谢了
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
我的nagios报警方式为飞信 现在的问题是有时候能报警,有时候就没有任何反应 麻烦路过的指点一二 谢谢了
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(5)
原来也用过libfetion,感觉短信丢失率没这么高吧,应该在95%左右吧,延迟也还好,一般10秒内基本能收到(移动短信队列不堵的时候),不知道现在飞信的丢失率咋样了,不过据说飞信1各月只能发5000条吧,至于每天是否有限制就不清楚了
我想,如果nagios可以正常出发告警(比如先用邮件或其他程序代替飞信),那么就要检查飞信是否有问题了
个人觉得可能飞信的问题大一点
p.s. 目前公司使用短信网关,但是我有点倾向于直接触发GSM Modem,因为这样几乎没有闪失(除非通信运营商数据挂了,但这种可能很小,个人也只经历过一次)
回复 3# luwenju
过奖了,没什么大名
没有任何反应的时候,检测可以从以下三个方面入手:
1)确认nagios的notification是否正常发出,nagios的log中可以查到相关的记录;
2)最好把你的fetion相关的脚本加上debug选项,调试的时候把日志打开,可以确认fetion接口是否正常调用,是否正常发送;
3)如果以上两个步骤都正常,那就看看fetion那边是否有问题。
回复 2# chenl
久闻石头兄大名,之前在刘宇博客中看到过你的名字,而且也去过你的BBS 呵呵
我开始以为是版本的问题 但是换了版本后还是这样
commands.cfg添加的内容如下
# 'notify-host-by-fei' command definition
define command {
command_name host-notify-by-fetion
command_line /usr/local/fetion/fetion --mobile=13511111111 --pwd=luwenju0518 --
to=$CONTACTPAGER$ --msg-utf8="Host $HOSTSTATE$ alert for $HOSTNAME$! on '$LONGDATETIME$'" $CONTACTPAGER
$
}
# 'notify-service-by-fei' command definition
define command {
command_name service-notify-by-fetion
command_line /usr/local/fetion/fetion --mobile=13511111111 --pwd=luwenju0518 --to=
$CONTACTPAGER$ --msg-utf8="$HOSTADDRESS$ $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ on $LONGDATETIME$"
$CONTACTPAGER$
}
contacts.cfg联系人设置的如下
define contact{
contact_name nagiosadmin
use generic-contact
alias Nagios Admin
host_notification_period 24x7
service_notification_period 24x7
host_notification_options d,r
service_notification_options c,w,r
service_notification_commands service-notify-by-fetion
host_notification_commands host-notify-by-fetion
pager 1351111111111
}
监控的主机的配置文件如下
define host {
use linux-server
host_name win2003
alias win2003
check_command check-host-alive
address 192.168.0.13
}
define hostgroup {
hostgroup_name win2003
alias win2003
members win2003
}
define service {
use generic-service
host_name win2003
service_description PING
check_command check_ping!100.0,20%!500.0,60%
}
麻烦石头兄指点一下
呵呵,这问题提的好,我相信没谁能分析出来原因 :)