关于运维监控系统,想听听各位高见。
本帖最后由 kelela 于 2010-07-23 22:46 编辑
个人觉得理想状态的监控系统,可以监测主机/网络/应用/数据库/业务系统的数据变化,并有多极报警功能,同时可以多角度展示数据
系统能够在监测对象发生问题后,自动控制和修复远程系统(有限度的)
系统还可以提供数据与BI或工作流系统交互
不知道大家如何认为,或者各位心目中的完美监控系统是怎样的?请不吝赐教。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(9)
本帖最后由 逸&moto163 于 2010-07-31 01:55 编辑
关注,只用过nagios做监控!
web页面可使用https,不过由于在内网,所以也没启用。
监控数据库时,是要用个程序来应答DB密码,不过这个密码程序只能由web页查询时调用(root直接执行程序不输出,并且web对应的用户无shell(同样不可直接输出),这是为了安全起见)
但我对密码加密本身没什么太多研究,最近准备有空看看资料。
是所监控的数据加密,还是登录密码加密?
数据监控我看可以放在内网,然后做个web。从公司可以登录到这个web查看所监控的信息。当然要做限制,只允许公司ip来登录。
不知道你门用什么软件来监控的。
回复 6# chinaciscoccie
汗。偶写的不是软文(晕,不会理解为此地无银三百两吧-_-||)
我只是目前在做监控系统(自己公司用的),希望不要有任何缺漏,所以想抛砖引玉听听高人的意见
另,最近在研究密码加密问题,否则监控数据库就不大安全了。
希望各位不吝赐教,非常感谢
软文。
solarwinds orion 谁用过?
至少那张图片不错
没有任何厂商的标志啊
2楼是广告。。。而且产品还不怎么样,晕{:3_188:}
楼上的是做广告的吧!
首先监控系统最应该关注故障处理和数据展现,先说说数据展现,看过太多的监控软件,从2008年奥运会用的新加坡网利,到国内的游龙等,大家都在追求好的监控数据的展现方式,这里讨论的展现方式不是说多么好看的报表,那些还上不了台面。这里讨论的数据展现关注的是如何让用户怎么使用这些监控数据。大家可能看到过这样的系统,一上来左边就看到一堆IT资源的树列表,点击哪个就看哪个;或者好一点的是把这些IT资源在左边树里面,按照设备类型分了一下类;其实一直以来运维监控领域就一直在关注数据展现这个问题,像什么BSM等这些概念,那到底什么才是好的数据展现方式呢?BSM指出了一个方向,那就是把IT资源和业务关联在一起,方向是没错的,但到底如何做呢?我们看到国内很多软件公司跟风BSM,但开发出来的东西确实不敢说好用。我们认为一个理想的BSM监控数据展现方式应该是这样的,IT资源在监控系统内部是按照一个统一的方式来看待的,不管你是一台服务器、还是一个服务器上的CPU利用率;当我们想建立BSM视图的时候,可以非常方便的把这些IT资源任意的拖动到我们的视图里来,如下图所示:
主视图监控orig.gif (46.95 KB, 下载次数: 71)
下载附件
2010-07-24 06:57 上传
现在再来说说故障处理,一个好的故障处理方式应该是灵活的,现在看到好多开源监控软件提供的阀值设置都很简单,就一个值,一个比较方式,一个故障级别;其实阀值设置这一块应该比这个更灵活,如有这样一个场景,有台服务器如果在10分钟内,有两次ping在150ms-200ms之间的,就应该向操作人员告警;这里只是以阀值这个最常用的故障判断方式为例来说明故障处理,下图是我们的一个阀值设置截图:
监控_阀值设置.gif (6.89 KB, 下载次数: 65)
下载附件
阀值设置
2010-07-24 07:04 上传
有机会到讨论,好的监控系统更多的是细节,欢迎使用我们提供的永久免费IT监控软件,我们的联系方式mail:yunweitec@yahoo.cn; qq: 1054618780;
from yunweitec