11.2 分析方法与过程
应用系统出现故障通常不是突然瘫痪造成的(除非对服务器直接断电),而是一个渐变的过程[19]。例如,系统长时间运行,数据会持续写入存储,存储空间逐渐变少,最终磁盘被写满而导致系统故障。由此可知,在不考虑人为因素的影响时,存储空间随时间变化存在很强的关联性,且历史数据对未来的发展存在一定的影响,故本案例可采用时间序列分析法对磁盘已使用空间进行预测分析。
采用时间序列分析法分析磁盘性能数据,预测未来的磁盘使用空间的情况,其挖掘建模的总体流程如图11-3所示。
图11-3 建模流程图
应用系统容量预测建模过程主要包含以下步骤。
1)从数据源中选择性抽取历史数据与每天定时抽取数据。
2)对抽取的数据进行周期性分析以及数据清洗、数据变换等操作后,形成建模数据。
3)采用时间序列分析法对建模数据进行模型的构建,利用模型预测服务器磁盘已使用情况。
4)应用模型预测服务器磁盘将要使用情况,通过预测到的磁盘使用大小与磁盘容量大小按照定制化标准进行判断,将结果反馈给系统管理员,提示管理员需要注意磁盘的使用情况。
11.2.1 数据抽取
磁盘使用情况的数据都存放在性能数据中,而监控采集的性能数据中存在大量的其他属性数据。为了抽取出磁盘数据,以属性的标识号(TARGET_ID)与采集指标的时间(COLLECTTIME)为条件,对性能数据进行抽取。本案例抽取2014-10-01至2014-11-16财务管理系统中某一台数据库服务器的磁盘的相关数据。
11.2.2 数据探索分析
由于本例是采用时序分析法进行建模的,为了建模的需要,需要探索数据的平稳性。通过时序图可以初步发现数据的平稳性。针对服务器磁盘已使用大小,以天为单位,进行周期性分析,其时序图如图11-4和图11-5所示。
图11-4 C盘已使用空间的时序图
图11-5 D盘已使用空间的时序图
由图11-4和图11-5可以得知,磁盘的使用情况都不具备有周期性,它们表现出缓慢性增长,呈现趋势性。因此,可以初步确认数据是非平稳的。
11.2.3 数据预处理
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论