AI新趋势——Minerva智能运维平台(下)

  2019-08-30 20:03:17

        在上一篇名为《AI新趋势—Minerva智能运维开发平台(上)》的文章中,我们简单介绍了智能运维的兴起以及群顶科技Minerva智能运维平台的架构与价值。在本篇文章中我们将选取Minerva智能运维平台的典型应用场景进行介绍。

一、磁盘健康智能管理系统  


随着信息化的高速发展以及云计算、云存储、物联网等新兴技术的发展,需要海量存储系统的有力支撑,随着数据的重要性不断增加,以磁盘为基础的存储设备故障所造成的事故影响越来越大,数据的恢复成本越来越高,因此对磁盘的智能化管理的要求也越来越高。

磁盘健康智能管理系统采用自适应、可扩展方式采集磁盘信息,利用机器学习算法,结合真实的磁盘生命周期数据,建立磁盘健康评估以及剩余寿命预测模型,评估磁盘当前的健康状态,预测磁盘的剩余寿命,实现磁盘健康智能管理。


二、云数据中心资源合理分配与任务调度

随着云数据中心规模的日益扩大,云计算平台的高能耗及其引起的环境问题引起了广泛的关注。如何在保障服务质量的情况下有效降低云数据中心的总体能耗,提高资源利用率,实现云计算系统的可持续发展,实现“绿色云计算”是当前面临的一个巨大挑战。

降低云数据中心整体能耗的两大重点在于降低计算与存储设备和温控设备的能耗。云计算可通过以下两种策略充分发挥本身的技术优势,优化业务资源配置,提高资源的利用率,实现节能目标。



2.1 合理的资源配置算法

分析数据中心任务调度分布,选择合适的任务执行节点,综合任务优先级、资源配置、资源亲和性等维度,基于机器学习算法构建多目标资源调度策略,实现低能耗的任务调度。


2.2 低能耗任务调度策略

分析数据中心任务调度分布,选择合适的任务执行节点,综合任务优先级、资源配置、资源亲和性等维度,基于机器学习算法构建多目标资源调度策略,实现低能耗的任务调度。

三、网络设备端口全流程智能管理

4G网络发展以来,互联网技术得到了新的突破。各种各样的网络服务越来越多的融入日常生活中来,人们对网络流量的需求也逐渐增加。实现网络设备端口全流程管理也是网络时代提出的必然要求。
其主要分为以下三个关键步骤:

3.1 端口流量动态感知

根据历史流量数据,建立时序分析模型,感知流量动态变化趋势,建立动态阈值区间,实时监控端口流量,感知流量异常,并根据异常种类及持续时长判断是否触发告警,帮助运维人员及时感知业务异常。

3.2 端口流量异常根因定位

针对端口流量异常确定异常链路,定向采集异常链路对端设备日志数据,结合日志及链路流量异常构建故障定位树,推断异常根因。帮助运维人员快速定位故障,最大程度缩短故障持续时间,降低故障带来的影响。


3.3 端口设备扩缩容

根据业务历史流量数据,利用时序预测算法预测未来一段时间内的流量,根据流量预测结果,对设备针对性执行扩缩容操作,保障业务安全稳定运行同时最大程度地节约资源。

Minerva智能运维平台的智能故障预测依托强大的大数据分析和机器学习能力,建立起面向业务场景的故障发现、定位、预测模型,对IT历史数据进行关联分析和深度学习,同时与监控系统实时获取的流式监测数据结合,进行IT故障的趋势分析和预测,在故障发生之前提前通过预测作出判断,帮助运维人员更好定位故障并采取有效措施,避免或者减少损失。

Copyright © 2007-2018.版权所有:南京群顶科技有限公司