云智慧AIOps智能运维应用实战之统一告警

  • 时间:
  • 浏览:0
  • 来源:极速快3_快3链接_极速快3链接

    企业IT系统构建是一二个 聚沙成塔的过程,伴随业务规模的不断增长,IT系统太久、IT架构的繁复度呈指数级增长,运维部门承受着巨大的管理压力,这就还要对离散的IT监测系统和海量的告警数据进行统一的架构设计 、避免和呈现。

    云智慧教育基于大数据和机器学习算法构建的智能运维统一告警平台,都都可以接入各种主流监控系统的告警消息与数据,实现统一的告警接入、发送与避免,帮助用户打通数据孤岛,建立统一标准与管理规范,减少对运维的事务性干扰,提升运维和企业运营的整体管理水平。

    智能化统一告警管理典型应用场景和需求分析

    智能运维统一告警平台广泛适用于核心业务对IT的依赖程度较高,具有较大IT规模和较高IT心智心智成熟 是什么 图片 图片 是什么是什么期图片 度的中大型企业,非常重视IT效率对业务效能的提升,希望充分利用云计算、大数据、人工智能技术,从而获得互联网+和数字化转型的成功,然而在现实中常常具备以下场景行态:

    业务系统繁多:包括企业HR系统、OA系统、财务系统、订单系统、ERP系统、协同系统、进销存系统等多个业务系统;

     IT系统规模繁复:IT系统的繁复性因为对应的监控系统繁多,监控系统分散但关联性很强,技术体系不统一,而且 已非常陈旧;

     运维压力巨大:运维人员少,在多个监控系统间往返,工作效率低,不断受到业务部门的投诉和抱怨,绩效考核难,流动性大,新人培养困难;

    智能运维统一告警应用场景和管理需求如下:

    监控系统离散,各个监控系统的告警规则设置土法律法律依据不同,告警消息分散存储,不便于统一管理;

    告警通知土法律法律依据有限,基本采用邮件和短信告警,时不时会造成“告警风暴”,各个业务系统的告警土法律法律依据不同,无法自定义告警消息格式;

    告警后定位这一 的问题困难,还要都都可以快速知晓并定位这一 的问题,针对告警消息关联定位到历史快照;

     缺少避免具体告警这一 的问题避免的自动化运维手段,针对 “模式化”这一 的问题,还要通过告警事件形成标准的自动化避免手段(如服务自动重启)等;

    不够统一的告警分析及避免平台,缺少集中的告警事件消息的展现及避免界面,分散管理造成人工及管理成本的增加;

    尚未建立健全面向标准规范的告警事件避免机制与流程,无法与企业的ITIL等事件管理流程及系统进行对接,无法形成面向这一 的问题事件分级避免的管理模型及支持面向运维人员的可量化KPI考核体系。

    智能化统一告警管理避免方案

    云智慧教育智能运维统一告警平台可通过restAPI 、Agent 等架构设计 土法律法律依据实现多套监控系统数据的统一接入告警平台,形成统一派单、统一运维的效果,建立更加完正的监控体系,帮助企业用户达成二个“统一”:统一管理、统一规范、统一避免、统一展现、统一通道、统一权限。

    整合主流的开源监控工具及商用监控产品,将以上各种监控软件架构设计 的性能指标参数通过该平台进行统一的告警规则及发送、排班设定,同时也支持直接接入并发送这一 监控系统产生的告警消息;

     支持手机短信、电子邮件、电一句话音、企业微信、App推送等多种告警通知土法律法律依据;

     告警平台能帮助用户在一二个 统一平台上可视化查看及管理IT系统的所有告警消息,基于可配置的这一 的问题事件等级管理及与外部系统的集成接口,帮助企业用户形成标准的告警事件避免流程和考评体系。

统一告警平台围绕接入发现、设置部署、异常告警、关闭总结的闭环管理流程进行设计,帮助企业构建蕴含“监控、工单、自动化运维”等完正的运维支撑体系,达到设备接入可发现、无盲点,监控手段同步跟进,异常具体情况及时预警,故障告警完正跟踪,故障避免避免方案可归档的互联网级运维响应目标。

    智能化统一告警管理典型案例

    某金融公司拥有 80 余套核心业务监控系统,而且每个系统会独立的产生告警通知,当时不时出现大规模故障时,运维人员同一定会收到来自各个系统的极少量告警通知,对正常的工作造成了极大困扰。

    通过部署云智慧教育智能告警平台,利用 restAPI 、Agent 架构设计 等土法律法律依据对接各个监控系统,将各个系统的告警消息进行统一汇聚和整合,让运维人员在一二个 平台上接收、避免所有故障消息,配合前文提到的告警抑制和智能关联分析功能,大幅缩短了整个运维团队的平均接手时间(MTTA,Mean Time To Assistant缩写),从过去的平均 25 分 23 秒降低到了 4 分 16 秒。

    自 2016 年云智慧教育推出智能运维统一告警平台以来,因为在银行、证券、保险、航空、医药、制造、新零售等数二个行业的上百家中大型客户中得到了成功部署和良好运行。在 2018 年 7 月Gartner发表的《Hype Cycle for ICT in China, 2018》中,云智慧教育籍此平台成为AIOps领域的Sample Vendors。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户亲戚亲戚朋友,发现稿件所处不实报道,欢迎读者反馈、纠正、举报这一 的问题(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及因为所处的风险,任何后果均由读者自行承担。

声明:本文转载自第三方媒体,如需转载,请联系版权方授权转载。协助申请