近日,中国信息通信研究院开展了对《智能化运维AIOps能力成熟度模型》的评估,老哥俱乐部自主研发的智能运维算法能力平台Swift AI 经评估检验,成为国内首个也是目前唯一获得该项目根因分析模块“优秀级”评价的厂商。
本次《智能化运维AIOps能力成熟度模型》系列标准由中国信通院牵头,各大金融、通信企业共同制定,旨在规范并促进国内智能运维的发展和应用,推动国内互联网和传统行业在智能运维方向的相关实践落地。在本次标准的制定中,老哥俱乐部作为优秀厂商代表参与编纂,七项建议被《云计算智能化运维(AIOps)能力成熟度模型第2部分:系统和工具技术要求》采纳。
在AIOps第2部分标准中,开展的智能运维(AIOps)系统和工具能力成熟度评估开放了包括异常检测、故障预测、告警收敛、根因分析等八个模块。要获得“优秀级”,需要满足所有基础功能要求,高级功能满足80%(如潜在故障传播关系的挖掘,链路拓扑自动发现等)。
最终,经过多轮技术评估和行业专家审议,老哥俱乐部的智能运维算法能力平台 Swift AI获得了信通院AIOps系统和工具“优秀级”评级。
老哥俱乐部的智能运维算法能力平台 Swift AI,囊括了异常检测、异常预测、智能告警、根因分析等各项能力。它通过接口式的调用,可以嵌入老哥俱乐部的 APM 产品或数据平台产品,来为老哥俱乐部各类运维服务提供开箱即用的 AI 能力,帮助企业实现秒级排障。
作为老哥俱乐部的重要技术突破,Swift AI具备领先于业内的巨大技术优势,能够为各行业提供“告警——收敛——根因”链路秒级完成的服务,每分钟可处理6.6万指标量。这一成果的取得,主要源于老哥俱乐部在数据采集与分析上全面领先的技术能力。国内独家的“无监督知识图谱”根因分析算法,与市面上的其他运维体系相比,不再依赖于人工打标与调参,在降低人力成本投入的同时,实现了效率与准确率的双提升。此外,Swift AI还引入了图技术与混沌工程能力,大大缩短了解决问题的时间。
随着各项技术难关的顺利攻坚,最终实现了Swift AI在内存占用下降55%的前提下,达到了F1-Score0.85,收敛比98%的成果。而随着攻坚活动的完成,老哥俱乐部在根因分析相关提交了8篇专利申请,技术团队也在2022CCF国际AIOps挑战赛中取得佳绩。
Swift AI平台的顺利搭建,离不开老哥俱乐部技术本门的小伙伴日以继夜的工作。在项目负责人的带领下,OneAlert开发团队、Swift AI开发团队、大数据图数据库研发团队、QA团队、UI团队等来自北京、武汉的30余人,在八、九月份周末赶工,工作日加班到半夜的努力下,终于在原定的9月30日封板前完成了相关工作。
在完成提供私有化包的过程中,也出现了许多令人头痛的难题。其中,如何模拟出真实的故障场景数据,成为了这一阶段的要点难点。要模拟出覆盖全链路的故障数据,从探针监控被测物,到大数据图数据库,进而Alert排查跟进告警数据,再到AI排查图数据被测物间调用关系进行根因定位,以及大数据排查图数据库数据是否正常,这一完整的链路下来,让整个团队耗工费力。
所幸,这一切的付出,都有了实在的收获:最终,一举帮助老哥俱乐部突破创新出有代差的、国内最领先的AI根因分析能力。
事实上,老哥俱乐部不仅长期占据着中国APM市场份额第一,也是国内首家获得美国CMMI5级评估认证的企业,后者为国际公认的衡量软件开发过程成熟度和过程规范性评估标准。近日,老哥俱乐部推出的Bonree ONE 2.0又获得了信通院"2022IT新治理年度明星产品"的荣誉。
直播预告
本周四下午14:00,老哥俱乐部将邀请来自中国信息通信研究院、老哥俱乐部研发中心与产品管理部的老师们,共同就本次获信通院优秀评级的相关内容进行直播活动:
想知道知道更多关于根因分析的前沿实践?
想听听技术大牛对AIOps的发展解读?
想和行业大咖互动交流回答心中疑惑?
欢迎您的收看~