你在这里

你在这里

AIOps的进步可能会震撼你的世界

公众:/ /图片/ davidl.jpg
David Linthicum 德勤咨询首席云战略官

AIOps在许多组织中仍处于试验阶段,尚未确定它能提供什么。大多数人面临的问题是如何找到时间和资金来选择第一次就能成功的AIOps技术堆栈。这项技术本身就很可怕。

然而,报道称,AIOps的可能性和成就继续产生谨慎的乐观情绪和日益增长的紧迫感。这不再是一个如果你会转到AIOps;它的问题

我们可以将AIOps最近的增长归因于两个关键驱动因素。首先,当企业转向复杂的架构时等多重云,当他们无法管理越来越多的具有相同资源和预算的异构系统时,他们最终遇到了瓶颈。第二,有越来越多的安全疑神疑鬼此外,人们还逐渐认识到,今天的安全行动需要更主动的监控和响应。

大多数现有的监视工具已经开始采用AIOps特性。这意味着你从80年代就开始使用的监控工具突然一个AIOps工具.你已经为它的特性和功能付费了,所以你也可以利用它们。从一开始就利用AIOps的云监控工具正变得更加注重战略,许多工具开始连接到更传统的平台以及基于云的系统。

今天,许多技术经理和员工都感到有压力,要在他们的企业中为AIOps打电话。这就是我所说的强行进军AIOps。如果您是被迫参加这次游行的,那么是时候了解一下AIOps技术的实际使用情况了,这样您就可以做出公平和明智的建议。这些新知识应该包括对当前AIOps技术的理解,以及它提供了什么,更重要的是,技术的理解短期和长期前景.随着2022年和2023年许多企业找到通往AIOps的道路,这种教育将变得更加重要。

以下是将在2022年发生的AIOps方面的四项进步——还有一项可能更遥远——以及您的CloudOps团队将从中受益的方式。

1.更好的SecOps集成

虽然这对于执行一般和安全操作的大多数人来说是显而易见的,但大多数AIOps技术工具还没有关注如何做到这一点利用AIOps工具提供更好的安全性

许多企业利用它们的AIOps工具的自动化系统以及它们的连接api来为AIOps形成新的角色。例如,一个常见的新角色是提供对系统遥测的可见性,如网络性能、I/O问题、数据库操作或任何其他可以表明系统是否可能受到攻击的数据。

太多的用户和/或运营团队发现安全漏洞时,发生了超出常规的事情。这可能包括CPU和I/O饱和,这是驻留在某些计算机上的恶意二进制文件的结果,甚至是基于物联网的系统(如设备和车辆)的结果。在过去,这会导致给安全团队打一个电话,后者确实与攻击系统进行了斗争。

更好的方法是积极主动。主动措施要求安全系统不仅能看到验证系统,还能看到可能指示攻击的关键指标。AIOps有潜力实时提供这些参数

许多企业将使用AIOps工具与现有的安全系统集成,以提供这种可见性,而那些处于领先地位的企业现在要求在工具开发人员的关键路径中包含该特性。除了识别漏洞之外,在2022年,您还可以期待AIOps工具进行自动修复。

2.操作性能的改进

性能操作通常包括监视cpu、存储、数据库和应用程序等系统的总体性能的活动。在过去,运营团队会收到用户的抱怨,抱怨响应时间过长,然后做出反应。如今,更多的是在用户感觉到问题之前发现问题,然后使用手动或自动化流程修复问题

大多数AIOps工具可以使用一组预定义的限制来发现性能问题,当问题存在时,这些限制会向操作团队发出警报。然而,大多数工具并没有提供关于如何纠正每个性能问题的预定义过程。在操作的世界里,可能有数百个可能的问题和解决方法。

例如,假设数据库服务器的响应时间从0.3秒下降到0.9秒。由于时间超出了其阈值,AIOps工具生成关于性能问题的警报。

但是现在什么?数据库服务器的性能下降可能有数百个原因,包括服务器内部和外部(如网络问题)。对于大多数利用自动化创建识别问题的流程的AIOps技术提供商和/或用户来说,找到这个问题是一件很难的事情。

在2022年,这一难题将导致周围环境的改善如何发现性能问题更重要的是,如何确定根本原因并自动修复问题。这是AIOps工具真正发挥价值的地方。

事件驱动的操作已经包括对系统问题的警告。很快,它们将包括执行一套复杂的诊断程序以确定原因并部署自动修复程序的能力。运营团队甚至不会参与这些流程。

3.自动接口更新和修复

如果说大多数新旧AIOps系统有什么问题的话,那就是处理管理下的所有系统的接口。有时,这些接口是加密的api或开箱即用的适配器,它们将作为操作集合一部分的系统之间的差异转换为AIOps工具如何处理它们。或者,他们可能有能力以相同的方式处理所有类型的系统组件,包括云和非云组件、数据库、应用程序等。

当接口出现问题时,AIOps用户通常被迫停止系统或更新适配器或其他接口,以解决主要是由于平台自动安装修复和改进而导致的问题,这些修复和改进最终会由于这样或那样的原因破坏适配器和接口。具有讽刺意味的是,能够提供自愈功能的AIOps工具还不能自愈。

2022年的许多变化将集中在这些接口的更新和修复的自动化上。AIOps用户和运维团队将不再需要处理AIOps系统所利用的数百个接口。那些让行动小组成员的工作更加困难的棘手任务将会消失。

4.新的治理集成

新闻快报:大多数AIOps工具都不具备治理意识。一些AIOps工具与允许或拒绝用户访问的安全系统交互。然而,治理是监视用户和应用程序如何使用资源并限制其使用的能力。

例如,有一些治理系统限制api的使用或数据的使用,或者围绕法规遵从性执行策略。治理系统可以监视系统和人类想要使用的任何东西,但是您希望它们以预先定义的方式来做,并包括对它们所能做的事情的限制。

其中一个比较常见的例子是成本治理,有时也被称为财务运营或FinOps。在这里,监控系统(通常是公共云系统)可以按用户、部门、公司等提供基于使用的计费。企业可以通过多种方式跟踪云和非云系统的成本消耗。

AIOps工具将需要与治理系统对话,因为可能存在如何治理事物的操作方面。在成本治理的情况下,中断和性能问题也可能在跟踪中发挥作用。如果一个系统是由使用平率,基于订阅的定价方法和系统是30%的时间,那么它可能是公平信贷这一比例回用户,部门,和/或公司的停机时间是AIOps报告的工具。

与治理工具集成的其他价值还包括能够报告API问题,或者让数据治理系统知道数据库何时宕机或有其他问题。

5.嵌套的、专门的知识库

虽然对于大多数AIOps参与者来说,知识库是一种新的网络特性,但是对于大多数企业来说,利用单一的通用知识库是不够的。即将出现的概念是嵌套的知识库,或者通用存储库,它们可以利用其他专门化的信息,以一种更结构化的方法来发现和解决操作问题。

让我们使用前面示例中性能较差的数据库服务器。AIOps工具可以利用通用知识库,通过使用用户定义的阈值和为AIOps工具提供“知识”的更大的存储经验集来确定存在性能问题。

单独的知识库可以存储和检索有关特定系统的信息,如网络交换机、基于云的存储系统、应用程序,或者在本例中,性能较差的数据库服务器。

其思想是确定与特定系统组件相关的问题的根本原因,并存储与每个组件相关的复杂知识。在我们的数据库服务器性能很差的情况下,知识库可以提供经验,表明该特定数据库服务器的大多数性能问题都与索引系统有关,并首先从那里寻找性能问题的根本原因。

也许它可以自动下载并安装一个尚未有人费心去做的修复程序。或者,它可能是系统需要考虑的其他400件事情之一。

虽然目前这种级别的AIOps有点像科幻小说,但大多数利用AIOps系统的人都想要(很快一般市场将会需求)工具,提供有关操作的一般知识,以及专注于特定组件的能力。AIOps工具提供商可以将这些专门的知识库作为一种选择出售,这样您就不必构建这些存储库或复制其他人已经完成的工作。

多学点知识很好

上述五个进展中的任何一个都可能对您在企业中设计和实现AIOps的方式产生深远的影响。无论您是否部署了AIOps工具包,用户和管理人员都应该了解AIOps在近期可能发生的情况。知道接下来会发生什么很好。

继续学习

阅读更多关于:18beplay官网 它行动
推特 推特 脸谱网 Watsapp 电子邮件 分享