O Conceito de AIOps

O que é AIOps

O AIOps, acrônimo para Artificial Intelligence Operations, combina Big Data e Machine Learning para automatizar processos de operações de TI, incluindo correlação de eventos, detecção de anomalias e determinação de causalidade, além de fornecer eficiência operacional, com alertas preditivos, evitando paralisações.

As plataformas AIOps aprimoram a tomada de decisão contextualizando grandes quantidades de dados operacionais originários das ferramentas de monitoração de infraestrutura (ITIM), monitoração de aplicação (APM), performance de rede (NPM) e monitoração de experiência digital (DEM), entre outras fontes.

 

O O objetivo é transformar os dados gerados pelas plataformas de sistemas de TI em insights significativos.

 

 

 

 

 

 

 

 

O AIOps endereça os seguintes problemas de ITOps:

  • O modelo quebrou-conserta (totalmente reativo) não funciona mais para operações de TI porque os problemas geralmente são encontrados após o fato ocorrer;
  • Cloud, DevOps e Micro Serviços trazem agilidade mas também adicionam complexidade de gerenciamento devido à sua natureza dinâmica. Sem as ferramentas adequadas, as operações de TI ficam presas em um modo totalmente reativo;
  • A identificação manual de problemas, correlação de eventos e vulnerabilidades são muito lentas e sujeitas a erros;
  • Ruído em operações gerados pelas ferramentas de monitoração em silos limita o sucesso potencial de ITOps em identificar a causa do problema;
  • Processos manuais e tarefas repetitivas consomem esforços e tempo da equipe de operações de TI;
  • Aumento dos custos com ITOps.

Motivação e objetivos da adoção de plataformas de AIOps

Empresas em todo o mundo estão se modernizando rapidamente através da tecnologia com a agilidade, automação e redução proativa de incidentes, fortalecendo seus negócios e gerando maiores expectativas para fornecer uma experiência digital excepcional (DX) aos seus usuários. Confira algumas das soluções necessárias:

  • Melhorar a experiência do cliente (CX) – evitar interrupções no serviço e considerar seus hábitos como usuário
  • Melhorar experiência do colaborador (EX) – criar uma organização e dinâmica para que uma equipe não precise executar a mesma tarefa diversas vezes, por exemplo;
  • Permitir inovação e agilidade – permitir novas tecnologias e serviços digitais As empresas estão se movendo mais rápido do que nunca e devem se adaptar continuamente às novas tecnologias e serviços digitais;
  • Contenção de custos.

Funcionamento do AIOps

O termo Inteligência Artificial para Operações de TI, ou AIOps, foi criado pelo Gartner em 2016 para designar uma categoria de plataformas que utilizam análise de dados através de Machine Learning para aprimorar análises para times de operações de TI.

No gráfico acima fica claro quais são os “inputs” e “outputs” de uma plataforma de AIOps.

Entradas/Inputs:

  • Observabilidade/Monitoração
    • Eventos
    • Métricas
    • Logs
    • Topologia
  • ITSM (Gestão de Serviços de TI)
    • Incidentes
    • Dependências
    • Mudanças
Saídas/Outputs:

  • Análise de dados históricos
  • Detecção de anomalias
  • Análise de performance
  • Correlação e contextualização
  • Automação
  • Análise de risco de uma mudança
  • Gerenciamento do conhecimento
  • Sugestão de soluções previamente utilizadas em cenários semelhantes
  • Execução automática de runbooks
  • Atuar na esteira de desenvolvimento/deploy

O foco do AIOps está na redução do MTTR

AIOps está focada em reduzir o tempo médio de resolução, ou seja, reduzir o MTTR (Mean Time to Repair), pois abrange a soma dos tempos entre a identificação de um incidente e sua correção. Quanto maior o MTTR, maior o impacto na organização.

Coletando informações de diversas fontes de dados e integrações (como ferramentas de monitoramento, logs, eventos, entre outros), analisando o comportamento do ambiente ao longo do tempo através do Machine Learning, uma ferramenta de AIOps pode apontar com maior assertividade para as causas mais prováveis do problema, sem a necessidade de visualizar todos os logs.

 

 

Reduzindo o ruído e fornecendo insights precisos sobre a origem do problema e até mesmo recomendando soluções utilizadas anteriormente pelos times de operação, é possível identificar de forma muito mais rápida o problema e tomar as ações corretivas.

 

 

 

 

 

 

Há um estudo do Forrester que aponta redução média de 50% no tempo médio de resolução (MTTR) em empresas que adotaram o AIOps para apoiar o time de ITOps.

 

 

Comparando os tempos médios com a adoção de AIOps é possível verificar a diminuição expressiva do MTTR, uma vez que o tempo para detecção e identificação do problema é Real Time (utilizando o poder e velocidade do Machine Learning) e em muitos casos, onde é possível sugerir uma solução ou automatizar a execução de um runbook para reduzir os MTTs ao máximo.

Esse é o primeiro conteúdo de uma nova série sobre AIOps. Acesse o blog da GFT Brasil para acompanhar os próximos artigos.