Os ambientes digitais de hoje, com certeza, nos permitem chegar a resultados muito melhores do que há alguns anos. Entretanto, para prover tanta capacidade às empresas, as estruturas também se tornaram muito mais complexas. Aplicações, servidores, cloud, equipamentos de rede... São muitas as variáveis nestes ambientes que, atualmente, não param de crescer ou ser alterados, tendo em vista que, para chegar em um determinado resultado, um número maior de componentes/alterações é exigido.
Com isso em mente, como uma resposta a esta complexidade cada vez maior, algumas soluções de telemetria surgiram no mercado. Mas será que somente isso seria o suficiente? Antes de mais nada, precisamos lembrar que não é possível controlar o que não podemos ver; visualizar os problemas, o consumo de recursos como memória e o processamento dos nossos equipamentos é imprescindível nas empresas de hoje.
Essas soluções são muito eficientes na identificação de problemas e erros, diminuindo o número de reuniões para resolver adversidades nas estruturas das empresas (War Rooms) e, mesmo quando elas ainda precisam acontecer, o tempo para conhecimento da causa raiz tem sido reduzido em números consideráveis. Aqui, podemos pensar, principalmente, na economia do tempo, já que os profissionais podem passar mais tempo dedicados às suas reais funções, sem desperdiçar horas ou até dias em salas de reunião.
Porém, as necessidades aumentaram, tanto no que é visualizado como no que é feito com essas informações coletadas e apresentadas, e aqui está a chave para entendermos qual é a ideia do conceito de observability. É preciso, sim, visualizar informações sobre a minha estrutura, visando resolver problemas já conhecidos, mas também ter noção de como erros e configurações pouco performáticas podem nos impactar sem que saibamos. Além disso, é necessário dar ferramentas ao usuário para que este possa utilizar os dados fornecidos de forma inteligente e coerente com as necessidades reais do seu ambiente.
Somente dizer se determinado sistema ou aplicação está up ou down não é suficiente. Atualmente, há ferramentas para prover informações do ponto de vista das aplicações que temos em nossas estruturas, fazendo com que consigamos visualizar, em alguns casos, em que ponto do código o problema reside. Quando olhamos para elementos de Data Center conseguimos ter informações sobre uso de CPU, memória, além de visualizar, por exemplo, como a carga de trabalho está se comportando em um determinado equipamento, fazendo com que, em estruturas de cloud, possamos entender se existe a possibilidade de utilizar uma especificação menor para aquela carga de trabalho.
Podemos ver alguns exemplos do que pode ser visualizado e como essas ferramentas têm auxiliado neste processo, entretanto, algumas delas chegam ao nível de mostrar ao usuário o quanto de impacto financeiro uma mudança, ou até uma parada que esteja acontecendo, está gerando à sua empresa. Porém, todos esses itens dizem respeito a várias frentes: redes, servidores, cloud, aplicações, entre outras. A implementação de uma ou várias soluções que estejam focadas nestes elementos é um processo, desde a instrumentação, que deve acontecer corretamente de forma a eliminar falsos positivos, até a forma correta dos itens que devemos visualizar, como também no adoption, fazendo com que os usuários não só utilizem as plataformas, mas que as usem da forma correta.
Existe um caminho a ser perseguido para que a sua rede seja realmente observável, considerando que vários produtos de diferentes fabricantes podem ser necessários para que a sua estrutura esteja visível. Vale ressaltar que itens adicionados nesses ambientes precisam, também, ser adicionados a estas plataformas, para que não passem a existir “buracos” ou pontos cegos que formem partes de sua estrutura que não poderão ser visualizadas.
Como dito anteriormente, observability é uma jornada, um processo necessário que nos faz ter ambientes mais controlados, proativos e possíveis de serem corrigidos de forma cada vez mais breve - quanto maior a granularidade de informações, maiores as chances de chegar à causa raiz real do problema. Essa jornada é um caminho sem volta que, se a sua empresa ainda não tem se preocupado, deverá fazer isso o quanto antes, pois a vida de todos é simplificada quando temos processos estruturados e essas ferramentas trabalhando para nós.
*Daniel de Oliveira é Soluctions Architect da NTT Ltd.