Indisponibilidade no acesso às lojas virtuais (Azure - Microsoft)
Incident Report for Linx Commerce
Postmortem

Incidente:

No dia 26 de junho de 2024, partir das 17:50, a nossa monitoria identificou uma queda em alguns serviços da Microsoft Azure, que impactaram o funcionamento das lojas, causando lentidão e indisponibilidade dos nossos sites.

Causa:

Após análise realizada pelo nosso time de Engenharia e Infraestrutura, identificamos que, dentre os problemas relatados pela Microsoft, dois deles impactaram diretamente a nossa operação. O  Load Balancer, responsável por direcionar as requisições da nossa aplicação para alguns recursos vitais que suportam o pleno funcionamento de nossa plataforma; e o Cache for Redis, responsável pela gestão de nossos caches aplicacionais.  

Solução:

Durante o incidente o time de engenharia entrou em contato com a Microsoft para acompanhar a resolução do problema. Como o tempo de resolução do incidente foi maior do que o esperado em um primeiro momento, o nosso time de Infraestrutura iniciou um trabalho para configurar uma estrutura de contingência para que os sites funcionassem sem o Redis Cache gerenciado pela Microsoft.  

Após essas ações imediatas, seguimos proativamente monitorando o serviço para assegurar sua total estabilidade. As contramedidas estabelecidas permanecerão por, no mínimo, 24 horas, até termos total certeza de que o serviço prestado pelo parceiro está com o uptime esperado.

Posted Jul 01, 2024 - 09:58 GMT-03:00

Resolved
Prezados,

Informamos que o nosso fornecedor, a Azure/Microsoft, nos atualizou com o status de encerramento de seu incidente às 20:55.

Manteremos nosso plano de contingencia, junto a nossa infraestrutura on-premise, apartada da Azure, para que seja utilizada caso tenha retorno de um novo incidente por parte do nosso fornecedor.

Agradecemos pela paciência e compreensão durante esse período e reforçamos nosso compromisso em oferecer para vocês a melhor experiência possível.

Estamos disponíveis para qualquer dúvida ou assistência adicional que possam precisar.

Atenciosamente,
Equipe Linx Commerce
Posted Jun 26, 2024 - 21:15 GMT-03:00
Monitoring
Prezados,

Nosso fornecedor, a Azure/Microsoft nos atualizou informando que seguem trabalhando em busca da normalização de seus serviços.

Seguimos com o incidente inteiramente relacionado ao nosso fornecedor, mas de qualquer forma realizamos uma plano de contingencia, onde manteremos nossa infraestrutura on-premise como retaguarda e independente da Azure.

Gostaríamos de tranquilizá-los quanto à nossa dedicação em monitorar rigorosamente nossos serviços, visando assegurar total estabilidade e desempenho em suas lojas.

Se notarem qualquer tipo de inconsistência, por favor, não hesitem em contatar nossa equipe de Relacionamento com o Cliente, que segue pronta para oferecer todo suporte necessário

Atenciosamente,
Equipe Linx Commerce
Posted Jun 26, 2024 - 20:54 GMT-03:00
Update
Prezados,

Identificamos que a origem do incidente é no nosso fornecedor Azure/Microsoft, onde nossa infraestrutura encontra-se hospedada.

Link para acesso ao incidente Azure/Microsoft: https://azure.status.microsoft/pt-br/status

A próxima atualização a ser informada pelo nosso fornecedor está prevista para daqui a 60 minutos.

Nosso time de tecnologia está realizando ações paliativas para tornar nossa infraestrutura independente desse incidente.

Atenciosamente,

Equipe Linx Commerce
Posted Jun 26, 2024 - 18:52 GMT-03:00
Identified
Prezados,

Identificamos um problema ocorrendo que impacta diretamente no acesso de algumas lojas virtuais e consequentemente navegação na mesma.

Nosso time já está atuando para tornar o serviço disponível o mais breve possível

Atenciosamente,

Equipe Linx Commerce
Posted Jun 26, 2024 - 18:30 GMT-03:00
This incident affected: Linx Commerce (Loja, Carrinho / Checkout, Sistema de Busca).