Interrupção nos Serviços da Amazon Web Services Causa Desordem em Aplicativos e Sites Principais na Região US-East-1

AWS fell on its face, knocking many apps, websites and games offline

Pontos principais

  • A interrupção da AWS originou-se de um problema de resolução de DNS com a API do DynamoDB na região US-East-1.
  • Aplicativos de consumo importantes, como Venmo, Snapchat, Canva, Fortnite e Alexa, experimentaram interrupções ou desempenho degradado.
  • A AWS mitigou o problema de DNS na madrugada, restaurando a maioria dos serviços, mas os lançamentos de instâncias do EC2 permaneceram limitados.
  • Uma ampla gama de serviços - incluindo bancos, companhias aéreas, Disney+, Reddit, Apple Music e The New York Times - relataram interrupções.
  • O incidente sublinha a forte dependência da AWS, que detém cerca de 30 por cento da participação de mercado global de nuvem.

Uma interrupção severa nos Serviços da Amazon Web Services (AWS) afetou uma ampla gama de serviços de internet em uma manhã de outubro. O incidente decorreu de um problema de resolução de DNS que afetou a API do DynamoDB na região US-East-1, levando a taxas de erro aumentadas e latência em vários serviços da AWS. Plataformas populares, como Venmo, Snapchat, Canva, Fortnite, Alexa, Lyft, Reddit, Disney+ e muitas outras, experimentaram interrupções parciais ou completas.

Emergência da Interrupção e Impacto Inicial

Na madrugada de uma manhã de outubro, a Amazon Web Services começou a relatar "taxas de erro aumentadas e latências para vários serviços da AWS" em sua região US-East-1, que abriga centros de dados na Virgínia do Norte. Ao meio-dia, usuários em todo os Estados Unidos e além estavam enfrentando interrupções generalizadas de serviços. Aplicativos de consumo importantes - incluindo Venmo, Snapchat, Canva e o popular jogo Fortnite - exibiam mensagens de erro ou se tornaram completamente inacessíveis. Até mesmo a assistente de voz da Amazon, Alexa, teve dificuldades em responder a comandos básicos, como consultas de clima ou controles de smart home.

Causa Técnica Raiz

De acordo com a página de saúde do serviço da AWS, a causa raiz foi identificada como um problema de resolução de DNS que afetou a API do DynamoDB. O DynamoDB, um serviço de banco de dados crítico usado por inúmeros clientes da AWS, armazenou dados de forma segura, mas se tornou inacessível por várias horas. Isso criou efetivamente uma "amnésia" temporária para aplicativos que dependem de recuperação de dados em tempo real, como explicado por um professor universitário citado na cobertura do evento.

Esforços de Mitigação e Desafios em Andamento

Na madrugada, a AWS anunciou que havia totalmente mitigado o problema de DNS e que "a maioria das operações de serviço da AWS está funcionando normalmente agora". No entanto, o efeito de onda da interrupção persistiu. O serviço EC2, que fornece capacidade de máquina virtual para muitos aplicativos baseados na web, continuou a experimentar erros elevados para novos lançamentos de instâncias. A AWS respondeu limitando a taxa de novos lançamentos de instâncias do EC2 para ajudar na recuperação e aconselhou os clientes a não vincular novos deploys a zonas de disponibilidade específicas, permitindo que o sistema tivesse maior flexibilidade na alocação de recursos.

Escopo dos Serviços Afetados

Os relatórios de detecção de queda aumentaram para uma ampla gama de plataformas. Usuários de aplicativos bancários, sistemas de reserva de voos, Disney+, Reddit, Apple Music, Pinterest, Roblox e The New York Times relataram desempenho lento ou interrupções completas. Até mesmo os serviços internos da Amazon, como a Alexa, foram visivelmente afetados, sublinhando a profundidade da dependência da região US-East-1. As empresas que hospedam suas cargas de trabalho nessa região enfrentaram um grande atraso de solicitações, e a recuperação completa foi projetada para levar tempo adicional além da mitigação inicial.

Implicações da Indústria

O incidente reforçou o papel central da AWS na arquitetura da internet moderna. Até meados de 2025, a AWS detinha uma participação estimada de 30 por cento do mercado global de infraestrutura de nuvem, tornando-a uma espinha dorsal para um vasto número de serviços online. A interrupção ilustrou o risco sistêmico que surge quando uma grande parte do tráfego da internet depende de alguns provedores-chave. Embora a resposta da AWS tenha demonstrado competência técnica no isolamento e tratamento do erro de DNS, o episódio também destacou a importância de estratégias de múltiplas regiões e implantações de nuvem diversificadas para aplicativos críticos.

Status Atual e Perspectiva

Na tarde, a AWS relatou que a maioria dos serviços havia retornado à operação normal, embora some capacidade de lançamento do EC2 ainda estivesse limitada. As empresas continuaram a monitorar seus sistemas para questões residuais, e os usuários relataram uma restauração gradual da funcionalidade em plataformas anteriormente afetadas. O episódio serve como um lembrete da fragilidade inerente às infraestruturas de nuvem altamente centralizadas e da necessidade de planejamento de contingência robusto.

#Serviços da Amazon Web#AWS#DynamoDB#EC2#US-East-1#Interrupção#Venmo#Snapchat#Canva#Fortnite#Alexa#Reddit#Disney+#Computação em Nuvem

Também disponível em:

Interrupção nos Serviços da Amazon Web Services Causa Desordem em Aplicativos e Sites Principais na Região US-East-1 | AI News