Cerca de 2.000 empresas foram afetadas pela interrupção do serviço, com mais de 8 milhões de pessoas a reportarem problemas.
A Amazon explicou por que motivo o seu serviço de cloud ficou indisponível esta semana, deixando plataformas de banca online, um site governamental, redes sociais e serviços de entregas de comida indisponíveis durante horas.
Numa explicação detalhada publicada no seu site, a Amazon Web Services (AWS) disse que houve uma falha no seu software de automação que provocou problemas em cascata.
Na origem do problema esteve o facto de clientes, como a Signal, não conseguirem ligar-se ao DynamoDB, um sistema que armazena dados de clientes.
A AWS afirmou que tal se deveu a “um defeito latente no sistema automatizado de gestão de DNS do serviço”.
O DNS pode ser visto como a lista telefónica da internet. Traduz nomes de sites, como www.amazon.com, em endereços IP que os computadores usam para encontrar outros numa rede.
Mas o sistema automatizado de DNS da AWS eliminou registos DNS do seu endpoint regional, impedindo a ligação ao DynamoDB e a outros serviços.
A falha não foi corrigida automaticamente e exigiu intervenção manual de operadores.
Estes problemas afetaram muitos serviços centrais da AWS na região da Virgínia do Norte, onde a Amazon tem uma das suas sedes. Embora as falhas tenham sido resolvidas em poucas horas, o impacto total em sites e aplicações durou 14,5 horas. Mais de 8 milhões de pessoas reportaram problemas.
Clientes da AWS, incluindo a Signal, a Roblox, o Snapchat e o site da autoridade fiscal do Reino Unido, estiveram entre os 2.000 sites afetados, segundo o Downdetector, um site que monitoriza interrupções na internet.
O incidente levou especialistas em tecnologia a sublinhar a dependência excessiva da Europa de um único serviço de cloud e as ambições europeias para uma cloud própria.