Usuários passaram o dia 7 de dezembro (ontem) relatando indisponibilidade generalizada da Amazon Web Services, derrubando sites e serviços de back-end de organizações como a Netflix, Disney+, iFood e Nubank. Os detalhes sobre a interrupção foram escassos.

Os problemas começaram no meio da manhã na costa leste dos EUA (meio da tarde no Brasil), disse Doug Madory, diretor de análise de internet da Kentik Inc, uma empresa de inteligência de rede. Os clientes que tentavam reservar ou alterar viagens com a Delta Air Lines estavam tendo problemas para se conectar à companhia aérea. “A Delta está trabalhando rapidamente para restaurar a funcionalidade de nossas linhas telefônicas com suporte da AWS”, disse o porta-voz Morgan Durrant. A companhia aérea se desculpou e incentivou os clientes a usarem seu site ou aplicativo para dispositivos móveis.

A Southwest Airlines, sediada em Dallas, disse que mudou para os servidores da Costa Oeste depois que alguns sistemas baseados em aeroportos foram afetados pela interrupção. Os clientes ainda estavam relatando interrupções para DownDetector, uma câmara de compensação popular para relatórios de interrupções de usuários, mais de três horas após o início. O porta-voz da Southwest, Brian Parrish, disse que não houve grandes interrupções nos voos.

O porta-voz da Toyota, Scott Vazin, disse que a região leste dos EUA para serviços de revendedor caiu. A empresa tem aplicativos que processam reclamações de garantia do revendedor e outros serviços, mais de 20 dos quais foram afetados.

A página de status da AWS relatou aumento nas taxas de erro para seu console de gerenciamento na manhã desta terça-feira.

“Estamos enfrentando problemas de API e console na região US-EAST-1”, dizia a página. “Identificamos a causa raiz e estamos trabalhando ativamente para a recuperação. Esse problema está afetando a página de destino do console global, que também está hospedada em US-EAST-1. ”

Ainda de acordo com DownDetector, pessoas que tentaram usar iFooc, Kindle, Roku e Disney + relataram problemas. O aplicativo do McDonald’s também estava fora do ar. Mas as companhias aéreas American, United, Alaska e JetBlue não foram afetadas. Kentik viu uma queda de 26% no tráfego para a Netflix, entre os principais serviços baseados na web afetados pela interrupção.

“A Netflix, que executa quase toda a sua infraestrutura na AWS, parece ter perdido 26% de seu tráfego”, disse Doug Madory, chefe de análise de internet da empresa de análise Kentik.

Dentre outros vários relatos, alguns bem curiosos, dos clientes finais. dos serviços. O Tinder não funcionou. Se alguém decidiu concluir uma limpeza em seu apartamento, descobriu que seu aspirador-robô Roomba também dependia da AWS. Um funcionário do Twitter em San Antonio (EUA) descobriu que as disfunções do AWS até afetaram suas luzes de Natal.

Uma pessoa, ontem, não podia pedir comida no iFood, ou reservar novamente sua passagem com a CVC para uma viagem de véspera de Natal, ou enviar dinheiro para sua amiga via NuBank. Se ela estava esperando um pedido da Amazon, ele pode ter atrasado, porque os motoristas de entrega descobriram que seus aplicativos também estavam fora do ar, assim eles não sabiam para onde ir ou o que entregar. Mas talvez tudo isso poderia não importar, porque o motorista não poderia não conseguir fazer tocar a campainha inteligente de qualquer forma.

Problemas anteriores

A Amazon experimentou 27 interrupções nos últimos 12 meses relacionadas a seus serviços, de acordo com o site de análise de ferramentas ToolTester.

Em junho, sites como Reddit, Amazon, CNN, PayPal, Spotify, Al Jazeera Media Network e o New York Times foram atingidos por uma indisponibilidade generalizada de uma hora vinculada ao provedor de rede de entrega de conteúdo dos EUA Fastly Inc (FSLY.N), um rival menor da AWS.

Centralização dos serviços

Madory disse que não acreditava que a interrupção fosse algo nefasto. Ele disse que um recente grupo de interrupções em provedores que hospedam sites importantes reflete como o setor de rede evoluiu. “Cada vez mais essas interrupções acabam sendo produto da automação e centralização da administração”, afirmou. “Isso acaba levando a interrupções que são difíceis de evitar completamente devido à complexidade operacional, mas são muito impactantes quando acontecem.”

O tecnólogo e ativista de acesso a dados públicos Carl Malamud disse que a interrupção destaca o quão mal o objetivo do projeto original da Internet – ser uma rede distribuída sem ponto central de falha, tornando-a resiliente a desastres em massa, como ataques nucleares – foi distorcida por uma Big Tech.

Não estava claro como ou se a interrupção estava afetando o governo federal norte-americano. A Agência de Segurança Cibernética e de Infraestrutura dos EUA disse em uma resposta a CBS americana por e-mail a perguntas que estava trabalhando com a Amazon “para entender quaisquer impactos potenciais que essa interrupção possa ter para agências federais ou outros parceiros.”

“Quando colocamos tudo em um só lugar, seja a nuvem da Amazon ou o monólito do Facebook, estamos violando esse princípio fundamental”, disse Malamud, que desenvolveu a primeira estação de rádio da Internet e mais tarde colocou online um banco de dados vital da U.S. Security and Exchange Commission. “Vimos que, quando o Facebook se tornou o instrumento de uma campanha massiva de desinformação, vimos isso hoje com o fracasso da Amazon.”

Um desafio que os gigantes da nuvem enfrentam é manter o controle das interdependências que podem fazer com que os sistemas falhem simultaneamente. Em outubro, o Facebook e seus outros serviços importantes, incluindo Messenger e WhatsApp, ficaram inativos por mais de seis horas depois que engenheiros trabalhando em seu backbone global, que envolve milhares de roteadores e dezenas de milhares de quilômetros de cabos de fibra óptica, acidentalmente acionaram uma interrupção em seus data centers.

Na época, o Facebook observou que parte do motivo da demora para lidar com a interrupção foi que algumas das ferramentas de software necessárias para tratar o problema não estavam disponíveis por causa da interrupção, que também interrompeu o acesso automatizado a alguns de seus centros de dados. Os engenheiros foram forçados a dirigir literalmente até alguns locais para colocá-los novamente online.

Internet é pra distribuir e não pra concentrar

A interrupção da AWS, no entanto, é um lembrete de que a Internet sofre com outros tipos de centralização – neste caso, de uma dependência esmagadora da Amazon, que domina os serviços online que complementam nossas vidas offline.