Na última terça-feira (21/06), o Cloudflare sofreu uma interrupção maciça causada por erro de configuração de rede. Entenda!
A Cloudflare diz que uma interrupção massiva que afetou mais de uma dúzia de seus data centers e centenas de grandes plataformas e serviços online na terça-feira (21/06) foi causada por uma mudança que deveria ter aumentado a resiliência da rede.
Cloudflare sofreu uma interrupção maciça causada por erro de configuração de rede
Sim. A Cloudflare sofreu uma interrupção maciça causada por erro de configuração de rede.
Após investigar o incidente, a Cloudflare disse o seguinte:
“Hoje, 21 de junho de 2022, a Cloudflare sofreu uma interrupção que afetou o tráfego em 19 de nossos data centers.”
“Infelizmente, esses 19 locais lidam com uma proporção significativa de nosso tráfego global. Essa interrupção foi causada por uma mudança que fazia parte de um projeto de longa duração para aumentar a resiliência em nossos locais mais movimentados.”
De acordo com relatos de usuários, a lista completa de sites e serviços afetados inclui, mas não se limita a Amazon, Twitch, Amazon Web Services, Steam, Coinbase, Telegram, Discord, DoorDash, Gitlab e muito mais.
A empresa começou a investigar esse incidente aproximadamente às 06h34 UTC depois que relatos de interrupção da conectividade com a rede da Cloudflare começaram a chegar de clientes e usuários em todo o mundo.
“Os clientes que tentarem acessar os sites da Cloudflare nas regiões afetadas observarão 500 erros. O incidente afeta todos os serviços de plano de dados em nossa rede”, disse a Cloudflare.
Embora não haja detalhes sobre o que causou a interrupção no relatório de incidente publicado no site de status do sistema da Cloudflare, a empresa compartilhou mais informações sobre a interrupção de 21 de junho no blog oficial.
“Essa interrupção foi causada por uma mudança que fazia parte de um projeto de longa duração para aumentar a resiliência em nossos locais mais movimentados.”, acrescentou a equipe da Cloudflare.
“Uma mudança na configuração de rede nesses locais causou uma interrupção que começou às 06:27 UTC. Às 06:58 UTC o primeiro data center foi colocado novamente online e às 07:42 UTC todos os data centers estavam online e funcionando corretamente.”
“Dependendo de sua localização no mundo, você pode não ter conseguido acessar sites e serviços que dependem da Cloudflare. Em outras localidades, a Cloudflare continuou operando normalmente.”
Embora os locais afetados representem apenas 4% de toda a rede da Cloudflare, sua interrupção afetou cerca de 50% de todas as solicitações HTTP tratadas pela Cloudflare globalmente.
A mudança que levou à interrupção de hoje foi parte de um projeto maior que converteria os data centers nos locais mais movimentados da Cloudlfare em uma arquitetura mais resiliente e flexível, conhecida internamente como Multi-Colo PoP (MCP).
A lista de data centers afetados no incidente de hoje inclui Amsterdã, Atlanta, Ashburn, Chicago, Frankfurt, Londres, Los Angeles, Madri, Manchester, Miami, Milão, Mumbai, Newark, Osaka, São Paulo, San Jose, Cingapura, Sydney e Tóquio.