Tālejoša ietekme uz infrastruktūru Amazon Web Services (AWS) periodiski ir atstājis tūkstošiem platformu un lietojumprogrammu dažādās valstīs bez apkalpošanas. Lietotāju atskaišu skaits dienas sākumā strauji pieauga, pateicoties Savienojamības kļūdas, latentums un neizdevušās augšupielādes, ar īpašu koncentrāciju Amerikas Savienotajās Valstīs un redzamu ietekmi Eiropā.
Saskaņā ar uzņēmuma statusa paneļa teikto, problēma radusies reģionā. ASV austrumi-1 (Ziemeļvirdžīnija) un izraisīja anomālu kļūdu līmeņa pieaugumu vairākās API. Līdz pusdienlaikam AWS ziņoja par skaidrām atveseļošanās pazīmēm daudzos pakalpojumos, lai gan komandas turpināja strādāt, lai pilnībā novērstu incidentu un atjaunotu visu darbību normālā stāvoklī.
Incidenta hronoloģija
Pirmie brīdinājumi tika izvietoti ap pulksten 9:00 (Spānijas pussalas laiks), un neilgi pēc tam incidentu skaits sasniedza maksimumu, un uzraudzības rīkos, piemēram, DownDetector, tika pastāvīgi saņemti paziņojumi. Uzņēmums ziņoja, ka plkst. 11:00 ir identificējis iespējamais cēlonis un sāka piemērot mazināšanas pasākumus, kas paātrināja atkopšanu dažādos slāņos.
Līdz pusdienlaikam AWS ziņoja, ka lielākā daļa darbību ir bijušas veiksmīgas. normalizēta uzvedība, lai gan tajā tika brīdināts par konkrētiem ierobežojumiem attiecībā uz noteiktām lietojumprogrammām un konkrētiem pakalpojumiem skartajā reģionā. Agrā pēcpusdienā atlikušās ietekmes kamēr norisinājās stabilizācijas darbi.

Kur bija tehniskā izcelsme?
Uzņēmums koncentrējās uz Amazon DynamoDB, tā pārvaldītā atslēgu-vērtību datubāzes pakalpojuma, kura galapunktā US-EAST-1 radās kļūmes, kas izraisīja kaskādes kļūdas vairākās atkarībās. AWS norādīja uz pamatā esošā DNS problēma kā izraisītājfaktors, kas pakāpeniski tika mazināts.
Praksē, ja domēna vārdu sistēma netiek pareizi atrisināta, Lietojumprogrammas neatrod savus resursus un rodas savienojuma kļūdas, taimauti un datu ielādes kļūmes. Kā ārkārtas pasākumu AWS ieteica klientiem ar pastāvīgām problēmām notīrīt kešatmiņu DNS, lai atjaunotu izšķirtspēju līdz pareizajiem galapunktiem.
Kas ir ticis ietekmēts
Darbības joma bija transversāla: pats Amazon reģistrēja incidentus Alexa y Prime Video, savukārt trešo pušu vidū bija problēmas ar tādiem populāriem pakalpojumiem kā Canva, Duolingo o SnapchatKļūmes tika konstatētas arī platformās Ģeneratīvais AI un sadarbības lietojumprogrammās, kas balstās uz AWS mākoni.
Arī digitālā izklaide netika atstāta novārtā. Lielapjoma nosaukumi un pakalpojumi, piemēram, Fortnite, Roblox o sadursme Royale ziņotās kļūdas Pieslēgties vai savienojamību, savukārt daži veikali un spēļu palaišanas programmas ieviesa mazināšanas pasākumus, lai mazinātu ietekmi, līdz datplūsma stabilizēsies.
Ietekme Spānijā
Valsts līmenī vairāki lietotāji ziņoja piekļuves problēmas digitālo pakalpojumu lietojumprogrammām un tīmekļa vietnēm, īpaši ietekmējot pusdienlaikā. Tika ietekmētas arī platformas biļešu pārdošana piemēram, Ticketmaster, kas atlika pusdienlaikam paredzētās biļešu izlaišanas; starp tām biļešu izlaišanas, kas saistītas ar ļoti pieprasīti koncerti.
Finanšu iestādes un lielās patērētāju platformas sazinājās konkrēti incidenti savās tiešsaistes sistēmās, lai gan ietekme atšķīrās atkarībā no reģiona un pakalpojuma. Ieviešot mazināšanas pasākumus skartajā ASV reģionā, Eiropā tika novērota pakāpeniska piekļuves atjaunošanās.
Pašreizējā situācija un ieteikumi
Stundām ritot, AWS norādīja, ka redzēja ievērojamas atveseļošanās pazīmes lielākajā daļā savu pakalpojumu, vienlaikus saglabājot ierobežotus ierobežojumus noteiktām darbībām ASV austrumu 1 reģionā. Uzņēmums turpina uzraudzīt sniegumu un ieviest korekcijas, lai pilnībā risinātu šo problēmu.
Ja joprojām rodas atsevišķas problēmas, ieteicams pārskatīt oficiālo AWS statusu un, ja nepieciešams, iztīrīt kešatmiņu DNS vai restartējiet klientus un pakalpojumus, kas ir atkarīgi no galapunktu risināšanas skartajā reģionā. Kritiskās izvietošanas gadījumos ieteicams pārbaudīt rezerves kopijas, tīkla atkarības un atkārtotas mēģināšanas politikas, lai samazinātu latentuma un pārejošu kļūdu ietekmi.
Epizode parāda, cik lielā mērā infrastruktūra Mākoņdatošana ir kļuvusi strukturāla digitālajā ekonomikā: lokalizēts darbības pārtraukums galvenajā centrā var novest pie ķēdes efekti globālā mērogā, sākot no straumēšanas un spēlēm līdz finanšu un produktivitātes lietojumprogrammām.