Google, saatler süren bulut kesintisi için özür ve olay raporu yayınladı

Google Şirketin, son zamanlardaki hatalı güncellemelerden kaynaklandığını söylediği büyük kesintiden dolayı özür diledi.
Şirket, Perşembe günü saatlerce süren kesintiyi açıklayan bir olay raporunu Cuma günü geç saatlerde yayınladı. Dünya genelinde 70'ten fazla Google bulut hizmeti düzgün çalışmayı bıraktı ve Cloudflare dahil olmak üzere düzinelerce üçüncü taraf hizmetini devre dışı bıraktı veya aksattı , OpenAI ve Shopify Gmail, Google Takvim, Google Drive, Google Meet ve diğer birinci parti ürünlerde de arızalar meydana geldi.
Google, olay raporunda "Bu kesintinin yarattığı etki için derinden özür dileriz" diye yazdı. "Google Cloud müşterileri ve kullanıcıları işlerini Google'a emanet ediyor ve biz de daha iyisini yapacağız. Bunun yalnızca müşterilerimizin işleri ve kullanıcıları üzerinde değil, aynı zamanda sistemlerimize duyulan güven üzerinde de yarattığı etki için özür dileriz. Bundan sonra bu tür kesintilerin önlenmesine yardımcı olmak için iyileştirmeler yapmaya kararlıyız."
Google'ın bulut biriminin CEO'su Thomas Kurian da perşembe günü X sayfasında yaptığı paylaşımda kesintiyle ilgili olarak "Müşterilerimize yaşattığımız kesintiden dolayı üzgünüz" dedi.
Google, Mayıs ayında otomatik gelen istekleri değerlendirmek için "kota politikası kontrollerine" yeni bir özellik ekledi, ancak şirket olay raporunda yeni özelliğin gerçek dünya durumlarında hemen test edilmediğini yazdı. Sonuç olarak şirketin sistemleri, boş girdiler içeren yeni özellikten gelen verileri nasıl düzgün bir şekilde işleyeceğini bilmiyordu. Şirket, bu boş girdilerin daha sonra tüm Google Cloud veri merkezi bölgelerine gönderildiğini ve bunun da çökmelere neden olduğunu yazdı.
Şirkete göre mühendisler sorunu 10 dakikada çözdüler. Ancak tüm olay bundan sonra yedi saat boyunca devam etti ve kaza bazı büyük bölgelerde aşırı yüklenmeye yol açtı.
Google, özelliği yayınladığında, sorunlar ortaya çıkarsa etkiyi en aza indirmek için yavaş uygulamaya izin veren giderek yaygınlaşan bir sektör uygulaması olan özellik bayraklarını kullanmadı. Google, özellik bayraklarının, özellik yaygın olarak kullanılabilir hale gelmeden önce sorunu yakalayacağını söyledi.
Google, ileride mimarisini değiştirecek ve böylece bir sistem arızalansa bile çökmeden çalışmaya devam edebilecek, dedi şirket. Google ayrıca tüm sistemleri denetleyeceğini ve "hem otomatik hem de insan iletişimlerini iyileştireceğini, böylece müşterilerimizin sorunlara tepki vermek için ihtiyaç duydukları bilgileri en kısa sürede alabileceklerini" söyledi.
— CNBC'den Jordan Novet bu habere katkıda bulundu.
CNBC