В пятницу 19 июня клиенты облачного сервиса Яндекса стали жертвами редкого стечения обстоятельств: сбой произошёл одновременно на четырех физических серверах.
Сетевой диск выдерживает одновременный отказ двух серверов без потери данных. В момент отказа сервера данные начинают реплицироваться на другие сервера. Но одновременный отказ 4-х серверов за такой короткий промежуток времени привел к тому, что не все данные успели реплицироваться. В результате этого часть данных на дисках оказалась потеряна.
В ночь с понедельника на вторник представители "Облака" сообщили, что работа пострадавших сервисов управляемых баз данных полностью восстановлена. Инцидент затронул менее 1% физических дисков, расположенных в зоне доступности ru-central-b.
Добавить 5 комментариев
Кто то сделал все по инструкции не включив голову?
даже при синхронном синке всех реплик остается вероятность, что упадут все сервера разом
И какими последствиями это теперь обернется, интересно…
> «И какими последствиями это теперь обернется, интересно…»
Им, скорее всего, придётся обнулять счетчик «2396 дней с момента последнего сноса Виндовз».
Авария – очередная. Прошлое падение облака тоже было с потерей данных https://m.roem.ru/17-05-2019/277763/avariya-na-yandeks-oblake/