«Мастерхост» отключился от пользователей

В компании "Мастерхост" в ночь на первое февраля произошла крупная авария. Недоступны были как сайты размещенные на виртуальном хостинге, так и арендаторы colo и dedicated. Также пострадал Roem.ru - мы пользовались NS-серверами "Мастерхоста".

Авария, хотя и произошла в нерабочее время, не осталась незамеченной мастерами все замечать и делать из этого "правильные" выводы:

Интересно, что такого написали Слон, Ведомости и Новая газета, что их понадобилось валить так срочно и разом.

Неужели призвали своих читателей приходить на шествие 4 февраля?!

Техническая поддержка хостера в 5:49 заявила Roem.ru по телефону, что проблема уже решена и в течение двух часов все проекты должны подняться. Соответственно, владельцам сайтов, которые до 8 часов по Москве не поднимутся, Roem.ru рекомендует обратиться в саппорт хостера. Причины сбоя техподдержка не сообщила.

Предыдущая крупная авария в "Мастерхосте" произошла чуть более месяца назад, тоже в нерабочее время, в субботу 24 декабря 2011-го года. Тогда у компании не работали NS-сервера, что привело к перебоям с доступом к ряду площадок.

За два месяца до этого из компании вышел ее основатель Леонид Филатов

Лучшие комментарии

  • Контекст комментария

    T0XA OptimPro.ru

    Получили ответ из .М, где у нас оборудование размещено: «Здравствуйте! Сегодня около 02:30 произошла авария на вводно-распределительном устройстве дата-центра. Это привело к тому, что подача электропитания к оборудованию была нарушена. Ситуация была оперативно зафиксирована дежурными службами для скорейшего восстановления системы подачи энергии. Ремонтные работы завершились к 05:00, в данный момент происходит восстановление штатного функционирования сервисов хостинга. Приносим вам наши искренние извинения!»

  • Контекст комментария

    T0XA OptimPro.ru

    С задержкой в 1 день, но все-таки они ответили: «Здравствуйте! Вынуждены сообщить вам, что сегодня ночью в процессе устранения последствий аварии 01.02.2012 были обнаружены дополнительные критические факторы, которые могли привести к отказу в работе системы энергообеспечения. Руководством компании было принято непростое решение об экстренном принудительном поэтапном отключении оборудования компании и части клиентского оборудования во избежание массовых проблем в дневное время. Мы сконцентрировали свои усилия на устранении ошибок, что позволило провести работы в период с 1.30 до 4.00 МСК. Приносим извинения за неудобства.»

Добавить 25 комментариев

  • Ответить
    Альтер Эго

    На самом деле за прошедший месяц короткие (примерно десятиминутные) и фрагментарные outages ns-серверов случались как минимум 4 раза. Картина была одной и той же: ns-сервера отвечают, но настолько медленно, что никакой клиентский софт просто этого не дожидается и отваливается. На крупных же авариях (что сейчас, что в декабре) картина иная — ns-сервера просто молчат и не хотят отвечать в принципе.

  • Ответить
    Альтер Эго

    Да, так точно. Трейс теряется в мастерхосте прямо сразу. Проблемы явно сетевые, потому что отцепились и потерялись клиенты на колокейшнах/dedicated, а не только отдельные сервисы типа dns или виртуального хостинга. У всех бывает, конечно, и само по себе это еще не повод проклинать .m. Никто не знает, были ли значимые перестановки после смены структуры собственников?

  • Ответить
    T0XA OptimPro.ru

    Получили ответ из .М, где у нас оборудование размещено: «Здравствуйте! Сегодня около 02:30 произошла авария на вводно-распределительном устройстве дата-центра. Это привело к тому, что подача электропитания к оборудованию была нарушена. Ситуация была оперативно зафиксирована дежурными службами для скорейшего восстановления системы подачи энергии. Ремонтные работы завершились к 05:00, в данный момент происходит восстановление штатного функционирования сервисов хостинга. Приносим вам наши искренние извинения!»

  • Ответить
    Альтер Эго

    Ого, Носик написал что это был не ДДоС. но закончил однако пожеланием Суркову и Володину больше так не делать.

  • Ответить

    вовремя я спрыгнул с dns’ов мастерхоста (хотя до этого рекомендовал всем своим знакомым). В конце прошлого года у них произошло 2 аварии, в результате которых были недоступны все 3 их основных сервера (ns1.masterhost.ru, ns2.masterhost.ru, ns.masterhost.ru). Во время первой аварии я с ужасом обнаружил, что все три сервера стоят в одном ДЦ (извините, но это полный п….ц для такой компании). Как раз стал искать другого поставщика услуг, и тут нате — они второй раз упали (в конце декабря), а переехать не успел еще — в эту же ночь поменял поставщика. Есть ощущение, что мастерхост уже не тот (ну либо им всегда везло).

  • Ответить
    T0XA OptimPro.ru

    spsh , насчет DNS вот не знаю, а насчет везения — хз. Помню как РТКОМ по 5-6 часов лежал (вернее весь трафик из Москвы шел через обходные каналы в Европе) в будни, в рабочее время. А тут — пару часов ночью, тут скорее первый-второй звоночек…но ТАК лень опять оборудование перевозить…

  • Ответить

    Мастерхост опять сдох. Как шаред-хостинг, так и их собственный сайт. Сперва был «бэд гетвей», теперь просто соединения нет. Экслер работает.

  • Ответить

    насчет DNS вот не знаю, а насчет везения — хз Оборудование мы у них забрали пару лет назад, когда у нас у стойки питание сдохло по непонятным причинам (ну точнее нам их так и не разъяснили). До этого 4 года без нареканий проработали (даже их «недозвон» до саппорта не волновал, т.к. звонили не по суперсрочным вопросам). А вот к службе ДНС до конца прошлого года вообще нареканий не было. Да и наличие какого-никакого редактора файла зоны подкупало (без общения с саппортом такое в 5м году было редкость). Но все течет — все меняется. Из последнего, как я отмечал — все ДНС-сервера в одном ДЦ. Это просто убийственно. Зачем вообще тогда нужны вторичные сервера, если они там же стоят?) Но это было бы еще ничего, если бы при этом у них можно было в настройках primary указать айпишники, с которых файл зоны можно было бы забрать (ну заказл вторичные сервера еще у одного хостера и радуйся). Так нет же — нельзя. Да и админку давно пора было бы переписать. Они застыли в середине нулевых. С таким подходом по-тихоньку отстанут от жизни) ЗЫ хостинг — это одна из передовых услуг, которая не то, что в ногу со временем должна шагать, — она его должна немного опережать. Российский хостеры точно до этого не доперли. Но к сожалению, с этим приходится мириться, т.к. оборудование хочется иметь под боком…

  • Ответить
    T0XA OptimPro.ru

    С задержкой в 1 день, но все-таки они ответили: «Здравствуйте! Вынуждены сообщить вам, что сегодня ночью в процессе устранения последствий аварии 01.02.2012 были обнаружены дополнительные критические факторы, которые могли привести к отказу в работе системы энергообеспечения. Руководством компании было принято непростое решение об экстренном принудительном поэтапном отключении оборудования компании и части клиентского оборудования во избежание массовых проблем в дневное время. Мы сконцентрировали свои усилия на устранении ошибок, что позволило провести работы в период с 1.30 до 4.00 МСК. Приносим извинения за неудобства.»

  • Ответить

    Сегодня у меня не получилось из-за каких-то технических косяков (похоже с линком от платежки до мастерхоста с подтверждением платежа) оплатить хостинг ни картой ни вебманями, пичаль :( А ведь какой хороший был провайдер еще несколько лет назад…

  • Ответить

    Похоже, аварии Мастерхоста стали таким обыденным делом, что на них уже никто не реагирует. Сейчас полдень, а мой проект не доступен с четырех утра… :(

  • Ответить

    Да, ночью опять была какая-то шняга Но сказать, что Мастерхост упал как обычно нельзя — сайты СМИ, например, даже не чихнули — обеспечили особым клиентам fanatical support, видать. Но не расстраивайтесь! У нас скоро будет статья на тему, почему необязательно валить из Мастерхоста.

  • Ответить
    T0XA OptimPro.ru

    sinodov , возможно проблемы только в отдельно взятом ДЦ, поэтому и новостные сайты могло и не задеть. Наше оборудование где-то с 4:00-4:30 до 6-ти было не доступно, а затем его техники решили еще в 9 утра ребутнуть, потом правда звонили, извинялись, но часть наших клиентов утром успели кипиш поднять((( Техник из мастерхоста сказал, что у них там паника была, а далее большая часть оборудования не смогла сама подняться, поэтому его еще и вручную ребутили, за что еще и нашему достался еще один ребут… Собственно это у них отдельно взятый ДЦ так зажигает? Или это какое-то начало больших и постоянных проблем?