четверг, 5 августа 2010 г.

глобальные катастрофы

Проснулся сегодня утром и за завтраком глянул в мониторинг. И увидел вот такое


Ужос. Правда я был уже слегка насторожен смс-ками о проблемах на хранилищах, поэтому не поперхнулся. Но быстренько доел и помчался на работу. За 25 минут доехав до Сенной, я выснил, что в здании, где у нас одна из основных серверных, нету електичества. Уже часа полтора как нету. Вот все и вырубилось нафик. В серверной оставался в живых только упс провайдела, но и он жил уже на последних крохах.
Охранники сказали, что электриков уже вызвали, появятся те, наверное, часам к 9-ти (а текущее время было 8:15). Пришлось плюнуть и ехать в офис.

Событий так много потому, что среди серверов, которые вырубились, оказались все основные ДНСы, которыми пользуется сервер мониторинга. Вот он и не может часть серверов найти, потому что они вырубились, а часть - потому что не может их найти через ДНС.

В первых двух строках такие большие цифры потому, что там по два события на сервер - недоступен агент мониторинга и нету пинга к серверу :)

Комментариев нет:

Отправить комментарий