Наладка центра обработки данных
Перечень услуг и параметры сервисного обслуживания центра обработки данных. Сервисное обслуживание, модернизация ПО и наладка центра обработки данных должны проводиться регулярно. От этого зависит бесперебойная работа оборудования, подсистем и сервисов ЦОД.
«Падение» дата-центра – основные причины
Причина 1 – прекращение электроснабжения или отказ оборудования
Важно на этапе проектирования предусмотреть необходимый запас мощности резервного электроснабжения – не менее 40%. Он обеспечит работу дата-центра в аварийном режиме. Если мощность генераторов меньше, чем рабочая мощность, то они не выдержат и поочерёдно выйдут из строя при работе в аварийном режиме. Это приведёт к «падению» дата-центра. На восстановление может уйти 5-8 или даже более часов.
Причина 2 – проблемы с автоматическим переключением
Если автоматика ЦОД спроектирована с ошибками и все сервисы инженерной инфраструктуры не контролируются из единого центра, то выход из строя одной из подсистем может привести к полной остановке ЦОД.
Автоматическая защита цепей подсистем СКС продумывается на стадии проектирования. Желательно, чтобы все системы были подключены к единой системе мониторинга. Часто оператор дата-центра просто забывает выполнить переключение и мониторинг сети, что приводит к перегрузкам и поломкам.
Нерегулярный сервис инженерных систем приводит к ослаблению контактов автоматов переключения. Итог - поломка, приводящая к длительному простою. Единый центр управления всеми инженерными системами – отличное решение для предотвращения аварий и простоя ЦОД.
Причина 3 – выход из строя аккумуляторов
Промежуточные аккумуляторы защищают IT-оборудование от перебоев в электроснабжении. Отказ источников бесперебойного питания (ИБП) приводит к остановке работы, так как необходимо время для переключения с основного источника сети на резервный генератор.
Причина 4 – протечки
Протечки кондиционеров и охладительного оборудования, неисправные трубы или кровля могут вызвать попадание влаги на контакты дорогостоящего оборудования и его поломку. Поэтому кроме герметизации контактов необходимо автоматизировать систему мониторинга, которая своевременно сообщит оператору о возникновении проблемы.
Причина 5 – неправильная эксплуатация оборудования
Персонал дата-центра должен раз в год проходить курсы повышения квалификации по работе с новым оборудованием и ПО. Руководитель компании должен сделать повышение квалификации плановым мероприятием.
Несколько важных рекомендаций по проектированию ЦОД:
- цветная маркировка оборудования и проводов всех систем СКС упростит сервис и устранение неисправностей;
- единые параметры оборудования и инженерных систем сократят расходы на комплектующие, ПО, монтаж и сервис;
- правильный расчёт размеров и размещения стоек, шкафов, полок;
- деление помещений на функциональные зоны.
При разработке проекта важно учитывать, что на стадии эксплуатации в его реализацию могут быть внесены изменения и дополнения.
Техническое сервисное обслуживание
Работы по сервисному обслуживанию дата-центра:
- проверка работоспособности систем безопасности;
- тест-системы климат-контроля;
- регулировка и отладка системы резервного электропитания и ИБП;
- осмотр соединений СКС;
- модернизация и отладка ПО;
- устранение поломок и дефектов;
- необходимые внеплановые ремонтные работы.
После каждого технического осмотра необходим запуск всех подсистем в тестовом режиме, проверка параметров работы и занесение показаний в журнал технического обслуживания ЦОД.