В EFSOL обратилась производственная компания, специализирующаяся на выпуске высокоточных металлоконструкций (соглашение NDA запрещает разглашение названия организации).
Проблема
Компания столкнулась с критической проблемой выявления сбоев в работе производственной инфраструктуры только по факту их возникновения. Это приводило к незапланированным простоям оборудования, срывам сроков выполнения заказов и значительным финансовым потерям. Отсутствие превентивного анализа состояния систем не позволяло своевременно реагировать на возникающие угрозы.Задачи
Текущую проблему разобрали на следующие задачи:- создать систему раннего обнаружения потенциальных неисправностей;
- организовать оперативное информирование ответственных специалистов;
- минимизировать время реакции на возникающие проблемы;
- сократить количество аварийных остановок производства.
Решение
Для решения поставленных задач был проведен комплексный ИТ-аудит существующей инфраструктуры с привлечением специалистов EFSOL. По результатам аудита разработана и внедрена система мониторинга на базе Zabbix, охватывающая все критические сервисы компании. Специалисты EFSOL настроили многоуровневую систему оповещений с дифференциацией по степени критичности событий. Созданы отдельные каналы уведомлений через корпоративный Telegram-бот и электронную почту, что обеспечивает получение предупреждений ответственными лицами в режиме реального времени.Структурная схема решения
Рисунок 1 – Схема работы системы мониторинга Zabbix.
Результат
Внедрение системы проактивного мониторинга позволило добиться значительных улучшений в работе производства. За первые три месяца эксплуатации:- время обнаружения критических неисправностей сократилось в среднем с 45 до 3 минут;
- количество внеплановых простоев снизилось;
- затраты на аварийное восстановление уменьшились.