За последние 5 лет облачные технологии приобрели всеобщее распространение в корпоративной сфере, и сейчас уже никто не удивляется факту, когда вся компания работает в «облаке» и не имеет своих серверов.
Всем известно, что «облако» — это некая отказоустойчивая инфраструктура, которая не привязана к конкретному «железу», невосприимчива к аппаратным сбоям, перепадам электричества, проблемам с интернет-каналом. Таким образом, если клиент арендует сервер в «облаке», он полностью уверен в том, что выделенные ему ресурсы будут всегда доступны.
Но данная концепция не спасает от программных проблем, которые могут произойти на серверах, например:
- Выход из строя ОС;
- Поражение вирусом;
- Ошибка приложения;
- Действия пользователя и т.д.
Для отслеживания этих проблем существуют так называемые регламентные операции, которые позволяют заранее вычислить потенциальные проблемы и предотвратить их до момента, когда они приведут к негативным последствиям.
Насколько справедлив принцип «Работает — не трогай»?
Всем ИТ-специалистам знакомо данное выражение и большинство системных администраторов «не лезут» к информационным узлам без надобности, вмешиваясь в работу серверов только в случае возникновения инцидентов. Стоит отметить, что такая тактика часто себя оправдывает в стабильных информационных системах, которые минимально подвержены воздействию человеческого фактора. Например, сервера с OC Linux, выполняющие роли веб-сервера, почтового сервера и интернет-шлюза могут годами работать без единой перезагрузки и это нормальное явление. Но совсем другая ситуация с серверами на базе ОС Windows, на которых работают пользователи, а набор установленных программ и компонентов на них постоянно изменяется под нужды пользователя. Поэтому за такими серверами необходим периодический контроль с целью выявить потенциальные проблемы и предотвратить их последствия.
Какие регламентные операции целесообразно выполнять?
Регламентные операции выполняются с операционной системой, приложениями, СУБД и т.д. Например, помимо работ с ОС Windows Server также широко распространены периодические задания по оптимизации MSSQL, баз 1С и другие. Время проведения профилактической деятельности заранее согласовывается с заказчиком сервисов, так как может наблюдаться снижение производительности и обычно выполняется в наименее загруженные часы работы клиента.
Ниже приведен перечень регламентных операций, рекомендованный для выполнения на удаленном сервере с операционной системой Windows Server.
№ | Название операции | Эффект от выполнения |
1 | Установка обновлений ОС и основных программ | Установка последних обновлений позволяет обезопасить сервера от взлома средствами использования уязвимостей ПО. Также обеспечивает совместимость с новейшими аппаратными и программными компонентами. |
2 | Плановая перезагрузка сервера | Перезагрузка сервера является стрессовым событием, иногда после ее выполнения возникают некоторые проблемы – например, выскакивают ошибки, происходит отказ в запуске служб, не загружаются драйвера и т.д. Негативные последствия часто возникают после установки обновлений или изменения конфигурации ПО. Основной смысл выполнения плановой перезагрузки в том, чтобы в случаи возникновения негативных последствий планово их устранить. |
3 | Полный антивирусный осмотр | Поиск вредоносного ПО с помощью установленного антивируса. |
4 | Проверка системы на вирусы с разовых утилит | Ни для кого не секрет, что нет совершенного антивируса, поэтому наряду с установленным антивирусом рекомендуется выполнять периодические проверки разовыми утилитами другого производителя. Это дает возможность с большей вероятностью обнаружить вредоносный софт. |
5 | Дефрагментация дисков | Дефрагментация позволяет ускорить процессы чтения/записи дисков и тем самым ускорить работу сервера. |
6 | Проверка резервных копий с восстановлением | Тестовое восстановление резервных копий дает 100%-ю гарантию того, что копии есть и они восстанавливаются. |
7 | Удаление temp-файлов и старых log-файлов | Освобождает место на дисках. |
8 | Контроль записей в системном журнале на предмет ошибок, анализ ошибок | Позволяет заранее выявить ошибки приложений или оборудования. |
9 | Проверка открытых портов | Позволяет выявить порты, которые не должны быть открыты. |
Учитывая тот факт, что регламентные работы выполняются в нерабочее время клиента и являются неинтеллектуальными, целесообразно настроить их автоматическое выполнение с контролем системой мониторинга, на случай если что-то пойдет не так. После выполнения операций обслуживающему инженеру придет отчет о выполненных заданиях и их результатах для дальнейшего анализа.
В результате внедрения инженерами EFSOL регламентных операций в облаке, удалось снизить в среднем на 80% количество негативных инцидентов, например:
- Поражение операционной системы вредоносным ПО снизилось — на 75%
- Отсутствие актуальной целостной резервной копии — на 95%
- Сбои операционной системы после неудачной установки обновлений — на 80%
- Сбои, проявляющиеся после перезагрузки сервера — на 70%
Оставшиеся 20% инцидентов происходят по причине обстоятельств, которые невозможно предусмотреть заранее и выявить с помощью профилактики — например, появление нового вируса, неадекватное поведение приложений и служб, действия пользователя и т.д.
Как показала практика, польза от регламентных операций значительно превосходит затраты времени и ресурсов на их выполнение. Это говорит о том, что проблему лучше предотвратить вовремя, чем бороться с ее последствиями.
EFSOL