+7 495 230 03 03 8 800 222 50 03

Как обеспечить максимальную отказоустойчивость информационной системы?

Дата публикации: 18 сентября 2013
Как обеспечить максимальную отказоустойчивость информационной системы?
Наиболее популярным решением для автоматизации бизнеса и бухгалтерского учета в странах СНГ является программное обеспечение компании 1С. Компания имеет решения практически для любого сектора экономики и позволяет решать ключевые задачи, поставленные перед бизнесом. Очевидным является тот факт, что современный бизнес стал очень зависеть от состояния ИТ-инфраструктуры. Конфиденциальные данные о контрагентах, договорах, счетах, личные данные сотрудников и прочая критичная информация хранятся в базах программ, таких как 1С.
В данной статье не рассматривается вариант безвозвратной утери баз данных, т.к. создание автоматических резервных копий является де-факто необходимым минимумом для работы любой системы. Наша цель – проработать ситуации недоступности ИТ-структуры. Ведь значительно чаще случаются временные сбои в работе систем, приносящие прямой и косвенный ущерб, несмотря на свою непродолжительность. Например, штрафы от поставщиков, покупателей, государственных и других организаций за несвоевременную подачу информации, упущенная выгода от незаключенных сделок, отсутствие внутренней оперативной информации во время принятия ключевых решений руководством компании и тому подобное. Эти проблемы также приводят к негативному имиджу компании на рынке и могут снизить желание партнеров работать с таким нестабильным партнером. Итак, для того чтобы понять, какую нужно построить структуру для обеспечения максимальной отказоустойчивости, рассмотрим те факторы, которые, собственно, и могут повлиять на стабильность работы системы учетной программы, на примере 1С. Факторы, которые могут повлиять на стабильность работы системы и действия для снижения рисков, связанных с ними:

Таблица 1. Факторы, влияющие на стабильность информационной системы

Фактор риска Как нейтрализовать риски
Выход из строя аппаратного сервера – отказ в работе одной из критических аппаратных составляющих сервера. Гарантировано предусмотреть подобный риск возможно, если в компании развернут точно такой же аппаратный сервер, информация на нем дублируется в режиме реального времени, а переход на резервный сервер происходит мгновенно.
Сбой операционной системы – выход из строя сервера в результате программного сбоя. Предыдущий вариант также спасает от второго риска – сбоя операционной системы.
Человеческий фактор – умышленное или случайное изменение данных в базе данных 1С. Против внесения неверной информации в базу помогает только создание резервных копий – чем чаще они делаются и чем больше глубина хранения копий – тем лучше. В случае выявления ошибки данные восстанавливаются на тот период, когда ошибки еще не было.
Ошибка ПО 1С – сбой в результате ошибки программиста, в результате добавления новой обработки или перехода на новый релиз программы. Для того, чтобы застраховать себя от ошибок кода, применения к базе новых обработок, версий платформы, релизов конфигурации и других улучшений – любые изменения требуется обязательно тестировать на аналогичной системе. Для этого необходимо иметь аналогичный сервер разработки и тестирования, в идеале с характеристиками, идентичными основному.
Выход из строя канала интернет – отключение провайдером интернета за неуплату, физическое повреждение линии связи в результате дорожных работ, проблемы с оборудованием у провайдера, либо у роутера в офисе.

Заранее подключить резервного провайдера и работать на нем, пока основной не починит свою магистраль. Резервного провайдера нужно выбирать так, чтобы он не пересекался с основным – например предоставление услуг через радиоканал или использование различных магистралей, чтобы в случае аварии они не пострадали оба.

Также рекомендуется иметь запасный маршрутизатор и шлюз интернет. Как минимум, в холодном резерве. Чтобы при возникновении форс-мажора можно было оперативно заменить вышедший из строя роутер и восстановить работоспособность офиса.

Сбой электропитания – отключение электричества в результате ремонта здания, сбоя на подстанции, повреждение линий электропередач. Рекомендуется каждое серверное оборудование подключить к источнику бесперебойного питания. Также оптимально будет подвести второй канал питания от другой подстанции, либо иметь автономный электрогенератор.
  • Стихийное бедствие – пожар, наводнение, ураган и другие беды, которые могут привести в негодность все серверное оборудование.
  • Рейдерский захват – захват компании на незаконных основаниях.
В случае затопления, пожара, разрушения или рейдерского захвата офиса, Вашу информацию спасет только ее дублирование в территориально удаленное место, например в офис филиала либо как оптимальный вариант – на дублирующую структуру в датацентре (катастрофоустойчивость).

Рассмотрим схему отказоустойчивой структуры, которая рассчитана на 100 пользователей 1С

  • Основа структуры – профессиональная система хранения данных Hi-End уровня
  • Ключевые сервисы рекомендуется базировать на двух равноценных носителях виртуальных машин
  • Для подключения аппаратных серверных платформ к системе хранения данных рекомендуем использовать протокол передачи данных по оптическому волокну Fibre Channel. Для этого в каждый сервер требуется вставить специальный адаптер SAN-сети FC
  • Для обеспечения отказоустойчивости и возможности линейного увеличения серверов в SAN-сети рекомендуется использовать специальные FC-коммутаторы. Все серверы будут подключены одновременно к двум FC-коммутаторам, в случае выхода из строя одного из них – система не потеряет связь с СХД.
Выбор в пользу СХД сделан по ряду причин:
  • Для формирования кластера СУБД необходимо единое хранилище;
  • Обладает более высокой производительностью и масштабируемостью по сравнению с использованием локальных дисков;
  • Имеет высокую отказоустойчивость за счет использования 2-х независимых контролеров, центральных процессоров, жестких дисков горячего резерва и 2-х блоков питания.

Таблица 2. Обеспечение отказоустойчивости информационной системы

Критерий Описание
Отказоустойчивость терминальных серверов При выходе из строя одного терминального сервера, сессии пользователей автоматически переключаются на другой терминальный сервер и пользователи продолжают работать. Это обеспечивается службой распределителя терминальных сессий (TS Broker), которая установлена на виртуальных контроллерах домена.
Отказоустойчивость SQL серверов Реализована с помощью технологии отказоустойчивого кластера СУБД MS SQL. Переключение между экземплярами СУБД происходит быстро.
Отказоустойчивость серверов 1С: Предприятие Настроена с помощью встроенной возможности сервера 1С держать несколько ферм и подключать клиентов циклически на резервную платформу в случае недоступности основной. Также данная реализация позволяет балансировать нагрузку между двумя серверами.
Отказоустойчивость контроллеров домена Реализована с помощью двух виртуальных машин, используя встроенные роли основного и резервного контроллеров домена MS Server.
Отказоустойчивость каналообразующего оборудования Обеспечивается кластером из двух роутеров надежного производителя, например, модель Juniper или Cisco. В случае выхода из строя одного из них, второй автоматически возьмет на себя весь поток трафика.
Отказоустойчивость и безопасность интернет соединения Выбранные в качестве шлюзов маршрутизаторы обеспечивают поддержку шифрованных туннелей IPSeс с алгоритмом шифрования 3des, что гарантирует высокую надежность шифрования, а также протокол динамической маршрутизации OSPF с поддержкой dead-interval minimal, который сводит время переключения на резервный канал к минимуму (1 – 2 секунды). Во время падения основного канала интернет – подключение к филиалам и удаленным точкам автоматически переводится на шифрованные туннели, построенные через резервного провайдера.
Отказоустойчивость электропитания Обеспечивается задействованием двух источников бесперебойного питания, которые подключены к разным блокам питания СХД и серверной платформы. ИБП в свою очередь подключены к различным каналам электропитания. Также задействован автономный электрогенератор.
Отказоустойчивость системы охлаждения серверов Задействованы два кондиционера с модулем согласования и оповещения о проблемах. Таким образом кондиционеры работают поочередно, что препятствует их быстрому изнашиванию.

Рисунок 1 – Схема организации отказоустойчивой информационной системы

Таблица 3 – Стоимость организации отказоустойчивой информационной системы

Перечень необходимых компонентов Спецификация Ориентировочная цена, руб
1 Серверное шасси с начинкой, 2 шт. Платформа серверная 2U Supermicro (Intel Xeon 2.4GHz – 3.2GHz Skylake 10-Core, 9x DDR4 32GB Samsung, C621, 2x SATA-DOM 128Gb, 2xGE, 2x1000W,Rail) 800 000 руб
2 Система хранения данных с дисками и оптическими картами Дисковый массив СХД 4 x 480 GB SSD; 2x Host I/O Module FC 16G 4port 1 400 000 руб
3 Источники бесперебойного питания, 2 шт. ИБП APC by Schneider Electric – Smart-UPS, 3000VA/2700W, Line-Interactive, in (230V 1xIEC-320 C20), out (8xIEC-C320 C13 1xIEC-C320 C19), Hot Swap User Replaceable Batteries, LCD, Rack, 3U, RM, цвет Чёрный 280 000 руб
4 Лицензии
  • операционные системы;
  • MS SQL Standard;
  • клиентские подключения к MS SQL;
  • клиентские подключения к серверу терминалов;
  • лицензии на сетевые подключения.
1 900 000 руб
5 Хранилище резервных копий с жесткими дисками Synology Компактный и масштабируемый сервер NAS 1U 105 000 руб
6 Роутеры надежного производителя, 2 шт Juniper SRX210 160 000 руб
7 Напольный серверный шкаф Hyperline TSC-2761-GR-RAL9004 110 000 руб
8 Дизельный генератор HUTER DY8000LX (не учитывается сопутствующее оборудование, стоимость помещения для генератора, а также получение разрешений на размещение) 50 000 руб
9 Система охлаждения Два кондиционера с системой согласования работы и системой оповещения о сбоях 95 000 руб
Итого: 4 900 000 рублей неизбежных единовременных затрат.

Вывод

Таким образом, 4,9 млн. рублей – цена уверенности в 100% сохранности Ваших данных, а также залог быстрого восстановления работоспособности. Альтернативой собственного владения информационной системы является аренда 1С сервера – это означает, что уже кто-то другой понес вышеописанные затраты, построил такую систему и теперь может ее отдать Вам в аренду. Ведь инвестиции в свою инфраструктуру по сравнению с арендой окупаются в среднем не менее чем через 5 лет, а за это время серверное оборудование и ПО морально устареет и требует новых вливаний финансов. В данном случае, Вы также экономите на заработной плате штатного системного администратора, ибо обслуживают данную систему сотрудники поставщика услуг, они же помогают пользователям в результате возникновения каких-либо проблем.
Для тех компаний, кто не желает полностью переходить в облако, мы предусмотрели несколько вариантов резервирования ИТ-инфраструктуры, чтобы в случае непредвиденных обстоятельств можно было быстро восстановить работу в компании без прерывания бизнес-процессов. Кроме этого, компания EFSOL предоставляет услуги по организации отказоустойчивых систем по индивидуальным требованиям клиента.
Лого ES мини

EFSOL

  • Аноним

    По моему мнению, нужно разносить критичные роли как можно дальше друг от друга… Инструментов придумали массу – технологию VMWare Vsan, репликации виртуальных машин на уровне гипервизоров, та же ГиперВ Replica…. Распределенные сетевые системы на базе Unix сборок, либо продукты сторонних разработчиков (по моему Старвинд, но могу ошибаться).

Заказать звонок

Оставьте свои данные для того, чтобы специалист с вами связался.

*нажимая на кнопку, Вы даете согласие на обработку персональных данных
Быстрое внедрение включает:
На сервере установлено следующее ПО (доступно при подключении по протоколу RDP):
Также настроено:
Перед внедрением клиент предоставляет информацию о пользователях (логины и пароли). После завершения работ, клиенту высылается инструкция и ярлык для подключения.
Индивидуальное внедрение по ТЗ клиента обсуждается отдельно.