Помогли выстроить Disaster Recovery для крупного ритейлера, дважды восстановиться после простоев у другого оператора и затем плавно мигрировать всю инфраструктуру в новое облако — отказоустойчивое и геораспределенное.
Коротко о главном
Клиент: Компания Colin’s, известный бренд женской и мужской одежды.
Масштаб инфраструктуры:
- 200+ магазинов по всей России.
- Центральный распределительный склад.
- Развитые онлайн-продажи.
- 600+ VPN-подключений.
- Критическая зависимость от облачной инфраструктуры.
Услуги OXYGEN: публичное облако VMware в Москве и кластер Disaster Recovery в Екатеринбурге.
Задачи и решение:
Компания Colin’s столкнулась с перебоями в работе облака у другого провайдера. После серии инцидентов был создан, а затем реализован план Disaster Recovery на платформе OXYGEN. Скорость и качество работы нашей команды во время реальных аварий убедили клиента не только в надежности DR-решения, но и в нашей экспертизе как облачного интегратора. В итоге Colin’s полностью мигрировал инфраструктуру в облако OXYGEN, чтобы сервисы работали стабильно, а компания не теряла выручку.
Бизнес-задачи и проблематика
Компания Colin’s работала с облачным провайдером, который предоставлял инфраструктуру, но не мог обеспечить главное — предсказуемость. Формально SLA присутствовал, но при этом не были прописаны RTO (Recovery Time Objective, время восстановления после аварии) и RPO (Recovery Point Objective, максимальная потеря данных).
В моменты инцидентов техподдержка не могла прогнозировать сроки восстановления. А для ритейлера с сотнями магазинов, терминалов, складами и 600+ VPN-подключениями каждая минута простоя — это упущенная прибыль компании. Поэтому появилась потребность в плане Б — втором облачном провайдере и отработанном сценарии аварийного переключения.
Оценка рисков и потерь
Потенциальные потери такого ритейлера при простое ИТ-инфраструктуры:
| Показатель | Оценка потерь |
| Потери оборота магазинов | ~2–4 млн ₽ / час |
| Онлайн-продажи | ~0,5–1 млн ₽ / час |
| Логистика и склад | косвенные потери из-за простоя |
| Репутационные риски | недоступность сервисов влияет на клиентский опыт |
Суммарная оценка риска: 3–6 млн ₽ за каждый час полной недоступности. При 4 часах простоя — потенциально 15–22 млн ₽.
Подключение Disaster Recovery OXYGEN
ИТ-директор Colin’s инициировал разработку комплексной DR-стратегии. Вместе с инженерами OXYGEN команда Colin’s выстроила сценарий Disaster Recovery на базе VMware Cloud Director Availability.
Архитектурное решение
- Классификация сервисов по критичности
Мы совместно с Colin’s ранжировали сервисы: что терпит несколько часов простоя, а что должно быть доступно всегда.
- Категория A — критические (авторизация, кадровые, операционные, складские сервисы)
- Категория B — важные, с возможностью восстановления в течение бизнес-дня
- Категория C — допускают отложенное восстановление
- Определение показателей восстановления
Формализовали важнейшие параметры восстановления, от которых зависит выбор сценария резервирования.
| Показатель | До проекта | После внедрения |
| RTO (Целевое время восстановления) | не прогнозировался | 5–7 минут для критичных |
| RPO (Целевая точка восстановления) | не формализован | ≤ 15 минут |
| Полный запуск DR | отсутствовал; восстановление инфраструктуры за ~4 часа | ~1 час |
- Техническая архитектура
На основе параметров и ранжирования сервисов выбрали архитектуру решения. Disaster Recovery построен на базе VMware Cloud Director Availability по сценарию Active-Passive в кластере OXYGEN в Москве (ЦОД Tier III).
Применение Disaster Recovery
Disaster Recovery OXYGEN дважды применяли «в боевых» условиях. Когда случился инцидент в облаке другого провайдера, точных сроков восстановления клиенту не давали. Через 20 минут неопределенности команда Colin’s приняла решение: переходим на DR.
Мы сразу подключились к задаче, и в течение часа клиентская инфраструктура была поднята на DR‑площадке. ИТ-специалисты клиента запустили сервисы и настроили маршрутизацию, опираясь на заранее проработанный сценарий. Основной провайдер восстановил работу только спустя почти 4 часа — уже поздно вечером.
Предотвращенные потери от одного инцидента:
3 часа предотвращенного простоя × 3–6 млн ₽ = 9–20 млн ₽ сохраненной выручки.
За два инцидента: 20–40 млн ₽ потенциально предотвращенных потерь.
Миграция в облако OXYGEN. Строительство геораспределенной архитектуры
После второго инцидента Colin’s окончательно решили перенести в OXYGEN и основную инфраструктуру компании – как сказал сам клиент, благодаря человеческому отношению. В критический момент специалисты техподдержки OXYGEN откликнулись за 15 минут, взяли задачу в работу и были на связи до самого решения.
Технически миграция прошла максимально спокойно, потому что у клиента уже была ИТ-инфраструктура на VMware. Мы настроили сетевую часть, «фоном» перенесли виртуальные машины, подняли их в новом облаке и остановили на старой площадке. Проверили сеть, настроили туннели — можно пользоваться. Когда сотрудники Colin’s утром пришли на работу, они даже не заметили переход.
«Мы гарантируем для наших клиентов, в том числе для клиентов в сфере ритейла, отказоустойчивость основного облака с четырьмя девятками после запятой — 99,9999%. Наши гарантии прописаны в SLA и мы несем за них финансовую ответственность», — комментирует ИТ-директор OXYGEN Александр Будкин. — «Мы понимаем, как ритейлерам важна отказоустойчивость бизнеса, и помогаем им в эффективной работе».
DR-кластер стал геораспределенным: облако в Москве, резерв в Екатеринбурге. Инженеры заранее проработали сетевую связность, маршрутизацию при переключении, схему сбора туннелей. Отдельный акцент инженеры сделали на сложных участках связи: если падает качество или доступность туннеля, специалисты OXYGEN это видят и оперативно стабилизируют.
«Disaster Recovery не понадобился ни разу — потому что основная площадка справляется с нагрузкой. Конечно же, мы проводим тестовые переключения, чтобы быть уверенными в стабильности. Тесты помогают клиенту удостовериться, что DR сработает корректно и подхватит нагрузку в случае необходимости», — отметил руководитель pre-sale OXYGEN Андрей Вахутинский.
Что изменилось в цифрах и по ощущению команды
Colin’s успешно работает с OXYGEN почти 6 лет, с момента полного переезда в облако прошло уже больше года.
- RTO стало управляемым
Сейчас у Colin’s есть гарантированный сценарий аварийного восстановления, который можно включить за минуты и вернуть сервисы в работу.
- Снизилась стоимость простоев
С предсказуемым DR ушли зависимость от чужих сроков и риски упущенной прибыли.
- Высокое качество техподдержки
По словам клиента, решающим преимуществом OXYGEN стали скорость и возможность быстро связаться с техническими специалистами.
ИТ-директор Colin’s руководил всем проектом построения архитектуры: оценивал риски и экономическую эффективность, принимал решение о переключении мощностей и миграции, распределении ИТ-ресурсов. На этом этапе Colin’s было важно иметь оперативную связь с провайдером, поэтому мы создали для клиента общий чат в мессенджере.
«Коллеги из OXYGEN — единственные по моему опыту работы с провайдерами согласились на общий чат со мной в Telegram. Ребята из техподдержки всегда реагируют быстрее типичных 30–60 минут — что уже довольно быстро, но в OXYGEN отклик молниеносный. Я чувствую, что наша стабильность и отказоустойчивость в приоритете для провайдера и, можно сказать, кайфую от работы с командой», — делится Сайпутдин Омаров, ИТ-директор Colin’s.
Итоги и развитие
Disaster Recovery стал управляемым инструментом ИТ-департамента, частью бизнес-стратегии и важным элементом финансовой устойчивости.
Сейчас мы оказываем консультационные услуги по управлению облаком и прорабатываем новые решения для клиента: в частности, удаленные рабочие столы для специалистов по электронному документообороту.
Если вы устали от провайдеров, которые не могут дать четких сроков при инцидентах — оставьте заявку в OXYGEN. Мы вместе сделаем вашу ИТ-инфраструктуру стабильной.
Читайте кейс Colin’s также в блоге Ритейл ТЕХ
