Skip to main content
search

Помогли выстроить Disaster Recovery для крупного ритейлера, дважды восстановиться после простоев у другого оператора и затем плавно мигрировать всю инфраструктуру в новое облако — отказоустойчивое и геораспределенное.

Коротко о главном

 

Клиент: Компания Colin’s, известный бренд женской и мужской одежды.

Масштаб инфраструктуры:

  • 200+ магазинов по всей России.
  • Центральный распределительный склад.
  • Развитые онлайн-продажи.
  • 600+ VPN-подключений.
  • Критическая зависимость от облачной инфраструктуры.

Услуги OXYGEN: публичное облако VMware в Москве и кластер Disaster Recovery в Екатеринбурге.

 

Задачи и решение:

Компания Colin’s столкнулась с перебоями в работе облака у другого провайдера. После серии инцидентов был создан, а затем реализован план Disaster Recovery на платформе OXYGEN. Скорость и качество работы нашей команды во время реальных аварий убедили клиента не только в надежности DR-решения, но и в нашей экспертизе как облачного интегратора. В итоге Colin’s полностью мигрировал инфраструктуру в облако OXYGEN, чтобы сервисы работали стабильно, а компания не теряла выручку.

Бизнес-задачи и проблематика

Компания Colin’s работала с облачным провайдером, который предоставлял инфраструктуру, но не мог обеспечить главное — предсказуемость. Формально SLA присутствовал, но при этом не были прописаны RTO (Recovery Time Objective, время восстановления после аварии) и RPO (Recovery Point Objective, максимальная потеря данных).

В моменты инцидентов техподдержка не могла прогнозировать сроки восстановления. А для ритейлера с сотнями магазинов, терминалов, складами и 600+ VPN-подключениями каждая минута простоя — это упущенная прибыль компании. Поэтому появилась потребность в плане Б — втором облачном провайдере и отработанном сценарии аварийного переключения.

Оценка рисков и потерь

Потенциальные потери такого ритейлера при простое ИТ-инфраструктуры:

Показатель Оценка потерь
Потери оборота магазинов ~2–4 млн ₽ / час
Онлайн-продажи ~0,5–1 млн ₽ / час
Логистика и склад косвенные потери из-за простоя
Репутационные риски недоступность сервисов влияет на клиентский опыт

Суммарная оценка риска: 3–6 млн ₽ за каждый час полной недоступности. При 4 часах простоя — потенциально 15–22 млн ₽.

Подключение Disaster Recovery OXYGEN

ИТ-директор Colin’s инициировал разработку комплексной DR-стратегии. Вместе с инженерами OXYGEN команда Colin’s выстроила сценарий Disaster Recovery на базе VMware Cloud Director Availability.

 Архитектурное решение

  1. Классификация сервисов по критичности

Мы совместно с Colin’s ранжировали сервисы: что терпит несколько часов простоя, а что должно быть доступно всегда.

  • Категория A — критические (авторизация, кадровые, операционные, складские сервисы)
  • Категория B — важные, с возможностью восстановления в течение бизнес-дня
  • Категория C — допускают отложенное восстановление
  1. Определение показателей восстановления

Формализовали важнейшие параметры восстановления, от которых зависит выбор сценария резервирования.

Показатель До проекта После внедрения
RTO (Целевое время восстановления) не прогнозировался 5–7 минут для критичных
RPO (Целевая точка восстановления) не формализован ≤ 15 минут
Полный запуск DR отсутствовал; восстановление инфраструктуры за ~4 часа ~1 час
  1. Техническая архитектура

На основе параметров и ранжирования сервисов выбрали архитектуру решения. Disaster Recovery построен на базе VMware Cloud Director Availability по сценарию Active-Passive в кластере OXYGEN в Москве (ЦОД Tier III).

Применение Disaster Recovery

Disaster Recovery OXYGEN дважды применяли «в боевых» условиях. Когда случился инцидент в облаке другого провайдера, точных сроков восстановления клиенту не давали. Через 20 минут неопределенности команда Colin’s приняла решение: переходим на DR.

Мы сразу подключились к задаче, и в течение часа клиентская инфраструктура была поднята на DR‑площадке. ИТ-специалисты клиента запустили сервисы и настроили маршрутизацию, опираясь на заранее проработанный сценарий. Основной провайдер восстановил работу только спустя почти 4 часа — уже поздно вечером.

Предотвращенные потери от одного инцидента:

3 часа предотвращенного простоя × 3–6 млн ₽ = 9–20 млн ₽ сохраненной выручки.

За два инцидента: 20–40 млн ₽ потенциально предотвращенных потерь.

Миграция в облако OXYGEN. Строительство геораспределенной архитектуры

После второго инцидента Colin’s окончательно решили перенести в OXYGEN и основную инфраструктуру компании – как сказал сам клиент, благодаря человеческому отношению. В критический момент специалисты техподдержки OXYGEN откликнулись за 15 минут, взяли задачу в работу и были на связи до самого решения.

Технически миграция прошла максимально спокойно, потому что у клиента уже была ИТ-инфраструктура на VMware. Мы настроили сетевую часть, «фоном» перенесли виртуальные машины, подняли их в новом облаке и остановили на старой площадке. Проверили сеть, настроили туннели — можно пользоваться. Когда сотрудники Colin’s утром пришли на работу, они даже не заметили переход.

«Мы гарантируем для наших клиентов, в том числе для клиентов в сфере ритейла, отказоустойчивость основного облака с четырьмя девятками после запятой — 99,9999%. Наши гарантии прописаны в SLA и мы несем за них финансовую ответственность», — комментирует ИТ-директор OXYGEN Александр Будкин. — «Мы понимаем, как ритейлерам важна отказоустойчивость бизнеса, и помогаем им в эффективной работе».

DR-кластер стал геораспределенным: облако в Москве, резерв в Екатеринбурге. Инженеры заранее проработали сетевую связность, маршрутизацию при переключении, схему сбора туннелей. Отдельный акцент инженеры сделали на сложных участках связи: если падает качество или доступность туннеля, специалисты OXYGEN это видят и оперативно стабилизируют.

«Disaster Recovery не понадобился ни разу — потому что основная площадка справляется с нагрузкой. Конечно же, мы проводим тестовые переключения, чтобы быть уверенными в стабильности. Тесты помогают клиенту удостовериться, что DR сработает корректно и подхватит нагрузку в случае необходимости», — отметил руководитель pre-sale OXYGEN Андрей Вахутинский.

Что изменилось в цифрах и по ощущению команды

Colin’s успешно работает с OXYGEN почти 6 лет, с момента полного переезда в облако прошло уже больше года.

  • RTO стало управляемым

Сейчас у Colin’s есть гарантированный сценарий аварийного восстановления, который можно включить за минуты и вернуть сервисы в работу.

  • Снизилась стоимость простоев

С предсказуемым DR ушли зависимость от чужих сроков и риски упущенной прибыли.

  • Высокое качество техподдержки

По словам клиента, решающим преимуществом OXYGEN стали скорость и возможность быстро связаться с техническими специалистами.

ИТ-директор Colin’s руководил всем проектом построения архитектуры: оценивал риски и экономическую эффективность, принимал решение о переключении мощностей и миграции, распределении ИТ-ресурсов. На этом этапе Colin’s было важно иметь оперативную связь с провайдером, поэтому мы создали для клиента общий чат в мессенджере.

«Коллеги из OXYGEN — единственные по моему опыту работы с провайдерами согласились на общий чат со мной в Telegram. Ребята из техподдержки всегда реагируют быстрее типичных 30–60 минут — что уже довольно быстро, но в OXYGEN отклик молниеносный. Я чувствую, что наша стабильность и отказоустойчивость в приоритете для провайдера и, можно сказать, кайфую от работы с командой», — делится Сайпутдин Омаров, ИТ-директор Colin’s.

Итоги и развитие

Disaster Recovery стал управляемым инструментом ИТ-департамента, частью бизнес-стратегии и важным элементом финансовой устойчивости.

Сейчас мы оказываем консультационные услуги по управлению облаком и прорабатываем новые решения для клиента: в частности, удаленные рабочие столы для специалистов по электронному документообороту.

Если вы устали от провайдеров, которые не могут дать четких сроков при инцидентах — оставьте заявку в OXYGEN. Мы вместе сделаем вашу ИТ-инфраструктуру стабильной.


Читайте кейс Colin’s также в блоге Ритейл ТЕХ

Close Menu

 

+7 (495) 935-72-00