Как эффективно управлять ИТ-инфраструктурой в облаке: своими силами или отдать на аутсорс
Современный бизнес невозможно представить без устойчивой и гибкой ИТ-инфраструктуры. От её надежности зависят скорость обработки заказов, бесперебойная работа онлайн-сервисов, безопасность клиентских данных. Вместе с ростом ИТ-систем растёт и сложность их сопровождения: появляются новые технологии, ужесточаются требования к безопасности, возрастают нагрузки и меняются задачи бизнеса.
На определённом этапе перед каждой компанией встаёт выбор: строить собственную команду для управления всей этой системой или передать инфраструктуру внешнему подрядчику, а самим сфокусироваться на развитии продукта. У каждого варианта есть свои плюсы, минусы и скрытые риски.
В статье разберём, из чего складывается современное управление ИТ-инфраструктурой и с какими трудностями сталкиваются компании, а на примерах кейсов K2 Cloud покажем, как всё устроено.
Что входит в ИТ-инфраструктуру
Прежде чем говорить о сопровождении ИТ-инфраструктуры, разберём, какое место она занимает в ИТ-ландшафте компании.
В упрощённом виде можно выделить три основных уровня:
- Платформа — в нашем случае это K2 Облако. Платформа обеспечивает базовый уровень вычислительных ресурсов: виртуальные машины, хранилища, сеть. Поддержка этой части входит в стандартный сервис облачного провайдера.
- ИТ-инфраструктура — промежуточный слой между платформой и бизнес-приложениями. Он включает в себя все компоненты, которые обеспечивают работу приложений: виртуальные машины, дисковые хранилища и файловые сервисы, сетевые настройки и схемы связности компонентов, операционные системы, базы данных, балансировщики нагрузки, веб-серверы и сопутствующее инфраструктурное ПО, системы резервного копирования и мониторинга, настройки безопасности.
- Бизнес-приложения — слой, за который чаще всего отвечает клиент. Здесь сосредоточены внутренние и клиентские сервисы, собственные разработки, интеграции и прикладные системы. Если мы сопровождаем инфраструктуру в облаке, то отвечаем за инфраструктурный слой, стабильную и отказоустойчивую работу инфраструктуры, быстро реагируем на изменения в нагрузках или требованиях бизнеса.
Компетенции для управления ИТ-инфраструктурой
Основные компетенции напрямую связаны с тем стеком технологий и инфраструктурным ПО, которые используют при построении систем.
Ключевые навыки:
Облачные технологии и виртуализация — понимание архитектуры облачных платформ, принципов масштабирования, резервирования и построения отказоустойчивых решений.
Сетевые технологии — знание сетевых протоколов, принципов построения корпоративных сетей, настройки маршрутизации, балансировки нагрузки и обеспечения сетевой безопасности.
Базы данных — опыт работы с реляционными и нереляционными СУБД, понимание схем репликации, кластеризации, шардирования и настройки отказоустойчивости хранилищ данных.
Опыт работы с классическими серверными стеками — развёртывание и сопровождение веб-сервисов на базе Linux, Nginx/Apache, SQL и NoSQL баз данных с использованием актуальных языков и фреймворков (Node.js, Python, Go, Laravel, FastAPI и др.). Интеграция с CI/CD, обеспечение безопасности, отказоустойчивости. Миграция устаревших решений на современные технологические стеки.
Микросервисная архитектура — понимание принципов построения распределённых приложений, контейнеризации, оркестрации (например, Kubernetes), взаимодействия сервисов и сервис-дискавери.
Системы резервного копирования и восстановления — знание подходов к построению стратегии бэкапов, тестированию восстановления и обеспечению непрерывности бизнеса.
Информационная безопасность — практическое понимание принципов защиты данных, настройки прав доступа, управления уязвимостями и соответствия требованиям ИБ.
Open Source-компоненты. Инфраструктура выходит далеко за пределы стандартного набора технологий. Мы регулярно работаем с десятками OSS-решений — от утилит и прокси до инструментов автоматизации, безопасности, CI/CD и Service Mesh. Благодаря командной специализации мы уверенно используем как популярные, так и нишевые инструменты в продакшен окружениях.
Все эти навыки нужны, чтобы выстраивать надёжную, безопасную и гибкую инфраструктуру, которая будет поддерживать рост бизнеса и адаптироваться к его задачам.
Какие сложности возникают при поддержке и управлении ИТ-инфраструктурой
При самостоятельном управлении ИТ-инфраструктурой компании сталкиваются с разными вызовами: от затрат на штат специалистов до соответствия требованиям регуляторов.
Низкая надёжность и неоптимальная конфигурация
Одна из ключевых проблем — недостаточная надёжность и неэффективная настройка инфраструктуры. Сбои напрямую отражаются на производительности бизнес-приложений и их доступности: время отклика и количество ошибок растут, а стабильность сервисов снижается. В результате страдают пользователи — ухудшается качество клиентского опыта, увеличивается отток клиентов, компания теряет выручку.
Отсутствие гибкости в инфраструктуре ограничивает скорость запуска новых продуктов и масштабирования уже работающих решений. Это влияет на ключевые показатели бизнеса: увеличивается time-to-market, нарушаются сроки вывода новых функций, под угрозу попадает достижение стратегических целей компании.
Зависимость от зарубежных вендоров и ограничение вендорской поддержки
Зависимость инфраструктурных компонентов от зарубежных решений
После 2022 года многие компании столкнулись с невозможностью продления лицензий, отсутствием обновлений и поддержки. В перспективе это создавало риски информационной безопасности, привело к накоплению уязвимостей и угрозе полной недоступности отдельных компонентов инфраструктуры.
Миграция с иностранных платформ на российские решения
Этот процесс затрагивает все уровни ИТ-ландшафта: от операционных систем и СУБД до специализированного отраслевого ПО. На практике это означает необходимость параллельного сопровождения двух сред — старой и новой, что требует дополнительных ресурсов на тестирование совместимости, перенос данных и обучение. ИТ-специалистам пришлось за ограниченное время развивать компетенции для работы с новыми технологиями и вендорами, параллельно решая проблемы их эксплуатации.
Легаси-системы
Как правило, они выполняют критически важные функции. При этом их эксплуатация характеризуется множеством проблем — от отсутствия технической поддержки компании-разработчика до дефицита специалистов, способных их обслуживать.
Ошибки в проектировании при переходе на контейнеризацию
Контейнеризация и использование оркестраторов вроде Kubernetes становятся всё более популярными: только за последний год количество компаний, внедривших подобные решения, выросло более чем на 30%. Мы наблюдаем эту динамику в собственных проектах. Изначально непродуманная архитектура контейнерных решений приводит к сбоям, сложности масштабирования, неэффективному использованию ресурсов. В результате бизнес теряет те преимущества, ради которых изначально и задумывался переход на современные платформы.
Дефицит квалифицированных специалистов
Потребность в профессионалах с компетенциями в современном инфраструктурном стеке продолжает расти, а рынок не успевает удовлетворять этот спрос. Стоимость специалистов возрастает, поэтому компании вынуждены ограничивать амбиции, замораживать проекты или искать компромиссы в архитектуре из-за отсутствия необходимой экспертизы внутри команды.
Варианты управления ИТ-инфраструктурой
Одни собирают для этого собственную команду, другие — передают управление на аутсорсинг. У каждого способа свои особенности.
Самостоятельное управление
Такой подход обеспечивает полный контроль над всеми технологическими процессами. Компания формирует собственный штат специалистов, которые администрируют системы, отвечают за техническую поддержку пользователей, обеспечивают информационную безопасность. Самостоятельное управление практикуют в организациях со строгими требованиями к безопасности данных, например, в банках или государственных структурах. Один из минусов самостоятельного управления — высокие расходы.
Аутсорсинг
Управление инфраструктурой делегируют внешнему подрядчику. Такой подход позволяет компаниям получить доступ к профессиональным ИТ-услугам без необходимости содержать большой штат специалистов. Интеграторы предлагают комплексные решения: аудит, мониторинг, управление облачными сервисами и техническую поддержку пользователей. Ключевые преимущества аутсорсинга — снижение операционных расходов, возможность быстро масштабировать ИТ-ресурсы в соответствии с текущими задачами, доступ к глубокой экспертизев различных областях.
Гибридный подход
Многие комбинируют самостоятельное управление с аутсорсингом. Например, критически важные системы оставляю под контролем внутренней ИТ-команды, а остальные сервисы передают в управление внешнему подрядчику. Такой подход позволяет оптимизировать затраты на ИТ и при этом сохранить контроль над ключевыми процессами в бизнесе.
Какую инфраструктуру передают на аутсорс
Компании передают на аутсорсинг разные типы инфраструктурных проектов в зависимости от специфики бизнеса и уровня необходимых компетенций.
В K2 Cloud мы выделяем несколько основных групп таких проектов:
Корпоративные сервисы
Почти половина проектов связана с поддержкой базовых корпоративных ИТ-систем, необходимых практически в любой компании: почтовые системы, Active Directory, ERP-системы, CRM-платформы, хранилища данных и файловые сервисы.
Клиентам важно, чтобы всё работало стабильно, соответствовало требованиям безопасности и вовремя обновлялось. Поэтому поддержка таких сервисов часто передаётся на аутсорс.
Облачный файлообменник (Nextcloud)
Отдельную долю проектов занимает поддержка корпоративного файлообменника, построенного на базе Nextcloud. Мы дорабатываем и поддерживаем эту платформу под ключ, включая адаптацию функциональности под потребности клиентов и интеграцию с корпоративной ИТ-инфраструктурой. Значительная часть наших наработок в рамках этих проектов включается в официальный репозиторий продукта, что позволяет нашим клиентам получать качественный, доработанный сервис с полной поддержкой.
E-commerce проекты
Множество проектов связано с инфраструктурой для e-commerce платформ. С 2020 года развитие онлайн-торговли ускорилось, и для многих компаний e-com стал важным каналом продаж. При этом ИТ-инфраструктура для высоконагруженных e-commerce систем требует серьёзной архитектурной проработки, высокой отказоустойчивости и быстрой масштабируемости. Поскольку создание и сопровождение таких решений выходит за рамки профильной экспертизы большинства компаний, управление e-commerce инфраструктурой часто передают профессиональной команде. Клиенты сосредотачиваются на разработке приложений, а поддержкой инфраструктурного слоя занимаемся мы.
Как эффективно управлять инфраструктурой: комплексный подход к решению проблем
В K2 Cloud мы используем подход Professional Services. Это значит, что проекты традиционно начинаются с глубокого IT-аудита, чтобы выявить слабые места текущей инфраструктуры, провести объективную оценку её состояния и сформировать обоснованный план решения проблем.
На основе результатов аудита мы разрабатываем детальный роадмап по развитию инфраструктуры. Для его реализации используем широкий спектр услуг, охватывающий весь жизненный цикл инфраструктурного слоя — от проектирования до круглосуточной эксплуатации. В него могут входить:
- миграция существующих систем;
- разработка архитектуры с нуля при запуске новых сервисов;
- модернизация инфраструктуры при резком росте нагрузки;
- устранение архитектурных и технических ошибок в действующих системах.
Особое внимание мы уделяем круглосуточной эксплуатации, обеспечению стабильной работы, оперативному внесению изменений и планомерному развитию инфраструктуры в соответствии с потребностями бизнеса.
Завершающий этап — использование современных DevOps-практик. Их невозможно рассматривать отдельно от общего подхода к управлению инфраструктурой. Интеграция процессов разработки, эксплуатации и управления инфраструктурным стеком позволяет компаниям быстро внедрять изменения и сохранять при этом надёжность систем.
Как Professional Services решают задачи по управлению инфраструктурой
Мы подходим к решению этих задач комплексно: от аудита и построения отказоустойчивой архитектуры до переноса сервисов, контейнеризации и настройки CI/CD.
Построили контейнеризацию для e-commerce в облаке
Клиент: лидер производства и оптовой дистрибуции канцтоваров в России, интернет-магазин с >10 000 товаров.
Задача: повысить стабильность e-commerce системы, устранить инфраструктурные сбои, мешающие продажам. Инфраструктура находилась on-premise, с единственным инженером в штате, отвечающим за всю поддержку.
Решение:
Прежде всего мы провели аудит инфраструктуры и выявили дублирование сервисов, отсутствие отказоустойчивости, неэффективную маршрутизацию. Для решения проблем разработали новую облачную архитектуру с учётом требований стабильности и стоимости.
После того, как её утвердили, мигрировали в К2 Облако и перешли на контейнерную платформу Nova — российский Kubernetes-совместимый продукт с удобным веб-интерфейсом. Все сервисы, включая сложный backend на 1С-Битрикс, контейнеризировали.
В результате получилась отказоустойчивая схема для всех сервисов: часть через Kubernetes, часть — через кластерные хранилища (Longhorn, GeeseFS). Деплой и CI/CD автоматизировали с помощью GitOps и FluxCD, в том числе auto-deploy новых версий из registry. Авторизацию через FreeIPA и SSO унифицировали, чтобы повысить безопасность, а сервисы интегрировали с Consul для проверки доступности удалённых точек по TCP, HTTPS, PING. без агента. Он организует единую точку входа в виде DNS-записи с TTL=0. Так мы обеспечили отказоустойчивость: если проверка Consul окончилась неудачей, то он автоматически выводит из балансировки внешний IP-адрес межсетевого экрана.
Результат:
- SLA на уровне 99,95%.
- Стабильная работа основного канала продаж.
- Возможность масштабирования при росте бизнеса.
- Снижение нагрузки на команду клиента за счёт полного сопровождения DevOps.
Цифровизировали страховую компанию
Клиент: федеральная страховая компания.
Задача: создать инфраструктуру для цифровых продуктов и онлайн-продаж. Изначально проект стартовал как пилотный для проверки гипотез, фокус был на скорости запуска. После роста онлайн-продаж разрозненные системы надо было объединить отказоустойчивой и безопасной сетевой инфраструктурой.
Какие проблемы решили:
- Разрозненные сетевые сегменты в разных проектах, VPC и аккаунтах.
- Отсутствие централизованной межсетевой безопасности.
- Недостаток собственных компетенций в сетевой архитектуре.
Решение:
Одной из ключевых задач клиента было создание новых каналов продаж и цифровизация. Эти две гипотезы хотели проверить быстро, из-за этого не все требования безопасности и доступности были соблюдены на этапе проектирования.
Наша задача состояла в проектировании и инсталляции отказоустойчивого межсетевого экрана. Межсетевой экран должен был обязательно находиться в трёх зонах доступности, размещаться на границе периметра и контролировать доступ как из интернета, так и в интернет, а также обеспечивать связность между проектами и разными контурами заказчика.
Вместе с командой K2 Кибербезопасности мы спроектировали для клиента отказоустойчивый межсетевой экран в трёх зонах доступности. Отдельным вызовом стала организация связности между изолированными средами с помощью VPN-as-a-Service с высокой доступностью. После появления в облаке сервиса транзитных шлюзов мы реализовали с его помощью прямую и безопасную маршрутизацию без VPN-туннелей.
Следующим шагом после проектирования стала интеграция с Consul для проверки доступности конечных точек и автоматического исключения недоступных IP-адресов из балансировки (схема Active-Active). Наладили поддержку альтернативных решений для возможной замены на open-source зарубежных компонентов, в частности, CheckPoint.
Результат:
- Построили масштабируемую, отказоустойчивую и безопасную сетевую инфраструктуру.
- Обеспечили запас производительности для роста бизнес-нагрузок без ограничений со стороны ИБ.
- За первый год после запуска цифровых продуктов клиентская база выросла более чем на 100 000 клиентов, а отказоустойчивость и доступность сохранились.
- Клиент получил долгосрочного технологического партнёра по дальнейшему развитию инфраструктуры.
Построили архитектуру e-com в облаке для международного ритейлера
Клиент: международный ритейлер
Задача: повысить стабильность и безопасность уже работающей e-commerce платформы, устранить систематические сбои, на которые жаловались покупатели, и избежать снижения продаж.
Какие проблемы решили:
- Многочисленные точки отказа архитектуры, разработаннойная сторонним подрядчиком.
- Размещение в одной зоне доступности, отсутствие кворумных кластеров.
- Низкий уровень отказоустойчивости приложений и инфраструктуры.
- Ограниченные средства мониторинга и медленное устранение проблем.
- Несоответствие новым требованиям PCI DSS и внутренней политике ИБ.
Решение:
Решать проблемы начали с IT-аудита текущей архитектуры, чтобы выявить уязвимости. Следующим этапом стала разработка и внедрение новой облачной архитектуры с cloud-native подходами: размещение в трёх зонах доступности, разделение кластеров Kubernetes для снижения доменов отказа и контейнеризация почти 1000 микросервисов. Кроме этого мы обеспечили балансировку нагрузки с помощью запросов к базам данных через ProxySQL.
Усилили сетевую безопасность: настроили межсетевой экран в трёх зонах доступности и алгоритмы шифрования по ГОСТ до офиса клиента. Чтобы соблюсти требования регулятора, мы использовали отечественную ОС на всех виртуальных машинах, которую интегрировали с антивирусом и системой мониторинга ИБ.
Service Discovery мы интегрировали через Consul. Организовали совместный процесс CI/CD с разработчиком e-com платформы. Взяли на себя сопровождение и эксплуатацию инфраструктуру с учётом требований ИБ.
Результат:
- Существенно снизили количество сбоев и аварий.
- Повысили стабильность и производительность e-commerce платформы.
- Защитили инфраструктуру от угроз безопасности, а компанию — от связанных с ними финансовых и репутационных потерь.
Выбор между аутсорсингом и управлением in-house
Аутсорсинг инфраструктурной поддержки в формате Professional Services позволяет компаниям получить надёжного технологического партнёра, который берёт на себя полное сопровождение и развитие всей ИТ-инфраструктуры. Благодаря индивидуальной проработке каждого проекта мы учитываем потребности бизнеса, сроки и бюджет. Это позволяет команде клиента фокусироваться на продуктах, ускорить проверку гипотез и снизить time-to-market для цифровых сервисов. Также у бизнеса снижается потребность в содержании узкопрофильных специалистов в штате и затраты на них, а bus-фактор становится контролируемым.
In-house управление инфраструктурой сопряжено с рядом рисков: сложно рассчитать рост нагрузки, правильно спланировать и распределить ресурсы, чтобы избежать лишних незадействованных мощностей или их дефицита.
Затраты на in-house управление инфраструктурой выше и носят единовременный характер. Некоторые компании используют комбинированный подход, чтобы оставить под корпоративным управлением критические важные элементы, и передать аутсорсеру остальное. Эта схема подходит тем, у кого повышенные требования к безопасности, продиктованные законодательством или регуляторами.
В остальных случаях бизнесу в современных реалиях дешевле и оптимальнее передать инфраструктуру во внешнее управление профессиональному подрядчику, который будет сопровождать и поддерживать инфраструктуру.