Top.Mail.Ru
2024-01-09 12:48:26

Amediateka выбирает EdgeЦентр: DevOps as a Service для оптимизации работы IT-инфраструктуры

Amediateka — стриминговый сервис сериалов и фильмов. На платформе проходят премьеры новых проектов HBO одновременно со всем миром, а также ведущих телеканалов и студий мира — Fox, Showtime, Starz, BBC, ABC Studios, Sony Pictures Television и других.

  • Год основания: 2013
  • Откуда: Москва, Россия
  • Сайт: amediateka.ru
  • Продукт: Управление IT-инфраструктурой

Компания Amediateka столкнулась с проблемами при сотрудничестве с подрядчиком, который занимался управлением IT-инфраструктуры. Основные из них: длительное время выполнения работ, низкое качество, непрозрачность взаимодействия, проблемы со стабильностью платформы, отсутствие мониторинга и обновлений инфраструктуры.

Перед клиентом стояла задача создать надежную IT-инфраструктуру с использованием услуг нового подрядчика, учитывая предыдущие ошибки и избегая их в будущем.

EdgeЦентр предложил Amediateka решение DevOps as a service. Оно избавляет от необходимости нанимать узкоспециализированных сотрудников высокой квалификации. Это позволяет сэкономить на зарплате и снижает сопутствующие расходы.

Что в себя включало управление IT-инфраструктурой клиента

Этапы работы специалистов EdgeЦентр над проектом:

  1. Мониторинг и аудит текущей IT-инфраструктуры, выявление и устранение обнаруженных проблем, как планово, так и аварийно. Круглосуточное дежурство наших специалистов для оперативного реагирования на возникающие инциденты.
  2. Внедрение решения для обеспечения высокой доступности платформы и устойчивости к аппаратным и программным сбоям.
  3. Обновление программного обеспечения, автоматизация рутинных процессов, таких как первичная настройка инфраструктуры и внедрение GitOps.
  4. Взаимодействие с разработчиками: настройка конвейера CI/CD - сборка, тестирование, действия по развертыванию ПО на стендах, помощь в выборе и имплементации компонентов технологического стека, отладка взаимодействия и повышение наблюдаемости компонентов системы.
  5. Участие в создании гибкой и масштабируемой системы, выявление проблем и оптимизация параметров в микросервисах и создание тикетов для разработчиков клиента.

С какими проблемами столкнулись на проекте и как их решили

Во время работы над проектом были выявлены проблемы в инфраструктуре клиента, которые требовалось устранить:

  1. Гипервизоры не были объединены в кластер. Если выходил из строя один физический сервер, это приводило к потере нескольких виртуальных машин на неопределенное время. Поэтому был создан отказоустойчивый кластер OpenStack с сетевым хранилищем Ceph, и все виртуальные машины были перенесены в него.
  2. Некорректные сетевые взаимодействия между элементами системы приводили к проблемам с маршрутизацией и утилизацией пропускной способности канала. Для устранения этой проблемы была изменена сетевая маршрутизация, а также внесены изменения в настройки сервисов.
  3. Обнаружена устаревшая версия кластера Kubernetes (1.14), которую требовалось обновить. В результате развернут новый кластер и осуществлен переезд.
  4. Был использован один балансировщик Nginx, развернутый на физическом сервере без возможности техобслуживания. Для исправления ситуации были введены в эксплуатацию две новые виртуальные машины.

Результаты сотрудничества и дальнейшие планы

Итог проекта по созданию IT-инфраструктуры оценивается по следующим показателям: время простоя, время ответа и процент успешных запросов. По всем этим метрикам команда EdgeЦентр показала высокие результаты.

Грамотная архитектура инфраструктуры и разрабатываемого продукта позволила клиенту обслуживать отдельные узлы системы без влияния на доступность и производительность. Благодаря увеличению наблюдаемости, большому количеству собираемых метрик, логов и трейсов, стало возможным быстро выявлять проблемные места. Это в свою очередь минимизирует вероятность сбоев и простоев в работе, а следовательно, уровень недовольства пользователей и партнеров.

За 2 года работы над проектом команда EdgeЦентр переработала сетевую архитектуру компании Amediateka. Это привело к следующим результатам:

  • Время доступности платформы (Service Level Indicator) - 99,5%. За год платформа была недоступна в сумме менее двух дней. В следующем году показатель SLI увеличится, так как проведены работы на критичной инфраструктуре и дальнейшие изменения будут без простоев.
  • Трафик в сети снизился в 4 раза.
  • Среднее время отдачи контента уменьшилось с 2 до 0,2 секунд.
  • Скорость сети возросла с 1 до 10 Gbit/s
  • Среднее время ответа на запрос - около 1,5 секунд.
  • Процент успешно выполненных запросов - 99,9%. 

Облачные и edge-решения от одного поставщика

Попробовать

Мы используем cookie, чтобы сайт стал лучше для вас.