Как приручить облачного зверя: раскрываем тему FinOps

31/7/2023

Содержание:

Закупать серверы или использовать «облако»? Какие риски есть в каждом из этих подходов? Как помирить тех, кто платит по счетам в компании и тех, кто может запустить дорогой ИИ-сервис на десять минут, забыть про него и обеспечить к концу месяца непредвиденные расходы организации?

Облако даёт компаниям гибкость и мощность, но может легко выйти из-под контроля. Как приручить этого опасного зверя?

В статье разберем:

  • Как взять облако под контроль и сделать расходы предсказуемыми.
  • Как FinOps помогает оптимизировать использование облачных сервисов.
  • Как избежать типичных ошибок и рисков при внедрении этой практики.

Путь к гибкой и масштабируемой ИТ-инфраструктуре

Сегодня многие компании сталкиваются с необходимостью модернизации устаревающей ИТ-инфраструктуры. В 2022 году во всём мире компании закупили серверов на более чем 122 млрд долларов, подсчитали IDC. В России по итогам 2020 года этот рынок достиг $1,32 млрд, увеличившись на 18,2% в сравнении с 2019-м. В 2023 году вырос спрос на подержанное серверное оборудование. производители техники ожидают увеличение  спроса на сервера и СХД в 2-3 раза. Цены на оборудование ожидаемо могут вырасти. Компании рассматривают облако как альтернативу закупке собственного «железа».

«У компании всегда есть риск купить недостаточное количество техники, а затем докупать её по другим, более высоким ценам, или же купить слишком много – тогда серверы будут недозагружены или вовсе окажутся на складе», – говорит Павел Токарев, Директор по технологиями и инновациям «Инферит Клаудмастер».

Переход на облачные сервисы позволяет компаниям избежать больших начальных капиталовложений (CAPEX) в покупку серверного оборудования и программного обеспечения. Вместо этого они платят только за фактическое потребление ресурсов – в этом случае расходы на ИТ-инфраструктуру переходят в категорию операционных расходов (OPEX).

Уменьшение CAPEX и перенос затрат на инфраструктуру в OPEX – это, в первую очередь, финансовая гибкость. Параллельно с этим компания получает возможность запускать любое количество серверов на любой срок, будь то минуты, дни или годы.

К преимуществам «облака» относятся:

  • Масштабируемость. Компании могут уменьшать вычислительные мощности, затрачивая меньше средств, или же наращивать их и по мере роста бизнеса. Нет риска закупить избыточное количество серверов.
  • Экономия средств. Нет необходимости инвестировать в дорогостоящее оборудование и программное обеспечение, которые со временем устаревают. Оплачивается только использование ресурсов.
  • Доступ к инновациям. Облачные провайдеры постоянно внедряют новые технологии и сервисы, к которым клиенты получают мгновенный доступ.
  • Простота использования. В облаке доступно множество готовых PaaS и SaaS сервисов – баз данных, AI/ML платформ, средств разработки.

«Конечному пользователю в принципе не нужно знать, какое аппаратное обеспечение используется и на какой операционной системе работает, например, база данных, они лишь используют сервис для решения своих задач. Крупнейшие «облачные» провайдеры в этом смысле далеко ушли от большинства компаний в плане предоставления различных PaaS и SaaS сервисов – от баз данных до платформ машинного обучения», – рассказывает Павел Токарев.

Когда «облако» становится дороже

Плюс собственной приватной инфраструктуры в том, что за сервер уже заплачены деньги, и потому можно запускать сколько угодно виртуальных машин, пока есть место. Дополнительных затрат не будет.

А провайдеры облачных услуг выставят счёт в конце месяца. Есть вероятность, что специалист запустил в течение этого периода дорогой сервис, скажем, по машинному обучению. Сервис мог быть нужен всего на несколько минут, но его вовремя не остановили и не удалили, и в результате он фактически проработал несколько дней.

Разработчик вряд ли понесёт финансовую ответственность за такую ошибку, но владельцу бюджета будет не очень приятно узнать о непредвиденных и, возможно, больших расходах. Согласно исследованию Flexera, опубликованному в 2023 году, превышают бюджет на облачные сервисы 45% компаний, и при этом 28% из затрат на «облако» компании считают неэффективными.

Поэтому контроль расходов должен выходить на первый план при использовании облачных сервисов. В том же отчёте говорится, что для 62% опрошенных именно оптимизация расходов на облако является главной задачей.

Грамотный подход к использованию облака позволит максимально эффективно расходовать средства и избежать перерасхода бюджета.

FinOps «помирит» тех, кто тратит, с теми, кто платит

Как же оптимизировать затраты на облако и избежать неприятных сюрпризов при получении счетов? На помощь приходит концепция FinOps – сочетание финансовых и технических практик для управления расходами на облако. Этот подход объединяет финансовые и ИТ-процессы для оптимизации расходов на инфраструктуру и достижения максимальной эффективности использования ресурсов, определяет диалог между финансовыми службами, ИТ-отделом и другими подразделениями, способствует развитию общего понимания и целей. Прозрачность затрат позволяет устранить потенциальные конфликты интересов между финансовой службой и ИТ-департаментом и обеспечить баланс интересов разных подразделений компании.

Приведём классический пример с Yandex Cloud. Компания подключает облако и предоставляет доступ DevOps и разработчикам без ограничений. Предполагается, что они сами будут ответственно (оптимально) использовать ресурсы. Однако на практике это не работает:

а) Специалисты часто запускают избыточно мощные виртуальные машины, чтобы всё было «быстрее и надёжнее». Например, для небольшого тестового стенда выделяют сервер с 64 Гб памяти и 32 ядрами или закладывают много мощности на production-машины, которые работают 24/7.

б) Забывают вовремя останавливать ненужные виртуальные машины, останавливать ненужные сервисы, удалять неиспользуемые артефакты (диски, балансировщики, публичные IP) после завершения работ. Серверы простаивают, но продолжают тарифицироваться.

Компания в любом из этих случаев будет нести необоснованные с точки зрения бизнеса затраты на «облако». Есть решение – ограничить свободу использования мощностей. Но тогда преимущества «облака» теряются! Необходим подход, который помирит тех, кто традиционно несет ответственность за расходы (это, например, финансисты) и тех, кто тратит деньги на «облако» (например, DevOps и «разработка»). Последние получат возможность решать свои задачи при достаточной гибкости и свободе выбора мощностей, а первые – прогнозировать и оптимизировать расходы, связанные с бизнес-задачами.

FinOps-практика объединяет в себе несколько ключевых компонентов:

  • Прозрачность. Детальная аналитика использования облачных сервисов и затрат на них.
  • Оптимизация. Выявление и устранение неэффективных расходов, например, на избыточные ресурсы.
  • Бюджетирование. Планирование и контроль бюджетов подразделений на основе их потребностей.
  • Коммуникация. Все специалисты, кто так или иначе причастны к использованию облака, должны общаться между собой, принимать совместные решения относительно использования облака.

Фактически, коммуникация – это определение того, что такое FinOps.

Внедрение FinOps дает компаниям существенные преимущества:

  • Возможность надежного прогнозирования, понимания будущих расходов и их обоснованность.
  • Повышение эффективности использования облачных ресурсов.
  • Принятие взвешенных бизнес-решений на основе данных об использовании и стоимости сервисов.
  • Снижение расходов – в среднем оно составляет 15-30% за счет оптимизации и правильного выбора сервисов.

Один из принципов FinOps – своевременная отчётность для всех заинтересованных лиц. Для каждого, кто так или иначе работает с инфраструктурой, она должна быть настроена индивидуально. Рассмотрим на примере «Инферит Клаудмастер» для Yandex Cloud. Платформа предоставляет детальные отчеты о затратах на облако с распределением по проектам, сервисам, подразделениям.

Платформа с помощью единого мультиоблачного дашборда Coster легко и быстро предоставит информацию о бюджетах и расходах по всем облакам, поможет найти ресурсы, которые приводят к перерасходам бюджетов, предложит пути оптимизации благодаря уникальному алгоритму, предоставит отчёты по расходам в разных бизнес-срезах.

Финансовый отдел может отслеживать общий бюджет на облако и его расходование по направлениям – разработка, тестирование, R&D и так далее. А менеджер проекта увидит только затраты на ресурсы, используемые в его проекте (т.н. showback - важная составляющая практики FinOps).

FinOps это не про то, чтобы тратить меньше – а про то, как тратить эффективно

Подход FinOps не о том, чтобы просто сократить расходы на облако. Его цель - обеспечить эффективное использование облачных ресурсов для развития бизнеса.

Да, на начальном этапе оптимизации можно сэкономить 10-30%. Например, выявив неиспользуемые виртуальные машины или избыточные мощности. Однако, в долгосрочной перспективе такая стратегия не работает. Компания достигает «потолка» экономии, но при этом тормозит свой рост и инновации из-за недостатка гибких ресурсов.

По-настоящему «зрелый» FinOps помогает бизнесу расти быстрее, даже если расходы на облако при этом увеличиваются. Вернее, они и должны увеличиваться!

Например, компания планирует утроить выручку за счет запуска новых цифровых сервисов. Для этого может потребоваться масштабирование инфраструктуры и использование более дорогих, но производительных облачных ресурсов. В итоге затраты на облачную инфраструктуру тоже вырастут, но всего в 1,5-2 раза.

Главной метрикой успеха будет стоимость облака в рамках юнит-экономики (unit economics) компании: в пересчете на один юнит - единицу услуг компании или клиента – стоимость облака должна снижаться.

Таким образом, FinOps не просто про экономию расходов на облако, а про умную оптимизацию ради роста бизнес-показателей компании, её прибыли.

Что еще мне нужно знать о FinOps?

FinOps держится на трёх «китах», трёх этапах с точки зрения фокуса и активностей, выполняемых в цикле.  

Информирование

На этом этапе собирается отчётность для стейкхолдеров, привязка к бизнесу – проектам и продуктам, выявление трендов и аномалий, сравнение показателей (внутреннее и внешнее), showback (затраты на ресурсы, использованные в конкретном проекте), поиск ненужных расходов – неиспользуемых, но оплачиваемых ресурсов и сервисов.

Оптимизация расходов

На этом этапе мы определяем, как тратить меньше, не теряя в производительности, и оптимизируем:  

  • цену (например, закупая постоянно используемые мощности впрок: reserved instances + saving plans),
  • использование (например, используя менее мощные VM или выключая сервисы на тот период, когда они не используются.  

Управление

Ключевая функция этого этапа – применить разработки с первых двух, понять, что можно улучшить, договориться о том, как в следующем цикле ещё более эффективно использовать облако.

Один из ключевых посылов FinOps заключается в том, что это практика: невозможно, не нужно и даже отчасти вредно внедрить FinOps один раз и навсегда. Но при этом можно получать быстрые ощутимые результаты от внедрения отдельных активностей или подходов FinOps. FinOps призывает начинать с малого и постоянно улучшаться – можно сравнить его с подходом DevOps в разработке (отсюда и концептуальное сходство в именах практик).

«Если в компании кто-то – это может быть DevOps-ер, например – сделал несколько отчётов по затратам на облако для себя, своей команды и, скажем, бухгалтера, и обновляет их по обратной связи от пользователей, уже можно говорить, что такая компания практикует FinOps», – говорит Павел Токарев.

Примеры оптимизации с FinOps

Пример 1

Проблема:

Отсутствие полной детализации в счетах от облачного провайдера: есть общая стоимость за все используемые мощности, но из них не понятно, кто именно и в каком количестве использовал ресурсы.

Решение:

Клаудмастер позволяет понять, какой юнит и в каком проекте использовал ресурсы, а также сколько ресурсов было утилизировано в отчетном периоде.

Результат:

100% прозрачности в расходах на облака и ведении бюджета. Встроенные отчеты показывают затраты каждого бизнес-юнита, команды или проекта в режиме реального времени и позволяют контролировать риски перерасхода IT-бюджета.

Пример 2

Проблема:

Расходы на потребляемые ресурсы ощутимо выросли по сравнению с предыдущими периодами.

Решение:

Клаудмастер помогает сократить затраты на облака предлагая рекомендации на основе собственного алгоритма для оптимизации ресурсов.

Результат:

Оптимизация расходов на облако до 20% без потери производительности на второй месяц использования.

FinOps – командная работа

FinOps, как практика, призван решать следующие проблемы:

  • отсутствие прозрачности и понимания влияния на бизнес расходов на облако у всех, и в первую очередь у «финансистов»;
  • слабая прогнозируемость таких расходов;
  • как следствие – либо ограничения в использовании облака вплоть до полного исчезновения всех его преимуществ, либо неэффективное использование вплоть до существенного перерасхода.

Для успешного следования практикам Finops следует

  • назначить ответственного за практику FinOps (роль - не позиция!);
  • начинать с малого и двигаться постепенно;
  • иметь в культуре компании коммуникацию как ценность;
  • начать с простейшего способа сделать отчетность по облаку для каждого заинтересованного лица;
  • помнить, что оптимизация это всегда компромисс.

Чек-лист по внедрению FinOps-практики

  1. Внедрить инструмент отслеживания и анализа затрат на облако. «Инферит Клаудмастер» собирает метрики использования ресурсов, анализирует расходы по сервисам, проектам, подразделениям.
  2. Настроить правила оптимизации затрат. Это может быть отключение неиспользуемых ресурсов, контроль запуска дорогостоящих сервисов, выбор оптимальных настроек виртуальных машин.
  3. Внедрить систему бюджетирования. Финансовый департамент совместно с ИТ и бизнес-подразделениями определяют бюджеты на основе анализа потребностей и приоритетов.
  4. Настроить панели мониторинга расходов для разных ролей. Например, финансовый отдел может отслеживать общий бюджет, а разработчики – бюджет своего проекта.
  5. Мотивировать сотрудников оптимизировать затраты. Установите чёткие KPI. Вознаграждайте команды за сокращение расходов.
  6. Регулярно проводить анализ эффективности использования облачных сервисов и оптимизировать ресурсы на основе полученных данных.

Итоги

Эффективное внедрение FinOps опирается на несколько ключевых принципов:

  1. Кросс-функциональное взаимодействие.
  2. Ориентация на ценность. Решения о выборе сервисов принимаются исходя из их вклада в бизнес-цели, а не только для экономии средств.
  3. Распределенная ответственность. Каждая команда отвечает за оптимальное использование выделенных ей облачный ресурсов.
  4. Централизованное управление. В компании создается центр экспертизы FinOps для координации и обучения.
  5. Прозрачная аналитика. Все заинтересованные роли получают актуальные данные об использовании и стоимости облачных сервисов.
  6. Гибкость модели расходов. Преимущества облака в оплате по факту использования ресурсов максимально реализуются.

Внедрение FinOps – это не разовое мероприятие, а практика, постоянный процесс оптимизации облака под задачи бизнеса. Регулярный анализ метрик и взаимодействие команд - залог успеха. В итоге компания сможет разово сэкономить до 30% затрат на ИТ-инфраструктуру, получит гибкость использования облака со сниженным риском выхода за рамки бюджета, обеспечит для своих специалистов доступ к инновационным технологиям облачных провайдеров, повысит эффективность работы собственного ИТ-отдела и, кроме того, сможет сократить сроки вывода цифровых продуктов и сервисов на 80%.

Оригинал нашей статьи на Хабр.

Рекомендуем

Инферит Облако

OpenStack: универсальное решение для масштабных облачных сред

От научных исследований до развлечений: OpenStack демонстрирует свою эффективность в различных сферах. Максим Мантуров, директор по облачным продуктам «Инферит», анализирует, как CERN, Walmart, China Mobile и Blizzard Entertainment используют этот инструмент для решения уникальных задач и масштабирования своих облачных инфраструктур.

Читать
Подробнее

Этика и безопасность искусственного интеллекта

Разработчиков искусственного интеллекта (ИИ) призвали приостановить обучение мощных систем, базирующихся на машинном обучении. Эксперты из крупных компаний считают, что необходим перерыв в исследованиях, чтобы избежать рисков. Кто-то считает, что огромные объёмы созданной ИИ информации не позволят людям отличать правду от лжи. Выработка принципов и стандартов, которые помогут обеспечить безопасность и этичность использования ИИ, чрезвычайно важна для дальнейшего развития этих технологий. В статье рассмотрим некоторые этические аспекты ИИ.

Читать
Подробнее

Инферит Техника

Как мы разрабатываем серверы в России

Параллельный импорт и приобретение серверов у иностранных компаний, которые остались на российском рынке, несут с собой ряд рисков. Они касаются работы службы поддержки, замены компонентов, технического обслуживания. А мы помогаем компаниям перейти с зарубежного оборудования и программного обеспечения на российские решения, чтобы свести подобные риски к минимуму. В этой статье мы расскажем о том, как происходит разработка новых серверов, которые мы собираем в наукограде Фрязино, какие обновления мы вносим по просьбам наших клиентов и как клиенты и партнёры (например, «К2Тех») тестируют серверы.

Читать
Подробнее