ГлавнаяЛента

Подборки карточек

Подборка решений: MLOps и LLMOps

8 апреля, 09:44|
1757

Принцип MLOps появился почти десять лет назад. За это время пользователей концепции управления жизненным циклом моделей машинного обучения от разработки до внедрения и далее стало заметно больше. Ее основной принцип заключается в автоматизации процесса внедрения, отслеживании версий модели и управлении ML-конвейерами.

Уровень зрелости MLOps в командах разработчиков оценивается по-разному. Например, в глобальной индустрии заметны модели Google и Azure (от Microsoft). Согласно им зрелость повышается по мере все большего охвата процессов разработки и принятия подходов МLOps командой — от полного отсутствия ML-практик до единых пайплайнов и платформ разработки.

Что еще почитать или посмотреть по теме: 

• Обзор концепции и методик зрелости MLOps от Академии Selectel

• Перевод статьи про принципы MLOps от Алексея Фатеева, MLOps/LLMOps Engineer в KTS

• Перевод статей о методах оценки уровней MLOps-зрелости в блоге VK Cloud на Habr 

• Тренды в MLOps в 2025 году, по мнению HatchWorks AI

• Подкаст Д. Скалли (D. Sculley), который широко известен как «The Godfather of MLOps»

• Конференция по инженерии данных SmartData (1-2 октября 2025 года)

По данным Global Market Insights, в 2024 году мировой рынок MLOps-решений оценивался в $1,7 млрд, а его совокупный среднегодовой темп роста (СAGR) в последующие девять лет (с 2025 по 2034 год) предполагается на уровне 37,4%.

Если на глобальном уровне есть примеры изучения насыщенности мирового рынка MLOps-продуктов, то российские исследователи пока лишь делают первые шаги в описании ландшафта отечественных решений. Среди таких попыток можно отметить исследования DevCrowd и Университета ИТМО соответственно.

В новой подборке ICT.Moscow попытался собрать проекты российских команд. Таких разработок за последние два года нашлось 20. Среди них ML- и MLOps-платформы, LLMOps-платформы, платформы и фреймворки AutoML, решения для развертывания моделей.

17 из них разработаны в Москве, оставшиеся 3 представлены командами, базирующимися в Санкт-Петербурге. Помимо очевидного вклада ИИ-бигтехов («Яндекс», «Сбер», VK, МТС), на рынке заметно присутствие и других игроков — интеграторов (Axenix Innovation, Neoflex, Polymatica, Rubbles, «Иннодата»), технокомпаний (Selectel, Т1, «Сибур»), научных организаций (НИУ ВШЭ, Университет ИТМО) и стартапов (Data Sapience, Antavira).

На примере подборки ICT.Moscow заметно, что ставку российские разработчики делают на комплексные платформенные MLOps-продукты. А вот специализированных решений встречается не так много в сравнении с мировой индустрией. Это же касается и Open Source — проектов.

Детально ознакомиться с решениями команд из столицы можно в отдельных карточках. В каждой из них содержится подробная информация о решениях и их предназначении, а также представлены необходимые ссылки и имеющиеся контакты разработчиков.


ML/MLOps-платформы

Комплексные (End-to-End) решения, которые позволяют выстроить полный цикл машинного обучения.

  • Разработанная компанией Data Sapience платформа Kolmogorov состоит из четырех модулей. Kolmogorov Axiom представляет собой конструктор датасетов и позволяет проводить эксперименты, с помощью Continuity можно настроить взаимодействие внутри команды и версионирование решения, Predicate позволяет проводить мониторинг состояния модели, а Kolmogorov Abacus представляет собой фреймворк для A/B-тестирования.
  • Созданное Axenix Innovation решение Dat.ax предназначено для унификации и автоматизации работы с данными. Также оно позволяет работать с метаданными, управлять процессами CI/СD и жизненным циклом моделей машинного обучения.
  • В основе платформы SmartMLOps — разработанный исследователями из НИУ ВШЭ фреймворк. Система предоставляет REST API для управления и запуска ИИ-модулей, оснащена инструментами для мониторинга и дает возможность проведения вычислений на суперкомпьютере cHARISMa.
  • Разработанная Selectel ML-платформа адаптирована под работу системы управления экспериментами ClearML, способна генерировать API для моделей машинного обучения, создавать воспроизводимые пайплайны, развертывать модели в виде отдельных сервисов и отслеживать их работу.
  • Cloud ML Platform оснащена инструментами для трекинга и версионирования экспериментов, моделей, данных и других артефактов, а также инструментами для развертывания и обновления моделей машинного обучения. По заявлениям разработчиков из VK Cloud, в ближайшем будущем в платформе появятся Feature Store, единая платформа Kubernetes для всех компонентов, а также каталоги данных и метаданных.
  • Созданная MWS ML Platform поддерживает полный цикл разработки и эксплуатации моделей машинного обучения: она оснащена каталогами фичей и гибкой библиотекой, а встроенная Kubernetes позволяет конфигурировать вычислительные ресурсы.
  • Yandex DataSphere позволяет провести полный цикл машинного обучения в облаке с помощью бессерверных вычислений. Или же пользователь может зарезервировать под свой проект виртуальную машину.
  • Neoflex Dognauts позволяет настроить рабочее место ML-специалиста, создавать модели в интегрированных средах разработки и затем мониторить их, отслеживать эксперименты. Кроме того, с помощью оснащенной Feature Store платформы можно контролировать выделяемые под проект ресурсы.
  • Polymatica ML поможет исследовать данные перед разработкой модели, сравнивать ее с другими после обучения и отслеживать ее точность и динамику профиля используемых данных. Жизненный цикл моделей можно автоматизировать и управлять им с помощью единого репозитория.
  • Компоненты Rubbles MLOps Suite включают в себя много популярных Open Source — решений (к примеру, Grafana, MLFlow, Seldon Core) и могут быть кастомизированы под потребителя. С помощью системы можно настраивать хранилища и кластеры для параллельных вычислений.
  • Созданный ГК «Т1» Scibox предоставляет вычислительные мощности и инструменты для работы с ИИ по модели сервиса, а также инструменты для создания конвейеров машинного обучения.
  • ML Фаб развертывается, устанавливается и настраивается в Kubernetes из единого репозитория. Среди компонентов платформы от «Иннодаты» — Feature Store и инструменты Data Governance.
  • Sibur ML Framework объединяет все этапы управления моделями, за исключением начального: постановки задачи, обучения и валидации модели. В специальной шине данных сохраняются результаты работы моделей, а также события сбоев и метрики.

LLMOps-платформы

MLOps-решения, предназначенные для обучения больших языковых моделей и учитывающие их специфику.

  • Разработанная в Selectel LLM-платформа помогает подбирать для большой языковой модели оптимальные настройки и промпты, запускать эксперименты по ее дообучению. 

Платформы и фреймворки AutoML

Решения, позволяющие автоматизировать процесс машинного обучения.

  • Разработанный в Университете ИТМО фреймворк FEDOT позволяет решить задачу структурного обучения: для обрабатываемых данных строится решение в виде графа, узлы которого состоят из обучаемых моделей и других компонентов. Получившаяся композитная модель содержит сразу несколько моделей машинного обучения и блоков предобработки данных.
  • Фреймворк FEDOT.Industrial разработан на основе FEDOT для решения задач индустриальных компаний, в частности проблем предиктивной аналитики: классификации временных рядов, детектирования аномалий (как в данных временных рядов, так и в изображениях), поиска точки изменения динамики временного ряда (Change-Point Detection) или детектирования объектов на изображениях.
  • Созданный специалистами из Лаборатории искусственного интеллекта «Сбера» фреймворк LightAutoML (LAMA) поддерживает обработку всех типов данных, которые используются в Python, задачи обучения с учителем, включая регрессию и классификацию, а также позволяет создавать свои пайплайны машинного обучения. 
  • Predict AutoML позволяет обучить модели для бизнес-аналитики. После очистки данных и выбора необходимой задачи платформа подберет под нее предобученную модель или ансамбль моделей. Кроме того, решение поддерживает федеративное вертикальное обучение, при котором модели можно обучать совместно, но без обмена данными с партнером.
  • Antavira предназначена для автоматизации обучения прогностических моделей машинного обучения. Пользователь может запускать неограниченное количество экспериментов, задавать любую последовательность выполнения функций моделирования, а также при необходимости выполнить градиентный спуск.

Решения для развертывания моделей

  • Выложенный в открытый доступ создателями из Университета ИТМО инструмент mljet позволяет автоматизировать развертывание моделей машинного обучения в веб-сервис.

Каких продуктов стоит ждать 

  • Разработчики из Альфа-Банка планируют предоставлять внутренний AutoML-сервис ANNA в пользование другим компаниям, а в будущем, возможно, его выложат в открытый доступ.
  • В рамках соглашения о сотрудничестве входящей в «Росатом» компании «Цифрум» и НИЯУ МИФИ планируется разработка AutoML-платформы. 

Московские разработчики могут дополнить существующие карточки своих проектов. Сообщить же о собственных новых разработках может любой отечественный автор программного кода, написав на hello@ict.moscow.


Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0