• лента
  • кейсы
  • московские решения
  • аналитика рынка
  • ICT.moscow об ИИ
  • презентации
  • подписка
  • материалы по теме
logo Evolution ML Inference

Evolution ML Inference

Сервис инференса моделей машинного обучения

Описание:

Облачный сервис Evolution ML Inference предназначен для инференса (работы на конечных устройствах) больших языковых моделей (Large Language Model, LLM) и других моделей машинного и глубокого обучения.

Пользователь может разворачивать собственные и выложенные в открытый доступ на платформе Hugging Face модели на базе облачных графических процессоров (Graphics Processing Unit, GPU).

Модели могут запускаться как без необходимости сборки образа напрямую из Hugging Face, так и c помощью собственных образов Docker со своим кодом инференса и окружением. Также поддерживается работа с библиотеками vLLM, TGI, Ollama, Diffusers, Transformers для более эффективного инференса.

При этом с помощью опции совместного использования графического ускорителя (Shared GPU) может использоваться только то количество видеопамяти процессора, которое необходимо для работы модели, с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей клиента.

Тарификация за использование модели начинается только в момент обращения к ней.

Облачный сервис Evolution ML Inference был представлен на конференции GoCloud в апреле 2025 года.


Документация


logo Evolution ML Inference
Проект запущен:
2025
Контакты:

Сайт:
110
Последнее обновление:21.04.2025
Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0