Evolution ML Inference на ICT.Moscow

851

Evolution ML Inference

Сервис инференса моделей машинного обучения

Описание:

Облачный сервис Evolution ML Inference предназначен для инференса (работы на конечных устройствах) больших языковых моделей (Large Language Model, LLM) и других моделей машинного и глубокого обучения.

Пользователь может разворачивать собственные и выложенные в открытый доступ на платформе Hugging Face модели на базе облачных графических процессоров (Graphics Processing Unit, GPU).

Модели могут запускаться как без необходимости сборки образа напрямую из Hugging Face, так и c помощью собственных образов Docker со своим кодом инференса и окружением. Также поддерживается работа с библиотеками vLLM, TGI, Ollama, Diffusers, Transformers для более эффективного инференса.

При этом с помощью опции совместного использования графического ускорителя (Shared GPU) может использоваться только то количество видеопамяти процессора, которое необходимо для работы модели, с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей клиента.

Тарификация за использование модели начинается только в момент обращения к ней.

Облачный сервис Evolution ML Inference был представлен на конференции GoCloud в апреле 2025 года.

Документация

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #облачный_сервис

Разработчик:

#Сбербанк #SberCloud #Cloud

Проект запущен:

2025

Сайт:

cloud.ru

Последнее обновление:28.05.2025

Материалы о разработчике

17 дек. 15:55

Нейросеть GigaChat сдала экзамены в РАНХиГС по направлениям «Экономика и финансы» и «Финансовая грамотность»

Сбербанк

17 дек. 14:33

«Сбер» представил ИИ-помощников для пользователей и бизнеса

Коммерсант

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

3 дек. 11:20

ВТБ: новые энергомощности для ЦОД могут обойтись в 6 трлн руб. до 2030 года

Коммерсант

25 ноя. 15:38

«Сбер»: развитие ИИ потребует 45 трлн руб. инвестиций в энергетику за 16 лет

Reuters

смотреть еще

Другие проекты разработчика:

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

DRAGON

Бенчмарк для RAG-систем

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Сбербанк #Университет_ИТМО

Evolution Notebooks

Сервис для работы специалистов по машинному обучению

#искусственный_интеллект #нейросети #машинное_обучение #разработка #Cloud #Сбербанк

Evolution ML Finetuning

Сервис для тонкой настройки LLM

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #облачный_сервис #Cloud #Сбербанк

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение