logo Inference-платформа

Inference-платформа

Платформа для запуска моделей машинного обучения

Описание:

Целью сервиса инференса (старта работы на конечном устройстве) ставится упрощение запуска моделей машинного обучения в промышленную эксплуатацию и повышение их производительности.

С помощью него можно загружать желаемые модели в S3-контейнеры (Simple Storage Service) объектного хранилища, а в результате получать готовые API-интерфейсы без разработки. Также решение дает возможность с помощью сценария Canary Deployment (постепенного и контролируемого внедрения изменений) регулярно обновлять версии моделей машинного обучения без прекращения обработки поступающих пользовательских запросов. При необходимости система самостоятельно добавляет вычислительные ресурсы для модели.

Inference-платформа построена на базе кластеров графических ускорителей на основе Kubernetes и дополнена популярными общедоступными инструментами NVIDIA Triton Inference Server, Ray Serve Cluster и Istio Ingress Controller.

Сервис был представлен Selectel в октябре 2024 года. По состоянию на ноябрь продукт доступен в режиме бесплатного бета-тестирования.

logo Inference-платформа
Проект запущен:
2024
Сайт:
Последнее обновление:15.11.2024
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0