Inference-платформа на ICT.Moscow

149

Inference-платформа

Платформа для запуска моделей машинного обучения

Описание:

Целью сервиса инференса (старта работы на конечном устройстве) ставится упрощение запуска моделей машинного обучения в промышленную эксплуатацию и повышение их производительности.

С помощью него можно загружать желаемые модели в S3-контейнеры (Simple Storage Service) объектного хранилища, а в результате получать готовые API-интерфейсы без разработки. Также решение дает возможность с помощью сценария Canary Deployment (постепенного и контролируемого внедрения изменений) регулярно обновлять версии моделей машинного обучения без прекращения обработки поступающих пользовательских запросов. При необходимости система самостоятельно добавляет вычислительные ресурсы для модели.

Inference-платформа построена на базе кластеров графических ускорителей на основе Kubernetes и дополнена популярными общедоступными инструментами NVIDIA Triton Inference Server, Ray Serve Cluster и Istio Ingress Controller.

Сервис был представлен Selectel в октябре 2024 года. По состоянию на ноябрь продукт доступен в режиме бесплатного бета-тестирования.

Технологии:

#искусственный_интеллект #нейросети #машинное_обучение

Разработчик:

#Selectel

Проект запущен:

2024

Сайт:

selectel.ru

Последнее обновление:15.11.2024

Материалы о разработчике

8 апр. 09:44

Подборка решений: MLOps и LLMOps

ICT.Moscow

16 дек. 2024

Selectel купил 100% компании «Единая сеть» для ускорения роста бизнеса в сегменте облачных инфраструктурных сервисов

РБК

11 окт. 2024

Selectel представил собственные серверы на Linux Debian

CNews

24 июля 2024

Selectel анонсировал открытое бета-тестирование серверной ОС на Linux

CNews

22 мая 2024

Selectel разрабатывает серверную ОС на базе Linux

Ведомости

смотреть еще

Похожие проекты:

1С-Рарус:Эхо

Сервис распознавания речи

#распознавание_речи #искусственный_интеллект #нейросети #машинное_обучение #1C_Рарус

NGCloud

Облачный IaaS-сервис

#искусственный_интеллект #нейросети #машинное_обучение #облачный_сервис #IaaS #Nubes

mClouds.ru

Облачный сервис аренды серверов с GPU

#IaaS #облачный_сервис #искусственный_интеллект #нейросети #машинное_обучение

GraLinQ AI

Программно-аппаратный комплекс для ИИ

#искусственный_интеллект #нейросети #машинное_обучение #инфраструктура #Гравитон #ХайТэк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение