
Vintix
Модель действия
Выложенная в открытый доступ модель действия (Action Model) Vintix предназначена для управления роботами и оптимизации индустриальных процессов.
Модель размером в 300 млн параметров состоит из 24 слоев. В основе архитектуры Vintix лежит трансформер TinyLlama. Она устойчива к шуму и частичной наблюдаемости среды, что позволяет модели справляться с задержками и неполными данными.
При создании Vintix использовался подход контекстного обучения с подкреплением (In-Context Reinforcement Learning, ICRL), за счет чего модель адаптируется к новым задачам непосредственно во время инференса, в частности при работе с роботами-манипуляторами, и корректирует свое поведение в процессе.
Модель Vintiх была представлена исследователями из Института AIRI в июне 2025 года.
Постер Vintix на конфенции ICML 2025
