Headless-AD на ICT.Moscow

ИБ В РОССИИ: БАЗА ЗНАНИЙИБ В РОССИИ: БАЗА ЗНАНИЙ

419

Headless-AD

Модель контекстного обучения

Описание:

Модель способна самостоятельно обучаться новым действиям в незнакомой среде на нескольких примерах. Headless-AD умеет выполнять в пять раз больше действий, чем заложено в нее при обучении. Модель может работать с различными типами действий: как теми, на которых ее обучали, так и с теми, с которыми она сталкивается впервые. Порядок взаимодействия не зависит от сочетания или количества последних.

За основу разработчики нейросети взяли модель дистилляции алгоритма (Algorithm Distillation, AD) трансформерной архитектуры. Исследователи отказались от конечного линейного слоя, который ограничивал количество доступных для модели действий, закодировали последние случайными векторами-эмбеддингами (что сделало необязательным дообучение для каждого нового действия) и внедрили контекст о доступных Headless-AD действиях.

Проведенные исследователями эксперименты показали, что модель способна к выполнению любой комбинации и любого количества действий, при этом сохраняя сравнимое со специализированными нейросетями качество их выполнения и не затрачивая дополнительные вычислительные ресурсы.

Модель была представлена учеными из лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI в июле 2024 года. Доступна как открытое ПО.

Репозиторий на GitHub

Статья в сборнике материалов Международной конференции по машинному обучению (ICML 2024)

👤 Владислав Куренков

👤 Александр Никулин

👤 Вячеслав Синий

Участвует в спецпроектах ICT.Moscow:

Смотреть

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#Т_Технологии #AIRI

Проект запущен:

2024

Последнее обновление:13.11.2025

Материалы о разработчике

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

24 ноя. 12:08

В AIRI разработали фреймворк Maestro для создания и оркестрации ИИ-агентов

AIRI

18 ноя. 12:45

В AIRI разработали платформу VLA Arena для оценки и сравнения моделей управления роботами

AIRI

11 ноя. 13:31

В T-Bank AI Research и Центральном университете разработали новый метод обучения рассуждающих моделей

Т-Технологии

5 ноя. 11:14

В AIRI разработали бенчмарк STEPS для оценки языковых моделей в сложных химических задачах

ТАСС

смотреть еще

Другие проекты разработчика:

T-Math

Бенчмарк для LLM

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Т_Технологии

cadrille

Большая мультимодальная модель для генерации 3D-объектов

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #3D #open_source #AIRI #МГУ

MERA Code

Бенчмарк для LLM

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Альянс_в_сфере_искусственного_интеллекта #Сбербанк #МТС #МТС_ВЕБ_Сервисы #Т_Технологии #Ростелеком

HeroBench

Бенчмарк для LLM

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #AIRI #НИУ_ВШЭ

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение