В AIRI представили бенчмарк AmbiK для оценки умения роботов работать по неоднозначным инструкциям

1 августа, 15:01|

213

Набор данных AmbiK включает 2 тыс. практических примеров заданий и предназначен для тестирования способности роботов устранять неточности, чтобы выполнить поставленную перед ними задачу. Это крупнейший в своем роде набор данных в мировой практике. Ранее существовавшие аналоги насчитывали около 600 примеров.

Цель проекта заключается в создании среды для симуляции реальных ситуаций, в которых робот получает некорректные, двусмысленные инструкции и вынужден запрашивать дополнительные разъяснения в тех случаях, когда это необходимо.

Тесты показали, что существующие алгоритмы не всегда успешно определяют моменты, когда требуются уточняющие запросы: самые продвинутые модели достигают успеха в одном из пяти возможных случаев.

Разработчики отмечают, что их «датасет пригоден не только для оценки распознавания нечетких команд, но и для систем, занимающихся планированием поведения». В работе над проектом также принимали участие МФТИ и Центр робототехники «Сбера».

Подробнее

Технологии:

#искусственный_интеллект #бенчмарк

Компании:

#AIRI #МФТИ #Сбербанк

Расскажите знакомым:

Материалы
по теме:

12:01

AppSec Solutions разработал SCA-анализатор AppSec.Track для проверки сгенерированного кода

AppSec Solutions

16 дек. 12:56

Москва разрабатывает подход для оптимизации градостроительного развития с помощью ИИ и цифровых двойников

mos.ru

16 дек. 12:16

«Яндекс» внедрил в платформу разработки SourceCraft ИИ-агента для проверки кода на уязвимость

Яндекс

16 дек. 11:55

WMT AI: 70% зарубежных компаний готовы интегрировать российские ИИ-решения в свою инфраструктуру

ComNews

15 дек. 14:48

В МФТИ и МГУ им. М.В. Ломоносова создали ИИ-систему для оценки стоимости произведений современного искусства

Известия

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение