ГлавнаяЛента

AIRI

В AIRI представили бенчмарк AmbiK для оценки умения роботов работать по неоднозначным инструкциям

1 августа, 15:01|
177

Набор данных AmbiK включает 2 тыс. практических примеров заданий и предназначен для тестирования способности роботов устранять неточности, чтобы выполнить поставленную перед ними задачу. Это крупнейший в своем роде набор данных в мировой практике. Ранее существовавшие аналоги насчитывали около 600 примеров.

Цель проекта заключается в создании среды для симуляции реальных ситуаций, в которых робот получает некорректные, двусмысленные инструкции и вынужден запрашивать дополнительные разъяснения в тех случаях, когда это необходимо.

Тесты показали, что существующие алгоритмы не всегда успешно определяют моменты, когда требуются уточняющие запросы: самые продвинутые модели достигают успеха в одном из пяти возможных случаев.

Разработчики отмечают, что их «датасет пригоден не только для оценки распознавания нечетких команд, но и для систем, занимающихся планированием поведения». В работе над проектом также принимали участие МФТИ и Центр робототехники «Сбера».

Подробнее

Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.