Датасет для контекстного обучения с подкреплением
Предназначение общедоступного набора данных для контекстного обучения с подкреплением XLand-100B — облегчить и удешевить проведение научных исследований без привлечения ИТ-специалистов. Также предполагается, что датасет будет использован в экспериментах по поиску новых способов обучения искусственного интеллекта.
XLand-100B включает 100 млрд примеров действий агента искусственного интеллекта на 30 тыс. задач. Это результат работы исследователей из AIRI и Центра искусственного интеллекта Т-Банка со средой XLand-MiniGrid. В ней проводилось предобучение ИИ-агента на 65 тыс. задач.
Датасет представляет собой запись хода этого обучения. Кроме XLand-100B, исследователи создали его уменьшенную версию — XLand-Trivial-20B. По словам разработчиков, датасеты уникальны тем, что содержат полную историю обучения модели: в них сохранены все состояния среды, в которых был агент во время обучения, все его действия и награды. Помимо самого датасета, в общий доступ выложены утилиты, позволяющие воспроизвести или расширить его.
XLand-100B был представлен специалистами из лаборатории Центра искусственного интеллекта Т-Банка и AIRI в июле 2024 года.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.