logo XLand-100B

XLand-100B

Датасет для контекстного обучения с подкреплением

Описание:

Предназначение общедоступного набора данных для контекстного обучения с подкреплением XLand-100B — облегчить и удешевить проведение научных исследований без привлечения ИТ-специалистов. Также предполагается, что датасет будет использован в экспериментах по поиску новых способов обучения искусственного интеллекта.

XLand-100B включает 100 млрд примеров действий агента искусственного интеллекта на 30 тыс. задач. Это результат работы исследователей из AIRI и Центра искусственного интеллекта Т-Банка со средой XLand-MiniGrid. В ней проводилось предобучение ИИ-агента на 65 тыс. задач.

Датасет представляет собой запись хода этого обучения. Кроме XLand-100B, исследователи создали его уменьшенную версию — XLand-Trivial-20B. По словам разработчиков, датасеты уникальны тем, что содержат полную историю обучения модели: в них сохранены все состояния среды, в которых был агент во время обучения, все его действия и награды. Помимо самого датасета, в общий доступ выложены утилиты, позволяющие воспроизвести или расширить его.

XLand-100B был представлен специалистами из лаборатории Центра искусственного интеллекта Т-Банка и AIRI в июле 2024 года.


Препринт на arXiv.org

Репозиторий на GitHub


👤Александр Никулин


logo XLand-100B
Проект запущен:
2024
Последнее обновление:20.11.2024
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0