• лента
  • кейсы
  • московские решения
  • аналитика рынка
  • ICT.moscow об ИИ
  • презентации
  • подписка
  • материалы по теме
logo ReBRAC

ReBRAC

Метод обучения с подкреплением

Описание:

ReBRAC (Revisited Behavior Regularized Actor Critic) представляет собой модификацию RAC (Behavior Regularized Actor Critic, актор-критик с контролируемым поведением).

Исследователи выделили четыре компонента обучения искусственного интеллекта с подкреплением, считавшихся второстепенными, — глубину нейросети, регуляризация компонентов ИИ-агентов (действующего актора и оценивающего эти поступки критика), увеличение эффективного горизонта планирования и использование нормализации слоев. Добавление этих элементов в метод BRAC, по заявлению специалистов, позволило обучить ИИ в четыре раза быстрее и на 40% качественнее.

Метод был представлен Tinkoff Research (сейчас – T-Bank AI Research) в декабре 2023 года.


Препринт в arXiv


logo ReBRAC
Проект запущен:
2023
Контакты:

Сайт:
69
Последнее обновление:04.12.2024
Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0