logo SAC-RND

SAC-RND

Метод обучения с подкреплением

Описание:

SAC-RND — усовершенствование метода использования случайных нейросетей (RND). Исследователи исправили глубины двух используемых сетей (случайной и основной), сделав их эквивалентными, и быстро обнаружили, что при таких настройках методу удается различать данные. Также был применен механизм слияния, основанный на модуляции сигналов и их линейном отображении.

Использование SAC-RND в робототехнических симуляторах, показало, что он позволит оптимизировать потребление ресурсов и времени при обучении с подкреплением.

Метод был представлен Tinkoff Research (сейчас – T-Bank AI Research) в августе 2023 года.


Статья о SAC-RND в сборнике материалов Международной конференции по машинному обучению (ICML 2023)


logo SAC-RND
Проект запущен:
2023
Сайт:
Последнее обновление:04.12.2024
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0