SAC-RND
Метод обучения с подкреплением
SAC-RND — усовершенствование метода использования случайных нейросетей (RND). Исследователи исправили глубины двух используемых сетей (случайной и основной), сделав их эквивалентными, и быстро обнаружили, что при таких настройках методу удается различать данные. Также был применен механизм слияния, основанный на модуляции сигналов и их линейном отображении.
Использование SAC-RND в робототехнических симуляторах, показало, что он позволит оптимизировать потребление ресурсов и времени при обучении с подкреплением.
Метод был представлен Tinkoff Research (сейчас – T-Bank AI Research) в августе 2023 года.
Статья о SAC-RND в сборнике материалов Международной конференции по машинному обучению (ICML 2023)