

Метод обучения с подкреплением
Метод помогает проводить контекстное обучение с подкреплением (In-Context Reinforcement Learning) с инъекцией синтетического шума, что позволяет создавать историю обучения модели.
Метод ADε представлен исследователями из лаборатории искусственного интеллекта Tinkoff AI Research (сейчас — T-Bank AI Research) в декабре 2023 года. Доступен как открытое ПО.

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.