logo LLM Microscope

LLM Microscope

Метод регуляризации больших языковых моделей

Описание:

Регуляризатор призван помочь избежать проявления негативных свойств линейной зависимости эмбеддингов (числовых представлений данных) в ходе предобучения больших языковых моделей.

LLM Microscope позволяет заменить сложные трансформерные блоки декодеров на более простые. Эксперименты показали, что провести эту операцию без потери качества можно для примерно 15% слоев.

Метод был представлен исследователями из Института AIRI, «Сколтеха» и «Сбера» в мае 2024 года. Доступен как открытое ПО.


Репозиторий на GitHub

Препринт на arXiv

Пост на Habr


👤 Андрей Кузнецов

👤 Иван Оселедец

👤 Антон Разжигаев


Участвует в спецпроектах ICT.Moscow:
logo LLM Microscope
Проект запущен:
2024
Последнее обновление:13.11.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.