AQLM + PV-tuning на ICT.Moscow

472

AQLM + PV-tuning

Метод сжатия больших языковых моделей

Описание:

Выложенное в общий доступ решение позволяет уменьшить большую языковую модель в несколько раз без значительной потери качества ответов нейросети.

Оно включает два инструмента. Алгоритм Additive Quantization of Language Models (AQLM) позволяет получить уменьшенную до восьми раз нейросеть. В его основе — аддитивное квантование (оптимизация за счет представления весов с меньшей точностью), где множество параметров нескольких слоев нейросети сжимается совместно с применением сборника кодов зашифрованных данных. Созданный в 2014 году алгоритм разработчики применили к задаче сжатия весов обученных больших языковых моделей. Второй инструмент — фреймворк для точной настройки (Fine-tuning) моделей PV-tuning, который исправляет ошибки, которые возникают в процессе сжатия.

Разработчики подчеркивают, что с помощью их метода впервые удалось добиться Парето — эффективной оптимизации моделей, в частности Llama 2, при сжатии в два бита на параметр. Заявляется, что решение позволяет обучать модели с 7 млрд параметров на одном графическом ускорителе, а модели с 70 млрд — на одном устройстве с восемью видеокартами NVIDIA A100.

Решение было представлено Yandex Research в июле 2024 года. По заявлениям разработчиков, тестирование с помощью англоязычных бенчмарков (известно об использовании WinoGrande, PiQA, HellaSwag, ARC) показало, что сохраняет в среднем 95% качества ответов нейросети относительно оригинальных версий.

Пост на Habr

Репозиторий на GitHub

Обучающие уменьшению нейросетей материалы на Google Colab

Сжатые с помощью метода модели на Hugging Face

Раздел об AQLM на сайте Международной конференции по машинному обучению ICML 2024

Посвященный PV-Tuning препринт на arXiv.org

👤 Ваге Егиазарян

👤 Денис Кузнеделев

👤 Владимир Малиновский

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#Яндекс #НИУ_ВШЭ

Проект запущен:

2024

Сайт:

research.yandex.com

Последнее обновление:10.02.2025

Материалы о разработчике

1 июля 16:35

«Яндекс Маркет»: 49% предпринимателей в E-commerce готовы делегировать обязанности ИИ

Известия

1 июля 15:55

VK Education и НИУ ВШЭ: 51% абитуриентов по ИТ-направлениям хотят в будущем разрабатывать ИТ-продукты и технологии

НИУ ВШЭ

27 июня 11:14

«Яндекс Фабрика» выпустила портативные колонки под собственным брендом Commo

Яндекс

25 июня 12:32

«Яндекс» внедрит сервис «Умное здание с Алисой» в ЖК «Самолета» и ФСК

Forbes

23 июня 11:56

«Яндекс» готовит регистрацию бренда Team Yandex для развития киберспортивных проектов

CNews

смотреть еще

Другие проекты разработчика:

YaMBDa

Датасет для обучения алгоритмов рекомендательных систем

#искусственный_интеллект #нейросети #машинное_обучение #open_source #датасеты #Яндекс

Alchemist

Датасет для обучения генеративных моделей

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #датасеты #Яндекс

Чистый берег

Модель для обнаружения мусора

#искусственный_интеллект #компьютерное_зрение #нейросети #машинное_обучение #open_source #Яндекс

Data.Forecast

Система предиктивной аналитики для индустрии гостеприимства

#искусственный_интеллект #нейросети #машинное_обучение #предиктивная_аналитика #маркетинг #НИУ_ВШЭ

смотреть еще

Похожие проекты:

Лира

Программно-аппаратный комплекс для решения задач ИИ

#искусственный_интеллект #нейросети #машинное_обучение #Аквариус #ХайТэк

Evolution AI Factory

Облачная платформа для создания ИИ-приложений

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #облачный_сервис #Сбербанк #Cloud

GigaStudio

Мультиагентная система для создания веб-приложений

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Сбербанк #СберТех

1С-Рарус:Эхо

Сервис распознавания речи

#распознавание_речи #искусственный_интеллект #нейросети #машинное_обучение #1C_Рарус

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение