logo HIGGS

HIGGS

Метод квантизации больших языковых моделей

Описание:

Общедоступный метод HIGGS (Hadamard Incoherence and Gaussian MSE-Optimal Grids) позволяет быстро сжимать большие языковые модели без потери качества, использования дополнительных данных и оптимизации параметров нейросетей.

Метод предполагает использование Адамаровых вращений (Hadamard Rotations), приводящим распределение весов модели к нормальному независимому и одинаковому распределению (IID), для которого рассчитанны оптимальные решетки.

Data-Free метод доступен как для скалярной, так и для векторной квантизации и проверен на популярных моделях Llama 3 и Qwen 2.5.

Метод HIGGS был представлен исследователями из Yandex Research, НИУ ВШЭ совместно с коллегами из MIT, KAUST и ISTA в апреле 2025 года.


Препринт на arXiv


👤 Владимир Малиновский

👤 Андрей Панферов


logo HIGGS
Проект запущен:
2024
Последнее обновление:11.04.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0