• лента
  • кейсы
  • московские решения
  • аналитика рынка
  • ICT.moscow об ИИ
  • презентации
  • подписка
  • материалы по теме
logo HIGGS

HIGGS

Метод квантизации больших языковых моделей

Описание:

Общедоступный метод HIGGS (Hadamard Incoherence and Gaussian MSE-Optimal Grids) позволяет быстро сжимать большие языковые модели без потери качества, использования дополнительных данных и оптимизации параметров нейросетей.

Метод предполагает использование Адамаровых вращений (Hadamard Rotations), приводящим распределение весов модели к нормальному независимому и одинаковому распределению (IID), для которого рассчитанны оптимальные решетки.

Data-Free метод доступен как для скалярной, так и для векторной квантизации и проверен на популярных моделях Llama 3 и Qwen 2.5.

Метод HIGGS был представлен исследователями из Yandex Research, НИУ ВШЭ совместно с коллегами из MIT, KAUST и ISTA в апреле 2025 года.


Препринт на arXiv


👤 Владимир Малиновский

👤 Андрей Панферов


logo HIGGS
Проект запущен:
2024
Контакты:

Сайт:
262
Последнее обновление:11.04.2025
Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0