
GigaEmbeddings
Модель векторного представления текстов
Выложенная в открытый доступ модель в 2,53 млрд параметров преобразует текст в вектор — его численное представление. GigaEmbeddings предназначена в том числе и для задачи с использованием генерации с дополненной выборкой (RAG).
Модель была создана на основе GigaChat — дообучена на датасете на русском и английском языках. Однако разработчики рекомендуют использовать GigaEmbeddings только для русского языка. Кроме того, модель не может обрабатывать данные длиной более 4096 токенов.
GigaEmbeddings была представлена SberDevices в декабре 2024 года.
