logo Giga-Embeddings

Giga-Embeddings

Модель векторного представления текстов

Описание:

Выложенная в открытый доступ модель преобразует текст в вектор — его численное представление. Giga-Embeddings предназначена в том числе и для задачи с использованием генерации с дополненной выборкой (RAG).

Модель была создана на основе GigaChat — дообучена на датасете на русском и английском языках. Однако разработчики рекомендуют использовать Giga-Embeddings только для русского языка. Кроме того, модель не может обрабатывать данные длиной более 4096 токенов.

Giga-Embeddings была представлена SberDevices в декабре 2024 года. В сентябре 2025 года разработчики представили и выложили в открытый доступ обновленную версию модели размером в 3 млрд параметров.


Репозиторий на GitVerse

Репозиторий на Hugging Face

Статья в сборнике материалов воркшопа Slavic NLP 2025


👤 Егор Колодин


logo Giga-Embeddings
Проект запущен:
2024
Последнее обновление:08.10.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.