logo USER

USER

Модель-эмбеддер

Описание:

Выложенная в общий доступ модель USER (Universal Sentence Encoder for Russian) предназначена для получения эмбеддингов (векторных представлений) предложений и параграфов из текстов на русском языке. Разработчики дообучили на русскоязычной части датасета mMARCO две модели, а затем объединили их с помощью метода LM-Cocktail.

Модель была представлена разработчиками из VK в декабре 2024 года.


Репозиторий на Hugging Face


👤 Егор Спирин


logo USER
Проект запущен:
2024
Последнее обновление:11.02.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0