logo RuPAWS

RuPAWS

Датасет для выявления парафразов

Описание:

Датасет может быть использован для обучения больших языковых моделей идентифицировать парафразы — пересказы исходного предложения другими словами. RuPAWS состоит из 17,3 тыс. пар парафразов и содержит большое количество предложений, в которых много одинаковых слов, но смысл при этом разный.

Датасет был представлен исследователями из MTS AI и Сколтеха в июне 2022 года. Доступен как открытое ПО.


Репозиторий на GitHub


👤 Ирина Кротова


Участвует в спецпроектах ICT.Moscow:
logo RuPAWS
Проект запущен:
2022
Последнее обновление:13.11.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.