logo RuPAWS

RuPAWS

Датасет для выявления парафразов

Описание:

Выложенный в открытый доступ датасет поможет обучить большие языковые модели идентифицировать парафразы — пересказы исходного предложения другими словами. RuPAWS состоит из 17,3 тыс. пар парафразов и содержит большое количество предложений, в которых много одинаковых слов, но смысл при этом разный.

Датасет был представлен исследователями из MTS AI и Сколтеха в июне 2022 года.


👤 Ирина Кротова


logo RuPAWS
Проект запущен:
2022
Последнее обновление:12.02.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0