SciRus-tiny на ICT.Moscow

554

SciRus-tiny

Нейросеть-эмбеддер

Описание:

Модель трансформерной архитектуры RoBERTa с 23 млн параметров для получения эмбеддингов (семантических векторных представлений) научных текстов размерностью 312. Размер словаря модели-эмбеддера составляет более 50 тыс. токенов, а максимальная длина контекста — 2 тысячи.

SciRus-tiny была обучена на наборе данных, состоящем из аннотаций научных статей в библиотеке elibrary.ru. Исследователи ставили перед собой задачу обучить модель обращать внимание на смысл текста вне зависимости от языка, на котором он написан, и учитывать при этом научную тематику текстов.

SciRus-tiny вместе с бенчмарком ruSciBench была представлена исследователями из лаборатории «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ им. М.В. Ломоносова в декабре 2023 года. В июне 2024 года нейросеть была внедрена в поисковую систему научной электронной библиотеки elibrary.ru. Доступна как открытое ПО.

Репозиторий на Hugging Face

👤 Алексей Ватолин

👤 Николай Герасименко

Участвует в спецпроектах ICT.Moscow:

Смотреть

Технологии:

#искусственный_интеллект #нейросети #машинное_обучение #open_source

Разработчик:

#МГУ

Проект запущен:

2023

Последнее обновление:13.11.2025

Материалы о разработчике

15 дек. 14:48

В МФТИ и МГУ им. М.В. Ломоносова создали ИИ-систему для оценки стоимости произведений современного искусства

Известия

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

2 дек. 15:04

В МГУ им. М.В. Ломоносова представили алгоритм FABEMD для расширения обучающей базы диагностических ИИ-систем

МГУ

27 ноя. 13:29

В «Яндексе» и МГУ им. М.В. Ломоносова представили датасет LORuGEC и метод обучения сложным правилам

Хабр

27 ноя. 11:54

В МГУ им. М.В. Ломоносова разрабатывают мультимодальную платформу для беспилотного транспорта

ТАСС

смотреть еще

Другие проекты разработчика:

cadrille

Большая мультимодальная модель для генерации 3D-объектов

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #3D #open_source #AIRI #МГУ

nanoMINER

Мультиагентная система для извлечения данных

#искусственный_интеллект #генеративный_ИИ #ИИ-агент #нейросети #машинное_обучение #распознавание_документа #open_source #МГУ #Университет_ИТМО

Ломоносов-2

Суперкомпьютер

#искусственный_интеллект #нейросети #машинное_обучение #суперкомпьютеры #МГУ

МГУ-270

Суперкомпьютер

#искусственный_интеллект #нейросети #машинное_обучение #суперкомпьютеры #МГУ

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение