LIBRA на ICT.Moscow

SMART CITY MOSCOW ОБНОВЛЕНИЕ 2025SMART CITY MOSCOW 2025

566

LIBRA

Бенчмарк для русскоязычных больших языковых моделей

Описание:

Бенчмарк LIBRA (Long Input Benchmark for Russian Analysis) помогает оценить способности языковой модели оперировать длинным контекстом: резюмировать, вычленять основные идеи текста, проводить реляционную операцию с объемной таблицей.

Задачи бенчмарка подразделены на четыре группы сложности. Датасеты в первой предназначены для оценки работы по поиску короткого важного фрагмента в большом нерелевантном тексте, во второй — по поиску ответа на вопрос, в третьей — по поиску ответа, распределенного среди нескольких релевантных фрагментов. Четвертая же группа наборов данных требует от модели понимания всего контекста, а также решения математических задач.

Тесты проводятся в формате Zero-shot, при котором модели даются задачи, ранее не использовавшиеся при обучении. Это, по словам исследователей, позволяет избежать выходов за пределы допустимой длины контекста.

Разработчики отмечают, что пользователи бенчмарка при тестировании моделей могут использовать как созданные ими промпты, так и свои собственные наборы инструкций.

LIBRA представлен в августе 2024 года разработчиками из AIRI, ecom.tech, SberDevices и МФТИ. Доступен как открытое ПО.

Репозитории на GitHub, Hugging Face

Лидерборд на Hugging Face

Участвует в спецпроектах ICT.Moscow:

Смотреть

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #бенчмарк #open_source

Разработчик:

#AIRI #МФТИ #Сбербанк #SberDevices

Проект запущен:

2024

Последнее обновление:13.11.2025

Материалы о разработчике

15 дек. 14:48

В МФТИ и МГУ им. М.В. Ломоносова создали ИИ-систему для оценки стоимости произведений современного искусства

Известия

4 дек. 13:36

В МФТИ и Институте океанологии им. П.П. Ширшова РАН создали нейросеть для моделирования экстремальных погодных явлений в Арктике

МФТИ

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

25 ноя. 15:38

«Сбер»: развитие ИИ потребует 45 трлн руб. инвестиций в энергетику за 16 лет

Reuters

24 ноя. 12:08

В AIRI разработали фреймворк Maestro для создания и оркестрации ИИ-агентов

AIRI

смотреть еще

Другие проекты разработчика:

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

DRAGON

Бенчмарк для RAG-систем

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Сбербанк #Университет_ИТМО

RCDINO

Мультимодальная модель для обнаружения 3D-объектов

#искусственный_интеллект #нейросети #машинное_обучение #распознавание_транспорта #3D #open_source #МФТИ

Evolution Notebooks

Сервис для работы специалистов по машинному обучению

#искусственный_интеллект #нейросети #машинное_обучение #разработка #Cloud #Сбербанк

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение