Команда MERA представила бенчмарк MERA Multi для мультимодальных моделей на русском языке

24 ноября, 14:10|

109

Команда разработчиков MERA выпустила новый бенчмарк MERA Multi для комплексной оценки мультимодальных способностей моделей на русском языке. Он включает 18 задач, которые проверяют понимание изображений, аудио и видео.

Задачи на визуальное восприятие оценивают способность распознавать объекты, интерпретировать сцены и соотносить их с текстовым описанием. Такие навыки есть у систем генерации изображений и поиска по ним, а также систем безопасности. Задачи на понимание аудио оценивают способность распознавать речь, интонации и звуковые сигналы. С их помощью можно проверить голосовых ассистентов и приложения, которые работают в шумной среде. Задачи на анализ видео оценивают способность отслеживания действий, событий и причинно-следственных связей во временном контексте, что является основой для интеллектуальных ассистентов, агентов и мультимодального поиска.

В рамках проекта также представлена таксономия навыков — описание компетенций, которые необходимы для мультимодальных задач. В перспективе все бенчмарки MERA будут использовать одну систему навыков.

Бенчмарк MERA для оценки русскоязычных языковых моделей был выпущен в конце 2023 года. Позднее появились также MERA Code для задач программирования и MERA Industrial для проверки отраслевых LLM. Команда MERA разрабатывает бенчмарки при поддержке Альянса в сфере ИИ.

Подробнее

Технологии:

#искусственный_интеллект #распознавание

Компании:

#Альянс_в_сфере_искусственного_интеллекта

Расскажите знакомым:

Материалы
по теме:

12:56

Москва разрабатывает подход для оптимизации градостроительного развития с помощью ИИ и цифровых двойников

mos.ru

12:16

«Яндекс» внедрил в платформу разработки SourceCraft ИИ-агента для проверки кода на уязвимость

Яндекс

11:55

WMT AI: 70% зарубежных компаний готовы интегрировать российские ИИ-решения в свою инфраструктуру

ComNews

15 дек. 14:48

В МФТИ и МГУ им. М.В. Ломоносова создали ИИ-систему для оценки стоимости произведений современного искусства

Известия

15 дек. 12:16

В Первом МГМУ им. И.М. Сеченова представили портативный электрокардиограф CardioQWARK с ИИ

CNews

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение