MMBench-ru на ICT.Moscow

ИБ В РОССИИ: БАЗА ЗНАНИЙИБ В РОССИИ: БАЗА ЗНАНИЙ

156

MMBench-ru

Бенчмарк для визуально‑текстовых мультимодальных моделей

Описание:

Выложенный в открытый доступ бенчмарк MMBench-ru представляет собой русифицированную версию бенчмарка MMBench. Используемый датасет был переведен с помощью большой языковой модели OpenAI GPT-4o, после чего из него были отсеяны не удавшиеся нейросети переводы.

Оба бенчмарка оценивают визуально‑текстовые мультимодальные модели (Visuon Language Models, VLM) с помощью задач на многовариантный выбор (Multiple Choice). MMBench-ru содержит почти 4 тыс. таких заданий, каждое из которых включает текст вопроса, связанное с ним изображение и четыре варианта ответов. От модели требуется дать правильный ответ. Для оценки результатов используется метрика Exact Match, которая в процентном соотношении отражает долю правильно сгенерированных моделью ответов от общего количества.

Бенчмарк MMBench-ru был представлен исследователями из VK Lab в августе 2024 года.

👤 Егор Спирин

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #бенчмарк

Разработчик:

#VK

Проект запущен:

2024

Сайт:

Страница на Hugging Face

Последнее обновление:15.05.2025

Материалы о разработчике

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

18 ноя. 14:59

VK внедрил в свои продукты ИИ-решение Discovery для персонализации контента

6 ноя. 12:26

В VK представили обновленную версию языковой модели Diona для генерации и обработки текста

Коммерсант

17 окт. 15:46

RuStore продолжил расширение в Азиатском регионе и вышел на рынок Южной Кореи

Forbes

17 окт. 13:22

VK Tech запустил сервис виртуальных карт GPU в VK Cloud

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение

MMBench-ru

Cloud GPU

RuModernBERT

GQA-ru

A-Vision

A-Vibe

Бизнес.Локатор

Evolution Managed RAG