

Отраслевой бенчмарк для больших языковых моделей
Бенчмарк предназначен для оценки работы больших языковых моделей в различных отраслях промышленности, в частности в сельском хозяйстве и медицине.
По состоянию на июнь 2025 года доступны три датасета для оценки знаний модели в различных сферах по подобию бенчмарка MMLU:
Общая оценка модели считается по среднему результату решения задач.
Специалисты из «Сколтеха», КубГАУ, НМИЦ им. В.А. Алмазова, РАНХиГС и ННГАСУ представили бенмарк MERA Industrial на площадке Альянса в области искусственного интеллекта в июне 2025 года.
По заявлениям разработчиков, в будущем в открытый доступ будут выложены код и датасеты бенчмарка, а также станет доступным функционал для тестирования пользовательских моделей и самостоятельной оценки.

Команда MERA представила бенчмарк MERA Multi для мультимодальных моделей на русском языке
Альянс в сфере искусственного интеллекта
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.