
Отраслевой бенчмарк для больших языковых моделей
Бенчмарк предназначен для оценки работы больших языковых моделей в различных отраслях промышленности, в частности в сельском хозяйстве и медицине.
По состоянию на июнь 2025 года доступны три датасета для оценки знаний модели в различных сферах по подобию бенчмарка MMLU:
Общая оценка модели считается по среднему результату решения задач.
Бенчмарк MERA Industrial был представлен Альянсом в области искусственного интеллекта в сотрудничестве со «Сколтехом», КубГАУ, НМИЦ им. В.А. Алмазова в июне 2025 года.
По заявлениям разработчиков, в будущем в открытый доступ будут выложены код и датасеты бенчмарка, а также станет доступным функционал для тестирования пользовательских моделей и самостоятельной оценки.
К российскому кодексу этики в сфере ИИ присоединились более 900 компаний
Альянс в сфере искусственного интеллекта
Альянс в сфере ИИ представил бенчмарк MERA Industrial для оценки отраслевых LLM
Альянс в сфере искусственного интеллекта
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.