MERA Code на ICT.Moscow

SMART CITY MOSCOW ОБНОВЛЕНИЕ 2025SMART CITY MOSCOW 2025

607

MERA Code

Бенчмарк для LLM

Описание:

Бенчмарк MERA Code позволяет оценить, насколько хорошо LLM справляются с задачами программирования, в том числе с учетом требований, сформулированных на русском языке.

Решение содержит 11 заданий в формате инструкций на 8 языках программирования: Python, Java, C#, JavaScript, Go, C, C++ и Scala. Каждый тест оформлен в виде фиксированного набора подобранных под задачу и корректный выбор ответа промптов, в среднем десяти, равномерно распределенных по каждой задаче.

Кодовая база для оценки MERA Code разработана на основе фреймворка LM Evaluation Harness. Бенчмарк делится на приватные и публичные задачи. Для того чтобы сделать результат публичным, пользователь должен отправить запрос на модерацию. Результаты тестирования отсортированы по общему среднему для задач показателю.

Бенмарк MERA Сode был представлен в рамках Альянса в сфере искусственного интеллекта разработчиками из Sber AI, MTS AI, Т-Банка, «Ростелекома» и «Сибирских нейросетей», в июле 2025 года. Частично доступен как открытое ПО.

Репозитории на GitVerse, GitHub и Hugging Face

Препринт на arXiv

👤 Алена Феногенова

👤 Артем Червяков

👤 Александр Харитонов

👤 Артем Завгороднев

👤 Дмитрий Воробьев

Участвует в спецпроектах ICT.Moscow:

Смотреть

Технологии:

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#Альянс_в_сфере_искусственного_интеллекта #Сбербанк #МТС #МТС_ВЕБ_Сервисы #Т_Технологии #Ростелеком

Проект запущен:

2025

Сайт:

mera.a-ai.ru

Последнее обновление:21.11.2025

Материалы о разработчике

15 дек. 14:38

TelecomDaily: в Москве доля успешных голосовых соединений в сетях МТС, «МегаФона», «Билайна» и T2 превысила 99,7%

TelecomDaily

8 дек. 12:04

MWS Cloud запустил сервис MWS GPU On-Premises для обучения и инференса ИИ в периметре предприятий

МТС

4 дек. 11:47

В MWS AI выпустили платформу для создания ИИ-приложений, агентов и мультиагентных систем MWS AI Agents Platform

МТС

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

27 ноя. 12:53

MWS Cloud: 41% компаний с виртуальной инфраструктурой пользуются услугами минимум двух облачных провайдеров

МТС

смотреть еще

Другие проекты разработчика:

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

DRAGON

Бенчмарк для RAG-систем

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Сбербанк #Университет_ИТМО

Evolution Notebooks

Сервис для работы специалистов по машинному обучению

#искусственный_интеллект #нейросети #машинное_обучение #разработка #Cloud #Сбербанк

T-Math

Бенчмарк для LLM

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Т_Технологии

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение