ICT.Moscow — База знаний ИИ

19 ноя. 2024 12:5524

Российский бенчмарк — 2024: переводной и закрытый?

Только за последнюю неделю появилось две новости о российских бенчмарках для оценки моделей ИИ. Пик таких публикаций пришелся на 2024 год.

Большинство открытых тестов проверяют большие языковые модели (LLM) в области обработки текстов на естественном языке. Значительная часть из них является переложением широко используемых англоязычных бенчмарков. Активно анонсировались аналоги бенчмарков LMSYS с оценщиками-судьями, а также бенчмарки для оценки знания российской специфики.

Но несмотря на значительное число представленных в открытом доступе бенчмарков, большая их часть закрыта от посторонних глаз.

Валентин Малых, руководитель группы NLP-исследований MTS AI:

«У каждой компании, которая занимается обработкой данных, есть внутренние бенчмарки. Это стандартная практика: команда, работающая над некоторой задачей, делает для нее бенчмарк. В крупных компаниях таких внутренних бенчмарков могут быть сотни».

Команды разработчиков, компании и целые экосистемы — каждый по-разному видит плюсы и минусы открытых и закрытых бенчмарков и на основе этого видения выбирает свой подход.

Сергей Марков, управляющий директор Управления экспериментальных систем машинного обучения SberDevices:

«Создатели бенчмарков сегодня находятся между Сциллой закрытости (и потенциально связанной с ней предвзятости) и Харибдой утечек тестовых данных в обучающие выборки моделей».

Однако открытым тестам, разработанным российскими командами, прогнозируют дальнейшее увеличение числа.

Татьяна Шаврина, старший научный сотрудник Института языкознания РАН:

«Количество бенчмарков продолжает увеличиваться, они становятся более специализированными, отражающими отдельные аспекты работы языковых моделей: написание кода, использование внешних API, понимание сложных длинных документов».

О тенденциях в разработке бенчмарков для моделей ИИ в новом материале ICT.Moscow →

Оригинал

Другие новости:

19 ноя.
11:08📬Утренняя подборка

18 ноя.
17:14Подборка решений: открытые бенчмарки для моделей

18 ноя.
13:33Вендор Yadro работает над созданием серверов для обучения ИИ-моделей

18 ноя.
10:44📬Утренняя подборка

15 ноя.
17:47Российская академия наук получит суперкомпьютер от холдинга «Росэлектроника»

все новости

Следить за новостями
об искусственном интеллекте
в Telegram @ict_moscow_ai

Следить за новостями об искусственном интеллекте в Telegram
@ict_moscow_ai

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение

Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0

Следить за новостямиоб искусственном интеллектев Telegram @ict_moscow_ai

Следить за новостями об искусственном интеллекте в Telegram @ict_moscow_ai

Следить за новостями
об искусственном интеллекте
в Telegram @ict_moscow_ai

Следить за новостями об искусственном интеллекте в Telegram
@ict_moscow_ai