Как реально выбирают LLM для своего кейса в 2025 году

ИБ В РОССИИ: БАЗА ЗНАНИЙИБ В РОССИИ: БАЗА ЗНАНИЙ

Главная Исследования Как реально выбирают LLM для своего кейса в 2025 году

LLM Arena

Как реально выбирают LLM для своего кейса в 2025 году

1/3

Команда энтузиастов — разработчиков проекта LLM Arena — опубликовала результаты опроса о выборе ИИ-специалистами больших языковых моделей (LLM) в 2025 году. Всего в рамках исследования в июле — августе 2025 года было опрошено 45 специалистов с практическим опытом работы с LLM-продуктами. В частности, 45% респондентов связаны с DS/ML-направлением, еще четверть — менеджмент в сфере ИИ.

Ключевые выводы:

при выборе LLM-модели 82,2% респондентов проводят собственные проверки и используют бенчмарки только как дополнительный инструмент;
те, кто проводит собственные тесты, используют свои данные и кастомные бенчмарки (26,7%). 17,8% задействуют ручную и качественную оценку, столько же — автоматизированную оценку по метрикам и через пайплайны;
26,7% опрошенных принципиально не пользуются бенчмарками. Среди тех, кто все же их применяет, наиболее популярны LMArena (13,3%), LLM Arena (11,1%), Mera (8,9%). Наименее распространены такие инструменты, как MTEB Leaderboard и MMLU/MMLU-Pro, набравшие по 4,4%;
82,2% специалистов не прибегают к ресурсам по ИИ/LLM-аналитике;
55,6% респондентов при выборе LLM обращают внимание на частоту обсуждений (в статьях, постах), использование в похожих продуктах (55,6%) и количество скачиваний на Hugging Face (48,9%);
29% специалистов для принятия решения о выборе LLM не хватает комплексной картины по конкретной модели. Еще 25% говорят о нехватке собственного тестирования под конкретные задачи (25%) и столько же — о реальном применении моделей и отзывах пользователей;
отмечается также, что наиболее востребованная информация по моделям — это подборки под конкретные задачи (88,9%) и сведения о требованиях для их локального запуска (75,6%). Также респонденты заинтересованы в простых инструментах для быстрого выбора и графиках, наглядно сравнивающих модели по цене, скорости и качеству;
68,9% респондентов интересуются уже не отдельными моделями, а более комплексными готовыми решениями;
среди целей выбора LLM называются баланс качества, цены и скорости, устойчивость без галлюцинаций и встраивание в имеющуюся инфраструктуру.

Подробнее

Тематика:

#разработка

Технологии:

#искусственный_интеллект #генеративный_ИИ

Компании:

#LLM_Arena

Расскажите знакомым:

322Дата добавления:18.09.2025

[Сообщить о нарушении авторских прав]

[Сообщить об ошибке]

Расскажите знакомым:

Похожие исследования:

17.12.25IBM
5 trends for 2026
48% работников в мире готовы, чтобы ими управляли ИИ-агенты.
Подробнее
17.12.25MarkTechPost
ML Global Impact Report 2025
Алгоритм «Яндекса» CatBoost стал одним из наиболее часто упоминаемых ML-инструментов в научных статьях.
Подробнее
16.12.25Capgemini
Turbocharging Software with Gen AI
В 2026 году до 85% разработчиков ПО могут начать использовать генеративный ИИ.
Подробнее
16.12.25PwC
2026 AI Business Predictions
Аналитики прогнозируют в 2026 году увеличение значимости ИИ-агентов в бизнесе, развитие систем оркестрации.
Подробнее

смотреть еще

Похожие материалы:

15:55

Нейросеть GigaChat сдала экзамены в РАНХиГС по направлениям «Экономика и финансы» и «Финансовая грамотность»

Сбербанк

15:22

В Москве с 2026 года начнется эксперимент по применению ИИ для выявления нарушений в благоустройстве

Ведомости

14:33

«Сбер» представил ИИ-помощников для пользователей и бизнеса

Коммерсант

12:01

AppSec Solutions разработал SCA-анализатор AppSec.Track для проверки сгенерированного кода

AppSec Solutions

16 дек. 12:56

Москва разрабатывает подход для оптимизации градостроительного развития с помощью ИИ и цифровых двойников

mos.ru

смотреть еще

Подпишитесь

на еженедельную подборку исследований от ICT.Moscow

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Добавить исследование в каталог ICT.Moscow

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение

Как реально выбирают LLM для своего кейса в 2025 году

5 trends for 2026

ML Global Impact Report 2025

Turbocharging Software with Gen AI

2026 AI Business Predictions