Компания Artificial Analysis представила обзор о ключевых тенденциях в развитии искусственного интеллекта в первом квартале 2025 года. Документ основан на собственных данных компании, пользовательских опросах и других источниках. В нем рассматриваются такие темы, как рост интеллектуальных способностей моделей, развитие моделей нового поколения, конкуренция между лабораториями США и Китая, а также динамика стоимости, скорости и вычислительных требований моделей.

Ключевые выводы:

  • все ведущие ИИ-лаборатории (OpenAI, Google DeepMind, Anthropic, xAI и др.) за последние месяцы добились существенного прогресса по трем направлениям: рост интеллектуальных возможностей, снижение стоимости вывода (Inference) и повышение скорости работы. Особенно заметен рост в качестве ответов на сложные запросы, при этом «умные» ответы стали дешевле в десятки раз по сравнению с концом 2024 года;
  • новое поколение языковых моделей опирается на стратегию пошагового мышления — перед финальным ответом модель проговаривает промежуточные рассуждения, формируя цепочку выводов. Это резко повысило уровень понимания модели и стало стандартом для лучших из них (например, GPT-4.5, Gemini 2.5 Pro, Claude 3 Opus). Такие Reasoning-модели теперь занимают лидирующие позиции в тестах на глубину интеллекта (вроде Artificial Analysis Intelligence Index);
  • хотя сами ИИ-модели и технологии их запуска стали работать быстрее — благодаря новым методам генерации и распределенным вычислениям — пользователям нередко приходится дольше ждать ответа. Это связано с тем, что современные Reasoning-модели перед финальным ответом генерируют огромный объем промежуточных рассуждений. Кроме того, агентные системы могут запускать десятки связанных запросов, чтобы решить одну сложную задачу, что тоже увеличивает общее время отклика;
  • китайские лаборатории, особенно DeepSeek, выпустили модели с открытым исходным кодом (Open Weights), которые в некоторых аспектах, включая скорость, эффективность, превосходят западные аналоги. В сегменте Non-Reasoning моделей DeepSeek V3-0324 является самой интеллектуальной из открытых. Однако в области Reasoning ИИ США пока сохраняют безоговорочное лидерство;
  • в современных моделях при обработке запроса все чаще активируется лишь малая часть параметров. Это позволяет использовать огромные модели, затрачивая при этом лишь 2–10% от их полной мощности. Например, Llama 4 Maverick активирует только 17 млрд параметров из 402 млрд (4,2%), что делает такие модели значительно экономичнее при сопоставимом качестве;
  • стоимость вывода модели уровня GPT-4 в 2025 году снизилась более чем в 1 тыс. раз по сравнению с моментом ее запуска в 2023. Этому способствовали три ключевых фактора: миниатюризация моделей, оптимизация процессов генерации и появление новых поколений чипов и серверов. Благодаря этому ИИ-инструменты стали доступнее для малого и среднего бизнеса;
  • ИИ все чаще работает сразу с несколькими типами данных: текст, изображение, аудио, видео. Модели вроде GPT-4o (от OpenAI) и Gemini 1.5 от Google воспринимают картинку и текст как единый контекст, что особенно ценно в аналитических и креативных задачах. Такие модели постепенно вытесняют специализированные инструменты — универсальность становится конкурентным преимуществом;
  • в 2025 году наблюдается заметный скачок качества в генерации видео: модель Veo 2 от Google обогнала Sora от OpenAI по плавности и точности синтеза. В аудиосфере инновации идут по двум направлениям: улучшение распознавания речи (например, Whisper 3 и модели ElevenLabs) и повышение реалистичности синтеза голоса. Диалоговые ИИ-системы теперь не просто озвучивают текст, а ведут живое общение в реальном времени;
  • несмотря на оптимизацию, общая вычислительная нагрузка продолжает расти. Один запрос от ИИ-агента может включать десятки подзапросов, каждый из которых сам по себе ресурсоемок. Например, сложный аналитический запрос может обойтись в 10–20 раз дороже, чем простой вопрос к GPT-4 в 2023 году;
  • с начала 2025 года крупные релизы моделей (как открытых, так и проприетарных) происходят почти ежемесячно. Улучшения стали пошаговыми, но происходят быстрее и затрагивают все: интеллект, скорость, креативность, стоимость. Такой темп создал эффект непрерывной эволюции на рынке ИИ;
  • Reasoning-модели, хоть и дороже в использовании (генерируют до 10 раз больше токенов), дают значительно более «умные» ответы и лучше справляются с аналитическими задачами. Non-reasoning модели, напротив, экономичны и быстры, что делает их удобными для массового применения (чат-боты, переводчики, простые ассистенты). Разработчикам все чаще приходится выбирать подход в зависимости от задачи, а не просто использовать самую мощную модель.
Подробнее

Расскажите знакомым:

51Дата добавления:25.06.2025

Расскажите знакомым:

Похожие исследования:
Подпишитесь
на еженедельную подборку исследований от ICT.Moscow

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Добавить исследование в каталог ICT.Moscow
Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.