
Большая языковая модель
Генеративная текстовая нейросеть, которая может создавать и перерабатывать тексты с учетом контекста беседы с пользователем. В числе сценариев применения модели называются контентные задачи, техподдержка, а также создание чат‑ботов, виртуальных ассистентов и прочее.
Модель была открыта для пользователей в мае 2023 года в виде навыка «Давай придумаем» в голосовом помощнике «Алиса». Вслед за этим нейросеть появилась в приложениях «Яндекс», «Яндекс Браузер», «Яндекс Станция» и других сервиcах компании. Она также применяется для обработки текстовых запросов в приложении для генерации изображений «Шедеврум».
В марте 2024 года разработчик анонсировал обновление до YandexGPT 3, а в октябре того же года представил поколение YandexGPT 4 в двух версиях — Pro и Lite — доступных по API. По сравнению с предыдущими версиями они стали способны выстраивать цепочку рассуждений (функция Сhain-of-thought), работать с более длинным контекстом, а также вызывать функции (Function Calling) — по запросу пользователя использовать внешние инструменты.
В феврале 2025 года было представлено поколение YandexGPT 5, также в двух версиях: Pro и Lite соответственно. Как заявляют разработчики, модели стали лучше решать математические задачи и писать код.
В ходе предобучения YandexGPT 5 Pro были использованы веса модели Qwen-2.5-32B-base. Совмещение последних и весов полного цикла обучения позволило, как заявляют разработчики, понизить длительность экспериментов и сэкономить ресурсы на подбор оптимальной конфигурации модели. При дообучении разработчики применили методы обучения с подкреплением: модифицированную версию метода DPO (Direct Preference Optimization) LogDPO и PPO (Proximal Policy Optimization). Это, по их словам, повысило стабильность обучения модели.
YandexGPT 5 Pro доступна по API в Yandex Cloud AI Studio, а также в чате «Алисы», причем как в оригинальной, так и в дообученной быть виртуальным ассистентом версии.
Предобученная версия YandexGPT 5 Lite размером в восемь млрд параметров была выложена в открытый доступ. По заявлениям разработчиков, дообученная инструктивная версия в ближайшее время станет доступна через API.
Демоверсия на Yandex Cloud
Версии модели:
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.