logo YandexGPT

YandexGPT

Большая языковая модель

Описание:

Генеративная текстовая нейросеть, которая может создавать и перерабатывать тексты с учетом контекста беседы с пользователем. В числе сценариев применения модели называются контентные задачи, техподдержка, а также создание чат‑ботов, виртуальных ассистентов и прочее.

Модель была открыта для пользователей в мае 2023 года в виде навыка «Давай придумаем» в голосовом помощнике «Алиса». Вслед за этим нейросеть появилась в приложениях «Яндекс», «Яндекс Браузер», «Яндекс Станция» и других сервиcах компании. Она также применяется для обработки текстовых запросов в приложении для генерации изображений «Шедеврум».

В марте 2024 года разработчик анонсировал обновление до YandexGPT 3, а в октябре того же года представил поколение YandexGPT 4 в двух версиях — Pro и Lite — доступных по API. По сравнению с предыдущими версиями они стали способны выстраивать цепочку рассуждений (функция Сhain-of-thought), работать с более длинным контекстом, а также вызывать функции (Function Calling) — по запросу пользователя использовать внешние инструменты.

В феврале 2025 года было представлено поколение YandexGPT 5, также в двух версиях: Pro и Lite соответственно. Как заявляют разработчики, модели стали лучше решать математические задачи и писать код.

В ходе предобучения YandexGPT 5 Pro были использованы веса модели Qwen-2.5-32B-base. Совмещение последних и весов полного цикла обучения позволило, как заявляют разработчики, понизить длительность экспериментов и сэкономить ресурсы на подбор оптимальной конфигурации модели. При дообучении разработчики применили методы обучения с подкреплением: модифицированную версию метода DPO (Direct Preference Optimization) LogDPO и PPO (Proximal Policy Optimization). Это, по их словам, повысило стабильность обучения модели.

YandexGPT 5 Pro доступна по API в Yandex Cloud AI Studio, а также в чате «Алисы», причем как в оригинальной, так и в дообученной быть виртуальным ассистентом версии.

Предобученная версия YandexGPT 5 Lite размером в восемь млрд параметров была выложена в открытый доступ. По заявлениям разработчиков, дообученная инструктивная версия в ближайшее время станет доступна через API.


Демоверсия на Yandex Cloud

Версии модели:


👤 Андрей Бут

👤 Алексей Долотов

👤 Сергей Воробьев

👤 Сергей Кастрюлин


logo YandexGPT
Проект запущен:
2023
Сайт:
Последнее обновление:26.02.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0