mGPT на ICT.Moscow

ИБ В РОССИИ: БАЗА ЗНАНИЙИБ В РОССИИ: БАЗА ЗНАНИЙ

373

mGPT

Большая языковая модель

Описание:

Выложенная в открытый доступ многоязычная модель длиной контекста в 512 токенов содержит 13 млрд параметров. mGPT была обучена на графических процессорах NVIDIA V100 на 600 Гб текстов на разных языках, собранных из датасета C4 и других открытых источников, главным образом, из «Википедии».

Модель на основе разработанной компанией OpenAI архитектуры GPT-3 способна создавать тексты на 61 языке 25 языковых семей, среди которых языки стран СНГ и малых народов России. Помимо генерации текста, mGPT после дообучения может решать специализированные задачи в области обработки естественного языка. Разработчики подчеркивают, что для большинства языков модель показала перплексию — меру того, насколько хорошо модель предсказывает детали тестовой выборки — от 2 до 10, что является хорошим показателем.

Компания SberDevices представила оригинальные версии модели (mGPT 13B и mGPT XL размером в 1,3 млрд параметров) в апреле 2022 года. Для 23 языков на основе mGPT XL на специальных датасетах были дообучены и представлены улучшенные моноязычные модели. Обновленная версия модели mGPT 13B была выпущена в июле 2023 года.

Промежуточные результаты обучения (чекпоинты) на «СберДиске»

Репозиторий на GitHub

Репозиторий на Hugging Face

Страница на Google Colab

Статья в журнале Transactions of the Association for Computational Linguistics

👤 Сергей Аверкиев

👤 Мария Тихонова

👤 Алена Феногенова

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#Сбербанк #SberDevices

Проект запущен:

2022

Сайт:

Страница на ML Space

Последнее обновление:19.02.2025

Материалы о разработчике

15 сен. 13:02

«Сбер» и Т-Банк тестируют китайские ускорители для ИИ

Ведомости

8 сен. 12:29

Основатель 2ГИС Александр Сысоев продал свою долю и покинул компанию

Forbes

4 сен. 13:12

Россия и другие члены AI Alliance Network создают Глобальную систему регулирования ИИ под эгидой ООН

Сбербанк

2 сен. 13:24

На площадке Ассоциации ФинТех протестировали 17 гипотез применения LLM в бизнес-процессах

Ассоциация ФинТех

28 авг. 09:54

Подборка решений: ИИ-агенты для разработчиков

ICT.Moscow

смотреть еще

Другие проекты разработчика:

GigaAgent

ИИ-агент

#искусственный_интеллект #генеративный_ИИ #ИИ-агент #нейросети #машинное_обучение #open_source #Сбербанк

HuBERT-CTC

Метод предобучения моделей распознавания речи

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #распознавание_речи #open_source #Сбербанк #SberDevices

Evolution AI Agents

Сервис для создания ИИ-агентов

#искусственный_интеллект #генеративный_ИИ #ИИ-агент #нейросети #машинное_обучение #Сбербанк #Cloud

Клаудия

ИИ-ассистент

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Похожие проекты:

GigaAgent

ИИ-агент

#искусственный_интеллект #генеративный_ИИ #ИИ-агент #нейросети #машинное_обучение #open_source #Сбербанк

AlpinaGPT

MLaaS-платформа

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #инфраструктура #Альпина

Boomq

Платформа для нагрузочного тестирования

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Перфоманс_Лаб

Vikhr Borealis

Большая языковая модель c возможностью распознавания речи

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #распознавание_речи #open_source #Vikhr_Models

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение