YaFSDP на ICT.Moscow

ИБ В РОССИИ: БАЗА ЗНАНИЙИБ В РОССИИ: БАЗА ЗНАНИЙ

304

YaFSDP

Библиотека для обучения больших языковых моделей

Описание:

Выложенная в открытый доступ библиотека YaFSDP (Yet another Fully Sharded Data Parallel) помогает оптимизировать использование большими языковыми моделями ресурсов большого числа графических процессоров на всех этапах обучения: предварительном, с учителем, выравнивании. Решение было представлено «Яндексом» в июне 2024 года.

Оно основано на подходе FSDP (Fully Sharded Data Parallelism), встроенном в широко используемую в машинном обучении библиотеку Torch. В нем множество параметров слоя нейросети можно объединить в один, который и будет разбиваться для обработки графическими процессорами. Однако в YaFSDP для хранения промежуточных весов и градиентов выделены два отдельных буфера.

Кроме того, в библиотеке усовершенствовано вычисление градиентов весов.

YaFSDP сравнили с оригинальным подходом FSDP в ускорении обучения моделей Llama 2 и Llama 3. При использовании небольших батчей датасетов российская библиотека позволяла делать это на 20–26% эффективнее. По заявлениям разработчиков, вкупе с другими оптимизациями памяти YaFSDP повышало скорость обучения на 45%.

В «Яндексе» отмечают, что несмотря на то, что YaFSDP рассчитана в первую очередь на большие языковые модели, использовать ее можно и для других нейросетей — например, предназначенных для создания изображений.

Репозиторий на GitHub
Разбор работы библиотеки на Habr

👤Михаил Хрущев

Технологии:

#искусственный_интеллект #нейросети #генеративный_ИИ #машинное_обучение #open_source

Разработчик:

#Яндекс

Проект запущен:

2024

Сайт:

opensource.yandex/projects

Последнее обновление:08.11.2024

Материалы о разработчике

31 июля 14:56

«Яндекс Роботикс» начал предоставлять компаниям роботов и софт для них по подписке

Forbes

30 июля 12:25

«Яндекс» представил нейросетевую технологию для распознавания голосовых команд в сложных условиях

РБК

29 июля 11:04

«Сбер», «Яндекс» и NexTouch могут купить контрактного производителя телевизоров «Квант»

Коммерсант

25 июля 16:06

Yandex B2B Tech открыл доступ к ИИ-модели Alibaba Qwen3-235B-A22B-Instruct-2507 в облаке

Яндекс

22 июля 12:04

«Яндекс» получил сертификат соответствия международному стандарту ISO по созданию ИИ-продуктов

Известия

смотреть еще

Другие проекты разработчика:

YaMBDa

Датасет для обучения алгоритмов рекомендательных систем

#искусственный_интеллект #нейросети #машинное_обучение #open_source #датасеты #Яндекс

Alchemist

Датасет для обучения генеративных моделей

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #датасеты #Яндекс

Чистый берег

Модель для обнаружения мусора

#искусственный_интеллект #компьютерное_зрение #нейросети #машинное_обучение #open_source #Яндекс

Yandex Neurosupport

ИИ-ассистент для операторов контакт-центров

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Яндекс

смотреть еще

Похожие проекты:

T-One

Модель распознавания речи

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #распознавание_речи #open_source #Т_Технологии

Виртуальная инфраструктура с GPU

GPUaaS для высоконагруженных вычислений и машинного обучения

#облачные_технологии #облачный_сервис #IaaS #искусственный_интеллект #машинное_обучение #МТС

Клаудия

ИИ-ассистент

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

POLLUX

Бенчмарк для оценки способностей генеративных моделей

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение