GigaAM на ICT.Moscow

База знаний. карта площадок.База знаний 5G

1542

GigaAM

Предобученная нейросеть для обработки речи

Описание:

GigaAM (Giga Acoustic Мodel) подходит для адаптации под различные задачи работы со звуком. Она обучена на датасете из 50 тыс. часов разнообразных русскоязычных данных. Модель существует в двух дообученных состояниях: GigaAM-CTC — для распознавания речи и GigaAM-Emo — для определения эмоций.

Обучение GigaAM-CTC проходило на корпусах Golos SberDevices, Sova, CommonVoice и LibriSpeech. Качество тестировали на семи срезах данных, учитывая как запросы для умных колонок, так и записи из телефонных каналов. В коротких запросах она допускает на 20–35% меньше ошибок в словах, чем такие решения, как NeMo-Conformer-RNNT и Whisper-Large-v3.

Модель GigaAM-Emo для определения эмоций дообучали на наборе Dusha: он состоит из записей речи продолжительностью до 20 секунд. Часть аудио записали актеры озвучки, остальные собраны из подкастов. Каждой записи приписано одно из четырех состояний: злость, грусть, нейтральная эмоция или счастье.

Этот класс Open Source — моделей был представлен разработчикам в декабре 2023 года, а в апреле 2024 года они были опубликованы в свободном доступе на GitHub и GitVerse. В декабре 2024 года было выпущено обновление моделей, в котором были усовершенствованы подготовка данных и технология предобучения базовой модели. За счёт этого удалось значительно снизить количество ошибок в словах (Word Error Rate) при распознавании русскоязычных запросов. Для повышения доступности использования моделей был упрощен код и подготовлена конвертация в формат открытой библиотеки программного обеспечения ONNX. Также была представлена самая продвинутая версия линейки — GigaAM-RNNT, предназначенная для распознавания речи.

Изучить текстовый обзор на Habr

Презентация

👤 Георгий Господинов

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #распознавание_речи

Разработчик:

#Сбербанк #SberDevices

Проект запущен:

2023

Сайт:

gitverse.ru/GigaTeam/GigaAM

Последнее обновление:21.01.2025

Материалы о разработчике

30 июня 16:12

Российские и казахстанские ученые предложили метод поиска уязвимостей в коде с помощью ИИ

ТАСС

30 июня 12:42

«Сбер» и Минфин заключили соглашение в сфере ИИ для усовершенствования бюджетного процесса

27 июня 11:57

Российские ученые представили инструмент защиты голосовых данных от автоматического сбора биометрии

AIRI

26 июня 12:24

«Сбер» выпустил ИИ-инструменты GigaStudio для создания приложений и Kandinsky 4.1 для генерации видео

Сбербанк

26 июня 11:44

«Сбер» представил обновленного ИИ-ассистента GigaCode 2.0 для ускорения разработки ПО

Сбербанк

смотреть еще

Другие проекты разработчика:

Evolution AI Factory

Облачная платформа для создания ИИ-приложений

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #облачный_сервис #Сбербанк #Cloud

GigaStudio

Мультиагентная система для создания веб-приложений

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Сбербанк #СберТех

TSForesight

Библиотека для прогнозирования временных рядов

#искусственный_интеллект #нейросети #машинное_обучение #open_source #Сбербанк

Evolution Foundation Models

Облачный сервис для работы с моделями ИИ

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #облачный_сервис #Cloud #SberCloud #Сбербанк

смотреть еще

Похожие проекты:

POLLUX

Бенчмарк для оценки способностей генеративных моделей

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Лира

Программно-аппаратный комплекс для решения задач ИИ

#искусственный_интеллект #нейросети #машинное_обучение #Аквариус #ХайТэк

Evolution AI Factory

Облачная платформа для создания ИИ-приложений

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #облачный_сервис #Сбербанк #Cloud

GigaStudio

Мультиагентная система для создания веб-приложений

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Сбербанк #СберТех

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение