Vikhr Salt на ICT.Moscow

SMART CITY MOSCOW ОБНОВЛЕНИЕ 2025SMART CITY MOSCOW 2025

625

Vikhr Salt

Большая мультимодальная модель

Описание:

Vikhr Salt (Speech and Language Transformer) переводит устную речь в текст и обратно. По состоянию на февраль 2025 года модель лучше всего работает с английским языком. Кроме того, Vikhr Salt поддерживает генерацию коротких фраз на немецком и французском.

В ее основе лежит большая языковая модель (Large Language Model, LLM), словарь которой был расширен аудиотокенами (небольшими аудиоотрезками). Далее модель (LLaMA 3) была дообучена для задач распознавания (Automatic Speech Recognition, ASR) и генерации речи (Text-to-Speech, TTS). Для кодирования аудиоряда Vikhr Salt использует две встроенных модели: EnСodec и SpeechTokenizer.

Модель размером в 3,23 млрд параметров была обучена на датасетах Librispeech и TEDLIUM в течение 150 часов с использованием графических процессоров NVIDIA A100.

Команда Vikhr Models представила Salt в январе 2025 года. По заявлениям разработчиков, в будущем модель будет дообучена для работы с русской речью, а также сможет обрабатывать и генерировать музыкальные треки. Доступна как открытое ПО.

Пример работы Vikhr Salt в Google Colab

Репозитории на GitHub и Hugging Face

👤 Александр Николич

👤 Ксения Сычева

Участвует в спецпроектах ICT.Moscow:

Смотреть

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #распознавание_речи #open_source

Разработчик:

#Vikhr_Models

Проект запущен:

2025

Последнее обновление:11.11.2025

Материалы о разработчике

27 янв. 09:45

Подборка решений: инструменты Open Source для разработчиков ИИ

ICT.Moscow

Другие проекты разработчика:

Vistral

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Vikhr_Models

Vikhr Borealis

Большая языковая модель c возможностью распознавания речи

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #распознавание_речи #open_source #Vikhr_Models

DeathMath

Бенчмарк для больших языковых моделей

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Vikhr_Models

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение