logo Golos

Golos

Русскоязычный речевой датасет

Описание:

Выложенный в открытый доступ датасет Golos состоит из более чем 1,1 млн аудиозаписей на русском языке суммарной длиной около 1240 часов и соответствующих им транскрипций. Средняя длина записей составляет около четырех секунд. По задумке разработчиков, датасет поможет в обучении моделей для генерации и распознавания речи.

Аудиофайлы были собраны в Golos из двух источников: краудсорсинговой платформы и студийных записей, сделанных с помощью устройства SberPortal. Данные в датасете обезличены.

Речь в записях похожа на запросы пользователей к ассистенту. Для описания запросов в различных доменах разработчики мы создали систему шаблонов, поясняющую их структуру.

Датасет Golos был представлен компанией SberDevices в мае 2021 года.


Репозиторий на GitHub


👤 Александр Денисенко


logo Golos
Проект запущен:
2021
Последнее обновление:12.02.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0