ГлавнаяЛента

Forbes

«Т-Технологии» выпустила модель потокового распознавания речи T-one

22 июля, 12:58|
87

ИИ-центр группы «Т-Технологии» выложил в открытый доступ модель автоматического распознавания речи (ASR) T-one. Пайплайн включает предобученную потоковую акустическую CTC-модель (Connectionist Temporal Classification), модуль разделения на фразы и декодер для распознавания в реальном времени.

T-one состоит из 70 млн параметров, модель можно запускать на ноутбуках. Входной аудиопоток обрабатывается сегментами по 300 мс.

Расходы на разработку составили меньше 10 млн руб. В эту сумму входит стоимость аппаратного обеспечения и зарплаты сотрудников.

Решение внедрено во внутренние продукты Т-Банка, включая службу поддержки, мобильного секретаря в «Т-Мобайле» и инструменты защиты от спам-звонков. Разработчики предполагают, что T-one будет интересна тем, кто разрабатывает голосовых роботов и ассистентов, а также занимается автоматизацией колл-центров.


Т-Банк развивает речевые технологии с 2016 года. С 2019 года был запущен голосовой ассистент «Олег», которого сейчас заменяет мобильный секретарь. Он принимает звонки, делает расшифровку разговора и с учетом контекста с юмором отвечает спамерам и мошенникам. В «Т-Технологиях» сейчас развивают шесть ИИ-ассистентов под разные пользовательские задачи: от покупки билетов до консультаций по ценным бумагам.


Подробнее

Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.