Сервис распознавания речи
Система распознавания речи предназначена для преобразования разговорной речи в текст. Сервис дополнен нейросетевыми моделями отсеивания шумов, распознавания эмоций, оценки пола и возраста абонента.
Речь абонента поступает в сервер распознавания. Для обработки она разбивается на фреймы по 10 миллисекунд. Фреймы с шумом отсеиваются при помощи нейросети. Очищенная речь абонента поступает в акустическую модель, которая преобразует последовательность звуковых импульсов в фонемы. Поток фонем проходит через лингвистическую модель, и речь преобразуется в текст фразы. Для уточнения результатов распознавания используется дополнительная лингвистическая модель.
Для выявления и группировки похожих фраз из большого массива разговорных данных интегрирована технология кластерного анализа. Она автоматически структурирует и анализирует большие объемы речевых данных, определяя наиболее частые причины обращений и ответы клиентов операторам контакт-центров.
info@vsrobotics.ru
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.