ГлавнаяЛента

РБК

«Яндекс» представил нейросетевую технологию для распознавания голосовых команд в сложных условиях

30 июля, 12:25|
171

Технология применяется в умных колонках и ТВ-станциях компании с голосовым помощником «Алиса». Основным элементом системы выступает механизм Attention, позволяющий анализировать сразу две аудиодорожки: одну обработанную алгоритмом эхоподавления, вторую — алгоритмом шумоподавления.

После анализа нейросеть определяет дорожку, где речь была распознана наиболее четко. Это предотвращает возможные артефакты, возникающие при стандартном шумоподавлении, обеспечивая стабильное функционирование даже в зашумленных помещениях.

Специалисты «Яндекса» подчеркнули, что традиционные устройства и виртуальные помощники часто применяют эхоподавление для выделения речи на музыкальном фоне, тогда как шумоподавляющие фильтры, снижающие посторонний шум, одновременно ухудшают качество восприятия человеческой речи.

По словам разработчиков, до появления нового решения не было универсального метода, эффективно работающего как в лабораторной среде, так и в повседневных условиях эксплуатации.

Подробнее

Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.