Сотрудники и студенты кафедры криптологии и кибербезопасности НИЯУ МИФИ представили систему для распознавания голосовых дипфейков с помощью нейросети. Сгенерированные аудиозаписи выявляются с помощью анализа кепстральных коэффициентов — математических характеристик аудиосигналов. Нейросеть обучена больше чем на 200 тыс. записей голосов — подлинных и сгенерированных.
Разработчики планируют создать облачный сервис для быстрого подключения функции распознавания дипфейков к любой публичной или коммерческой системе, например к колл-центру или мессенджеру. Ученые также хотят открыть лабораторию для совершенствования нейросети. Утверждается, что решением заинтересовались ряд компаний, в том числе Т-Банк и «Информзащита».
Ученые НИЯУ МИФИ разрабатывают «Сипуху» с 2022 года. Изначально цель проекта была академической, но с развитием технологии генерации голоса у разработки появились перспективы прикладного использования. Например, для распознавания мошенничества. На первом этапе «Сипуху» поддержал Фонд содействия инновациям.
По данным BI.ZONE, в 2025 году на дипфейки приходится 3–5% всех мошенничеств в России. Ранее показатель не превышал десятых долей процента.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.