В конце апреля подразделение «Сбера» SberDevices открыло бета-тестирование платформы Visper для создания виртуального ведущего, способного зачитывать текст, как живой диктор. «Сбер» занимается цифровыми аватарами на первый год: «робот присутствия» «Ника» появилась в 2018-м, телеведущая «Елена» — в 2019-м, патент на технологию создания человеческой мимики на основе текста был получен компанией в 2020-м. В прошлом году свою платформу с цифровыми ведущими представила Mail.ru Group.
На фоне развития умных помощников в этом прослеживается тенденция развития голосовых ассистентов за рамками подхода voice only, то есть не ограниченных только голосовым интерфейсом.
ICT.Moscow поговорил с ключевыми игроками этого рынка в России и зарубежными представителями отрасли, чтобы понять, что происходит с индустрией цифровых ассистентов сейчас и каковы ее главные тренды в ближайшей перспективе. Из мнений 17 экспертов складывается сложная картина этой отрасли.
Среди ее основных трендов: развитие мультимодальности умных помощников; экспериментирование с форматами устройств и механиками взаимодействия с пользователями; растущее ожидание безопасной и удобной голосовой коммерции; надежды и опасения, связанные с голосовой идентификацией пользователей; все более широкое использование умных помощников в бизнесе. Вот какие аспекты умных помощников ICT.Moscow обсудил с представителями этой индустрии:
В 2020 году мировой рынок умных колонок преодолел отметку в 150 млн проданных устройств, подсчитали в Strategy Analytics. При этом доля умных экранов достигла 26%. Согласно данным Just AI, к концу 2023 года в мире будет 640 млн умных колонок. Эксперты Juniper Research ожидают, что к 2024 году будет насчитываться 8,4 млрд устройств с голосовыми ассистентами.
Согласно подсчету Just AI, в 2020 году аудитория голосовых ассистентов в России составила 52 млн пользователей. Самые популярные помощники в стране — «Алиса» (45 млн пользователей), Google Ассистент (11 млн) и Siri (6 млн). Часть аудитории пользуется сразу несколькими решениями. Опрос Just AI среди пользователей смартфонов показал, что умными помощниками пользуются все больше: если в 2019 году 71% опрошенных когда-либо взаимодействовали с такими сервисами, то в 2020 году этот показатель достиг 77%. Ежедневно в России в 2020 году голосовыми ассистентами пользовались 32% респондентов против 29% в 2019 году.
Как пояснил ICT.Moscow управляющий директор Just AI Кирилл Петров, для умных помощников переломным стал именно 2020 год, а в 2021 году рост их популярности продолжится.
Спрос на умные колонки в России тоже растет. Продажи колонок с голосовым помощником за год выросли в семь раз. По оценкам «М.Видео-Эльдорадо», в январе-июле 2020 года абсолютное большинство продаж пришлось на устройства с «Алисой». В марте Яндекс объявил, что за три года с момента запуска было продано более 1,3 млн колонок с его голосовым ассистентом. Тем не менее умные колонки пока не стали главным каналом взаимодействия человека и умного помощника. В Mail.ru Group констатируют, что лидирующей категорией с голосовыми ассистентами являются смартфоны.
директор по продукту «Маруся» в Mail.ru Group
Про ограниченность исключительно голосового формата говорит и Павел Гвай, CEO и сооснователь инструмента для проектирования диалогов Fabble.io.
CEO & Co-Founder инструмента для проектирования диалогов Fabble.io
Обработка естественного языка (NLP) — четвертое по числу компаний в России направление работы в области искусственного интеллекта (ИИ): по оценке составителей «Карты искусственного интеллекта России» (по состоянию на 29 апреля 2021 года), в этой сфере работают 52 компании из примерно 480. В топ-15 компаний России, занимающихся NLP, вошли Яндекс, ЦРТ, ABBYY, Mail.ru Group, Just AI, «Тинькофф», «Сбер» и др. (список составлен авторами «Альманаха ИИ №2. AI Report – NLP» на основе опроса экспертов).
Как отмечает директор по продукту «Маруся» в Mail.ru Group Анатолий Кульбацкий, «ключевыми игроками на рынке ассистентов общего пользования являются экосистемы». Это, в первую очередь, Яндекс с «Алисой», Mail.ru Group с «Марусей» и «Сбер» с семейством виртуальных ассистентов «Салют». Вместе с разработкой голосовых помощников эти компании создали и собственные устройства — «Станцию» (Яндекс), «Капсулу» (Mail.ru Group) и «Портал» («Сбер»). Последнее является на данный момент единственным российским умным экраном, подобным Nest Hub от Google или Echo Show от Amazon.
Над своей парой «ассистент-колонка» работает и МТС. Прошлым летом устройство раздали для тестирования пользователям, но в начале 2021 года СМИ сообщали о том, что проект «забуксовал». Свой голосовой ассистент «Олег» есть у компании «Тинькофф»; его основной функционал строится вокруг управления финансами, но он также способен, например, отвечать на входящие телефонные звонки (при использовании «Тинькофф Мобайл»).
директор по продукту «Маруся» в Mail.ru Group
Один из трендов сейчас — это появление узкоспециализированных голосовых ассистентов, каждый из которых направлен на решение конкретных задач пользователя, согласен руководитель мобильного приложения «Моя Москва» Степан Митаки. Примером может служить «Олег», который позиционировался как «голосовой помощник в сфере финансовых и лайфстайл-услуг». Эксперты недавно обсуждали в Clubhouse, что со временем компании будут реже создавать собственных самостоятельных умных помощников и больше заниматься профильными навыками в рамках открытых платформ. Например, руководитель сервиса Яндекс.Диалоги Павел Капля отметил, что «у бизнесов не должно стоять задачи сделать своего помощника — нужно думать о том, как эффективно и лаконично заходить в другие ассистенты общего назначения».
Еще одним из трендов индустрии (который, однако, участники той дискуссии назвали спорным) является открытие платформ для создания сторонними разработчиками новых навыков умных помощников, иными словами — ориентирование на модель в чем-то схожую с принципом open source. По этой модели появляются, например, навыки «Алисы», смартапы «Сбера» (приложения, с помощью которых можно продвигать товары и услуги на умных устройствах со встроенным голосовым ассистентом семейства «Салют») и скиллы «Маруси». Эксперты видят в такой модели сходство с написанием приложений внутри App Store и Google Play и прогнозируют, что со временем это направление будет все больше набирать обороты, а механизмы создания навыков станут проще. Но при этом они не торопятся однозначно утверждать, что индустрия будет развиваться именно по этому сценарию.
Эксперты, с которыми ICT.Moscow обсудил тренды развития сферы цифровых ассистентов, не ожидают от 2021 года кардинальных изменений, но ждут появления новых механик взаимодействия пользователей с умными помощниками и предвидят эксперименты с цифровыми аватарами и различными устройствами.
CEO & Co-Founder инструмента для проектирования диалогов Fabble.io
Заведующий лабораторией нейронных систем и глубокого обучения МФТИ Михаил Бурцев отмечает, что помощники будут становиться кросс-платформенными, и напоминает, что уже сейчас «Алиса» есть в колонке, телевизоре и автомобиле. Об экспериментах говорит и генеральный директор ЦРТ Дмитрий Дырмовский. Он отмечает, что «банки, финансовые институты традиционно отдают предпочтение современным ИИ-решениям для улучшения пользовательского опыта, они уже убедились в их эффективности и продолжат эксперименты».
генеральный директор Группы компаний ЦРТ
Сооснователь и операционный директор Neuro.net Александр Кузнецов уверен, что «потенциал у голосовых помощников еще не исчерпан и тут точно есть куда расти». «Не исключено, что возникнут новые форматы, и предпосылки к этому уже появляются на рынке», – добавляет он.
эксперт в области разговорных интерфейсов и голосовых технологий
Потенциал формата voice only всегда будет ограничен кругом задач, не требующих визуального контакта, напоминает сооснователь Fabble.io Павел Гвай. «Формат voice first в этом отношении имеет практически безграничный потенциал, наследуя сильные стороны как графического, так и голосового интерфейса», — продолжает он. Хольгер Вайсс (Holger G. Weiss), глава German Autolabs, также указывает на ограниченность voice only помощников, особенно когда надо взаимодействовать со списками. «Поэтому мы убеждены, – говорит он, – что выигрышной будет комбинация [форматов] — по крайней мере, для более сложных сценариев использования. Умные колонки по-прежнему будут хороши для воспроизведения музыки и включения света».
CEO компании EORA
Управляющий директор Just AI Кирилл Петров напоминает, что в конце прошлого года в России стартовали продажи смарт-дисплеев. По его словам, «умные экраны дают большую выразительность и открывают новые возможности, например, видеошопинг». В то же время Роман Доронин из EORA не ожидает большого спроса на такие устройства и полагает, что умные колонки с экраном в 2021 году останутся «девайсами для ценителей». Технический директор SberDevices Денис Филиппов считает, что ассортимент устройств с виртуальными ассистентами в ближайшее время будет активно увеличиваться: любая домашняя техника от холодильника до телевизора — поверхность, где может жить ассистент.
управляющий директор и сооснователь Just AI
Игорь Калинин, основатель компании TWIN (создает платформу автоматизированных коммуникаций), убежден, что с точки зрения технологий переломный момент в сфере голосовых систем уже наступил, следующий шаг — масштабизация, в том числе и на российском рынке.
Созданием цифровых аватаров в «Сбере» вместе с другими структурами занимается SberDevices — то же подразделение, которое выпустило первый в России умный экран. Там отмечают, что аватар нужен для того, чтобы бизнес мог доставлять контент аудитории без поиска и привлечения живых спикеров, то есть быстрее и дешевле. Точно так же позиционировали своего виртуального ведущего в Mail.ru Group. В момент презентации сервиса в компании прогнозировали, что к 2022 году 79% интернет-трафика в России будут составлять онлайн-видео.
CTO SberDevices
В ходе беседы в Clubhouse с профильными экспертами CEO Fabble Павел Гвай говорил о возможностях мультимодальности и отметил, что, вероятно, «в будущем мы сможем не только услышать помощника, но и увидеть его аватар с мимикой».
Цифровыми аватарами занимаются и в еще одном подразделении «Сбера» — AR/VR Lab: в феврале был открыт бесплатный альфа-доступ к сервису, который создает лицевую анимацию 3D-персонажа по звуковому файлу с записью речи человека. На перспективность взаимопроникновения технологий дополненной и виртуальной реальности с умными помощниками указывает и Хольгер Вайсс, основатель и CEO немецкой компании German Autolabs, разрабатывающей голосовых ассистентов для сферы логистики.
основатель и CEO German Autolabs
Уже есть примеры, когда цифровые аватары применяются вместо ведущих на телевидении. Например, осенью прошлого года такую технологию начали использовать на корейском телеканале MBN. Журналисты считают, что виртуальный ведущий может быть особенно полезен при экстренном освещении чрезвычайных ситуаций в отсутствие нужного специалиста. Но замена ведущих или дикторов умными помощниками еще не везде воспринимается положительно: недавно столичный Дептранс в конкурсе на диктора Метрополитена получил заявки, поданные от имени «Алисы» и ассистентов семейства «Салют», но выбрал все-таки живых людей.
Александр Кузнецов из Neuro.net отмечает все большую доступность технологий — в том числе для среднего и малого бизнеса — и тоже говорит о тенденции внедрения умных помощников в пользовательские интерфейсы. Денис Филиппов из SberDevices подчеркивает, что технологии цифрового аватара способны существенно разнообразить рынок видеоконтента, снизив стоимость производства. Но вопрос с успешными бизнес-моделями таких решений остается открытым, поиски новых вариантов их применения продолжаются.
Разработчики voice tech спешат заверить, что умные помощники, выполняя часть функций людей, не заменят живых сотрудников.
сооснователь и операционный директор Neuro.net
В «МегаФоне» убеждены, что с развитием технологий появляются новые профессии. Например, в команде развития виртуального помощника «Елены» есть конфигураторы и дизайнеры диалогов, но пять лет назад подобных специальностей на российском рынке не было.
Даже если голосовые ассистенты не заменят людей, они, тем не менее, будут сильно влиять на человеческий труд. Аналитики Gartner в конце прошлого года включили в топ-10 стратегических прогнозов увеличение производительности труда благодаря речевым технологиям. По их оценкам, к 2025 году 75% всех разговоров на работе будут записываться и анализироваться, в том числе посредством умных колонок. Gartner также видит одним из глобальных технотрендов гиперавтоматизацию, которая включает применение ИИ и виртуальных помощников.
Эксперты сошлись во мнении, что цифровых ассистентов активнее всего внедряет банковская сфера. При этом кейсы использования голосовых помощников, чат-ботов и умных аватаров можно найти не только в банкинге, но и в медицине, клиентской поддержке, транспорте, городских сервисах, образовании, культуре и медиа.
заведующий лабораторией нейронных систем и глубокого обучения МФТИ
Сооснователь и операционный директор Neuro.net Александр Кузнецов называет самыми активными по внедрению голосовых ассистентов банковскую и финансовую отрасли, телеком. Он ожидает, что к ним добавятся крупные игроки из ритейла, e-commerce и сервисных услуг.
генеральный директор Группы компаний ЦРТ
Сооснователь Fabble.io Павел Гвай считает самыми перспективными банковский сектор, медицину и автомобили. По его словам, в медицине и банковском секторе приходится собирать много информации и отвечать на однотипные вопросы: как записаться к врачу, какие исследования необходимо сделать перед приемом. Но в части высококвалифицированных услуг, например, врачей и консультантов, цифровые ассистенты в ближайшее время вряд ли заменят, добавляет эксперт.
В Just AI не забывают, что умный помощник — изначально детище ИТ-компаний, и говорят, что для голосовых ассистентов в 2021 году локомотивом по-прежнему будут интернет-компании (Яндекс, Mail.ru), а также крупные банки и финансовые институты.
управляющий директор и сооснователь Just AI
Со временем боты появятся во всех B2C-отраслях, считает Игорь Калинин из компании TWIN. Единственная проблема — российский потребитель пока не привык коммуницировать с ботами.
основатель TWIN
Среди новых сценариев, набирающих популярность, — голосовой поиск товаров по электронному каталогу, делится управляющий директор Just AI Кирилл Петров. «Отчасти данный тренд объясняет тот факт, что в США более 45% пользователей хотели бы иметь возможность взаимодействовать с мобильными приложениями голосом, – поясняет он. – Кроме того, мы будем все чаще видеть умные устройства в коммерческих организациях, например, в номерах отелей».
Про то, что умные устройства выходят за пределы квартир, говорит и руководитель мобильного приложения «Моя Москва» Степан Митаки. По его словам, «на Западе теперь голосовых ассистентов можно встретить в гипермаркетах или в разных сервисных учреждениях. И люди не боятся говорить с ними».
Глава компании EORA Роман Доронин также обращает внимание на эффективность, которую показывают проекты, где совмещаются разные технологии, например обработка естественного языка и машинное зрение.
Другим примером совмещения технологий могут быть цифровые аватары, сочетающие речевые технологии с генерацией реалистичного видеоизображения. Они нацелены в первую очередь на отрасли, в которых применяется аудиовизуальный контент, например, СМИ и медиа в более широком смысле.
Совершение покупок с помощью голосового ассистента — один из базовых функционалов, которые анонсировались во время презентации и «Алисы», и «Салюта». Однако до сих пор коммерция не входит в перечень основных пользовательских сценариев взаимодействия с виртуальными помощниками. Опросы Just AI показывают, что в России голосовыми помощниками пользуются чаще всего для поиска в интернете, навигации, чтобы узнать прогноз погоды, позвонить, поставить будильник или включить музыку. Гендиректор ЦРТ Дмитрий Дырмовский констатирует, что пока большинство навыков голосовых ассистентов имеет явный развлекательный приоритет, а бизнес-ориентация только набирает обороты.
В 2018 году эксперты компании OC&C Strategy Consultants оптимистично предсказывали, что к 2022 году объем рынка голосовой коммерции в США достигнет отметки в $40 млрд и этот канал продаж перевернет ритейл. По их данным, 36% владельцев умных колонок уже использовали эти устройства для покупок (у других аналитиков этот показатель был ниже — 22% у Edison Research и 23% у Voicebot). Эксперты из Juniper Research в ноябре прошлого года прогнозировали, что в ближайшие пять лет количество покупок с помощью голоса на устройствах умного дома вырастет на 630% и около 20% от всего объема покупок придется на смарт-экраны и смарт-телевизоры. К 2025 году объем транзакций с помощью голоса на устройствах умного дома достигнет $164 млрд.
Роман Доронин из EORA согласен с тем, что 2021 год станет прорывным для коммерциализации голосовых ассистентов. По его словам, «тренд на это задает «Сбер» с экосистемой ассистентов «Салют» и возможностью интеграции оплаты в разные типы приложений».
директор по продукту «Маруся» в Mail.ru Group
При этом Анатолий Кульбацкий из Mail.ru Group обращает внимание на существующие ограничения для коммерциализации в России как цифрового контента, так и нецифровых товаров. Кульбацкий указывает на сравнительно небольшой рынок устройств для digital goods (около 1,5 млн девайсов в РФ) по сравнению с рынком смартфонов, ПК и ТВ. Поскольку «доминирующей категорией использования голосовых ассистентов является смартфон, то продажа digital goods через ассистентов попадает под регулирование продаж на платформах Apple и Google», подчеркивает он. С другой стороны, оплата с подтверждением голосом находится на ранней стадии, и у пользователей не сформирован паттерн «купить голосом». Но эксперт ожидает появления в этом году на рынке ряда новых и интересных решений по покупкам товаров, оплате услуг и платежам.
управляющий директор и сооснователь Just AI
Ожидания других собеседников ICT.Moscow более сдержанные. Например, эксперт в области разговорных интерфейсов и голосовых технологий Аркадий Сандлер (занимал позицию CEO в компании-разработчике чат-ботов «Наносемантика», курировал создание умной колонки и голосового помощника «Марвин» в МТС) считает, что мы не увидим бума голосовой коммерции в текущем году, хотя он и ожидает экспериментов в этой области.
А вот в ассистенты специального назначения создаются и будут создаваться для того, чтобы обеспечить какую-то бизнес-модель, оптимизировать бизнес-процесс и т.д. Собственно такие ассистенты и начали создаваться задолго до помощников общего назначения. Само существование ассистентов специального назначения — это доказательство экономической целесообразности.
эксперт в области разговорных интерфейсов и голосовых технологий
Сохранение конфиденциальности данных — основное ограничение для коммерциализации умных помощников, убежден сооснователь Neuro.net Александр Кузнецов. Он говорит, что участникам этого стремительно развивающегося рынка необходимо уделять большое внимание данному вопросу.
Денис Филиппов, технический директор SberDevices, указывает на то, что в настоящее время умные помощники практически не приносят прибыли.
CTO SberDevices
О сложностях другого типа коммерциализации — платы за отдельные навыки ассистентов, а не совершения покупок через него — рассуждает Никита Муренький, VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU. По его мнению, в России проблемы с коммерциализацией в целом такие же, как и во всем мире: «во-первых, это сложности с поиском нужных навыков в ассистентах, хотя платформы Amazon и Google делают многое, чтобы это изменить; во-вторых, кейсы применения либо имеют малую ценность, либо пользователь пока попросту не готов за них платить». Сегодня культура использования смарт-устройств в России и мире только формируется, подчеркивает эксперт.
VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU компании KODE
Еще один фактор, сдерживающий рост сегмента умных колонок и других устройств с умными помощниками — обеспеченность производителей электронными компонентами. На это обращает внимание представитель компании МТС. «Во всем мире сейчас наблюдается острый дефицит ИИ-чипов, при этом существует очень мало компаний, которые уже имеют готовые чипы и продукты на их основе, – говорит он. – По нашим оценкам, рынок ИИ-чипов будет расти в среднем на 25% ежегодно». Также собеседник ICT.Moscow добавил, что для решения этой проблемы компания инвестировала $10 млн в стартап – производителя ИИ-чипов Kneron.
Последние несколько лет умных помощников стали применять и для того, чтобы упростить получение различных социальных и иных услуг. Например, цифровой ассистент есть на бета-версии федерального портала госуслуг, умные чат-боты применяются в столичных сервисах.
сооснователь и операционный директор Neuro.net
В ЦРТ поступает все больше запросов на интеллектуальные диалоговые системы, которые становятся удобным коммуникатором, медиатором между городом и его жителями, рассказывает Дмитрий Дырмовский. В качестве примера он приводит созданного совместно с командой Московского метрополитена чат-бота «Александру», которая отвечает на 88% вопросов пассажиров без перевода на оператора. А заведующий лабораторией нейронных систем и глубокого обучения МФТИ Михаил Бурцев рассказывает о том, что в Татарстане на основе открытой библиотеки DeepPavlov разработали и внедрили «Лилию» — умного помощника по госуслугам. Она может отвечать на вопросы по COVID-19 и записать на вакцинацию, принимать показания счетчиков.
Один из самых частых вариантов внедрения технологий когнитивной автоматизации — создание чат-ботов по своим тематикам, что, собственно, и является разработкой специализированных виртуальных ассистентов, говорит Аркадий Сандлер. Основное направление работы государств в voice tech — внедрение ИИ на горячие линии, резюмирует Никита Муренький из TORTU, добавляя, что на уровне региональных МФЦ это уже происходит в России прямо сейчас.
VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU компании KODE
Представитель продукта «Общегородской контакт-центр» ДИТ Москвы Борис Маяцкий считает более перспективным для городских задач разработку отдельных решений с учетом мер информационной безопасности, хотя некоторые сервисы будут реализованы в навыках голосовых помощников, например, в «Алисе» или «Салюте». Руководитель мобильного приложения «Моя Москва» Степан Митаки выступает за комбинированный подход. Есть ситуации, в которых отдельное решение лучше справится с задачей пользователя и люди испытывают больший уровень доверия к нему. В каких-то ситуациях человеку можно помочь благодаря интеграции. Последнее актуально больше всего для получения справочной информации.
В «МегаФоне» видят высокий интерес к голосовым помощникам со стороны государства и говорят, что в пандемию он особенно возрос. В государственных структурах голосовые помощники чаще всего используются для оптимизации затрат на рутинные процессы: предоставление справочной информации, сбор данных о приборах учета и т.д., добавляет пресс-служба телеком-оператора.
Но есть и противоположная точка зрения: директор по продуктам ID R&D Олег Ковпак пока не видит большого интереса от государственных структур. «Несмотря на то, что подобные сервисы позволили бы автоматизировать титанические объемы обращений, поступающих от граждан, такие внедрения в России пока что единичны», — поясняет он свою позицию.
Применение цифровых ассистентов невозможно без надежных систем защиты. Индустрия сейчас изучает возможности и слабые места одного из вариантов такой защиты — голосовой биометрии (идентификации и аутентификации пользователей по голосу). В середине апреля стало известно о намерении государства перезапустить сбор биометрических данных граждан, включая образцы голоса, для Единой биометрической системы (ЕБС). Собеседники ICT.Moscow видят в голосовой биометрии ключ к новым бизнес-моделям для умных помощников, но осторожны в оценках сроков широкого внедрения технологии. Центральным остается вопрос безопасности, но также пока не ясны перспективы и возможности взаимодействия бизнеса с ЕБС.
директор по продуктам ID R&D
Аркадий Сандлер подчеркивает, что для использования голосовой биометрии в чувствительных операциях необходимо достаточное юридическое обеспечение: либо регулирование, либо понятное объяснение пользователю, что он действует на свой страх и риск.
Директор по продуктам ID R&D Олег Ковпак приводит перечень факторов, необходимых для точной голосовой аутентификации: она должна работать на достаточно коротких фразах, не должна зависеть от текста фразы и должна быть защищена от возможных атак (например, воспроизведения записанной на диктофон команды или синтезированного голоса).
По словам эксперта, такие технологии существуют уже сейчас. ЕБС пока не поддерживает подобные сценарии, хотя законодательные препятствия были устранены в конце прошлого года, напоминает Олег Ковпак. Кроме того, часть из этих сценариев могут быть завязаны на обработку голоса на устройстве, а не в облаке. «Я считаю, что повсеместное использование биометрии зависит не от количества образцов в базе ЕБС или «Сбера», а от наличия востребованных конечными клиентами сервисов, – говорит эксперт. – ЕБС и Сбер имеют отличную базу для предоставления биометрии как сервиса для других компаний, однако пока неясно, будут ли они раскрывать этот потенциал».
VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU компании KODE
Никита Муренький считает, что голосовую биометрию лучше сочетать с более привычными способами аутентификации. Он объясняет это тем, что «биометрическая точность голоса находится в довольно широком диапазоне 90-99%». К тому же использовать голос неудобно в людных и шумных местах, особенно если речь идет о конфиденциальных данных, не говоря уже о том, что голосовой слепок можно украсть, и это практикуется телефонными мошенниками уже сейчас.
В Mail.ru Group ICT.Moscow говорят, что будут рассматривать вариант с интеграцией с ЕБС, если это будет полезно для пользователей, но фокусируются на развитии собственных технологий и решений. Сооснователь Neuro.net Александр Кузнецов считает, что участие государства и крупных игроков может ускорить внедрение технологии, однако рассчитывает, что она начнет активно использоваться не ранее следующего года.
Столичный контакт-центр не планирует внедрять голосовую идентификацию в городских сервисах и выполнение платежей голосом. «В рамках городского контакт-центра заявители к этому пока не готовы, ровно как и не готова нормативно-правовая база, – поясняет представитель продукта «Общегородской контакт-центр» ДИТ Москвы Борис Маяцкий. – Вызвать платежный сервис голосом в рамках мобильного приложения, безусловно, простая функция, но идентификация и акцепт платежа пока будет проводится привычными методами».
руководитель мобильного приложения «Моя Москва»
Роман Доронин из EORA подчеркивает, что системы голосовой биометрии должны быть устойчивы к разным видам атак. «И эта сложность лежит не в количестве данных для обучения моделей, а в логике системы безопасности и механик валидации человека. Уже сейчас злоумышленники делают даже не дипфейк, а просто предзапись фраз, пока с тобой разговаривают, и могут их отдать на вход модели», — поясняет он. Генеральный директор группы компаний ЦРТ Дмитрий Дырмовский также видит перспективы в комбинации голосовой и лицевой биометрии. По его мнению, это будет не только удобно, но и безопасно.
Александр Кузнецов из Neuro.net, напротив, говорит, что с помощью так называемого «голосового отпечатка» можно эффективно бороться с фродом, спуфингом (подменой или синтезом голоса) и собирать базу голосов мошенников.
Идентификация по голосу — это путь не только к новым сервисам, но и улучшение существующих. Например, директор по продукту «Маруся» в Mail.ru Group Анатолий Кульбацкий считает, что есть ряд сценариев, когда важно определить, говорит ли с ассистентом ребенок или взрослый, чтобы сформировать правильный набор контента.
директор по продукту «Маруся» в Mail.ru Group
Биометрия будет развиваться и помогать различать пользователей для доступа к чувствительным данным — платежам, почте, переписке в социальных сетях, добавляет Кульбацкий. Это будет нормальное эволюционное развитие функциональности ассистента. Об умении умных помощников различать членов семьи и разграничивать права доступа, формируя релевантные предложения, говорит и гендиректор группы компаний ЦРТ Дмитрий Дырмовский. Но он подчеркивает, что главное — предоставление возможности совершать финансово значимые операции строго определенному кругу лиц.
Специалисты одной из российских ИТ-компаний в ходе дискуссии о voice tech в Clubhouse в феврале рассуждали о том, что отечественные голосовые системы во многом более развиты, чем зарубежные, за счет ограничений , с которыми сталкиваются разработчики в других странах. С таким утверждением частично согласны эксперты, с которыми обсудил этот вопрос ICT.Moscow, хотя полного единодушия по этому вопросу нет.
управляющий директор и сооснователь Just AI
Аркадий Сандлер отмечает, что его коллеги в других странах не ощущают ограничений при соблюдении очень предсказуемых законов. «Там, где отсутствует ясное регулирование (не обязательно запретительное, кстати), есть свобода трактовки, а традиция трактовок правоохранительными органами в РФ, мягко говоря, конъюнктурно мотивирована и склонна к предвзятости», – добавляет эксперт.
сооснователь и операционный директор Neuro.net
В апреле Европейская комиссия подготовила правила регулирования систем искусственного интеллекта. В частности, правила относят чат-ботов к категории «умеренного риска» и предписывают четко информировать пользователя, что тот взаимодействуют не с человеком. А системы удаленной биометрической идентификации отнесены к категории «высокого риска», что накладывает на них еще больше ограничений и требований.
В России довольно строгие ограничения, особенно в части биометрических персональных данных, причем последние изменения, подписанные президентом в конце прошлого года, ужесточают их еще сильнее, убежден Олег Ковпак из ID R&D.
Если тенденция по нормативному регулированию сохранится, то возможные опасения небезосновательны, причем может усложниться и коммерческая отрасль биометрии, и государственная в лице ЕБС, а это в конечном счете ударит по обычным пользователям.
директор по продуктам ID R&D
О необходимости доработки действующих норм говорит представитель МТС. В компании считают важным «внести точечные корректировки в законодательство о персональных данных, чтобы у компаний появилась регулируемая законодательством возможность обрабатывать предварительно обезличенные данные, в том числе накопленные государством», а также «на законодательном уровне упростить процедуру перевода персональных данных в деперсонализированную информацию и разрешить использование такой информации».
пресс-секретарь Группы МТС
Противоположной точки зрения придерживается Игорь Калинин из компании TWIN. Он считает, что в России боты пока минимально ограничиваются со стороны регуляторов — и это дает разработчикам большую свободу. Но отсутствие законодательства указывает и на отсутствие признания. По его мнению, голосовые технологии пока не кажутся правительству приоритетной сферой. Более того, чтобы построить сотрудничество с госкомпаниями, нужно преодолеть немало ограничений. Но в то же время он напомнил, что Министерство цифрового развития намерено предоставлять госуслуги в режиме диалога с умным помощником, и, по мнению эксперта, этот план может быть реализован в перспективе нескольких лет.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.