ГлавнаяЛента

Статьи

Умные помощники: обзор рынка, тренды и перспективы

18 мая 2021|
9699

В конце апреля подразделение «Сбера» SberDevices открыло бета-тестирование платформы Visper для создания виртуального ведущего, способного зачитывать текст, как живой диктор. «Сбер» занимается цифровыми аватарами на первый год: «робот присутствия» «Ника» появилась в 2018-м, телеведущая «Елена» — в 2019-м, патент на технологию создания человеческой мимики на основе текста был получен компанией в 2020-м. В прошлом году свою платформу с цифровыми ведущими представила Mail.ru Group.

На фоне развития умных помощников в этом прослеживается тенденция развития голосовых ассистентов за рамками подхода voice only, то есть не ограниченных только голосовым интерфейсом. 

ICT.Moscow поговорил с ключевыми игроками этого рынка в России и зарубежными представителями отрасли, чтобы понять, что происходит с индустрией цифровых ассистентов сейчас и каковы ее главные тренды в ближайшей перспективе. Из мнений 17 экспертов складывается сложная картина этой отрасли.

Среди ее основных трендов: развитие мультимодальности умных помощников; экспериментирование с форматами устройств и механиками взаимодействия с пользователями; растущее ожидание безопасной и удобной голосовой коммерции; надежды и опасения, связанные с голосовой идентификацией пользователей; все более широкое использование умных помощников в бизнесе. Вот какие аспекты умных помощников ICT.Moscow обсудил с представителями этой индустрии:


 

Как расширяется использование цифровых помощников

В 2020 году мировой рынок умных колонок преодолел отметку в 150 млн проданных устройств, подсчитали в Strategy Analytics. При этом доля умных экранов достигла 26%. Согласно данным Just AI, к концу 2023 года в мире будет 640 млн умных колонок. Эксперты Juniper Research ожидают, что к 2024 году будет насчитываться 8,4 млрд устройств с голосовыми ассистентами. 

Согласно подсчету Just AI, в 2020 году аудитория голосовых ассистентов в России составила 52 млн пользователей. Самые популярные помощники в стране — «Алиса» (45 млн пользователей), Google Ассистент (11 млн) и Siri (6 млн). Часть аудитории пользуется сразу несколькими решениями. Опрос Just AI среди пользователей смартфонов показал, что умными помощниками пользуются все больше: если в 2019 году 71% опрошенных когда-либо взаимодействовали с такими сервисами, то в 2020 году этот показатель достиг 77%. Ежедневно в России в 2020 году голосовыми ассистентами пользовались 32% респондентов против 29% в 2019 году.

Как пояснил ICT.Moscow управляющий директор Just AI Кирилл Петров, для умных помощников переломным стал именно 2020 год, а в 2021 году рост их популярности продолжится. 

Спрос на умные колонки в России тоже растет. Продажи колонок с голосовым помощником за год выросли в семь раз. По оценкам «М.Видео-Эльдорадо», в январе-июле 2020 года абсолютное большинство продаж пришлось на устройства с «Алисой». В марте Яндекс объявил, что за три года с момента запуска было продано более 1,3 млн колонок с его голосовым ассистентом. Тем не менее умные колонки пока не стали главным каналом взаимодействия человека и умного помощника. В Mail.ru Group констатируют, что лидирующей категорией с голосовыми ассистентами являются смартфоны. 

По нашим оценкам, от 90 до 95% пользователей голосовых ассистентов используют помощники на телефонах. Мы наблюдаем за этим трендом и ведем работу скорее в модели voice first (мультимодальный формат с возможностью взаимодействия голосом), нежели voice only. У формата voice only довольно много ограничений, особенно ярко они выражаются в сценариях выбора, поиска или изучения информации. 

Анатолий Кульбацкий

директор по продукту «Маруся» в Mail.ru Group

Про ограниченность исключительно голосового формата говорит и Павел Гвай, CEO и сооснователь инструмента для проектирования диалогов Fabble.io.

Voice only будет продолжать развиваться вместе с нейросетями и технологиями распознавания голоса. Однако потенциал этого формата всегда будет ограничен кругом задач, не требующих визуального контакта. Формат voice first в этом отношении имеет практически безграничный потенциал, наследуя сильные стороны как графического, так и голосового интерфейса.

Павел Гвай

CEO & Co-Founder инструмента для проектирования диалогов Fabble.io

Кто делает умных помощников в России

Обработка естественного языка (NLP) — четвертое по числу компаний в России направление работы в области искусственного интеллекта (ИИ): по оценке составителей «Карты искусственного интеллекта России» (по состоянию на 29 апреля 2021 года), в этой сфере работают 52 компании из примерно 480. В топ-15 компаний России, занимающихся NLP, вошли Яндекс, ЦРТ, ABBYY, Mail.ru Group, Just AI, «Тинькофф», «Сбер» и др. (список составлен авторами «Альманаха ИИ №2. AI Report – NLP» на основе опроса экспертов).

Как отмечает директор по продукту «Маруся» в Mail.ru Group Анатолий Кульбацкий, «ключевыми игроками на рынке ассистентов общего пользования являются экосистемы». Это, в первую очередь, Яндекс с «Алисой», Mail.ru Group с «Марусей» и «Сбер» с семейством виртуальных ассистентов «Салют». Вместе с разработкой голосовых помощников эти компании создали и собственные устройства — «Станцию» (Яндекс), «Капсулу» (Mail.ru Group) и «Портал» («Сбер»). Последнее является на данный момент единственным российским умным экраном, подобным Nest Hub от Google или Echo Show от Amazon. 

Над своей парой «ассистент-колонка» работает и МТС. Прошлым летом устройство раздали для тестирования пользователям, но в начале 2021 года СМИ сообщали о том, что проект «забуксовал». Свой голосовой ассистент «Олег» есть у компании «Тинькофф»; его основной функционал строится вокруг управления финансами, но он также способен, например, отвечать на входящие телефонные звонки (при использовании «Тинькофф Мобайл»). 

За прошлый год мы видим активность, инвестиции и развитие специализированных ассистентов для решения конкретных задач: банковских ассистентов, помощников по заказу услуг, ответов на вопросы пользователей. Я думаю, что в этом или следующем году окончательно завершится формирование игроков на рынке ассистентов общего пользования, и ассистенты для решения специализированных задач будут активнее приходить в ассистенты-платформы. Этот шаг позволит дотянуться до большой аудитории и предоставить им опыт взаимодействия со специализированным помощником.

Анатолий Кульбацкий

директор по продукту «Маруся» в Mail.ru Group

Один из трендов сейчас — это появление узкоспециализированных голосовых ассистентов, каждый из которых направлен на решение конкретных задач пользователя, согласен руководитель мобильного приложения «Моя Москва» Степан Митаки. Примером может служить «Олег», который позиционировался как «голосовой помощник в сфере финансовых и лайфстайл-услуг». Эксперты недавно обсуждали в Clubhouse, что со временем компании будут реже создавать собственных самостоятельных умных помощников и больше заниматься профильными навыками в рамках открытых платформ. Например, руководитель сервиса Яндекс.Диалоги Павел Капля отметил, что «у бизнесов не должно стоять задачи сделать своего помощника — нужно думать о том, как эффективно и лаконично заходить в другие ассистенты общего назначения»

Еще одним из трендов индустрии (который, однако, участники той дискуссии назвали спорным) является открытие платформ для создания сторонними разработчиками новых навыков умных помощников, иными словами — ориентирование на модель в чем-то схожую с принципом open source. По этой модели появляются, например, навыки «Алисы», смартапы «Сбера» (приложения, с помощью которых можно продвигать товары и услуги на умных устройствах со встроенным голосовым ассистентом семейства «Салют») и скиллы «Маруси». Эксперты видят в такой модели сходство с написанием приложений внутри App Store и Google Play и прогнозируют, что со временем это направление будет все больше набирать обороты, а механизмы создания навыков станут проще. Но при этом они не торопятся однозначно утверждать, что индустрия будет развиваться именно по этому сценарию.

2021 — год экспериментов

Эксперты, с которыми ICT.Moscow обсудил тренды развития сферы цифровых ассистентов, не ожидают от 2021 года кардинальных изменений, но ждут появления новых механик взаимодействия пользователей с умными помощниками и предвидят эксперименты с цифровыми аватарами и различными устройствами.

Не думаю, что 2021 год станет переломным в развитии voice tech. Пик ожиданий остался позади, сейчас компании скорее будут экспериментировать с экранами, аватарами, Emotional AI и носимыми устройствами. Эти эксперименты вполне смогут обеспечить развитие и изменение структуры рынка в следующие годы.

Павел Гвай

CEO & Co-Founder инструмента для проектирования диалогов Fabble.io

Заведующий лабораторией нейронных систем и глубокого обучения МФТИ Михаил Бурцев отмечает, что помощники будут становиться кросс-платформенными, и напоминает, что уже сейчас «Алиса» есть в колонке, телевизоре и автомобиле. Об экспериментах говорит и генеральный директор ЦРТ Дмитрий Дырмовский. Он отмечает, что «банки, финансовые институты традиционно отдают предпочтение современным ИИ-решениям для улучшения пользовательского опыта, они уже убедились в их эффективности и продолжат эксперименты»

Преимущество за форматом voice only сохранится, также мы будем наблюдать переход от voice only к комбинированным устройствам. Экспоненциального роста в 2021 года мы не прогнозируем, скорее он произойдет в перспективе трех лет.

Дмитрий Дырмовский

генеральный директор Группы компаний ЦРТ

Сооснователь и операционный директор Neuro.net Александр Кузнецов уверен, что «потенциал у голосовых помощников еще не исчерпан и тут точно есть куда расти». «Не исключено, что возникнут новые форматы, и предпосылки к этому уже появляются на рынке», – добавляет он. 

Все больше разных жизненных сценариев строится через голосовое взаимодействие, а это создает пространство для внедрения виртуальных ассистентов. Также как и возможности для омниканального взаимодействия с пользователями, переключаясь между устройствами и форматами (голос-текст), сохраняя контекст. 

Аркадий Сандлер

эксперт в области разговорных интерфейсов и голосовых технологий

Потенциал формата voice only всегда будет ограничен кругом задач, не требующих визуального контакта, напоминает сооснователь Fabble.io Павел Гвай. «Формат voice first в этом отношении имеет практически безграничный потенциал, наследуя сильные стороны как графического, так и голосового интерфейса», — продолжает он. Хольгер Вайсс (Holger G. Weiss), глава German Autolabs, также указывает на ограниченность voice only помощников, особенно когда надо взаимодействовать со списками. «Поэтому мы убеждены, – говорит он, – что выигрышной будет комбинация [форматов] по крайней мере, для более сложных сценариев использования. Умные колонки по-прежнему будут хороши для воспроизведения музыки и включения света»

Нас ждут большие изменения, ключевые из которых находятся в плоскости мультимодальности, когда взаимодействие с ассистентом происходит с использованием как голосовых элементов, так и визуальных. Что касается умных экранов, то большое распространение получат ассистенты, интегрированные в смарт-ТВ

Роман Доронин

CEO компании EORA

Управляющий директор Just AI Кирилл Петров напоминает, что в конце прошлого года в России стартовали продажи смарт-дисплеев. По его словам, «умные экраны дают большую выразительность и открывают новые возможности, например, видеошопинг». В то же время Роман Доронин из EORA не ожидает большого спроса на такие устройства и полагает, что умные колонки с экраном в 2021 году останутся «девайсами для ценителей». Технический директор SberDevices Денис Филиппов считает, что ассортимент устройств с виртуальными ассистентами в ближайшее время будет активно увеличиваться: любая домашняя техника от холодильника до телевизора — поверхность, где может жить ассистент. 

Архитектура смарт-дисплеев воплощает мультимодальный подход — синергию визуального, голосового и тач-интерфейсов. Тренд на мультимодальность будет усиливаться и постепенно переориентирует рынок с формата voice only на voice first, хотя в 2021 году концепция voice only по-прежнему будет основной. 

Кирилл Петров

управляющий директор и сооснователь Just AI

Игорь Калинин, основатель компании TWIN (создает платформу автоматизированных коммуникаций), убежден, что с точки зрения технологий переломный момент в сфере голосовых систем уже наступил, следующий шаг — масштабизация, в том числе и на российском рынке.

От колонок к аватарам

Созданием цифровых аватаров в «Сбере» вместе с другими структурами занимается SberDevices — то же подразделение, которое выпустило первый в России умный экран. Там отмечают, что аватар нужен для того, чтобы бизнес мог доставлять контент аудитории без поиска и привлечения живых спикеров, то есть быстрее и дешевле. Точно так же позиционировали своего виртуального ведущего в Mail.ru Group. В момент презентации сервиса в компании прогнозировали, что к 2022 году 79% интернет-трафика в России будут составлять онлайн-видео.

На наш взгляд, вряд ли в ближайшем будущем виртуальные личности смогут массово вытеснить живых людей из какой-либо сферы, но они способны дополнить интерфейсы взаимодействия клиента с информацией. 

В ходе беседы в Clubhouse с профильными экспертами CEO Fabble Павел Гвай говорил о возможностях мультимодальности и отметил, что, вероятно, «в будущем мы сможем не только услышать помощника, но и увидеть его аватар с мимикой».

Цифровыми аватарами занимаются и в еще одном подразделении «Сбера» — AR/VR Lab: в феврале был открыт бесплатный альфа-доступ к сервису, который создает лицевую анимацию 3D-персонажа по звуковому файлу с записью речи человека. На перспективность взаимопроникновения технологий дополненной и виртуальной реальности с умными помощниками указывает и Хольгер Вайсс, основатель и CEO немецкой компании German Autolabs, разрабатывающей голосовых ассистентов для сферы логистики.

У голосовых помощников появятся новые кейсы с AR и VR, например в областях обслуживания и производства.

Хольгер Вайсс

основатель и CEO German Autolabs

Уже есть примеры, когда цифровые аватары применяются вместо ведущих на телевидении. Например, осенью прошлого года такую технологию начали использовать на корейском телеканале MBN. Журналисты считают, что виртуальный ведущий может быть особенно полезен при экстренном освещении чрезвычайных ситуаций в отсутствие нужного специалиста. Но замена ведущих или дикторов умными помощниками еще не везде воспринимается положительно: недавно столичный Дептранс в конкурсе на диктора Метрополитена получил заявки, поданные от имени «Алисы» и ассистентов семейства «Салют», но выбрал все-таки живых людей. 

Александр Кузнецов из Neuro.net отмечает все большую доступность технологий — в том числе для среднего и малого бизнеса — и тоже говорит о тенденции внедрения умных помощников в пользовательские интерфейсы. Денис Филиппов из SberDevices подчеркивает, что технологии цифрового аватара способны существенно разнообразить рынок видеоконтента, снизив стоимость производства. Но вопрос с успешными бизнес-моделями таких решений остается открытым, поиски новых вариантов их применения продолжаются

Цифровые ассистенты как рабочая сила

Разработчики voice tech спешат заверить, что умные помощники, выполняя часть функций людей, не заменят живых сотрудников.

Мы категорически против идеи увольнения сотрудников и замены их на цифровых помощников. Наши технологии позволяют избавить человека от рутинных задач, монотонной работы, которая способна и самого человека превратить в робота. Наши цифровые агенты могут брать на себя примерно 80% стандартных кейсов.

Александр Кузнецов

сооснователь и операционный директор Neuro.net

В «МегаФоне» убеждены, что с развитием технологий появляются новые профессии. Например, в команде развития виртуального помощника «Елены» есть конфигураторы и дизайнеры диалогов, но пять лет назад подобных специальностей на российском рынке не было.

Даже если голосовые ассистенты не заменят людей, они, тем не менее, будут сильно влиять на человеческий труд. Аналитики Gartner в конце прошлого года включили в топ-10 стратегических прогнозов увеличение производительности труда благодаря речевым технологиям. По их оценкам, к 2025 году 75% всех разговоров на работе будут записываться и анализироваться, в том числе посредством умных колонок. Gartner также видит одним из глобальных технотрендов гиперавтоматизацию, которая включает применение ИИ и виртуальных помощников.

Сферы применения цифровых ассистентов

Эксперты сошлись во мнении, что цифровых ассистентов активнее всего внедряет банковская сфера. При этом кейсы использования голосовых помощников, чат-ботов и умных аватаров можно найти не только в банкинге, но и в медицине, клиентской поддержке, транспорте, городских сервисах, образовании, культуре и медиа.

Локомотивом останется финансовая отрасль, в первую очередь крупные банки. Основным применением будет оставаться автоматизация колл-центров. Общий же тренд на ближайшие несколько лет — внедрение помощников в сферах, где много взаимодействия с клиентами, например, в интернет-магазинах.

Михаил Бурцев

заведующий лабораторией нейронных систем и глубокого обучения МФТИ

Сооснователь и операционный директор Neuro.net Александр Кузнецов называет самыми активными по внедрению голосовых ассистентов банковскую и финансовую отрасли, телеком. Он ожидает, что к ним добавятся крупные игроки из ритейла, e-commerce и сервисных услуг. 

Прежде всего это банки и ритейл — и это очевидно: банки, финансовые институты традиционно отдают предпочтение современным ИИ-решениям для улучшения пользовательского опыта, они уже убедились в их эффективности и продолжат эксперименты. Ключевой драйвер роста — освобождение сотрудников от рутины, автоматизация стандартных запросов, поиск релевантного ответа пользователя в максимально сжатый срок, чтобы сберечь время клиента.

Дмитрий Дырмовский

генеральный директор Группы компаний ЦРТ

Сооснователь Fabble.io Павел Гвай считает самыми перспективными банковский сектор, медицину и автомобили. По его словам, в медицине и банковском секторе приходится собирать много информации и отвечать на однотипные вопросы: как записаться к врачу, какие исследования необходимо сделать перед приемом. Но в части высококвалифицированных услуг, например, врачей и консультантов, цифровые ассистенты в ближайшее время вряд ли заменят, добавляет эксперт.

В Just AI не забывают, что умный помощник — изначально детище ИТ-компаний, и говорят, что для голосовых ассистентов в 2021 году локомотивом по-прежнему будут  интернет-компании (Яндекс, Mail.ru), а также крупные банки и финансовые институты.

В сегменте среднего и малого бизнеса комплексные голосовые ассистенты станут популярными в 2022-2023 годах. Пока же наибольшей популярностью среди технологий разговорного ИИ среди этих компаний пользуются  относительно простые сценарии, такие как роботизированные обзвоны и информирование клиентов компаний.

Кирилл Петров

управляющий директор и сооснователь Just AI

Со временем боты появятся во всех B2C-отраслях, считает Игорь Калинин из компании TWIN. Единственная проблема — российский потребитель пока не привык коммуницировать с ботами. 

Это напоминает ситуацию с кассами самообслуживания — часто люди предпочитают постоять в очереди, только бы не пробивать товары самостоятельно. Они боятся с непривычки сделать что-то не так. То же касается и ботов: многим кажется, что диалог будет неудачным, а ИИ не решит проблему. При этом сегодня отличить виртуального специалиста от реального оператора становится все сложнее. И вполне вероятно, что вы общались с ботом, сами об этом не подозревая.

Игорь Калинин

основатель TWIN

Среди новых сценариев, набирающих популярность, — голосовой поиск товаров по электронному каталогу, делится управляющий директор Just AI Кирилл Петров. «Отчасти данный тренд объясняет тот факт, что в США более 45% пользователей хотели бы иметь возможность взаимодействовать с мобильными приложениями голосом, – поясняет он. – Кроме того, мы будем все чаще видеть умные устройства в коммерческих организациях, например, в номерах отелей». 

Про то, что умные устройства выходят за пределы квартир, говорит и руководитель мобильного приложения «Моя Москва» Степан Митаки. По его словам, «на Западе теперь голосовых ассистентов можно встретить в гипермаркетах или в разных сервисных учреждениях. И люди не боятся говорить с ними».

Глава компании EORA Роман Доронин также обращает внимание на эффективность, которую показывают проекты, где совмещаются разные технологии, например обработка естественного языка и машинное зрение. 

Другим примером совмещения технологий могут быть цифровые аватары, сочетающие речевые технологии с генерацией реалистичного видеоизображения. Они нацелены в первую очередь на отрасли, в которых применяется аудиовизуальный контент, например, СМИ и медиа в более широком смысле.

Рост голосовой коммерции

Совершение покупок с помощью голосового ассистента — один из базовых функционалов, которые анонсировались во время презентации и «Алисы», и «Салюта». Однако до сих пор коммерция не входит в перечень основных пользовательских сценариев взаимодействия с виртуальными помощниками. Опросы Just AI показывают, что в России голосовыми помощниками пользуются чаще всего для поиска в интернете, навигации, чтобы узнать прогноз погоды, позвонить, поставить будильник или включить музыку. Гендиректор ЦРТ Дмитрий Дырмовский констатирует, что пока большинство навыков голосовых ассистентов имеет явный развлекательный приоритет, а бизнес-ориентация только набирает обороты.

В 2018 году эксперты компании OC&C Strategy Consultants оптимистично предсказывали, что к 2022 году объем рынка голосовой коммерции в США достигнет отметки в $40 млрд и этот канал продаж перевернет ритейл. По их данным, 36% владельцев умных колонок уже использовали эти устройства для покупок (у других аналитиков этот показатель был ниже — 22% у Edison Research и 23% у Voicebot). Эксперты из Juniper Research в ноябре прошлого года прогнозировали, что в ближайшие пять лет количество покупок с помощью голоса на устройствах умного дома вырастет на 630% и около 20% от всего объема покупок придется на смарт-экраны и смарт-телевизоры. К 2025 году объем транзакций с помощью голоса на устройствах умного дома достигнет $164 млрд.

Роман Доронин из EORA согласен с тем, что 2021 год станет прорывным для коммерциализации голосовых ассистентов. По его словам, «тренд на это задает «Сбер» с экосистемой ассистентов «Салют» и возможностью интеграции оплаты в разные типы приложений».

Сейчас реализована монетизация музыки через подписку у всех ассистентов на рынке, следующий этап — развитие оплат digital goods (игры, аудиоконтент, другие сервисы по подписке) для умных устройств, а также non-digital для платформы в мобильных приложениях и внедрение ассистентов для упрощения сценариев пользователя, где необходим ввод данных, повторный заказ или заказ конкретного товара. 

Анатолий Кульбацкий

директор по продукту «Маруся» в Mail.ru Group

При этом Анатолий Кульбацкий из Mail.ru Group обращает внимание на существующие ограничения для коммерциализации в России как цифрового контента, так и нецифровых товаров. Кульбацкий указывает на сравнительно небольшой рынок устройств для digital goods (около 1,5 млн девайсов в РФ) по сравнению с рынком смартфонов, ПК и ТВ. Поскольку «доминирующей категорией использования голосовых ассистентов является смартфон, то продажа digital goods через ассистентов попадает под регулирование продаж на платформах Apple и Google», подчеркивает он. С другой стороны, оплата с подтверждением голосом находится на ранней стадии, и у пользователей не сформирован паттерн «купить голосом». Но эксперт ожидает появления в этом году на рынке ряда новых и интересных решений по покупкам товаров, оплате услуг и платежам.  

Мы полагаем, что прорывным станет 2022 год, но и этот будет важным для  кастомизированных голосовых ассистентов. Помимо банков, в текущем году подобные помощники будут появляться и у ритейлеров. Голосовая коммерция в России будет развиваться, повторяя мировые тенденции. Потребительский паттерн в плане голосового шоппинга во многом формируют умные колонки и экраны. 

Кирилл Петров

управляющий директор и сооснователь Just AI

Ожидания других собеседников ICT.Moscow более сдержанные. Например, эксперт в области разговорных интерфейсов и голосовых технологий Аркадий Сандлер (занимал позицию CEO в компании-разработчике чат-ботов «Наносемантика», курировал создание умной колонки и голосового помощника «Марвин» в МТС) считает, что мы не увидим бума голосовой коммерции в текущем году, хотя он и ожидает экспериментов в этой области.

В 2021, более четверти которого уже прошло, будет больше происходить процесс привыкания пользователей к продукту, к способу взаимодействия. Это будет приводить к наращиванию пользовательской базы, охвату классом продуктов. Что касается монетизации, не думаю, что в ассистентах общего назначения в текущем году начнется массированная монетизация, видимо, будут происходить какие-то эксперименты.

А вот в ассистенты специального назначения создаются и будут создаваться для того, чтобы обеспечить какую-то бизнес-модель, оптимизировать бизнес-процесс и т.д. Собственно такие ассистенты и начали создаваться задолго до помощников общего назначения. Само существование ассистентов специального назначения — это доказательство экономической целесообразности. 

Аркадий Сандлер

эксперт в области разговорных интерфейсов и голосовых технологий

Сохранение конфиденциальности данных — основное ограничение для коммерциализации умных помощников, убежден сооснователь Neuro.net Александр Кузнецов. Он говорит, что участникам этого стремительно развивающегося рынка необходимо уделять большое внимание данному вопросу.

Денис Филиппов, технический директор SberDevices, указывает на то, что в настоящее время умные помощники практически не приносят прибыли.

Пока виртуальные ассистенты практически не монетизируются, сейчас это больше похоже на инвестиции. Локальный рынок еще не достиг уровня зрелости, но уже сейчас компании постепенно открывают для себя коммерческие модели, в которых ассистенты выступают проводниками между клиентом и покупкой.

О сложностях другого типа коммерциализации — платы за отдельные навыки ассистентов, а не совершения покупок через него — рассуждает Никита Муренький, VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU. По его мнению, в России проблемы с коммерциализацией в целом такие же, как и во всем мире: «во-первых, это сложности с поиском нужных навыков в ассистентах, хотя платформы Amazon и Google делают многое, чтобы это изменить; во-вторых, кейсы применения либо имеют малую ценность, либо пользователь пока попросту не готов за них платить». Сегодня культура использования смарт-устройств в России и мире только формируется, подчеркивает эксперт. 

Пользователь, который купил устройство и регулярно оплачивает подписку на сервисы, считает, что уже заплатил за ассистента — для него это часть продукта. Он не воспринимает навыки ассистента как отдельный продукт и не понимает, зачем платить за что-то еще.

Никита Муренький

VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU компании KODE

Еще один фактор, сдерживающий рост сегмента умных колонок и других устройств с умными помощниками — обеспеченность производителей электронными компонентами. На это обращает внимание представитель компании МТС. «Во всем мире сейчас наблюдается острый дефицит ИИ-чипов, при этом существует очень мало компаний, которые уже имеют готовые чипы и продукты на их основе, – говорит он. – По нашим оценкам, рынок ИИ-чипов будет расти в среднем на 25% ежегодно». Также собеседник ICT.Moscow добавил, что для решения этой проблемы компания инвестировала $10 млн в стартап – производителя ИИ-чипов Kneron.

Умные помощники для умных городов

Последние несколько лет умных помощников стали применять и для того, чтобы упростить получение различных социальных и иных услуг. Например, цифровой ассистент есть на бета-версии федерального портала госуслуг, умные чат-боты применяются в столичных сервисах.

По нашему опыту, инициирует проекты Москва и область, а затем успешный опыт масштабируется в регионах. Например, показателен здесь наш совместный проект с Минздравом Московской области: в декабре мы запустили цифровых операторов для записи к врачу сначала на горячей линии губернатора МО, а затем кейс был внедрен еще в нескольких регионах. 

Александр Кузнецов

сооснователь и операционный директор Neuro.net

В ЦРТ поступает все больше запросов на интеллектуальные диалоговые системы, которые становятся удобным коммуникатором, медиатором между городом и его жителями, рассказывает Дмитрий Дырмовский. В качестве примера он приводит созданного совместно с командой Московского метрополитена чат-бота «Александру», которая отвечает на 88% вопросов пассажиров без перевода на оператора. А заведующий лабораторией нейронных систем и глубокого обучения МФТИ Михаил Бурцев рассказывает о том, что в Татарстане на основе открытой библиотеки DeepPavlov разработали и внедрили «Лилию» — умного помощника по госуслугам. Она может отвечать на вопросы по COVID-19 и записать на вакцинацию, принимать показания счетчиков.

Один из самых частых вариантов внедрения технологий когнитивной автоматизации — создание чат-ботов по своим тематикам, что, собственно, и является разработкой специализированных виртуальных ассистентов, говорит Аркадий Сандлер. Основное направление работы государств в voice tech — внедрение ИИ на горячие линии, резюмирует Никита Муренький из TORTU, добавляя, что на уровне региональных МФЦ это уже происходит в России прямо сейчас.

Большой плюс работы с голосовыми ассистентами в этой сфере кроется в типичном кейсе: пользователь госуслуг, как правило, знает, что ему нужно, но не знает, как сформулировать запрос на услугу. Это идеальный кейс для ИИ, а голос позволяет ускорить взаимодействие. Самый главный барьер для внедрения — неразвитость рынка и отсутствие опыта.

Никита Муренький

VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU компании KODE

Представитель продукта «Общегородской контакт-центр» ДИТ Москвы Борис Маяцкий считает более перспективным для городских задач разработку отдельных решений с учетом мер информационной безопасности, хотя некоторые сервисы будут реализованы в навыках голосовых помощников, например, в «Алисе» или «Салюте». Руководитель мобильного приложения «Моя Москва» Степан Митаки выступает за комбинированный подход. Есть ситуации, в которых отдельное решение лучше справится с задачей пользователя и люди испытывают больший уровень доверия к нему. В каких-то ситуациях человеку можно помочь благодаря интеграции. Последнее актуально больше всего для получения справочной информации. 

В «МегаФоне» видят высокий интерес к голосовым помощникам со стороны государства и говорят, что в пандемию он особенно возрос. В государственных структурах голосовые помощники чаще всего используются для оптимизации затрат на рутинные процессы: предоставление справочной информации, сбор данных о приборах учета и т.д., добавляет пресс-служба телеком-оператора.

Но есть и противоположная точка зрения: директор по продуктам ID R&D Олег Ковпак пока не видит большого интереса от государственных структур. «Несмотря на то, что подобные сервисы позволили бы автоматизировать титанические объемы обращений, поступающих от граждан, такие внедрения в России пока что единичны», — поясняет он свою позицию. 

Биометрия для работы с цифровыми ассистентами 

Применение цифровых ассистентов невозможно без надежных систем защиты. Индустрия сейчас изучает возможности и слабые места одного из вариантов такой защиты — голосовой биометрии (идентификации и аутентификации пользователей по голосу). В середине апреля стало известно о намерении государства перезапустить сбор биометрических данных граждан, включая образцы голоса, для Единой биометрической системы (ЕБС). Собеседники ICT.Moscow видят в голосовой биометрии ключ к новым бизнес-моделям для умных помощников, но осторожны в оценках сроков широкого внедрения технологии. Центральным остается вопрос безопасности, но также пока не ясны перспективы и возможности взаимодействия бизнеса с ЕБС.

Возможность персонализации сервисов и предоставления их только аутентифицированным пользователям даст возможность бизнесу быстрее масштабировать использование голосовых ассистентов, и это именно та область, где голосовая биометрия будет применяться повсеместно.

Олег Ковпак

директор по продуктам ID R&D

Аркадий Сандлер подчеркивает, что для использования голосовой биометрии в чувствительных операциях необходимо достаточное юридическое обеспечение: либо регулирование, либо понятное объяснение пользователю, что он действует на свой страх и риск.

Директор по продуктам ID R&D Олег Ковпак приводит перечень факторов, необходимых для точной голосовой аутентификации: она должна работать на достаточно коротких фразах, не должна зависеть от текста фразы и должна быть защищена от возможных атак (например, воспроизведения записанной на диктофон команды или синтезированного голоса). 

По словам эксперта, такие технологии существуют уже сейчас. ЕБС пока не поддерживает подобные сценарии, хотя законодательные препятствия были устранены в конце прошлого года, напоминает Олег Ковпак. Кроме того, часть из этих сценариев могут быть завязаны на обработку голоса на устройстве, а не в облаке. «Я считаю, что повсеместное использование биометрии зависит не от количества образцов в базе ЕБС или «Сбера», а от наличия востребованных конечными клиентами сервисов, – говорит эксперт. – ЕБС и Сбер имеют отличную базу для предоставления биометрии как сервиса для других компаний, однако пока неясно, будут ли они раскрывать этот потенциал».

Внедрение ЕБС, безусловно, будет способствовать распространению голосовой биометрии, особенно в банковской сфере. Голосовым слепком, оставленным в одном банке, смогут пользоваться другие банки. Это упростит доступ к банковским продуктам.

Никита Муренький

VUI Team Lead команды дизайна и разработки разговорных продуктов TORTU компании KODE

Никита Муренький считает, что голосовую биометрию лучше сочетать с более привычными способами аутентификации. Он объясняет это тем, что «биометрическая точность голоса находится в довольно широком диапазоне 90-99%». К тому же использовать голос неудобно в людных и шумных местах, особенно если речь идет о конфиденциальных данных, не говоря уже о том, что голосовой слепок можно украсть, и это практикуется телефонными мошенниками уже сейчас.

В Mail.ru Group ICT.Moscow говорят, что будут рассматривать вариант с интеграцией с ЕБС, если это будет полезно для пользователей, но фокусируются на развитии собственных технологий и решений. Сооснователь Neuro.net Александр Кузнецов считает, что участие государства и крупных игроков может ускорить внедрение технологии, однако рассчитывает, что она начнет активно использоваться не ранее следующего года.

Столичный контакт-центр не планирует внедрять голосовую идентификацию в городских сервисах и выполнение платежей голосом. «В рамках городского контакт-центра заявители к этому пока не готовы, ровно как и не готова нормативно-правовая база, – поясняет представитель продукта «Общегородской контакт-центр» ДИТ Москвы Борис Маяцкий. – Вызвать платежный сервис голосом в рамках мобильного приложения, безусловно, простая функция, но идентификация и акцепт платежа пока будет проводится привычными методами».

Голосовая биометрия — очень интересная и перспективная технология, в сторону которой мы смотрим, но пока она еще недостаточно проработана. Например, не совсем понятно, какой уровень безопасности она может предоставить. Особенно актуально это с ростом технологий дипфейков и синтеза голоса. Мы изучаем и тестируем эту технологию, но до полноценного применения необходимо пройти еще большой путь.

Степан Митаки

руководитель мобильного приложения «Моя Москва»

Роман Доронин из EORA подчеркивает, что системы голосовой биометрии должны быть устойчивы к разным видам атак. «И эта сложность лежит не в количестве данных для обучения моделей, а в логике системы безопасности и механик валидации человека. Уже сейчас злоумышленники делают даже не дипфейк, а просто предзапись фраз, пока с тобой разговаривают, и могут их отдать на вход модели», — поясняет он. Генеральный директор группы компаний ЦРТ Дмитрий Дырмовский также видит перспективы в комбинации голосовой и лицевой биометрии. По его мнению, это будет не только удобно, но и безопасно.

Александр Кузнецов из Neuro.net, напротив, говорит, что с помощью так называемого «голосового отпечатка» можно эффективно бороться с фродом, спуфингом (подменой или синтезом голоса) и собирать базу голосов мошенников.

Идентификация по голосу — это путь не только к новым сервисам, но и улучшение существующих. Например, директор по продукту «Маруся» в Mail.ru Group Анатолий Кульбацкий считает, что есть ряд сценариев, когда важно определить, говорит ли с ассистентом ребенок или взрослый, чтобы сформировать правильный набор контента.

Мы знаем, что домашним устройством нередко пользуются несколько членов семьи, а иногда и гости. Внедрение биометрии должно коснуться персонализации контента. Пользователь сможет слушать свою музыку, возвращаться к месту игры, где остановился он сам, а не родственник.

Анатолий Кульбацкий

директор по продукту «Маруся» в Mail.ru Group

Биометрия будет развиваться и помогать различать пользователей для доступа к чувствительным данным — платежам, почте, переписке в социальных сетях, добавляет Кульбацкий. Это будет нормальное эволюционное развитие функциональности ассистента. Об умении умных помощников различать членов семьи и разграничивать права доступа, формируя релевантные предложения, говорит и гендиректор группы компаний ЦРТ Дмитрий Дырмовский. Но он подчеркивает, что главное — предоставление возможности совершать финансово значимые операции строго определенному кругу лиц.

Правовое поле для умных помощников

Специалисты одной из российских ИТ-компаний в ходе дискуссии о voice tech в Clubhouse в феврале рассуждали о том, что отечественные голосовые системы во многом более развиты, чем зарубежные, за счет ограничений , с которыми сталкиваются разработчики в других странах. С таким утверждением частично согласны эксперты, с которыми обсудил этот вопрос ICT.Moscow, хотя полного единодушия по этому вопросу нет.

Сегодня в России немного проще работать с персональными данными, чем в Европе, однако мы понимаем, что регулирование будет появляться. Хорошо это или плохо, зависит от того, как будет это регулирование вводиться, насколько учитывать реальные сценарии и интересы всех заинтересованных сторон, в том числе бизнеса.

Кирилл Петров

управляющий директор и сооснователь Just AI

Аркадий Сандлер отмечает, что его коллеги в других странах не ощущают ограничений при соблюдении очень предсказуемых законов. «Там, где отсутствует ясное регулирование (не обязательно запретительное, кстати), есть свобода трактовки, а традиция трактовок правоохранительными органами в РФ, мягко говоря, конъюнктурно мотивирована и склонна к предвзятости», – добавляет эксперт.

В Европе, где есть GDPR, и в США (Калифорнии) требования намного жестче, это мы знаем в том числе по своим международным проектам. Но и при работе в России у нас все равно возникает много вопросов относительно нормативного регулирования. Например, все компании-пользователи нашего сервиса должны получать согласие на рекламные звонки у своих клиентов, а при использовании нашего сервиса в облаке — еще и согласие на передачу обезличенных персональных данных своих клиентов нам. Хотя по факту мы к этим данным доступа не имеем, но они временно хранятся в наших облачных хранилищах.

Александр Кузнецов

сооснователь и операционный директор Neuro.net

В апреле Европейская комиссия подготовила правила регулирования систем искусственного интеллекта. В частности, правила относят чат-ботов к категории «умеренного риска» и предписывают четко информировать пользователя, что тот взаимодействуют не с человеком. А системы удаленной биометрической идентификации отнесены к категории «высокого риска», что накладывает на них еще больше ограничений и требований.

В России довольно строгие ограничения, особенно в части биометрических персональных данных, причем последние изменения, подписанные президентом в конце прошлого года, ужесточают их еще сильнее, убежден Олег Ковпак из ID R&D. 

На мой взгляд, это никак не улучшает возможности бизнеса по применению биометрии, особенно в и так зарегулированных секторах, таких как, банковский. Обеспечение информационной безопасности для работы с биометрией ставит их на грань экономической целесообразности, а где-то делает попросту технически невыполнимыми, например, из-за отсутствия средств криптографической защиты нужного класса на целевых платформах или устройствах.

Если тенденция по нормативному регулированию сохранится, то возможные опасения небезосновательны, причем может усложниться и коммерческая отрасль биометрии, и государственная в лице ЕБС, а это в конечном счете ударит по обычным пользователям.

Олег Ковпак

директор по продуктам ID R&D

О необходимости доработки действующих норм говорит представитель МТС. В компании считают важным «внести точечные корректировки в законодательство о персональных данных, чтобы у компаний появилась регулируемая законодательством возможность обрабатывать предварительно обезличенные данные, в том числе накопленные государством», а также «на законодательном уровне упростить процедуру перевода персональных данных в деперсонализированную информацию и разрешить использование такой информации».

Для успешного развития рынка умных помощников на основе технологий ИИ требуется увеличение объема доступных качественных данных и создание благоприятных условий для их использования.

Алексей Меркутов

пресс-секретарь Группы МТС

Противоположной точки зрения придерживается Игорь Калинин из компании TWIN. Он считает, что в России боты пока минимально ограничиваются со стороны регуляторов — и это дает разработчикам большую свободу. Но отсутствие законодательства указывает и на отсутствие признания. По его мнению, голосовые технологии пока не кажутся правительству приоритетной сферой. Более того, чтобы построить сотрудничество с госкомпаниями, нужно преодолеть немало ограничений. Но в то же время он напомнил, что Министерство цифрового развития намерено предоставлять госуслуги в режиме диалога с умным помощником, и, по мнению эксперта, этот план может быть реализован в перспективе нескольких лет.

Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.


Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0