Кирилл Петров, управляющий директор и сооснователь компании Just AI, составил обзор ключевых изменений и прогнозов развития рынка разговорного искусственного интеллекта (ИИ).
У рынка разговорного ИИ есть интересная особенность — в стабильное время компании занимаются внедрением ИИ-ботов в бизнес-процессы, экспериментируют с голосовыми ассистентами и автоматизируют новые каналы коммуникации, продаж и т.д. В условиях кризиса речевые технологии, которые лежат в основе таких решений, позволяют бизнесу экономить и решать насущные вопросы. Рынок разговорного ИИ, действительно, достаточно прочный и в целом пока не перестает расти. Но в 2022 году произошли события, которые вызвали серьезные потрясения даже в этой отрасли.
Санкции и ограничения нашли отражение в резком дефиците GPU-серверов (графических процессоров — прим. ред.), уходе зарубежных вендоров, а также глобальном снижении венчурных инвестиций. Это открыло возможности для российских поставщиков и заставило крупные компании всерьез задуматься о том, чем заменять иностранные решения.
Рынок разговорного ИИ всегда был связан с контакт-центрами (КЦ) и банковским сектором, потому что пользовательская поддержка — это одно из базовых применений речевых технологий. Санкции привели к блокировке многих банковских приложений, и у компаний ушло немало времени, чтобы пересмотреть стратегии и найти новые пути их распространения через альтернативные магазины приложений.
Для голосовых inapp-ассистентов (голосовых помощников, работающих внутри приложений — прим. ред.), которые находились в процессе внедрения, это было не самое лучшее время, ведь если приложение перестает работать на какое-то время, то первостепенной задачей банка становится закрытие основных клиентских потребностей, а голосовые ассистенты уходят на второй план. Некоторые компании рассматривают миграцию голосового ассистента из мобильного интерфейса в web.
Тем не менее те компании, чьи виртуальные помощники уже имели свою аудиторию, отмечают, что этот канал связи сохранял свою значимость для коммуникации клиента с банком и в кризисный период. Например, по статистике ВТБ, аудитория голосового ассистента «Лео» с начала 2022 года выросла в 2,3 раза, клиенты перевели голосом более 200 млн руб.
Коллеги из аналитической компании Frank RG проанализировали опыт 23 российских банков в пандемию и кризис 2022 года. По их данным, на колл-центры и чаты приходится 94% обращений клиентов, а доля вопросов, решенных во время первого обращения в службу поддержки, составляет более 80%. Руководители банковских контакт-центров отмечают, что именно роботизация и омниканальность являются основными приоритетами при повышении клиентской удовлетворенности.
Ситуация в мире внесла свои коррективы, и вместе с задачей по развитию дистанционных каналов связи компаниям необходимо решать проблему импортозамещения. Ведь уход ключевых компаний с этого рынка — Avaya и Cisco — не мог не отразиться на общей картине, но в то же время открыл возможности для российских поставщиков и целого ряда изменений, которые возникают в этой индустрии. Например, технология IVR (интерактивное голосовое меню — прим. ред.) зачастую является составной частью платформ для КЦ, и сегодня российские поставщики решений в области Conversational AI (разговорного ИИ — прим. ред.) активно предлагают компаниям переходить на свои решения. Во многих случаях это уже более продвинутые версии так называемых «умных IVR», когда вместо привычного нажатия на цифры на телефоне диалог осуществляется целиком голосом. Например, голосовой помощник общегородского контакт-центра Москвы на базе умного IVR обработал более 28 млн звонков за 2022 год. Время ожидания на линии удалось сократить в два раза.
Главный тренд 2022 года — мобильные секретари. Помимо «Олега» от «Тинькофф» и «Маши» от стартапа DeepVoice, собственные голосовые помощники появились и стали доступны всем пользователям у трех крупных сотовых операторов — «МегаФона», Теле2 и билайна. «МегаФон» запустил наиболее комплексную версию с гибридным синтезом и двумя голосами, полностью интегрировав его в приложение, в котором люди могут получать расшифровки звонков. Спустя три месяца после запуска «Агент Ева» успела принять более 17,7 млн «белых звонков» (звонки, исключающие спам, мошенников, рекламу — прим. ред.), а ее аудитория превысила 500 тыс. абонентов.
Секретари билайна и Теле2 тоже вышли в свет с набором интересных функций и разных персонажей: у Tele2 — два героя, у билайна — пять секретарей на выбор с разными голосами, включая Кроша из «Смешариков». Также операторы активно внедряют функцию защиты от спама, которая приносит им дополнительную прибыль, — спамеры тратят деньги на разговоры, которые в итоге обрабатывает бот. По оценкам Just AI, на конец года активная аудитория, использующая мобильных секретарей в России, составляет более 1,5 млн пользователей, и в зависимости от модели привлечения трафика может достигнуть от пяти до нескольких десятков миллионов в 2023 году.
Голосовые ассистенты и умные колонки остаются огромной и популярной нишей — около половины домохозяйств США имеют хотя бы одно умное устройство и активно им пользуются. Но при этом американский рынок близок к насыщению и растет с точки зрения устройств благодаря европейскому и азиатскому (в частности, индийскому) рынкам.
В этом году Google и Amazon признали, что не смогли решить ключевые вопросы, связанные с развитием экосистем разработки навыков внешними разработчиками. Навыки для ассистентов нелегко монетизировать, кроме того, серой зоной остается дистрибуция навыков: непонятно, как создателям навыков доносить свой продукт до конечной аудитории, как это происходит, например, в AppStore, где у разработчиков есть постоянные возможности находить и монетизировать свою аудиторию. Как следствие, Google закрывает Google Actions для своего ассистента, а Amazon сократил людей в отдельных командах — Alexa Auto, Alexa Skills Kit и других.
Рынок умных устройств в России активно растет, лидером по продажам остаются колонки с голосовым помощником — 4,3 млн девайсов было продано в 2022 году (в 2021-м — 2,5 млн). По нашим оценкам, общий объем рынка умных устройств в России в 2022 году составил около 23 млрд рублей.
Доля Яндекса в сегменте в 2022 году составила 70%. Набрав хороший опыт в производстве, команда Яндекса вышла на большие объемы по закупкам, поставкам и, наконец, продажам, добившись выхода в операционную прибыль направления устройств по итогам второго и третьего кварталов.
У «Сбера» самым массовым устройством по-прежнему является телеприставка SberBox, а из новинок этого года можно отметить целый ряд сервисов для ИИ: «Рерайтер», «Суммаризатор», «Молотилку», Kandinsky 2.0, RuGPT-3 и RuDall-e. Обе компании, Яндекс и «Сбер», делают также активную ставку на собственные модели смарт-ТВ со встроенными ассистентами.
VK (ранее Mail.ru Group — прим. ред.) тоже продолжает усиливать свои позиции на рынке. 1 декабря компания запустила в продажу умные колонки «Капсула Нео» в довольно бюджетном ценовом сегменте. И это вдобавок к осеннему релизу «Капсул» в двух цветах, новым устройствам Xiaomi с «Марусей» и множеству новых функций для умного дома.
Рынок разговорного ИИ в России всегда очень быстро откликался на тренды, возникающие в этой сфере в США, Европе, Китае, а иногда и опережал их — примером может быть «болталка» «Алисы» и развитие концепции голосового ассистента как персонажа со своим характером. Если внимательно смотреть на яркие инвестиционные сделки на рынке и профиль стартапов, можно увидеть, как те или иные тенденции возникают или усиливаются.
Одна из самых заметных в индустрии инвестиционных историй 2022 года — покупка Microsoft компании Nuance, производителя программного обеспечения, который занимается технологиями искусственного интеллекта, распознавания речи и изображений. По примерным оценкам, сумма сделки составляет $19,7 млрд. Это поможет Microsoft ускорить внедрение инноваций, а Nuance, в свою очередь, масштабировать свой успех в отрасли.
Нельзя не отметить растущую популярность компании OpenAI, которая уже зарекомендовала себя как ведущая исследовательская лаборатория ИИ в мире. Создание продвинутой языковой модели GPT-3 стало трамплином для разработки еще более амбициозных проектов в области языковых моделей. Последнее творение OpenAI — чат-бот ChatGPT, способный понимать и отвечать на запросы на естественном языке различными способами. В перспективе он вполне может составить серьезную конкуренцию поисковому сервису Google. Сумма последней крупной инвестиции составила $1 млрд, инвестором тоже стал Microsoft.
Более $50 млн OpenAI Startup Fund инвестировал в компанию Descript. Это платформа для редактирования аудио и видео с помощью ИИ. В ней используются технологии распознавания речи, синтеза и клонирования голоса, а также подавления шумов. Ожидается, что обновленный функционал сервиса упростит процесс создания контента для начинающих специалистов, а также расширит творческие возможности.
Несмотря на быстрое развитие рынка и технологий разговорного ИИ, инвестиционная активность в России в этой сфере в 2022-м была относительно невысокой — в первую очередь из-за меняющейся ситуации в области венчурных инвестиций в стране в целом. Если в 2019-2021 годах было сразу несколько сделок, в частности, покупка компании ЦРТ «Сбером», инвестиции со стороны МТС и Совкомбанка в компанию Just AI, то в 2022 году на фоне санкций и экономической нестабильности многие инвесторы поставили свою инвестиционную активность на паузу.
Однако общая динамика рынка и развитие искусственного интеллекта, в том числе в таких областях как машинный перевод, генеративный ИИ, клонирование и синтез речи, позволяют сделать вывод о дальнейшем росте сегмента разговорного ИИ и появлении новых проектов, компаний и инвестиционных сделок в этой в сфере в ближайшие годы как в России, так и во всем мире.
Ожидается, что в ближайшем будущем голосовые помощники станут более персонализированными и проактивными. Вместо того чтобы просто ждать команд пользователя, ассистенты будут собирать информацию для конкретного контекста и делать подходящие предложения самостоятельно. Все больше мобильных приложений будут оснащены голосовым управлением — это поможет расширить их возможности и избавить пользователей от сложной навигации.
Благодаря развитию технологий синтеза речи человеческий голос будет сложно отличить от искусственного, ведь роботизированная речь становится все более эмоциональной. Технология клонирования голоса станет незаменимым инструментом для рекламодателей, кинематографистов, разработчиков игр и других создателей контента.
Недавнее появление ChatGPT от OpenAI, анонс Google чат-бота с искусственным интеллектом под названием Bard, который будет напрямую конкурировать с ChatGPT, запуск новой поисковой системы Bing на базе ИИ и обновления браузера Edge компанией Microsoft, планы Яндекса по внедрению новой нейросети в свои сервисы дополнительно ускоряют прогресс в сфере разговорного ИИ. Его применения будут охватывать поиск, образование, генерацию текстов, редактуру, работу со стилями речи и многое другое.
Не может быть никаких сомнений в том, разговорный ИИ большими шагами проникает в нашу жизнь в той или иной форме. Чтобы эффективно использовать технологии искусственного интеллекта для взаимодействия со своими клиентами, бизнесу необходимо беспрерывно следить и адаптироваться к новым достижениям в этой области.
За новостями развития и применения искусственного интеллекта следите в Telegram-фиде и на ICT.Moscow
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.