ГлавнаяЛента

Статьи

Куда движутся российские экосистемы

5 декабря 2024, 13:00|
5570

ICT.Moscow представляет обзор текущих особенностей в подходах к развитию и применению искусственного интеллекта российскими цифровыми экосистемами — компаниями «Яндекс», «Сбер», VK, МТС и Т-Банк.

В ноябре 2024 года Центр искусственного интеллекта МТС (MTS AI) представил собственную оценку российского рынка продуктов для бизнеса, основанных на больших языковых моделях (LLM), в 35 млрд руб. Это лишь часть всего национального рынка ИИ, который по итогам прошлого года оценивался правительством почти в 650 млрд руб. Основными отечественными акторами в области искусственного интеллекта, скорее всего, можно признать российские цифровые экосистемы, которые нередко называют «бигтехами». Четыре года назад ICT.Moscow на основе открытых источников детально изучил процессы развития таких компаний и отдельно рассмотрел применение ими искусственного интеллекта, но за минувшие годы их ассоциированность с ИИ существенно возросла.

Бурное становление экосистем пришлось преимущественно на период пандемии. Затем, на фоне глобальных пертурбаций, в их развитии наступило некоторое затишье. Хотя это не был период полного бездействия и экосистемы продолжали формировать свои портфели, в некотором смысле компании заняли более выжидательную позицию, чтобы адаптироваться к новой реальности. И наконец, 2024 год стал моментом, когда информационная повестка стабилизировалась и установились векторы развития компаний, благодаря чему стало возможным через анализ их присутствия в СМИ оценить дальнейшие направления эволюции.

Руководствуясь медийной активностью в области ИИ экосистемных компаний, ICT.Moscow отобрал «Яндекс», «Сбер», VK, МТС и Т-Банк, проанализировал их особенности. Основным источником данных послужил архив новостной ленты проекта «База знаний AI», а также другие источники информации за период с января 2023 года по декабрь 2024 года. Сообщения с упоминанием рассматриваемых компаний. Эти данные были размечены с распределением инфоповодов по категориям. Действия экосистем в области искусственного интеллекта анализировались по двум уровням. Первый — ресурсный уровень, он объединяет собственные разработки компаний. Это модели и нейросети, отдельные ИИ-сервисы, открытые разработки и ресурсы, применимые для создания и использования ИИ (датасеты, библиотеки, бенчмарки, методы, фреймворки, исходный код отдельных решений, сервисы для ML-разработки), а также инфраструктура в виде облачных сервисов. В общей сложности было отобрано 126 разработок. Второй — операционный уровень, он показывает многообразие практик применения ИИ-разработок в собственных продуктах экосистем, опыт сотрудничества в части искусственного интеллекта с другими организациями, а также примеры использования сторонними компаниями экосистемных ИИ-решений.

В дополнение к обзору отдельно приводятся мнения экспертов, которых ICT.Moscow пригласил к обсуждению подходов российских экосистем к искусственному интеллекту. Это представители профильных структур МФТИ, МГУ им. М.В. Ломоносова, ИТМО, а также компании Just AI.

Примечание: в обзор могли не войти отдельные разработки или проекты изучаемых компаний, если за выбранный период они ни разу не упоминались в новостной ленте «Базы знаний AI» (например, потому что были запущены ранее). Также, поскольку анализировалась информационная активность, прямое количественное сравнение компаний между собой может быть не вполне корректным.


Создание моделей и новых продуктов

У каждой из рассматриваемых экосистем разный характер, обусловленный бэкграундом компании и фокусом основного бизнеса. То, как компании привыкли продавать свои продукты, пока влияет и на подходы к разработке и внедрению искусственного интеллекта. Данные, которыми они изначально располагают или к которым могут получить доступ, — еще одна причина отличий.

При этом почти все экосистемы говорят похожие слова о том, насколько для них важен искусственный интеллект, и в их структуре есть подразделения (иногда несколько), прицельно ведущие разработки в этой области. А вот оценку вклада ИИ в выручку приводил только «Сбер», правда, не раскрывая деталей таких вычислений. «Яндекс» же лишь признавался, что «монетизационный потенциал» генеративных технологий в поиске «крайне незначительный» в сравнении с затрачиваемыми на него ресурсами.

Содержание раздела

«Яндекс»

«Сбер»

VK

МТС

Т-Банк


«Яндекс»

Компания занимается практически всем спектром рассматриваемых в рамках этого обзора работ, связанных с ИИ: создает модели и обучает нейросети, запускает на их основе отдельные ИИ-сервисы, которые не могли бы функционировать без искусственного интеллекта, предлагает разработчикам открытые решения и платные инструменты на своей инфраструктуре.

Из анализа инфополя с января 2023 года по сентябрь 2024 года следует, что флагманскими проектами «Яндекса» в области искусственного интеллекта, несомненно, являются собственные генеративные нейросети YandexGPT и YandexART. За период наблюдений их различные версии (YandexGPT 2, YandexGPT 3 Lite, YandexGPT 3 Pro, YandexART, YandexART 1.3) упоминались многократно. Компания позиционирует их как фундаментальные модели. В связи с этим «Яндекс» зарегистрировал соответствующую торговую марку — Yandex Foundation Models. В июне 2024 года появилась информация о ведении разработки мультимодальной модели SpeechGPT.

Периодически компания рассказывает о разработанных ею моделях, заточенных под конкретные узкие задачи. К ним можно отнести такие решения, как ИИ-модель для распознавания эмоций человека по голосу, нейросеть для прогнозирования на два года вперед климатического феномена Эль-Ниньо, а также нейросеть для исследования планктона в водоемах.

Но основной упор в ИИ компания делает на ресурсо- и наукоемких разработках. На странице с вакансиями YandexGPT называется «ключевым проектом для «Яндекса» и отмечается, что «компания сильно вкладывается в исследовательскую часть, а ее результаты быстро превращаются в продукты». Нацеленность на быстрое внедрение разработок видна на примере таких решений, как «Нейро» и «Шедеврум», которые были анонсированы одновременно с нейросетями, на которых они построены. Другой пример — голосовой ассистент «Алиса», который регулярно получает обновления по мере развития новых моделей.

Помимо массовых продуктов, сотрудники компании занимаются и узкоспециализированными проектами. Научные разработки тоже становятся доступными пользователям в виде отдельных продуктов, например ИИ-сервис для прогнозирования распространения вулканического пепла или поиск по архивам.

Обращает на себя внимание анонс сервиса федеративного машинного обучения, который позволяет реализовывать совместные проекты без необходимости партнерам передавать «Яндексу» свои датасеты. Инструмент был опробован вместе с Институтом системного программирования им. В.П. Иванникова РАН и Сеченовским университетом. Во взаимодействии экосистемы с другими организациями — преимущественно научными — появляются такие проекты, как нейросеть для прогнозирования Эль-Ниньо (вместе с НИУ ВШЭ) или нейросеть для обнаружения на УЗИ симптомов врожденного заболевания у детей Spina Bifida (совместно с НМИЦ АГП им. В.И. Кулакова и фондом «Спина бифида»). Еще одним примером может служить нейросеть для обработки данных с фотоловушек, применяемая для изучения снежных барсов в Сайлюгемском национальном парке.

Отдельно обращает на себя внимание продукт с искусственным интеллектом для разработчиков — Yandex Code Assistant. На профессиональную аудиторию рассчитаны и различные связанные с ИИ наработки компании, выложенные в открытый доступ. В 2023 году компания опубликовала датасет отзывов об организациях, опубликованных на «Яндекс Картах» (Geo Reviews Dataset), исходный код платформы для хранения и обработки данных YTsaurus, применяемой в том числе в машинном обучении. В 2024 году «Яндекс» выложил в Open Source алгоритм для ускорения процесса обучения больших языковых моделей YaFSDP, методы сжатия больших языковых моделей AQLM + PV-tuning. Помимо этого, в сентябре была представлена демоверсия SourceCraft — платформы для разработки на базе нейросетей и на облачной платформе Yandex Cloud.

В медиапространстве также упоминалась представленная еще в 2020 году среда для ML-разработки полного цикла Yandex DataSphere — еще одно решение для разработчиков, но проприетарное и платное, получившее обновление в 2023 году. К заметным инфраструктурным проектам компании можно отнести три суперкомпьютера — «Червоненкис», «Галушкин» и «Ляпунов».

«Сбер»

Эта компания прошла большой путь в области ИИ. В 2020 году «Сбер» был заметен только в сотрудничествах, а также в крупном инфраструктурном проекте суперкомпьютера Christofari. У компании тогда еще даже не было своего голосового ассистента. Сейчас же «Сбер» видит в искусственном интеллекте как одну из своих целей, так и новый источник дохода, о чем говорится в представленной в конце 2023 года обновленной стратегии компании до 2026 года. ИИ стал одним из лейтмотивов и заявлений топ-менеджемента, и пресс-релизов организации.

Весной 2023 года (за три недели до презентации YandexGPT «Яндексом») «Сбер» представил свою большую языковую модель — GigaChat, сразу объявив, что нейросеть уже активно внедряется в продукты и сервисы компании. Так же, как и у «Яндекса», у «Сбера» есть собственная генеративная нейросеть для создания изображений — Kandinsky. Именно на эти модели приходится наибольшая доля всех упоминаний компании в контексте ИИ за рассматриваемый период.

В числе других собственных моделей «Сбера» — GigaAM для распознавания речи, CLaMP и SymFormer для генерации музыки, MiVOLO для определения пола и возраста человека по фотографии. Для части из них представлен открытый исходный код. В открытом доступе размещена и нейросетевая модель, которая лежит в основе сервиса GigaChat — ruGPT-3.5 13B, а также многоязычная модель mGPT 13B.

Эти и другие модели компания использует в различных ИИ-сервисах, начиная с голосового ассистента «Салют». Многие из таких решений реализованы в виде узкопрофильного помощника, в частности это юридический ассистент GigaLegal на базе GigaChat, ассистент разработчика GigaCode, «Ассистент преподавателя» для образовательной сферы. Анонсировано создание мультимодального медицинского диагностического ассистента GigaPevt. Помимо этого, у «Сбера» есть ряд платформ и приложений, например SaluteSpeech для синтеза и распознавания речи, Layer — для распознавания объектов в кадре. Графовая платформа «Сбера» позволяет обрабатывать массивы данных, а Sber Process Mining — анализировать бизнес-процессы.

Из рассматриваемых пяти экосистемных компаний только «Сбер» рассказывает об ИИ-сервисах, созданных в рамках сотрудничества с другими организациями. Это такие решения, как ИИ-сервис для оценки тяжести поражения при ишемической болезни сердца; ИИ-помощник, подбирающий замену подсанкционным комплектующим, которых не найти в России; ИИ-алгоритм для ускорения создания молекул перспективных лекарственных препаратов; модели глубокого обучения для прогнозирования засухи по климатическим данным; ИИ-алгоритм для раннего выявления признаков эпилептических приступов; система управления роботом-манипулятором на основе LLM.

В контексте импортозамещения «Сбер» пытается быть универсальным решением для экспертов, создающих ИИ в России. Список заметных, открытых и доступных профессиональному сообществу разработок «Сбера» включает в себя модель ruRoBERTa, фреймворк RePlay, датасет для распознавания русского жестового языка, метод оптимизации моделей-трансформеров, а также библиотеку для автозаполнения данных и считывания кодов SaluteVision Mobile SDK. Выложены в Open Source датасеты EasyPortrait для анализа лиц, библиотеки Py-Boost для ускорения разработки моделей машинного обучения и Sim4Rec для моделирования реакции пользователя на предложения рекомендательных систем. Разработчикам доступен фреймворк для федеративного обучения Stalactite, созданный «Сбером» совместно с ИТМО в рамках федерального проекта.

Помимо этого, часть моделей также доступна по принципу Open Source. Например, в открытый доступ выложен класс моделей GigaAM для обработки речи, включая модель GigaAM-Emo для определения эмоций, которую дообучали на датасете Dusha, также доступном разработчикам. В 2023 году «Сбер» совместно с Институтом искусственного интеллекта AIRI представил и выложил в открытый доступ мультимодальную модель OmniFusion, которая способна поддерживать визуальный диалог и отвечать на вопросы по картинкам.

Отдельно можно упомянуть бенчмарки: ruMTEB (для сравнения текстовых эмбеддингов и эмбеддеров), ruMT-Bench и ruIFEval (для оценки больших языковых моделей), LIBRA (для оценки способности модели оперировать длинным контекстом), MedBench (для сопоставления моделей, работающих с различными медицинскими данными), RealCode_eval (для оценки возможностей генерации кода языковыми моделями). Открытый бенчмарк для оценки современных русскоязычных языковых моделей MERA был представлен «Сбером» совместно с Альянсом в сфере искусственного интеллекта, MTS AI, НИУ ВШЭ и «Сколтехом». Подробнее о последних открытых российских бенчмарках, большинство из которых созданы командами из экосистемы «Сбера», можно прочитать здесь.

В 2024 году «Сбер» представил GigaIDE — собственную интегрированную среду разработки, поддерживающую ИИ-средства работы с кодом. Облачная платформа для разработки и реализации ИИ-сервисов ML Space, запущенная еще в 2020 году компанией SberCloud (позже — Cloud.ru), по-прежнему продолжает время от времени фигурировать в СМИ.

В информационном пространстве за рассматриваемый период несколько раз упоминались суперкомпьютеры «Сбера» — Christofari и Christofari Neo (на нем, в частности, происходило обучение нейросети GigaChat), которые применяются также для работы ML Space.

VK

Эта экосистема была менее заметна в СМИ в контексте собственных нейросетей. В медиапространстве упоминалась ее безымянная большая языковая модель (LLM), которая применяется в ряде ИИ-сервисов.

В части сервисов с искусственным интеллектом было анонсировано приложение-редактор с ML-инструментами для работы с видео с использованием дипфейков (для улучшения изображения, удаления объектов и других функций). В ноябре 2024 года VK запустила ИИ-консультанта для работы с облачными сервисами.

Бизнес-аналитикам компания предлагает платформу для автоматической (No-Code) разработки моделей машинного обучения — AutoML. Экосистема также предоставляет B2B-сервисы предиктивной, клиентской и геоаналитики VK Predict. Отдельно стоят инструменты работы с данными для бизнеса — Data Clean Room и VK Cloud Spark. Первое позволяет совместно с партнерами обучать нейросети без обмена своей информацией, а второе — структурировать данные из разных источников для моделей машинного обучения, аналитических и предиктивных систем. В сентябре компания представила еще один инфраструктурный проект VK Data Platform — платформу, объединяющую несколько взаимосвязанных инструментов для работы с большими данными.

А вот упоминаний VK с открытыми проектами для ИИ-разработчиков (датасеты, библиотеки, бенчмарки), как у остальных экосистем, за рассматриваемый период в медиапространстве было немного. Однако в середине ноября появилась информация о планах компании открыть сторонним разработчикам свои решения в формате Open Source, включая ИИ-модели.

МТС

Экосистема, построенная вокруг телеком-компании, тоже обладает внушительным списком моделей и ИИ-сервисов, особенно если учитывать и разработки компании VisionLabs, которую оператор приобрел в 2022 году. Флагманом можно считать фундаментальную модель MTS AI Chat: по некоторым показателям ее версия MTS AI Chat-7B превзошла модели YandexGPT и GigaChat. Но в отличие от «Яндекса» и «Сбера» МТС не создает собственные большие языковые модели с нуля, а обучает модели на основе Open Source. Впоследствии модель получила название Cotype. Она вместе с версиями Cotype Pro и Cotype Lite обучена для решения задач бизнеса, например для ускорения подготовки текстов или поиска и анализа информации. В открытый доступ были выложены три маленькие варианта модели — Cotype‑Nano, Cotype-Nano-4bit и Cotype-Nano-CPU, которые могут работать на пользовательских устройствах. Компания также анонсировала отдельные ИИ-модели для разных индустрий.

В части разработок VisionLabs за рассматриваемый период в информационном пространстве встречались упоминания нейросети для распознавания огня и дыма в видеопотоке, а также интегрированный в систему LUNA SDK алгоритм OneShot Liveness, который определяет наличие человека перед камерой во время процедуры верификации личности.

Говоря об отдельных ИИ-решениях, стоит отметить сервис Kodify для генерации и автодополнения кода в целях оптимизации процесса разработки. Одна из его особенностей заключается в том, что он может быть развернут On-Premise, то есть на оборудовании клиента. Ранее компания рассказывала о другом своем инструменте для разработки — Software 2.0.

Хотя компания закрыла в 2023 году проект умной колонки «Марвин», развитие этого голосового ассистента продолжается, но в формате специализированного помощника. МТС работает и над еще одним вариантом ассистента, который в качестве цифрового аватара своего пользователя сможет за него решать некоторые рутинные задачи, — это проект Altego.

Поскольку МТС изначально — оператор связи, существенная часть его бизнеса построена на обеспечении коммуникаций, причем как со своими абонентами, так и между бизнес-клиентами компании и их пользователями. Например, во всех каналах обратной связи своих экосистемных продуктов (онлайн-кинотеатра KION, МТС Банка и др.) внедрен сервис речевой аналитики WordPulse, определяющий тон обращения. Это решение вместе с платформой синтеза и распознавания речи Audiogram компания предлагает использовать для создания чат-ботов, автоматизации колл-центров и в других сценариях. МТС анонсировал выпуск новых ИИ-сервисов по модели SaaS, а также API ИИ-моделей для разных индустрий.

ИИ-сервисы для работы с видео включают в себя VisionLabs Kidney Tumor Detector для обнаружения патологий почек, сервис облачного видеонаблюдения TenVision, систему управления биометрическими данными Luna Platform, а также собственный детектор дипфейков.

За рассматриваемый период в новостную ленту попало упоминание только одного открытого проекта для разработчиков — библиотеки для специалистов по глубокому обучению нейросетей CoolGraph. Напротив, как у оператора связи у МТС есть несколько инфраструктурных проектов, нацеленных на ИИ. Это запущенный в 2021 году суперкомпьютер MTS GROM, облачная платформа для машинного обучения ML Platform MWS (компания MWS или MTC Web Services ранее была известна как CloudMTS), а также проект «Рой 9» — платформа распределенных вычислений, которая позволяет обучать нейросети, используя множество подключенных пользовательских устройств.

В части ИИ-сервисов, созданных совместно с другими организациями, можно отметить платформу для корпоративных коммуникаций MAX как результат сотрудничества с компанией «ВижнСервис».

Т-Банк

Экосистема Т-Банка (подразумевается холдинг «Т-Технологии») представила в 2024 году свою флагманскую большую языковую модель T-lite, которая входит в семейство языковых моделей банка Gen-T. В отличие от других экосистем Т-Банк сразу выложил ее в открытый доступ, тем самым позиционируя ее не как готовый продукт, а как основу для разработки сторонних русскоязычных приложений. В компании явно видят перспективы в Open Source — вплоть до того, что Анатолий Потапов, руководитель группы фундаментальных технологий LLM, на своей странице на Hugging Face называет Центр искусственного интеллекта Т-Банка «русским Mistral», проводя параллель с французским стартапом и разработчиком открытых моделей. Созданная совместно с Институтом AIRI модель Headless-AD, способная самостоятельно обучаться новым действиям на ограниченном количестве примеров, тоже выложена в открытый доступ.

Отдельно в медиа упоминалась созданная в компании модель для обнаружения мошеннических заявок на кредит. Речь идет о внутреннем инструменте, который, помимо традиционной проверки кредитоспособности клиента, может выявить признаки того, что кредит оформляется под воздействием социальной инженерии. Публичные ИИ-сервисы Т-Банка также сфокусированы на решении узкоспециализированных задач. Функция цифрового помощника реализована в виде «вселенной ассистентов» — шести отдельных решений на основе Gen-T, каждый из которых предназначен для решения конкретного круга задач. К ним относится помощь в управлении финансами, инвестициями и звонками, в онлайн-шопинге, планировании путешествий, а также в объяснении детям основ финансовой грамотности. Ранее у компании был единый голосовой помощник «Олег» со схожими функциями. Он был доступен в приложении «Тинькофф», которое позиционировалось как первое суперприложение на российском рынке, объединившее функциональность нескольких сервисов.

NLP является одной из центральных тем работы внутренней лаборатории исследований ИИ Tinkoff Research, позже ставшей T-Bank AI Research. Эта команда регулярно готовит публикации для международных профильных научных конференций. За рассматриваемый период в поле зрения СМИ попали открытые публикации о новом методе SAC-RND для увеличения скорости обучения искусственного интеллекта, а также о методе ReBRAC для более эффективного дообучения ИИ. В августе 2024 года специалисты лаборатории представили новую архитектуру языковых моделей ReBased, которая позволяет приблизить качество линейных моделей к трансформерам. А в октябре — открыли доступ к своей библиотеке инструментов Turbo Alignment для обучения больших языковых моделей под задачи бизнеса. Разработчикам доступен датасет XLand-100B для контекстного обучения с подкреплением. Он был создан учеными из T-Bank AI Research и Института AIRI. А совместно со студентами НИТУ МИСИС и МФТИ был разработан метод SDDE, который помогает ИИ точнее распознавать на фотографиях ранее неизвестные ему объекты. А при участии студентов из МФТИ, «Сколтеха» и Университета Иннополис специалисты T-Bank AI Research и Института AIRI создали библиотеку XLand-MiniGrid.


Применение и распространение разработок

Мало создать нейросеть, надо еще суметь сделать из нее источник дохода и максимально распространить ее. При сравнительно ограниченном наборе способов продвижения своих разработок цифровые экосистемы все-таки по-разному подходят к этой задаче. Базовым сценарием можно считать применение ИИ в уже существующих экосистемных продуктах и сервисах. По сути это универсальный подход, так как он позволяет одновременно предложить пользователям новую функциональность существующих решений, снизить затраты, продемонстрировать технологические возможности компании.

Содержание раздела

«Яндекс»

«Сбер»

VK

МТС

Т-Банк


«Яндекс»

Очевидным образом «Яндекс» приоритизирует внедрение ИИ в свои уже существующие сервисы. За период наблюдения в таком контексте упоминались практически все основные продукты компании — от браузера и поиска до сервисов «Карты», «Погода», «Недвижимость», «Музыка», «Букмейт» (с сентября 2024 года — «Яндекс Книги»), «Путешествия», «Практикум» и «Учебник». Отдельно следует отметить «Маркет», который ИИ в большей степени затронул со стороны бэк-офиса через частичную автоматизацию логистики и складов с помощью автономных роботов-доставщиков и роборуки. А самым заметным применением нейросетей в сервисе «Такси» являются беспилотные автомобили (Self-Driving Car).

В СМИ единичны сообщения о подписанных компанией соглашениях (например, с МГМУ им. И.М. Сеченова). Гораздо чаще фигурируют новости о тестированиях различными организациями решений «Яндекса» или внедрении их. Речь о таких структурах, как Fix Price, X5 Group, «Лемана ПРО», «Проектная Практика», «Госуслуги», НИУ ВШЭ.

«Сбер»

Компания в большей степени тяготеет к созданию приведенных выше новых продуктов, опирающихся на ИИ, чем к дополнению запущенных ранее сервисов возможностями ИИ. Исключением в информационном поле можно считать интеграцию GigaChat в систему Platform V Product 360, предназначенную для работы с товарными данными. Компания также тестирует беспилотные автомобили, совместно с грузоперевозчиком Globaltruck запустила грузовые беспилотные перевозки по трассе М-11 «Нева». При этом «Сбер» активно применяет искусственный интеллект для своих внутренних задач: по заявлению самого банка, он задействовал ИИ в 85% процессов компании.

В информационном поле главной отличительной чертой «Сбера» в части распространения своих решений с искусственным интеллектом является преобладание сообщений о заключенных соглашениях, причем большинство из них — с государственными и региональными структурами. Это, в частности, можно объяснить тем, что «Сбер» является крупным партнером проекта «Искусственный интеллект» национальной программы «Цифровая экономика Российской Федерации».

В число партнеров входят субъекты Российской Федерации (например, Московская, Нижегородская, Волгоградская, Липецкая, Воронежская области), университеты (ПСПбГМУ им. И.П. Павлова, БФУ имени И. Канта), компании («Сибур», «Россети», «Газпром космические системы», «Геоскан») и другие. У «Сбера» также есть пример международного соглашения — с кубинским инновационным кластером. Помимо этого, «Сбер» нередко упоминался журналистами в контексте внедрений его продуктов с ИИ сторонними организациями. В этот перечень входят министерства (Минцифры, Минфин), вузы (МГУ им. М.В. Ломоносова), рыночные компании («МойОфис», «Абрау-Дюрсо») и прочие.

Компания неоднократно фигурировала в СМИ с новостями о полученных патентах на свои разработки с нейросетями. Можно предположить, что наличие таких документов помогает ей при работе с клиентами из госсектора. «Сбер» старается вовлекать разработчиков в свою экосистему и популяризирует собственные инструменты разработки, активно публикуя открытые модели, датасеты, бенчмарки, а также поддерживая ученых, занимающихся различными аспектами ИИ.

VK

В части внедрения искусственного интеллекта в свои сервисы VK схож и с «Яндексом»: нейросети применяются почти во всем продуктовом портфеле компании, включая как потребительские решения, так и профессиональные. Это, естественно, соцсети «ВКонтакте» и «Одноклассники», сервисы «VK Видео», «Почта Mail.ru», «Календарь Mail.ru», «Облако Mail.ru» и «Заметки Mail.ru». Дополнительную функциональность благодаря ИИ получили и B2B-продукты компании, включая VK Tracer, «VK Реклама», «VK Звонки», «VK Мессенджер» и VK Predict (последний включает в себя AutoML, «VK Девелопер», «ГеоКурсор» и др.).

Головная компания популярных российских соцсетей проявляла активность среднего уровня в части сотрудничества с другими организациями. За рассматриваемый период в поле зрения попадали такие партнеры VK, как Министерство туризма Самарской области и Кабинет министров Чувашской Республики, Росбанк и Московский кредитный банк, а также ритейлер X5 Group. О внедрениях, анонсах или тестах ИИ-продуктов экосистемы VK журналисты писали реже, их внимание привлекли «МойОфис» и ГК «Мангазея».

МТС

Подобно «Яндексу» МТС активно внедряет собственные ИИ-разработки в различные элементы своей экосистемы. Причем в медиапространстве упоминаются как потребительские сервисы типа онлайн-кинотеатра KION и электронной библиотеки «Строки», так и решения для бизнеса: EnergyTool, МТС Exolve, «МТС Линк Чаты» и «МТС Видеонаблюдение». В новостной ленте «Базы знаний AI» упоминались договоренности о сотрудничестве оператора с различными организациями — от Министерства транспорта Республики Узбекистан и Центра биометрических технологий до компаний Softline, «Россети Урал», Axbit Group и «Евраз».

Т-Банк

Из пяти рассматриваемых цифровых экосистем Т-Банк реже всего упоминался в связи с внедрениями моделей ИИ в свои продукты, что объясняется сфокусированностью компании, по сути, на одном продукте — мобильном супераппе банка.

В то же время, по недавнему заявлению компании, доля искусственного интеллекта в продуктах Т-Банка уже в ближайшие пару лет достигнет 80%.


Что будет дальше

Сегодня «Яндекс» и «Сбер» — публичные лидеры в теме искусственного интеллекта в России. От них напрямую зависит будущее отрасли. На это указывают действия властей: глава Минцифры заявлял, что стране не нужен государственный суперкомпьютер для ИИ — «Сбер» и «Яндекс» сами обеспечат рынок мощностями. Министерство только планирует давать гранты компаниям на использование этих суперкомпьютеров.

Экосистемность этих компаний помогает им раскрывать потенциал ИИ, использовать весь арсенал доступных данных, интегрировать в существующие сервисы и запускать новые, решать внутренние задачи и привлекать новых клиентов, причем как на сервисы с ИИ, так и на ИИ как сервис. Заметным новым направлением становятся роботы (включая автономный транспорт): из внутренних экспериментов они перешли в готовые продукты для бизнес-клиентов.

В России «Яндекс» был пионером массовых популярных решений с искусственным интеллектом, другие экосистемы старались повторить его опыт (например, с голосовыми ассистентами, умными колонками, облачными сервисами, беспилотными автомобилями, рекомендательными системами в медиаконтенте). В последнее время можно наблюдать изменение фокуса экосистем с E-commerce на искусственный интеллект, который позволяет им и продавать услуги, и экономить ресурсы. И наиболее ярким примером здесь может послужить тот же «Яндекс».

В этом контексте интерес представляют и другие российские цифровые экосистемы, проявляющие активность в области ИИ — МТС, VK и Т-Банк. Они делают ставки на разные направления, включая открытость, использование своей обширной аудитории, науку и сообщество. Ближайший год должен показать, смогут ли они так же эффективно, как экосистемы-лидеры, сфокусироваться на искусственном интеллекте.

«Яндекс»

Если раньше в документах «Яндекса» термином «экосистема» обозначалась не бизнес-модель, а технологическая среда для новых разработок, то в презентации для инвесторов 2024 года уже встречается понятие «экосистема сервисов». Тем не менее наблюдаемая картина показывает, что за четыре года с прошлого анализа подход «Яндекса» в технологической плоскости не изменился: у компании по-прежнему в приоритете самостоятельная внутренняя разработка.

Более того, несмотря на маркетинговую риторику вокруг пользовательских сервисов, наблюдается последовательный запуск сложных технологических проектов, изначально нацеленных на B2B-рынок. Причем это не только создание собственных фундаментальных моделей с нуля, но и свое производство оборудования для практического применения ИИ, в первую очередь — роботов и сенсоров для них. И если в потребительском сегменте развитие компании кажется более-менее предсказуемым (усовершенствование сервисов с помощью своих нейросетей), то в сегменте для бизнеса можно ожидать новых для российского рынка предложений на базе ИИ.

«Яндекс» остается заметен как поставщик решений для ИИ по принципу Open Source. Это направление также может получить развитие, поскольку, например, в компании не исключают возможность опубликовать открытый код большой языковой модели YandexGPT.

О том, как «Яндекс» будет работать с государственными структурами, судить сложно, поскольку в отличие от «Сбера» открытой информации о таких партнерствах практически нет. И либо «Яндекс» сознательно не намерен конкурировать в этой области со «Сбером», либо ограничен условиями NDA и предоставляет ИИ-сервисы по принципу White Label.

«Сбер»

В целом следует ожидать, что «Сбер» продолжит развивать новые решения на базе искусственного интеллекта, вкладывая заметное количество ресурсов в инфраструктуру и привлечение высокопрофессиональных кадров, а также партнеров для совместных проектов. Вероятно, компания продолжит выпускать ИИ-продукты в формате специализированных ассистентов для помощи в разных профессиональных областях.

Вслед за «Яндексом» компания продолжает развивать направление автономного транспорта в части грузовых перевозок (с пассажирским транспортом на сегодняшний день ни у кого нет существенного продвижения к коммерческой эксплуатации). Год назад в «Сбере» заявляли, что занимаются разработкой человекоподобного робота, чего не делает ни одна из остальных экосистем, его презентация ожидается в начале 2025 года. Но учитывая, что в мире пока практически нет успешных кейсов применения таких устройств, этот проект выглядит скорее как имиджевый. Больший интерес могут в перспективе представлять разработки «Сбера» в части ИИ для обучения иных промышленных и сервисных роботов.

Большее в сравнении с другими экосистемами количество открытых инструментов для разработчиков, а также инициативы компании в области поддержки науки и исследований выглядят как реализация ее «миссии» по развитию ИИ в стране, а также как способ привлекать все больше первоклассных специалистов. Тут можно ожидать увеличения числа подобных открытых проектов и не снижающейся поддержки ученых.

VK

Для экосистемы VK, построенной на фундаменте социальной сети и медиаплатформы, генеративный искусственный интеллект для создания контента кажется максимально уместным. Вместе с тем на основе информации о пользователях и их поведении компания предлагает различные сервисы для бизнеса, в том числе по совместной работе с данными.

Учитывая портфель и недавние заявления компании, можно ожидать, что в 2025 году VK попытается потеснить другие экосистемы в нише открытых решений для разработчиков ИИ.

У компании есть тяготение к сотрудничеству с региональными структурами.

МТС

Сильная сторона МТС — в обучении моделей под профессиональные задачи, создание компетентных ассистентов, а также большая экспертиза ее «дочки» VisionLabs в видеоаналитике. Разработки МТС применяются как внутри самой компании, так и предлагаются рынку в качестве сервисов, которые доступны не только по отдельности, но и в виде конструктора решений. Можно ожидать, что в ближайшее время эти установки не поменяются.

В ноябре компания первой в России объявила о планах выложить полностью в открытый доступ свою большую языковую модель для бизнеса. Обращает на себя внимание тот факт, что эта модель предназначена для запуска непосредственно на персональных компьютерах и телефонах, то есть речь идет об Edge AI. Уникальных для рынка прорывов можно ожидать в части распределенной инфраструктуры для ИИ, например в формате периферийных вычислений (Edge Computing) или иных архитектур.

Т-Банк

Для Т-Банка характерно то, что практически все его разработки с искусственным интеллектом реализованы в едином приложении, а не множестве сервисов, как у других экосистем. В то же время обращает на себя внимание разделение и профилирование ИИ-сервисов для решения отдельных задач.

Можно ожидать, что компания, с одной стороны, продолжит фокусироваться на прикладном характере использования искусственного интеллекта преимущественно в голосовой модальности, параллельно развивая внутреннее научное направление.

Также вызывает интерес ИИ-лаборатория Omut AI, запущенная подразделением T-Bank AI Research и Центральным университетом, учрежденным самим Т-Банком и сфокусированным на подготовке специалистов в области ИИ.

Общие прогнозы по направлениям

Из наблюдений за активностью российских цифровых экосистем последних двух лет можно заключить, что в 2025 году в области искусственного интеллекта в России, вероятно, будут развиваться направления Open Source, робототехники, специализированных моделей, а также, возможно, малых моделей для выполнения инференса на периферийных устройствах (фактически по принципу Edge AI).

Продолжающийся кадровый голод будет провоцировать компании все активнее участвовать в процессе подготовки молодых специалистов, а потребность в инновациях — поддерживать научные исследования, связанные с ИИ.

Наблюдение за этими векторами в 2025 году может принести интересные результаты.


Мнения экспертов

О лидерах и больших моделях

Комментируя особенности разработки и применения искусственного интеллекта российскими экосистемами, собеседники ICT.Moscow гораздо больше внимания уделяют «Яндексу» и «Сберу».

«Сбер» делает ставку на быстрое повторение недавно вышедших больших моделей, но в более компактном и эффективном варианте. А «Яндекс» разрабатывает свои уникальные модели. Но при этом и те, и другие практически не отстают от мировых лидеров, отставание измеряется буквально несколькими месяцами. «Сбер», на мой взгляд, делает большую ставку на AutoML, давая возможность пользователю быстро экспериментировать с разными моделями, в попытке решить свою задачу. Тогда как «Яндекс» старается предлагать уже готовые работающие решения для отдельных задач. Это дольше и затратнее, но стратегически, я думаю, правильнее.

Игорь Пивоваров

главный аналитик Центра искусственного интеллекта МФТИ

Сегодня мало кто может позволить себе разрабатывать модели ИИ с нуля.

С точки зрения базовых технологий «Сбер» и «Яндекс», обладая необходимыми ресурсами, реализуют базовые ИИ-технологии полностью своими силами. Особенно это касается LLM: оба вендора имеют собственную базовую технологию. Другие игроки, в силу иного количества ресурсов или же иной стратегии, более широко используют Open Source.

Глеб Обломский

директор по продуктам Just AI

О том, что цифровой экосистеме дает создание базовой технологии, рассуждает Дмитрий Ватолин, ведущий научный сотрудник института ИИ МГУ, руководитель лабораторий Компьютерной графики и мультимедиа на ВМК МГУ, Интеллектуального анализа видео в институте ИИ МГУ, Интеллектуальных методов обработки видео Университета Иннополис.

Дело не в Foundation Model. Возможность создания топовой LLM — это вершина айсберга и показатель того, что у вас есть достаточное количество сильных специалистов, которые в состоянии выстроить подготовку данных, множество тонкостей архитектуры модели, ее нетривиальное обучение и еще менее тривиальное тестирование на мировом уровне. При этом с точки зрения бизнеса наибольший эффект дают упрощенные (дистиллированные) модели, которые занимают пусть не первые места в рейтингах, зато намного дешевле в инференс (процесс работы обученной нейросети — прим. ред.). 

Дмитрий Ватолин

ведущий научный сотрудник института ИИ МГУ

В ближайшие годы и основной массовой интерфейс взаимодействия человека с гаджетами, и основу увеличения производительности труда за счет разного рода ассистентов обеспечат мультимодальные LLM, рассуждает Дмитрий Ватолин. Поэтому, по его словам, такие модели «не просто важны, а критичны». С тем, что ИИ изменит привычное использование персональных устройств, согласны и другие эксперты, опрошенные ICT.Moscow ранее.

Наличие у «российского бигтеха» собственных фундаментальных моделей — это «позитивный момент», уверен Николай Никитин, руководитель лаборатории автоматического машинного обучения и старший научный сотрудник лаборатории моделирования природных систем Университета ИТМО. В частности, он отмечает YaLM 100B, Kandinsky 2 и 3, T-lite. «Прежде всего, это позволяет разработчикам получить достаточно уникальные компетенции — наиболее ценна не конкретная модель сама по себе, а способность создавать специализированные фундаментальные модели под конкретные задачи. Кроме того, высочайшая динамика научных исследований в этой области не позволяет всегда брать готовое», — говорит эксперт.

Об Open Source и привлекательности экосистем

Николай Никитин отмечает, что сама возможность «легального» доступа к облачным моделям различных классов «достаточно критична для полномасштабного внедрения технологий ИИ в реальные бизнес-процессы». При этом как лидер сообщества ITMO OpenSource он советует делать модели и данные открытыми и работать совместно, чтобы «сработал эффект масштаба». Согласно недавнему исследованию ИТМО все пять рассматриваемых экосистем входят в топ-10 российских разработчиков собственных открытых решений и участников других разработок Open Source в областях искусственного интеллекта, машинного обучения и Data Scien

В целом все перечисленные компании («Яндекс», «Сбер», VK, МТС и Т-Банк — прим. ред.) придерживаются общей «опенсорсной» логики развития и продвижения проектов. Если говорить об особенностях, то «Яндекс» больше склонен делать успешные проекты в какой-то мере самостоятельными. Большую ставку он делает на привлечение энтузиастов Open Source через свои мероприятия для разработчиков, например Yandex Open Source Jam. Для исследователей в области ИИ вручается престижная премия Yandex ML Prize. «Сбер» создает сильные ИИ-инструменты силами Sber AI Lab, а также выкладывает много открытых моделей и датасетов в рамках деятельности SberDevices и других подразделений. Также ведется активная работа по созданию сообщества на базе GitVerse (например, проводится масштабная конференция GigaConf). В рамках взаимодействия с исследователями организуется конференция AI Journey и вручается крупнейшая в этой области Научная премия «Сбера». При этом сотрудники и «Яндекса», и «Сбера» имеют очень высокую представленность на топовых международных конференциях в области ИИ. Другие экосистемы несколько меньше по масштабу и концентрируются на небольшом числе флагманских решений Open Source в области ИИ.

Николай Никитин

руководитель лаборатории автоматического машинного обучения Университета ИТМО

Недавнее исследование DevCrowd говорит о том, что экосистемам удается быть желанным местом работы. 190 респондентов, работающих в сфере DS/ML/ИИ в российских проектах, назвали наиболее привлекательными компаниями «Яндекс» (57,9%), Т-Банк (45,3%) и «Сбер» (40%). Компания VK оказалась на шестом месте (15,3%), а МТС — на десятом (14,7%).


Дополнительно: материалы по темам экосистем и ИИ


Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0