ГлавнаяЛента

Статьи

Год под созвездием GPT: главное в сфере ИИ в 2023 году

27 декабря 2023, 11:00|
9216

Генеративные нейросети-трансформеры, или GPT, стали одним из самых ярких технологических событий 2023 года. Об этом говорит не только череда анонсов от крупнейших мировых и российских ИИ-компаний, но также статистика поисковых запросов. Если до 2023 года интерес к искусственному интеллекту и нейросетям был сравнительно ровным, то с конца 2022 — начала 2023 года он стал быстро расти. Это видно как в глобальной статистике (Artificial Intelligence, а также запрос Generative, демонстрирующий всплеск интереса именно к генеративным ИИ-моделям), так и в российской (в первую очередь показателен запрос «нейросеть»).

Какие именно ИИ-тренды активно развивались в 2023 году и почему именно они стали такими значимыми? Какие показатели говорят о беспрецедентном развитии технологии сегодня? Как искусственный интеллект будет развиваться дальше? Об этом ICT.Moscow, подводя итоги года, поговорил с экспертами в области ИИ из AIRI, МФТИ и сообщества AGI Russia.

Главный тренд — большие языковые модели

Одним из наиболее заметных и значимых направлений, в которых развивался ИИ в 2023 году, стали большие языковые модели — LLM. В частности, за этот год были представлены GPT-4 Turbo от OpenAI и его потенциальный конкурент — Bard от Google. В России развивались, соответственно, YandexGPT от Яндекса (была представлена вторая версия) и GigaChat от «Сбера» (анонсирован переход на новую LLM-модель). Но, по мнению опрошенных ICT.Moscow экспертов, важную роль в развитии LLM сыграл несколько иной аспект.

Самые интересные продвижения в области LLM были связаны с усилением их возможностей в области математики. Здесь нужно упомянуть работу от DeepMind (дочерняя исследовательская компания Google — прим. ред.) по FunSearch, опубликованную в журнале Nature: модель ИИ впервые в истории решила математическую задачу, не решенную ранее человеком. 

Другое заметное продвижение (хотя и неопубликованное и лежащее пока в плоскости догадок и слухов) было у разработчиков из OpenAI — модель Q*. В ней к LLM присоединено обучение с подкреплением Q-learning, благодаря которому система запоминает оптимальную траекторию ходов для достижения цели. Поверх этого добавлен еще и алгоритм A* для поиска кратчайших путей. И с помощью такой пирамиды из алгоритмов модель учили решать математические задачи, требующие последовательных рассуждений. В результате модель, по словам отдельных разработчиков, стала демонстрировать недоступную ранее логическую связность рассуждений.

Игорь Пивоваров

главный аналитик Центра Прикладных систем искусственного интеллекта МФТИ

О значимости ИИ на основе трансформеров, в частности ChatGPT, говорит и Антон Колонин, представитель российского сообщества в области сильного искусственного интеллекта AGI Russia. Именно их эксперт называет главным трендом 2023 года, поскольку с их помощью «удалось практически, а не формально пройти тест Тьюринга».

Причем тест пройден не на основе искусственно созданной программы и ручной инженерии дерева диалогов, с помощью которых тест был формально пройден около пяти лет назад, а с помощью системы ИИ (в данном случае — ChatGPT), обученной на большом объеме неструктурированных данных.

Антон Колонин

AGI Russia

Главным же событием в области ИИ Антон Колонин назвал историю с перестановками в руководстве OpenAI «с непонятной природой и непонятными результатами». Подробнее о том, как отреагировала отрасль в ноябре на те события, можно почитать в этом материале ICT.Moscow.

Начало глобального развития мультимодальности

В разговоре с ICT.Moscow эксперты не упоминали еще один тренд 2023 года — развитие сервисов генерирования иллюстраций, таких как DALL-E, Kandinsky, YandexART и др. Вместо этого они говорили о другом аспекте, который был заметен в 2023-м и, с высокой вероятностью, будет еще более заметным в 2024 году. Речь идет о мультимодальных нейросетях, то есть тех, которые работают одновременно с несколькими типами контента: текстами, изображениями, речью, звуками и др.

Главные тренды в 2023 году связаны с бурным развитием генеративного ИИ, который включает как большие языковые модели, так и синтез изображений, видео и 3D-объектов. Следует отметить, что тренд актуален как для России, так и для всего мира, что говорит о высоком уровне развития отрасли в стране и высоком уровне квалификации наших исследователей и разработчиков. Тенденции возникли не сами по себе, а являются логичным и ожидаемым продолжением трендов 2022 года, когда появились первые модели высококачественной генерации изображений, сервис ChatGPT.

Андрей Кузнецов

руководитель научной группы FusionBrain Института AIRI

При этом главным событием года эксперт называет выход мультимодальной модели GPT-4 Vision в составе GPT-4 Turbo (по словам Андрея Кузнецова, способна решать огромное количество задач в модальностях изображений и текста), а также выход линейки моделей Kandinsky, позволяющих генерировать изображения, анимации и видео по текстовым описаниям.

О явном тренде на развитие мультимодальных нейросетей говорит и Игорь Пивоваров из МФТИ.

В начале года вышла мультимодальная модель ChatGPT 4 от OpenAI, а в конце года — Gemini от Google. Обе воспринимают на вход не только текст, но и изображения и видео; могут описать, что происходит на картинке/видео или сгенерировать картинку/видео в ответ на текстовое описание. Это, безусловно, следующий шаг в развитии ИИ, приближающий модели к возможностям человека.

Игорь Пивоваров

главный аналитик Центра Прикладных систем искусственного интеллекта МФТИ

Массовое применение ИИ благодаря открытости

Важным, если не ключевым фактором развития и роста популярности генеративного ИИ среди компаний и массовых пользователей эксперты также называют открытость, то есть появление на рынке и поддержка моделей с открытым исходным кодом (Open Source).

Нужно отметить появление новых моделей Open Source, которые открыты и бесплатны для использования и при этом не сильно уступают упомянутым моделям от OpenAI и Google. В ИИ-сообществе продолжается тренд на создание открытых бесплатных альтернатив любым новым коммерческим моделям от ведущих компаний.

Игорь Пивоваров

главный аналитик Центра Прикладных систем искусственного интеллекта МФТИ

Андрей Кузнецов из AIRI, объясняя трендовость генеративного искусственного интеллекта в 2023 году, уточнил, что она «подтверждается и метрическими показателями числа публикаций на ведущих международных конференциях, и обилием моделей Open Source, решающих задачи генеративного ИИ». Более того, по мнению эксперта, это привело к понятным и измеримым эффектам.

Нельзя не отметить, что все это привело к росту количества приложений, устойчиво сформировав и закрепив статус ИИ-ассистента в сознании массового пользователя.

Андрей Кузнецов

руководитель научной группы FusionBrain Института AIRI

Перспективы и опасности будущего ИИ

О появлении новых приложений, основанных на генеративных нейросетях, говорит и Антон Колонин из AGI Russia, но уже в контексте развития ИИ в 2024 году. Однако эксперт осторожен в прогнозах и называет несколько возможных сценариев.

Одним из заметных трендов 2024 года станет применение построения прикладных приложений на основе ChatGPT в бизнесе. Либо же станет понятно, что при всем хайпе вокруг генеративных нейросетей бизнес-приложения на его основе строить не удается по причине так называемых галлюцинаций (ошибочных, но при этом системных и якобы подкрепленных верифицированными данными результатов работы нейросетей — прим. ред.), а также из-за огромных вычислительных затрат, необходимых для обучения, и невозможности переобучения.

Антон Колонин

AGI Russia

Андрей Кузнецов из AIRI видит перспективы в развитии именно мультимодальных моделей, «которые смогут работать не только с изображениями и текстом, но и с аудио, видео, временными рядами и другими форматами».

Тренд на мультимодальный генеративный ИИ будет очень активно развиваться в следующие годы. Также существует огромный потенциал в области синтеза видео и управлении редактированием видео через инструкции на естественном языке.

Андрей Кузнецов

руководитель научной группы FusionBrain Института AIRI

Игорь Пивоваров из МФТИ также видит очень быстрое развитие технологии в последние годы, но не считает это однозначно позитивным трендом. Он, скорее, предостерегает, что если так будет продолжаться и дальше, то это может привести к неконтролируемым последствиям и непредсказуемым эффектам.

Нельзя не отметить сильное ускорение событий в области разработки ИИ, что согласуется с так называемой концепцией сингулярности. Это период времени, когда развитие технологий и изменения в обществе начинают происходить с такой скоростью и в таком масштабе, что человек перестает понимать происходящее и оно выходит из-под контроля.

На мой взгляд, это очень опасный тренд. Я считаю, что стоит ввести общий мораторий на разработку новых моделей ИИ следующего поколения минимум на 6–12 месяцев, постараться выработать единые международные правила такой разработки и предпринять усилия по дипломатическому урегулированию и созданию договоренностей по разработке ИИ.

Игорь Пивоваров

главный аналитик Центра Прикладных систем искусственного интеллекта МФТИ


В ноябре ICT.Moscow побеседовал об итогах 2023 года в сфере ИИ с директором по развитию искусственного интеллекта в Яндексе Александром Крайновым. Он подробно рассказал о значимости генеративных ИИ-моделей, зарождающемся тренде на мультимодальные нейросети и других аспектах развития технологии глобально и в России. Прочитать интервью можно здесь.

Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0