OmniFusion на ICT.Moscow

1326

OmniFusion

Мультимодальная ИИ-модель

Описание:

Языковая модель OmniFusion способна поддерживать визуальный диалог и отвечать на вопросы по картинкам. Ее иностранными аналогами являются такие продукты, как LLaVA, Gemini, GPT-4 Vision и китайские Qwen, DeepSeek и LVIS. Первая версия была презентована в ноябре 2023 года.

В апреле 2024 года в свободном доступе была опубликована версия OmniFusion 1.1, которая предназначена для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например изображений, а в перспективе — аудио-, 3D- и видеоконтента.

Эта версия способна распознать и описать изображение. С ее помощью можно проанализировать карту помещений или узнать, как собрать устройство по фото его отдельных комплектующих. Также OmniFusion 1.1 умеет распознавать тексты, решать логические задачи. С ее помощью можно решить математический пример, написанный на доске, или распознать формулу и получить ее представление в формате LaTeX.

Качество модели оценивали в разных вариантах ее архитектуры при помощи ряда бенчмарков (специализированных текстов для анализа эффективности ИИ-моделей в ответах на визуальные вопросы).

Модель можно использовать как в некоммерческой, так и в коммерческой деятельности. Доступна как открытое ПО.

Репозиторий на GitHub

Препринт на arXiv

Текстовый обзор на Habr

👤 Елизавета Гончарова

👤 Андрей Кузнецов

👤 Антон Разжигаев

👤 Денис Димитров

Участвует в спецпроектах ICT.Moscow:

Смотреть

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#AIRI #Сбербанк

Проект запущен:

2023

Последнее обновление:14.11.2025

Материалы о разработчике

17 дек. 15:55

Нейросеть GigaChat сдала экзамены в РАНХиГС по направлениям «Экономика и финансы» и «Финансовая грамотность»

Сбербанк

17 дек. 14:33

«Сбер» представил ИИ-помощников для пользователей и бизнеса

Коммерсант

3 дек. 13:05

ICT.Moscow: 120 новых решений для ИИ-разработки представлено в России в 2025 году

ICT.Moscow

25 ноя. 15:38

«Сбер»: развитие ИИ потребует 45 трлн руб. инвестиций в энергетику за 16 лет

Reuters

24 ноя. 12:08

В AIRI разработали фреймворк Maestro для создания и оркестрации ИИ-агентов

AIRI

смотреть еще

Другие проекты разработчика:

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

DRAGON

Бенчмарк для RAG-систем

#бенчмарк #искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Сбербанк #Университет_ИТМО

Evolution Notebooks

Сервис для работы специалистов по машинному обучению

#искусственный_интеллект #нейросети #машинное_обучение #разработка #Cloud #Сбербанк

cadrille

Большая мультимодальная модель для генерации 3D-объектов

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #3D #open_source #AIRI #МГУ

смотреть еще

Похожие проекты:

A-Vision

Большая мультимодальная модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

A-Vibe

Большая языковая модель

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source #Avito

Бизнес.Локатор

ИИ-сервис для малого бизнеса

#искусственный_интеллект #нейросети #машинное_обучение #геоинформационные_системы #бизнес_аналитика #Билайн

Evolution Managed RAG

RAG-сервис

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #Cloud #Сбербанк

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение