«Сбер» выпустил новую модель Kandinsky 4.1 Image для генерации изображений по текстовым описаниям. Также был создан ИИ-редактор MALVINA (Multimodal Artificial Language VIsion Neural Assistant), который позволяет редактировать изображение, следуя текстовым инструкциям.
Модель Kandinsky 4.1 Image была дополнительно дообучена на тщательно отобранных вручную изображениях, сбалансированных по девяти метакатегориям (люди, техника, природа и другие).
В основе новой версии модели генерации изображений Kandinsky лежит обновленная архитектура — теперь это диффузионный трансформер (DiT), который позволяет использовать лучшие практики в области обучения больших трансформерных моделей. Технология обеспечивает возможность эффективного масштабирования.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.