

Большая мультимодальная модель для генерации 3D-объектов
Мультимодальная модель cadrille помогает восстанавливать трехмерные элементы деталей в форме CAD (Computer-Aided Design) по их изображениям и схемам.
Модель размером в 2 млрд параметров принимает на вход облака точек, изображения и текстовые описания деталей, а на выходе генерирует код на языке Python, при выполнении которого создается CAD-объект.

Нейросеть была обучена в два этапа. Предобученная на интернет-данных визуально-языковая модель (VLM) прошла также стадии тонкой настройки с учителем (Supervised Fine-Tuning, SFT) на синтетических данных, что дало ей возможность обрабатывать облака точек, и обучения с подкреплением, улучшившего общее качество реконструкции.
Модель cadrille представлена исследователями из Института AIRI и МГУ им. М.В. Ломоносова в июне 2025 года. Доступна как открытое ПО.
Репозитории на GitHub и Hugging Face
#искусственный_интеллект#генеративный_ИИ#нейросети#машинное_обучение#3D#open_source
Разработчик:
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.