

Модель компьютерного зрения
Задачей модели компьютерного зрения является распознавание трехмерных объектов. Архитектура UniDet3D основана на чистом трансформере-энкодере и позволяет обучать модель на нескольких датасетах, а не использовать какой-либо один специализированный.
UniDet3D была обучена на датасетах ScanNet, S3DIS, ARKitScenes, MultiScan, 3RScan и ScanNet++. Разработчики провели переразметку использованных для обучения модели наборов данных, сократив число уникальных классов объектов и унифицировав их.
Разработчики подчеркивают, что UniDet3D можно постепенно научить работать с большим числом разнородных наборов данных и одинаково эффективно распознавать объекты в разных типах «облаков точек» — наборов координат, полученных при помощи лазерных радаров и других типов трехмерных сканеров.

Модель была представлена исследователями из Института AIRI в январе 2025 года. Доступна как открытое ПО.
#искусственный_интеллект#нейросети#машинное_обучение#компьютерное_зрение#open_source
Разработчик:
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.