logo MiVOLO

MiVOLO

Модель для определения возраста и пола

Описание:

Задачей нейросети является предположение пола и возраста человека по его фото. В ее основе — гибридная (сочетающая элементы сверточных и трансформерных нейросетей) модель VOLO. Изображения тела и лица подаются в MiVOLO независимо, как два входа в два сверточных стебля, после чего объединяются. Такой подход, отмечают разработчики, позволяет обрабатывать изображения, не все части которых содержат полезную информацию.

Модель умеет предсказывать пол и возраст даже на тех фотографиях, где лица не видно. По заявлениям разработчиков, MiVOLO справляется с задачей определения возраста лучше, чем человек. Нейросеть была обучена на специально созданном под нее открытом датасете LAGENDA.

MiVOLO была представлена и командой продукта Layer в июле 2023 года. Тогда же стало известно об интеграции нейросети в продукт. В феврале 2024 года была выпущена новая версия модели — MiVOLOv2.0. Она была обучена на расширенном датасете, что позволило уменьшить количество ошибок модели. Доступна как открытое ПО.


Репозитории на GitHub и Hugging Face

Демоверсия на Hugging Face

Препринт в arXiv

Текстовый обзор на Habr

Бот в Telegram


👤 Максим Купрашевич

👤 Ирина Толстых


Участвует в спецпроектах ICT.Moscow:
logo MiVOLO
Проект запущен:
2023
Последнее обновление:13.11.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.