Разработчик Smart Engines обновил ИИ-систему «Шерлок», добавив в нее функцию распознавания и проверки документов на фарси и урду. Для обновления решения был создан датасет MIDV-UP, состоящий из документов Ирана и Пакистана.
В набор вошли 9 тыс. аннотированных изображений, в том числе 1 тыс. удостоверений различных типов. Образцы были получены с помощью метода создания обучающих данных без использования документов реальных людей. Датасет охватывает различные сценарии предъявления документов, в том числе сканированные изображения, фотографии и видеоролики с естественными помехами.
MIDV-UP использовали для обучения ИИ-системы «Шерлок», которая предназначена для распознавания и комплексной проверки физических и цифровых документов. Она способна работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы.
Разработчики предполагают, что новый функционал даст возможность масштабирования «Шерлока» в России и на международных рынках, в том числе в Иране и Пакистане.
Smart Engines летом 2025 года представил мультимодальную ИИ-модель «Шерлок 2o» для выявления поддельных документов. Проверка ведется по 600 параметрам.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.