Российская ИТ-компания Smart Engines запатентовала в США решение на основе искусственного интеллекта для выявления случайных и некачественных изображений до начала распознавания документов. Система сопоставляет каждое изображение с эталонными шаблонами, оценивает совпадающие признаки и то, как они распределены по предполагаемой области документа. Алгоритм также проверяет, чтобы документ занимал в кадре не меньше 70% от эталонного размера и чтобы изображение не было чрезмерно сжато.
Разработка предназначена для защиты от атак, во время которых системы подвергаются искусственной нагрузке: хакеры загружают неподходящие или искаженные кадры, чтобы найти уязвимости. В Smart Engines предполагают, что их решение будет эффективно в банках и FinTech, телекоме, страховании, логистике, HR и других секторах, где ведется дистанционная работа с документами.
ИИ-систему проверили на датасетах MIDV-500 и eBDtheque. Первый содержит по 300 кадров 30 типов удостоверений, второй — 100 изображений комиксов. Как объясняют исследователи, геометрическая структура комиксов напоминает документ и может повлиять на результаты работы искусственного интеллекта. По результатам тестирования процент ложных срабатываний удалось снизить до нуля. Кадры, которые не прошли фильтрацию, не содержали документ или были недостаточно высокого качества для извлечения информации.
Для Smart Engines американский патент стал 14-м в области ИИ. В 2024 году разработчик получил 18 патентов в России и 5 в США.
В Москве утвержден порядок работы роверов в доставке
Департамент транспорта
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.