Система распознавания документов
Система для OCR-обработки документов. В решение включены документы государственного образца: паспорт, водительское удостоверение, СНИЛС и т.д. Для других документов система дообучается.
Решение состоит из набора микросервисов, каждый из которых берет на себя отдельный этап распознавания. Алгоритм классификации определяет, сколько документов на изображении и к какому типу они относятся. Алгоритм выравнивания находит границы документа и устраняет искажения на картинке. Затем осуществляется поиск полей с требуемой информацией. Это помогает нейросети правильно разрезать изображение и отправить каждый фрагмент на распознавание. Алгоритм OCR распознает данные, подготовленные разметчиком, и переводит их в цифровой вид. Алгоритм проверки и дораспознавания ищет ошибки, которые могли возникнуть при распознавании, и исправляет их.
Система может работать в облаке или в контуре клиента. Для обработки данных используются временные хранилища. В случае обращения к решению Dbrain в облаке сервис использует установленные законом методы декомпозиции и анонимизации.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.