Распознавание сканов документов

Добрый день, партнеры!

В рамках реализации одной из бизнес-задач необходимо распознание сканов распечатанных и подписанных документов. В некоторых случаях это затрудняется тем, что в скане печать или подпись закрывает часть необходимой для распознавания информацией. Какая из технологий OCR предпочтительней для реализации этой задачи и дает больший процент правильного распознавания? Может быть кто-то посоветует сторонний сервис для этого этапа задачи? Или может быть необходима какая-та предварительная обработка сканов вроде высветления или повышения контрастности? Но хотелось бы так же это реализовать с помощью робота внутри процесса

Здравствуйте, @Timofey!

Что-то определённое порекомендовать не можем - нужно смотреть на конкретных примерах. Также, точность распознавания зависит от множества факторов, в том числе от качества сканирования и умения разработчиков обработать полученную информацию.

Для распознавания стандартных документов не требуется предварительной обработки сканов.
Наличие печати является осложняющим фактором, но насколько - надо проверять. В данном случае однозначно сказать по поводу реализации нельзя, нужно подходить творчески. Вы можете с помощью стороннего сервиса, например, заменить синий цвет печати в документе на белый. Данную операцию можно автоматизировать и выполнять в рамках алгоритма робота.