Распознавание текста

Подскажите.
Есть у нас акты, и пока у нас по актам два вопроса.
Как нам распознавать более эффективно нужные области.
Нам необходимо сканировать весь документ или все же лучше сканировать областями.

И второй вопрос. Если у нас дата приходит в разных форматах (на одних актах числами на других буквами(месяц)), а система принимает только цифрами, то как лучше нам их обрабатывать?

Здравствуйте, @Aleksandr_ITIP!

Если необходимая информация находится в примерно одних и тех же областях на данных документах, то проще всего использовать области для распознавания. Если нет - возможно распознавать весь документ и использовать ключевые слова для извлечения необходимой информации из получаемого массива значений.

В данном случае робот после распознавания документа может проводить поиск по полученным значениям в массиве и заменять определённые слова на цифры. Это можно проводить с помощью методов на языке JavaScript.

Если остались вопросы - обращайтесь!

1 симпатия

Еще есть вопрос.
Есть ли возможность распознавать подпись, штрихкод и печать?

@Aleksandr_ITIP, подскажите, Вам необходимо извлечь данные из такого рода элементов или проверить их наличие?

Если необходимо проверить наличие печати, штрихкода и других визуальных элементов, то в данном случае возможно использовать функцию “Найти картинку”.

В случае необходимости распознавания значений с печати необходимо тестирование на конкретных документах. Стандартными средствами платформы сбор данных с круглых печатей не реализован. Однако это возможно сделать через использованию сторонних сервисов либо скриптов. Алгоритмически данная задача решаема.

1 симпатия

Добрый день!
Появился новый вопрос по распознаванию.
Есть у нас счет фактуры. Изначально когда их сканируют они размещены в книжной ориентации.
Если мы переводим их в альбомную, то Электроник упорно отказывается это принять и считает что левый нижний угол - это левый верхний угол из-за чего настройки распознавания сбиваются и становится очень сложно охватить нужную область.
Подскажите как быть?
Если Вариант распознавания документа без разворота?
Просто сейчас если мы документ не разворачиваем, то сбиваются строки.

Добрый день, @Aleksandr_ITIP!

В данном случае возможно автоматически поворачивать документы с помощью робота:

Робот определяет необходимость поворота - распознаёт определённую область, которую мы выбрали в качестве “якоря” для понимания ориентации документа (например, “Счёт-фактура”) и далее поворачивает изображение при необходимости.

image

Если остались вопросы - обращайтесь!

Да, я это понимаю.
А как повернуть так как нужно нам?
Сейчас получается что он поворачивает 1 раз и считывает не ту область. и что бы я не делал он все равно разворачивает документ так как хочет, даже если мы уже сами развернули документ

На всякий случай, вот изображение с зонами распознавания.

@Aleksandr_ITIP, спасибо за информацию и подробный скриншот! Данная ситуация действительно наблюдается, это баг - передал информацию тестировщикам, завели задачу на исправление.

На данный момент проблему можно решить пересохранив файл в другом приложении (например, открыть уже повёрнутый файл в Paint и нажать “Сохранить”), что также возможно производить автоматически с помощью робота.
Попробуйте таким образом и опишите, пожалуйста, Ваш результат.

Все понял спасибо.
Так и подумал про сохранение.