Как прочитать все строки в картинке?

Здравствуйте! Задача перенести данные из отсканированной счет/фактуры в 1С.
Проблема - мы никогда заранее не знаем, сколько строк с товарами будет в счет/фактуре?
В настоящее время я на следующем этапе: Распознаю тескт (Google) и записываю в переменные данные фактуры по шаблону. В шаблоне у меня, например, две строки с товаром, а их может оказать пять. Задача - проверить сколько строк на самом деле и перенести все данные в 1С.
Может уже писали на Форуме, но я не нашел?

Добрый день, @mitr!

В данном случае возможно использовать распознавание документа полностью без шаблона. В полученном массиве элементов проводить поиск по конкретным ключевым словам (или набору таких слов), т.к. мы имеем определённый формат документа (счёт-фактура). Т.е., например, робот может искать шапку таблицы в документе и извлекать все следующие значения, идущие “до” какого-либо следующего ключевого слова, например, “Всего к оплате”. Таким образом робот извлечёт все строчки, находящиеся между данными значениями.

Проводить разбивку полученных значений в соответствии со столбцами возможно используя регулярные выражения либо параметры координат (не фиксированно, а относительно полученных параметров координат столбца в документе).

Подскажите, если есть какие-либо вопросы по данной теме.

1 симпатия

Спасибо. Собственно, я так и думал. Буду разбираться с массивом. Если кто-то уже решил эту задачу было бы неплохо обменяться опытом.
Вопросы появятся по мере решения)