Тестирование Yandex Vision

Мы тестировали Yandex Vision, насколько мне правильно сказал программист результатом запроса является таблица значение и его координата. У вас так же? Есть идеи как на сканах пдф УПД вычленять номенклатуру товаров, если сканы кривые, т.е. координаты всегда немного отличаются на нескольких страницах и их координаты мы в принципе не знаем, как и количество страниц?

Здравствуйте, @Main_Robot!

Yandex Vision только недавно добавили возможность распознавания PDF-файлов, поэтому в ближайших релизах вы увидите такую возможность и на нашей платформе. Да, сейчас результатом распознавания будет массив объектов, в каждом элементе которого будет собственно сам распознанный текст, координаты относительно документа, размеры блока с элементом текста и язык текста. Подробнее об этой и других функциях вы можете узнать в нашей базе знаний.
Чтобы выбирать конкретные значения из отсканированного документа вы можете:

  1. Использовать координаты и ввести погрешность, если мы знаем что координаты элемента могут изменяться в каких-то определённых пределах, допустим необходимый текст точно находится на координатах по от Х до Х+50 и от Y до Y+50. Тогда мы можем выбрать все элементы из массива у которых параметры соответствуют данному требованию.
  2. Использовать ключевые слова, например, на УПД мы знаем что необходимые нам значения на распознанном документе могут находится от “11”, который завершает заголовок таблицы и до “Всего к оплате”. И так далее.