ABBYY FlexiCapture Engine

ABBYY FlexiCapture Engine становить собою набір бібліотек, які динамічно підключаться (Dynamic Link Libraries, DLL) і дозволяють створювати додатки будь-якої складності, починаючи з робочих станцій і завершуючи складними серверними рішеннями.

В основі продукту ABBYY FlexiCapture Engine лежить технологія ABBYY FlexiCapture, яка використовує потужні алгоритми інтелектуальної класифікації документів.

Створення «з нуля» додатків для обробки даних

ABBYY FlexiCapture Engine дозволяє «з нуля» створювати додатки будь-якої архітектури, починаючи з робочих станцій і завершуючи серверними рішеннями для обробки документів різного типу. Тепер розробники отримали можливість створювати власні додатки на основі всесвітньо визнаних технологій для обробки даних ABBYY FlexiCapture, відомої раніше як ABBYY FormReader.

Впровадження функціональності обробки даних в існуючі додатки

Розробники зможуть розширити функціональність вже існуючих додатків за рахунок використання ABBYY FlexiCapture Engine. Наприклад, існує можливість доповнити робоче місце бухгалтера функцією сканування й автоматизованого введення інформації з рахунків-фактур, або додати функцію сканування документів, які засвідчують особу, на робочому місці співробітника бюро перепусток. Інструментарій дозволить безшовно інтегрувати функціональність потокового введення даних і обробки документів, при цьому користувач буде працювати у звичному інтерфейсі інформаційної системи.

Обробка різних типів документів в одному потоці

ABBYY FlexiCapture Engine дозволяє обробляти будь-які типи документів і форм із довільною чи фіксованою структурою. Користувачі кінцевого додатка зможуть як видобувати дані для їх подальшого використання в інформаційних системах підприємства, так і конвертувати документи у файли формату PDF із можливістю повнотекстового пошуку. Працюючи з додатками на основі ABBYY FlexiCapture Engine, співробітники організацій зможуть швидко та легко вводити в систему дані з будь-яких типів документів.

Автоматична класифікація документів

ABBYY FlexiCapture Engine дозволить створити додатки, в основі яких буде лежати принцип єдиної точки введення документів у систему. Відскановані документи можуть надходити в єдиному потоці, а система буде автоматично аналізувати всі документи, які надходять, незалежно від їхнього типу, чи то анкети, рахунки, контракти чи журнальні статті, і правильно обробляти їх на основі завчасно заданих правил.

Робота з документами з фіксованою структурою

В ABBYY FlexiCapture Engine використовуються останні досягнення компанії ABBYY з обробки документів із фіксованою структурою, поля який співпадають на просвіт.

Приклади таких документів:

  • опитувальники
  • дослідження
  • екзаменаційні бланки

Інтеграція ABBYY FlexiCapture Engine в додаток дозволяє користувачеві отримувати документи в єдиному потоці, наприклад зі сканера, а потім автоматично підбирає шаблон для обробки кожного зображення сторінки. Шаблони для роботи з документами створюються завчасно в редакторі шаблонів під усі типи документів, які будуть зустрічатися під час обробки. На основі заданого шаблону в документі може бути правильно визначено та розпізнано інформаційні поля «ПІБ», «Адреса», «Телефон», «Номер рахунка» і будь-які інші текстові поля, а також мітки (стать: «ч»/«ж») і штрих-коди. ABBYY FlexiCapture Engine обробляє бланки, заповнені як на принтері, так і від руки.

Обробка неструктурованих документів

ABBYY FlexiCapture Engine дозволяє обробляти неструктуровані документи, дані яких мають різне розміщення в документі, тобто не співпадають на просвіт.

Приклади таких документів:

  • рахунки-фактури
  • платіжні доручення
  • акти виконаних робіт

Для обробки таких документів необхідно створити гнучкий опис, який дозволить системі видобувати текстові рядки, штрих-коди, дати, валютні символи, числа, роздільники, таблиці. Наприклад, використовуючи лише один гнучкий опис, програма може знайти всі необхідні поля на рахунках, які надходять від різних постачальників і мають різний формат.

Обробка багатосторінкових документів і таблиць

Технології, які використовуються в ABBYY FlexiCapture Engine, дозволяють обробляти багатосторінкові документи, зокрема таблиці, які займають більше однієї сторінки. Наприклад, під час обробки договору може бути видобуто «Номер договору» на першій сторінці, а також «Сума договору» та «Реквізити сторін» на останній сторінці, при цьому не важливо, скільки сторінок містить сам договір. Під час обробки рахунків враховуються дані позицій всіх полів рахунка, навіть якщо вони розміщені на декількох сторінках. Під час сканування багатосторінкових документів не важливий порядок сторінок, обробку та збирання документів у потоці буде здійснено на основі попередньо створених правил збирання документів.

Верифікація та контроль отриманих даних

Спеціальне API верифікації в ABBYY FlexiCapture Engine дозволяє отримати додаткові відомості про розпізнані дані, наприклад, координати, тип поля, список помилок, відсоток впевнено розпізнаних символів. Ці дані у свою чергу дозволяють настроїти якість перевірки розпізнаних символів, а також відслідковувати помилки, які виникають під час обробки та збирання документа.

Існують наступні методи верифікації:

  • Групова верифікація для одночасної перевірки міток і цифр на всіх документах
  • Верифікація окремих текстових полів
  • Перевірка на основі заданих правил

Верифікація дозволить суттєво покращити якість отриманих даних і полегшити роботу оператора під час введення документів у систему.

Конвертація документів у PDF-формат

Після обробки документи може бути експортовано до цільової інформаційної системи у вигляді структурованих даних, а також у вигляді електронних документів у форматі PDF або PDF/A. Ця додаткова можливість дозволяє на додачу до видобування даних для подальшої обробки одночасно формувати архіви електронних документів із можливістю пошуку документів за їхнім змістом. Так, наприклад, обробка рахунків-фактур за таким сценарієм дозволить автоматично завантажувати фінансові дані в ERP-систему, а електронні копії рахунків-фактур у форматі PDF зберігати в електронний архів.

Робота з документами різними мовами

ABBYY FlexiCapture Engine дозволяє обробляти друковані документи 198 мовами на базі латиниці, кирилиці, вірменського, грецького алфавітів, а також документи, заповнені від руки, 113 мовами. Технології ABBYY дозволяють обробляти документи, які містять як одну, так і декілька мов одночасно.