ABBYY FlexiCapture Engine

ABBYY FlexiCapture Engine представляет собой набор динамически подключаемых библиотек (Dynamic Link Libraries, DLL) и позволяет создавать приложения любой сложности, начиная от рабочих станций и заканчивая сложными серверными решениями.

В основе продукта ABBYY FlexiCapture Engine лежит технология ABBYY FlexiCapture, использующая мощные алгоритмы интеллектуальной классификации документов.

Создание «с нуля» приложений по обработке данных

ABBYY FlexiCapture Engine позволяет «с нуля» создавать приложения любой архитектуры, начиная от рабочих станций и заканчивая серверными решениями для обработки документов различного типа. Теперь разработчики получили возможность создавать собственные приложения на основе всемирно признанных технологий по обработке данных ABBYY FlexiCapture, ранее известной как ABBYY FormReader.

Внедрение функциональности обработки данных в существующие приложения

Разработчики смогут расширить функциональность уже существующих приложений за счет использования ABBYY FlexiCapture Engine. Например, существует возможность дополнить рабочее место бухгалтера функцией сканирования и автоматизированного ввода информации со счетов-фактур, или добавить функцию сканирования документов удостоверяющих личность на рабочем месте сотрудника бюро пропусков. Инструментарий позволит бесшовно интегрировать функциональность потокового ввода данных и обработки документов, при этом пользователь будет работать в привычном интерфейсе информационной системы.

Обработка различных типов документов в одном потоке

ABBYY FlexiCapture Engine позволяет обрабатывать любые типы документов и форм с произвольной или фиксированной структурой. Пользователи конечного приложения смогут как извлекать данные для их дальнейшего использования в информационных системах предприятия, так и конвертировать документы в файлы формата PDF с возможностью полнотекстового поиска. Работая с приложениями на основе ABBYY FlexiCapture Engine, сотрудники организаций смогут быстро и легко вводить в систему данные с любых типов документов.

Автоматическая классификация документов

ABBYY FlexiCapture Engine позволит создать приложения, в основе которого будет лежать принцип единой точки ввода документов в систему. Отсканированные документы могут поступать в едином потоке, а система будет автоматически анализировать все поступающие документы вне зависимости от их типа, будь то анкеты, счета, контракты или журнальные статьи, и правильно обрабатывать их на основе заранее заданных правил.

Работа с документами с фиксированной структурой

В ABBYY FlexiCapture Engine используются последние достижения компании ABBYY по обработке документов с фиксированной структурой, поля которых совпадают на просвет.

Примеры таких документов:

  • опросники
  • исследования
  • экзаменационные бланки

Интеграция ABBYY FlexiCapture Engine в приложение позволяет пользователю получать документы в едином потоке, например со сканера, а далее автоматически подбирает шаблон для обработки каждого изображения страницы. Шаблон для работы с документами создаются заранее в редакторе шаблонов под все типы документов, которые будут встречаться при обработке. На основе заданного шаблона в документе могут быть правильно определены и распознаны информационные поля «ФИО», «Адрес», «Телефон», «Номер счета» и любые другие текстовые поля, а также метки (пол: «м»/«ж») и штрихкоды. ABBYY FlexiCapture Engine обрабатывает бланки, заполненные как на принтере, так и от руки.

Обработка неструктурированных документов

ABBYY FlexiCapture Engine позволяет обрабатывать неструктурированные документы, данные которых имеют разное расположение в документе, то есть, не совпадают на просвет.

Примеры таких документов:

  • счета-фактуры
  • платежные поручения
  • акты выполненных работ

Для обработки таких документов необходимо создать гибкое описание, которое позволит системе извлекать текстовые строки, штрихкоды, даты, валютные символы, числа, разделители, таблицы. Например, используя лишь одно гибкое описание программа может найти все необходимые поля на счетах, поступающих от разных поставщиков и имеющих разный формат.

Обработка многостраничных документов и таблиц

Технологии, используемые в ABBYY FlexiCapture Engine, позволяют обрабатывать многостраничные документы, в том числе таблицы, которые занимают более одной страницы. Например, при обработке договора могут быть извлечены «Номер договора» на первой странице, а также «Сумма договора» и «Реквизиты сторон» на последней странице, при этом не важно, сколько страниц содержит сам договор. При обработке счетов, учитываются данные позиций всех полей счета, даже если они расположены на нескольких странницах. Сканируя многостраничные документы, не важен порядок страниц, обработка и сборка документов в потоке будет осуществлена на основе заранее созданных правил сборки документов.

Верификация и контроль полученных данных

Специальное API верификации в ABBYY FlexiCapture Engine позволяет получить дополнительные сведения о распознанных данных, например, координаты, тип поля, список ошибок, процент уверенно распознанных символов. Эти данные в свою очередь позволяют настроить качество проверки распознанных символов, а также отслеживать ошибки, возникающие при обработке и сборке документа.

Существуют следующие методы верификации:

  • Групповая верификация для одновременной проверки меток и цифр на всех документах
  • Верификации отдельных текстовых полей
  • Проверка на основе заданных правил

Верификация позволит значительно улучшить качество полученных данных и облегчить работу оператора при вводе документов в систему.

Конвертация документов в PDF-формат

После обработки документы могут быть экспортированы в целевую информационную систему в виде структурированных данных, а также в виде электронных документов в формате PDF или PDF/A. Эта дополнительная возможность позволяет наряду с извлечением данных для последующей обработки одновременно формировать архивы электронных документов с возможностью поиска документов по их содержимому. Так, например, обработка счетов-фактур по такому сценарию позволит автоматически загружать финансовые данные в ERP систему, а электронные копии счетов-фактур в формате PDF сохранять в электронный архив.

Работа с документами на разных языках

ABBYY FlexiCapture Engine позволяет обрабатывать печатные документы на 198 языках на базе латиницы, кириллицы, армянского, греческого алфавитов, а также документы, заполненные от руки, на 113 языках. Технологии ABBYY позволяют обрабатывать документы, включающие как один, так и несколько языков одновременно.