Программа FormReader Enterprise Edition обеспечивает потоковый ввод документов и незаменима в крупных проектах. Если средний ежедневный объём обрабатываемых бумажных документов составляет 2-3 тыс. или пиковые нагрузки превышают 10000 документов в день, если в процесс обработки вовлечены более трёх сотрудников, то, возможно, программа FormReader Enterprise Edition – тот инструмент, который позволит сделать задачу ввода данных с бумажных документов простой и легко выполнимой.
Формы формируются в виде пакетов и проходят все стадии процесса обработки. Маршрут пакетов показан на схеме. Сначала происходит сканирование, затем распознавание. Извлеченные данные сравниваются с оригинальным изображением и при необходимости исправляются. Отдельные страницы собираются в документ. Затем итоговые данные экспортируют в базу данных или файл. За каждую операцию процесса обработки отвечает специализированная станция комплекса.
Структура вводимых документов может быть любой сложности. Формы могут быть многостраничными, содержать приложения, формы нескольких типов могут обрабатываться в едином потоке без предварительной сортировки. Обрабатывая пакет форм, ABBYY FormReader Enterprise Edition отслеживает маршрут и состояние каждой страницы, собирает их в документы в соответствии с заданной структурой, отслеживает правильность сборки и предупреждает пользователя об ошибках.
Бесперебойность и эффективность работы комплекса на базе Enterprise Edition достигаются за счет чёткого определения параметров работы комплекса, гибкого распределения задач между станциями в процессе, концентрации операторов на своих задачах. Этому также способствуют мониторинг и контроль хода обработки пакетов, возможности дублировать выполнения операций и при необходимости расширить комплекс, подключив дополнительные станции.
Для создания комплекса потребуется несколько – по числу операторов – компьютеров, объединённых в сеть, сервер, один или несколько сканеров (их количество зависит от объёма документов и технических характеристик самих сканеров). В комплекс FormReader Enterprise Edition входят сервер данных, станции настройки, сканирования, регистрации распознавания, верификации, корректировки, а также станция экспорта и мониторинга. Некоторые станции участвуют в процессе ввода и обработки данных, другие отвечают за работу самого комплекса.
С помощью сервера данных, входящего в состав комплекса, происходит обмен данными между станциями. На сервере к тому же устанавливается единый для всего комплекса ключ защиты.
Станция настройки предназначена для подготовки комплекса к работе (непосредственно к процессу ввода форм). Оператор станции настройки планирует процесс обработки форм в целом и настраивает работу на каждой станции в отдельности: включает в проект и настраивает необходимые типы пакетов, назначает папки для хранения исходных и итоговых данных, распределяет обязанности между операторами, дает им необходимые права. Оператор станции настройки может просмотреть параметры лицензии комплекса, просмотреть список компьютеров сети, на которые установлены станции комплекса и которые в данный момент работают в комплексе.
После того как настройка комплекса закончена, можно приступать к процессу обработки форм.
Станция сканирования является первой станцией, на которую поступают формы в процессе ввода и обработки. На станцию сканирования поступает пачка бумажных форм или файлы изображений заранее отсканированной пачки. Оператор станции сканирования создаёт новый пакет для хранения и последующей обработки изображений пачки форм, регистрирует этот пакет, сканирует бумажные формы и/или добавляет готовые файлы изображений в созданный пакет и отправляет его для последующей обработки на станцию распознавания.
При необходимости обработку любого пакета можно отложить. Отложенный пакет не поступает на дальнейшую обработку; оператор станции сканирования может открыть и продолжить его обработку позже.
Станция регистрации - это полностью автоматизированная станция, которая используется либо вместо станции сканирования, либо вместе с ней. Станция регистрации автоматически добавляет изображения, появляющиеся в "горячей" папке, в пакет, регистрирует пакет и отправляет его на станцию распознавания. Станция регистрации имеет открытый программный интерфейс (API), который позволяет настраивать операции ввода документов и создавать пользовательские модули ввода данных.
На станции распознавания производится распознавание пакетов в автоматическом режиме. Оператору станции необходимо лишь запустить процесс распознавания. После этого каждый пакет, готовый к распознаванию, распознаётся автоматически. После завершения процесса распознавания пакеты автоматически отправляются на станцию верификации или на станцию корректировки, если станция верификации отсутствует.
На станции верификации производится редактирование результатов распознавания и, опционально, выполнения одностраничных правил. Оператор станции верификации последовательно выполняет верификацию неуверенно распознанных символов и проверку данных с помощью одностраничных правил, руководствуясь подсказками программы. По окончании работы пакет отправляется для последующей обработки на станцию корректировки. В случае возникновения проблем при обработке пакета оператор станции верификации может отправить пакет на станцию корректировки как проблемный, снабдив его комментариями. Станция верификации является опциональной.
В случае отсутствия станции верификации в комплексе, верификация данных и проверка данных с помощью одностраничных правил осуществляются на станции корректировки.
На станции корректировки производится сборка документов пакета (сборка пакета) и редактирование результатов выполнения многостраничных правил. Оператор станции корректировки последовательно выполняет сборку пакета и проверку данных с помощью многостраничных правил, руководствуясь подсказками программы. По окончании обработки пакет отправляется для последующей обработки на станцию экспорта и мониторинга.
В случае необходимости оператор станции корректировки может отсканировать или распознать страницы пакета заново, изменив при этом, например, настройки сканирования или распознавания, а также провести повторную верификацию страниц пакета, корректировку результатов проверки одностраничных правил.
В случае возникновения проблем при обработке пакета, оператор станции корректировки может отправить пакет на станцию экспорта и мониторинга как проблемный, снабдив его комментарием. В случае отсутствия опциональной станции верификации на станции корректировки производится верификация данных и проверка данных с помощью одностраничных правил.
На станции экспорта и мониторинга производится экспорт пакетов, общий мониторинг работы комплекса и работа с проблемными пакетами.
Экспорт данных может происходить в двух режимах – автоматическом или ручном. В первом случае после запуска экспорта автоматически экспортируются все пакеты, поступающие в очередь на экспорт. Во втором случае оператор сначала должен выбрать пакеты для экспорта, выделив их в списке пакетов в очереди на экспорт, а затем запустить процесс экспорта выделенных пакетов.
В процессе мониторинга комплекса оператор может просмотреть статистику обработки пакетов и сеансов работы станций, проверить журнал событий.
Если в процессе обработки возникли проблемы, этот пакет отправляется оператору станции экспорта и мониторинга, который может приписать пакет для обработки какому-либо оператору, удалить пакет из базы данных, остановить работу какой-либо станции комплекса, заблокировать обработку пакета.