Архитектура решения

ABBYY Recognition Server состоит из нескольких компонентов, которые могут быть установлены на одной или разных машинах в локальной сети.

Менеджер сервера

Это ключевой компонент, который служит для управления всеми остальными компонентами системы, настройками обработки, а также распределением заданий между станциями обработки, сканирования, индексирования и верификации.

Станция обработки

Станция обработки представляет собой службу Windows, которая непосредственно осуществляет распознавание изображений. К одному менеджеру сервера можно подсоединить несколько  станций обработки; таким образом, комплекс легко масштабируется и его продуктивность возрастает.

Консоль удаленного администрирования

Представляет собой общий интерфейс администрирования для настройки системы и контроля ее работы. С ее помощью осуществляется:

Станция сканирования

Предназначена для потокового сканирования документов и предварительной обработки изображений. С нее документы направляются на станции обработки для дальнейшего распознавания.

Возможности станции сканирования

Станция индексирования

Предназначена для присвоения распознанным документам типов и атрибутов. Если значение атрибута содержится в тексте документа, оператору достаточно курсором выделить нужные слова на изображении. При необходимости поле атрибута может быть заполнено вручную. Возможна также настройка автоматического заполнения атрибутов с помощью скриптов.

Станция верификации

Предназначена для контроля качества распознавания страниц, проверки орфографии и редактирования распознанного текста. При необходимости страница может быть отправлена на повторную обработку.

Этапы обработки документов

Процесс обработки документов включает в себя несколько последовательных этапов.

Получение изображений

Распознавание

Определение типа документов и присвоение атрибутов

Публикация документов