После получения изображений FineReader Engine, прежде чем распознавать или архивировать документы, выполняет ряд операций по их обработке с целью улучшения их качества:

Основные функции обработки изображений

FineReader Engine предлагает ряд функций обработки изображений:

Автоматическое исправление перекосов

Это важная функция применяется к отсканированным документам, если на изображении имеются перекосы. Для работы функции не требуется наличие видимых границ страницы или линий.  FineReader Engine 9.0 предлагает несколько методов исправления перекосов: по парам черных квадратов, по линиям или по строкам текста.

Разбиение книжных разворотов

Функция используется при сканировании разворотов книг, т. е. одновременно левой и правой страницы. Качество распознавания повышается, если такое изображение разбить на два по одной книжной странице на каждом изображении. В таком случае распознавание и анализ форматирования производятся отдельно для каждой страницы, а при необходимости выполняется исправление перекосов.

Удаление шума (очистка изображений от «мусора»)

Эта функция удаляет с изображений черные точки, которые появляются при сканировании документов среднего и плохого качества. Если такие точки расположены близко к буквам, такой шум может ухудшить качество распознавания, и в этом случае необходимо применить функцию «удаление шума».

Отфильтровывание текстур и адаптивная бинаризация

Технология отфильтровывания текстур позволяет удалить фоновые шумы, такие как цветной или текстурный фон, и повысить качество распознавания трудных для чтения документов (газет, цветных документов, факсов, ксерокопий).
Инновационная технология адаптивной бинаризации динамически корректирует порог яркости для отдельных фрагментов изображения при распознавании. Выбирая индивидуальные параметры распознавания, технология позволяет получить точный результат при распознавании документов с контрастным серым, переменным цветным или текстурным фоном.

Автоматическое определение ориентации страницы (повороты на 90, 180 и 270 градусов)

Эта функция очень важна при пакетном вводе изображений, когда ориентация страниц при сканировании неизвестна или может различаться от документа к документу. Система автоматически определяет ориентацию каждой страницы и при необходимости корректирует ее.

Исправление цвета текста и фона

Эта функция разработана для пользователей, работающих с системами армирования и управления документооборотом (DMS). При отправке распознанного документа в архив он сохраняется и как изображение, и как обычный текст, а координаты каждого символа на изображении записываются в архивный индекс. При осуществлении поиска в архиве, пользователь получает изображение релевантного документа, а чтобы подсветить искомый текст на изображении, программа изменяет цвет текста и фона.

Технологии оптического распознавания для цифровых камер

Технология идентифицирует изображения, полученные цифровой фотокамерой и применяет к ним специальные алгоритмы обработки для исправления искажений, которые часто встречаются на цифровых фотографиях: текст не в фокусе, изогнутые строки, отсутствие информации о разрешении снимка, дефекты из-за недостаточной освещенности.

Удаление шума в отдельных фрагментах изображения с возможностью задать размер черных точек.

Извлечение данных из полей, ограниченных различными рамками, таких как combo box, поля с подчеркиванием, рамки и т. д.