API-интерфейс инструментария ABBYY FineReader Engine дает доступ ко множеству функций и технологий обработки документов и позволяет создавать Linux-решения для преобразования документов и создания PDF-файлов. Среди основных достоинств продукта:
ABBYY FineReader Engine может получать изображения из источников двух типов: из файлов и напрямую из памяти.
SDK поддерживает большинство графических форматов, в том числе многостраничный TIFF и JPEG 2000 (part1), и работает с черно-белыми, полутоновыми и цветными изображениями. Он также открывает PDF-файлы, конвертируя их в изображения при помощи технологии Adobe® PDF Library.
Графические форматы:
Форматы изображений в памяти:
Дополнительные возможности для PDF-файлов:
После получения изображений FineReader Engine, прежде чем распознавать или архивировать документы, выполняет ряд операций по их обработке с целью улучшения их качества:
Основные функции обработки изображений
FineReader Engine предлагает ряд функций обработки изображений:
Автоматическое исправление перекосов
Это важная функция применяется к отсканированным документам, если на изображении имеются перекосы. Для работы функции не требуется наличие видимых границ страницы или линий. FineReader Engine 9.0 предлагает несколько методов исправления перекосов: по парам черных квадратов, по линиям или по строкам текста.
Разбиение книжных разворотов
Функция используется при сканировании разворотов книг, т. е. одновременно левой и правой страницы. Качество распознавания повышается, если такое изображение разбить на два – по одной книжной странице на каждом изображении. В таком случае распознавание и анализ форматирования производятся отдельно для каждой страницы, а при необходимости выполняется исправление перекосов.
Удаление шума (очистка изображений от «мусора»)
Эта функция удаляет с изображений черные точки, которые появляются при сканировании документов среднего и плохого качества. Если такие точки расположены близко к буквам, такой шум может ухудшить качество распознавания, и в этом случае необходимо применить функцию «удаление шума».
Отфильтровывание текстур и адаптивная бинаризация
Технология отфильтровывания текстур позволяет удалить фоновые шумы, такие как цветной или текстурный фон, и повысить качество распознавания трудных для чтения документов (газет, цветных документов, факсов, ксерокопий).
Инновационная технология адаптивной бинаризации динамически корректирует порог яркости для отдельных фрагментов изображения при распознавании. Выбирая индивидуальные параметры распознавания, технология позволяет получить точный результат при распознавании документов с контрастным серым, переменным цветным или текстурным фоном.
Автоматическое определение ориентации страницы (повороты на 90, 180 и 270 градусов)
Эта функция очень важна при пакетном вводе изображений, когда ориентация страниц при сканировании неизвестна или может различаться от документа к документу. Система автоматически определяет ориентацию каждой страницы и при необходимости корректирует ее.
Исправление цвета текста и фона
Эта функция разработана для пользователей, работающих с системами армирования и управления документооборотом (DMS). При отправке распознанного документа в архив он сохраняется и как изображение, и как обычный текст, а координаты каждого символа на изображении записываются в архивный индекс. При осуществлении поиска в архиве, пользователь получает изображение релевантного документа, а чтобы подсветить искомый текст на изображении, программа изменяет цвет текста и фона.
Технологии оптического распознавания для цифровых камер
Технология идентифицирует изображения, полученные цифровой фотокамерой и применяет к ним специальные алгоритмы обработки для исправления искажений, которые часто встречаются на цифровых фотографиях: текст не в фокусе, изогнутые строки, отсутствие информации о разрешении снимка, дефекты из-за недостаточной освещенности.
Удаление шума в отдельных фрагментах изображения с возможностью задать размер черных точек.
Извлечение данных из полей, ограниченных различными рамками, таких как combo box, поля с подчеркиванием, рамки и т. д.
Функции анализа документов в API-FineReader Engine обеспечивают автоматическое конвертирование документов с сохранением форматирования, зональное распознавание с возможностью ручного выделения блоков на изображении и много другое. В том числе:
Специальные функции анализа документов:
Анализ документов для распознавания счетов
Это функция предобработки для конвертирования полуструктурированных документов, таких как счета, платежные поручения, накладные, визитные карточки, контракты, бланки страховых требований, резюме и т. д. Она находит всевозможные текстовые объекты на таких документах, в том числе цифры, даже если они находятся внутри печатей, картинок, логотипов или в коротких отрывках текста.
В отличие от стандартного полностраничного анализа документов, эта функция исходит из того, что все напечатанное на документе является текстом. Функция также следит за тем, чтобы текстовая информация не интерпретировалась как графические элементы, а числа не разбивались на множество символов. В результате на анализ документов и их последующую обработку другими системами подается максимум информации о тексте, в том числе его координаты.
Блок анализа документов для распознавания счетов используется в программе FlexiLayout Studio на первом этапе анализа полуструктурированных документов, помогая извлекать данные из документов с похожими данными, но с разной структурой.
Анализ документов для полнотекстового индексирования
Автоматически находит и распознает весь текст на документах, в том числе текст, помещенный на картинках, графиках и диаграммах. Разработчикам эта функция может потребоваться для извлечения всей текстовой информации из документов с целью последующего индексирования (например, в системах управления документооборотом, системах управления контентом и системах архивирования).
Зональное распознавание/распознавание на уровне полей
ABBYY FineReader Engine 9.0 поддерживает распознавание на уровне полей (зональное распознавание), необходимое в ключевых бизнес-процессах, таких как ввод форм, классификация по ключевым словам и индексирование по ключевым словам. Мощные функции обработки изображений позволяют находить небольшие блоки любого качества с любыми графическими особенностями, которые могут повлиять на качество распознавания (например, подчеркнутый текст, шум от сканирования, пробелы в тексте и т. д.)
Основная функциональность для зонального распознавания включает в себя многоязычное оптическое распознавание и чтение штрихкодов, а также ряд специальных функций:
ABBYY FineReader Engine 9.0 for Linux теперь включает в себя технологию адаптивного распознавания документов (Adaptive Document Recognition Technology, ADRT), которая представляет собой набор алгоритмов синтеза, воссоздающих общую логическую структуру документа. Технология строит логическую модель структуры документа и находит ее элементы. Технология ADRT определяет:
Будучи одним из мировых лидеров в области распознавания документов, компания ABBYY предлагает высокоточные OCR-технологии для более чем 198 языков, в том числе для языков с латинским и кириллическим алфавитами, для языков с иероглифической письменностью (китайский, японский), а также для корейского, тайского и вьетнамского языков, а также старых готических шрифтов.
Режимы распознавания
SDK предусматривает различные режимы распознавания, что позволяет разработчиком быстро выбрать оптимальное соотношение скорости и качества в зависимости от своих задач. Кроме режима распознавания по умолчанию, распознавание печатных и рукопечатных символов может осуществляться в быстром и сбалансированном режимах:
Пользовательские языки
ABBYY FineReader Engine предоставляет API-интерфейс для создания и редактирования языков распознавания, создания копий имеющихся языков и их доработки, а также добавления новых слов в пользовательские языки.
Ниже приводятся два примера, показывающие, как пользовательские языки могут повысить качество распознавания:
Обучение системы
SDK позволяет использовать шаблоны из программы ABBYY FineReader для ПК (профессиональной или корпоративной версии). Разработчик также может импортировать шаблоны, созданные в Windows-версии инструментария. ABBYY FineReader Engine довольно гибок и позволяет создать приложение с любой архитектурой, будь то клиентская рабочая станция или серверное решение.
Чтение штрихкодов
PDF на входе
PDF на выходе
Настройка качества и скорости конвертирования в PDF
FineReader Engine – гибкий набор инструментов, позволяющий разработчикам, работающим на операционных системах с открытым кодом, получать оптимальное для своих задач соотношение качества и скорости.
ABBYY FineReader Engine 9.0 for Linux поддерживает все распространенные форматы файлов.
SDK поддерживает большинство графических форматов, в том числе многостраничный TIFF и JPEG 2000 (part1), и работает с черно-белыми, полутоновыми и цветными изображениями. Он также открывает PDF-файлы, конвертируя их в изображения при помощи технологии Adobe® PDF Library Technology.
Дополнительную информацию по файловым форматам можно найти в разделе Техническая информация.
Получение и экспорт распознанного текста
API-интерфейс к FineReader Engine предоставляет широкие возможности по экспорту результатов распознавания на разных уровнях воссоздания документа: