ABBYY Mobile OCR Engine

Этапы Детали

Шаг 1: Импорт и обработка изображения

Изображение загружается из памяти и подготавливается для распознавания текста. Бинаризация изображения отделяет текст от фона, создавая черно-белое изображение, которое значительно меньше по размеру, чем цветной оригинал. К изображению может быть применена дополнительная коррекция перекосов строк и определение ориентации документа.

Функция автоматического исправления перекосов строк. Изображения документов, полученные при помощи мобильных устройств или с использованием портативного сканера, часто имеют перекосы (изгибы) строк, что приводит к ошибкам распознавания. ABBYY Mobile OCR Engine обнаруживает и исправляет перекосы с точностью до одного градуса, что значительно повышает качество распознавания символов.

Функция определения ориентации страницы. Во время предварительной обработки изображений технология автоматически определяет ориентацию распознаваемого текста (перевернут ли текст на 90 или 180 градусов).

Шаг 2: Анализ документа

Анализ документов представляет собой набор алгоритмов, который анализирует изображение - определяет буквы, соединения букв в словах, затем строки текста, и, наконец, параграфы. Кроме того, область чтения очищается и удаляется шум.

Поддержка переносов. Если Mobile OCR Engine встречает часть переносимого слова (например, ПОН-) на одной линии, а вторую часть (например, едельник) на следующей строке, он будет объединять их в одно слово (понедельник).

Сохранение многоколоночного текста. В предыдущих версиях ABBYY Mobile OCR Engine текст распознавался слева направо и снизу вверх, из-за чего все распознанные данные помещались в один массив. В ABBYY Mobile OCR Engine появилась функция сборки абзацев (Paragraph Assembly), которая определяет границы текстовых блоков и позволяет программе распознавать текст слева направо и снизу вверх в каждом блоке по отдельности, сохраняя многоколоночный текст, разбиение на абзацы и другое деление текста.

Сохранение шрифтов. ABBYY Mobile OCR Engine определяет свойства шрифтов в исходном тексте (различает полужирный шрифт, курсив и подчеркивание).

Индикатор уверенности распознавания, который показывает, насколько уверенно распознан текст. Это позволяет разработчикам гибко задавать различные критерии при проверке орфографии и верификации данных.

Проверка орфографии во время распознавания текста значительно улучшает качество получаемого результата.

Шаг 3: Оптическое распознавание символов (OCR)

Затем обнаруженные текстовые блоки на изображении распознаются с использованием специального языка и определённого шаблона. Для многих типов данных имеются словари разрешенных слов, которые также могут использоваться в процессе контроля данных. Результаты распознавания представляют собой набор символов с координатами, объединёнными в строки. Каждый символ имеет уровень доверия, который показывает, насколько Mobile OCR Engine был уверен в окончательном определении символа.

Два режима распознавания

ABBYY Mobile OCR Engine – гибкая и удобная технология, которая позволяет изменять настройки в зависимости от поставленных целей. Доступно два режима распознавания:

Режим экспресс-распознавания больше всего подходит для изображений хорошего качества, сокращает время на обработку изображений и распознавание текста;

Полный режим для максимальной точности распознавания больше всего подходит для изображений низкого качества, при этом для получения оптимального результата затрачивается больше времени.

Business Card Processing (опционально)

ABBYY Mobile OCR Engine – это больше, чем просто высокоточная технология оптического распознавания: инструментарий позволяет обрабатывать изображения визитных карточек, полученных при помощи мобильных устройств или портативных сканеров. ABBYY Mobile OCR Engine способен извлекать из изображений такую информацию, как имя и фамилия, должность, различные виды телефонных номеров, адрес электронной почты, название компании, адрес в интернете и почтовый адрес.

Теперь технология обработки визиток распознает более 23 языков.

Распознавание штрих-кодов (опционально)

Эта функция обеспечивает распознавание штрих-кодов, которая поддерживает типы 1D и 2D штрих-кодов. Поиск штрих-кода на странице, и обнаружение штрих-кода недоступны. Пользователь должен либо сфотографировать только штрих-код или вручную обрезать изображение штрих-кода.

Шаг 4: Обработка результата

Результаты распознавания могут быть обработаны и экспортированы. Разработчик приложения имеет полный контроль над OCR результатами.