ABBYY Mobile OCR Engine

Етапи Деталі

Крок 1: імпорт і обробка зображення

Зображення завантажується з пам’яті та підготовлюється для розпізнавання тексту. Бінаризація зображення відділює текст від фону, створюючи чорно-біле зображення, яке має значно менший розмір, ніж кольоровий оригінал. До зображення може бути застосовано додаткову корекцію перекосів рядків і визначення орієнтації документа.

Функція автоматичного виправлення перекосів рядків. Зображення документів, отримані за допомогою мобільних пристроїв або з використанням портативного сканера, часто мають перекоси (згини) рядків, що призводить до помилок розпізнавання. ABBYY Mobile OCR Engine виявляє та виправляє перекоси з точністю до одного градуса, що суттєво підвищує якість розпізнавання символів.

Функція визначення орієнтації сторінки. Під час попередньої обробки зображень технологія автоматично визначає орієнтацію тексту, який розпізнається (чи перевернуто текст на 90 чи 180 градусів).

Крок 2: Аналіз документа

Аналіз документів є набором алгоритмів, який аналізує зображення — визначає літери, поєднання літер в словах, потім рядки тексту, і, врешті-решт, параграфи. Окрім того, область читання очищується і видаляється шум.

Підтримка переносів. Якщо Mobile OCR Engine зустрічає частину переношуваного слова (наприклад, ПОН-) на одному рядку, а другу частину (наприклад, еділок) на наступному рядку, він буде об’єднувати їх в одне слово (понеділок).

Збереження багатошпальтового тексту. В попередніх версіях ABBYY Mobile OCR Engine текст розпізнавався зліва направо і знизу догори, через що всі розпізнані дані поміщалися в один масив. В ABBYY Mobile OCR Engine з’явилася функція збирання абзаців (Paragraph Assembly), яка визначає межі текстових блоків і дозволяє програмі розпізнавати текст зліва направо і знизу догори в кожному блоці окремо, зберігаючи багатошпальтовий текст, розбивку на абзаци та інший поділ тексту.

Збереження шрифтів. ABBYY Mobile OCR Engine визначає властивості шрифтів у вихідному тексті (розрізняє напівжирний шрифт, курсив і підкреслення).

Індикатор впевненості розпізнавання, який відображає, наскільки впевнено розпізнано текст. Це дозволяє розробникам гнучко задавати різні критерії під час перевірки орфографії та верифікації даних.

Перевірка орфографії під час розпізнавання тексту суттєво покращується якість отримуваного результату.

Крок 3: Оптичне розпізнавання символів (OCR)

Потім виявлені текстові блоки на зображенні розпізнаються з використанням спеціальної мови та певного шаблону. Для багатьох типів даних наявні словники дозволених слів, які також можуть використовуватися у процесі контролю даних. Результати розпізнавання становлять собою набір символів із координатами, об’єднаними в рядки. Кожен символ має рівень довіри, який вказує, наскільки Mobile OCR Engine був упевнений в остаточному визначенні символу.

Два режими розпізнавання

ABBYY Mobile OCR Engine — гнучка та зручна технологія, яка дозволяє змінювати настройки залежно від встановлених цілей. Доступно два режими розпізнавання:

Режим експрес-розпізнавання найбільше підходить для зображень хорошої якості, скорочує час на обробку зображень і розпізнавання тексту;

Повний режим для максимальної точності розпізнавання найбільше підходить для зображень низької якості, при цьому для отримання оптимального результату витрачається більше часу.

Business Card Processing (опціонально)

ABBYY Mobile OCR Engine — це більше, ніж просто високоточна технологія оптичного розпізнавання: інструментарій дозволяє обробляти зображення візитних карток, отриманих за допомогою мобільних пристроїв чи портативних сканерів. ABBYY Mobile OCR Engine здатний видобувати із зображень таку інформацію, як ім’я та прізвище, посада, різні види телефонних номерів, адресу електронної пошти, назва компанії, адреса в Інтернеті та поштова адреса.

Тепер технологія обробки візиток розпізнає більше 23 мов.

Розпізнавання штрих-кодів (опціонально)

Ця функція забезпечує розпізнавання штрих-кодів і підтримує типи штрих-кодів 1D і 2D. Пошук штрих-кода на сторінці та виявлення штрих-кода недоступні. Користувач повинен або сфотографувати лише штрих-код або вручну обрізати зображення штрих-кода.

Крок 4: Обробка результату

Результати розпізнавання може бути оброблено й експортовано. Розробник додатка має повний контроль над OCR-результатами.