ABBYY Mobile Imaging SDK

Детекторы для оценки качества изображений

  1. Детектор расфокусировки и размытости изображения
  2. Детектор бликов
  3. Детектор шумов

Готовые наборы функций

  1. Черно-белый документ
  2. Визитная карточка
  3. Цветной документ
  4. Документ со светлым изображением на темном фоне
  5. Квитанция
  6. «Шпионский снимок»
  7. Гербовая бумага
  8. Снимок на улице

Функции улучшения качества изображений

  1. Ручная настройка яркости и контраста
  2. Автоматическая настройка яркости и контраста
  3. Автоматическое улучшение изображения
  4. Бинаризация
  5. Очистка фона
  6. Градации серого
  7. Обрезка изображения вручную
  8. Автоматическое обрезание/обнаружение контуров
  9. Удаление шумов
  10. Глубокая очистка
  11. Инверсия
  12. Фиксированное вращение
  13. Вращение
  14. Повышение резкости изображения
  15. Коррекция перспективы
  16. Белая бумага

Детекторы для оценки качества изображения

Набор детекторов, входящих в состав SDK, позволяет непосредственно после съёмки определить, подходит ли полученное изображение для распознавания, или лучше его переснять. Детекторы предупредят, если снимок получился размытым, пересвеченным или с избытком цифрового «шума».

Детектор расфокусировки и размытости изображения

Перед поиском дефектов, все изображение делится на блоки. Каждый блок подвергается анализу, в ходе которого производится поиск текста. Вся последующая информация относится к секторам изображения, в которых есть блоки с текстом.

Детектор выявляет следующее:

До После

Детектор бликов

Детектор выявляет следующее:

До После

Детектор шумов

В результате работы детектора выводится сообщение, которое содержит следующие данные:

Один из этих параметров можно использовать для оценки достаточности уровня освещения. Соотношение сигнал/шум предназначено для настройки, в то время как двоичное значение определяется во время работы детектора.

До После

Как интерпретировать результаты работы детекторов

Для обеспечения высокого качества распознавания, детекторы бликов и шумов должны показать значение «ложь» и детектор расфокусировки значение, близкое к нулю, для размера зон с размытым и расфокусированным изображением. Предполагается, что, для типичных изображений, пороговое значение последних параметров определяется пользователем, так как оно может отличаться для разных типов изображений.

 

Гготовые наборы функций

SDK cодержит ряд функций с предустановленными параметрами обработки для некоторых распространенных типов изображений, таких как черно-белые документы, визитные карточки, и др.

Черно-белый документ

Набор содержит функции для обработки черно-белых документов. Для такого типа изображений операции выполняются в следующем порядке:

До После

Визитная карточка

Набор содержит функции для обработки визитных карточек. Для такого типа изображений операции выполняются в следующем порядке:

До После

Цветной документ

Набор содержит функции для обработки цветных документов. Для такого типа изображений операции выполняются в следующем порядке:

До После

Документ со светлым изображением на темном фоне

Набор содержит функции для обработки документов со светлым изображением на темном фоне. Для такого типа изображений операции выполняются в следующем порядке:

До После

Квитанция

Набор содержит функции для обработки квитанций. Для такого типа изображений операции выполняются в следующем порядке:

До

После

«Шпионский снимок»

Набор содержит функции для обработки нерезких, размытых, темных фотографий.  Для такого типа изображений операции выполняются в следующем порядке:

До

После

Гербовая бумага

Набор содержит функции для обработки гербовых бумаг. Для такого типа изображений операции выполняются в следующем порядке:

До

После

Снимок на улице

Набор содержит функции для обработки фотографий с высоким уровнем шумов, которые зачастую появляются при съемке на улице. В таких изображениях контраст и яркость регулируются автоматически.

До

После

 

Функции улучшения качества изображений

Ручная настройка яркости и контраста

Позволяет регулировать контраст изображения, основываясь на уровне настройки.

До

После

Автоматическая настройка яркости и контраста

Позволяет регулировать яркость и контраст автоматически.

До

После

Автоматическое улучшение изображения

Локальное улучшение контраста и создание белого фона (в результате создается изображение с использованием градаций серого).

До

После

Бинаризация

Преобразование изображения в градациях серого или цветного изображения в черно-белое.

До

После

Очистка фона

Автоматически удаляет фоновые элементы, такие как текстура, точки, линии и т.д.

До

После

Градации серого

Преобразование цветного RGB-изображения в изображение в градациях серого.

До

После

Обрезка изображения вручную

Позволяет пользователям обрезать изображение до размера указанного прямоугольника.

В сэмпле не предусмотрен пользовательский интерфейс изменения координат углов. Изменять координаты углов в сэмпле можно только через код.

До

После

Пользовательский интерфейс изменения координат углов может быть реализован в конечном приложении, например, как показано на скриншоте из приложения ABBYY FineScanner.

Ручная обрезка в FineScanner,
до

Ручная обрезка в FineScanner,
после

Автоматическая обрезка/обнаружение контуров

Обнаружение контуров изображения по отношению к фону для последующей обрезки фона.
Указывает координаты зоны обрезки (четыре угла четырехугольника).

До

После

Удаление шумов

Удаление «паразитных» пикселей на изображении, используя регулировку порогового уровня.

До

После

Глубокая очистка

Удаление шумов в монохромном изображении.

До

После

Инверсия

Инвертирование черно-белого изображения.

До

После

Фиксированное вращение

Поворот изображения на 90 градусов.

До

После

Вращение

Вращение изображения с выбором произвольного угла поворота.

До

После

Повышение резкости изображения

Удаление размытости вокруг символов, используя уровень корректировки.

До

После

Коррекция перспективы

Корректировка искажения перспективы (преобразование трапециевидной формы в квадратную).

До

После

В сэмпле не предусмотрен пользовательский интерфейс корректировки искажения перспективы. Корректировать искажение в сэмпле можно только через код.

Пользовательский интерфейс корректировки искажения перспективы может быть реализован в конечном приложении, например, как показано на скриншоте из приложения ABBYY FineScanner.

Корректировка искажения
перспективы, до
Корректировка искажения
перспективы, после

Белая бумага

Преобразует фон документа в белый цвет.

До

После