Інструменти для обробки зображень

Після отримання зображень FineReader Engine, перш ніж розпізнавати чи архівувати документи, виконує ряд операцій з їх обробки з метою покращення їхньої якості:

Основні функції обробки зображень

FineReader Engine пропонує ряд функцій обробки зображень:

Автоматичне виправлення перекосів

Ця важлива функція застосовується до відсканованих документів, якщо на зображенні є перекоси. Для роботи функції не потрібна наявність видимих меж сторінки чи ліній.  FineReader Engine 9.0 пропонує декілька методів виправлення перекосів: за парами чорних квадратів, за лініями чи за рядками тексту.

Розбивка книжкових розворотів

Функція використовується під час сканування розворотів книг, тобто одночасно лівої та правої сторінок. Якість розпізнавання підвищується, якщо таке зображення розбити на два по одній книжковій сторінці на кожному зображенні. В такому разі розпізнавання й аналіз форматування здійснюється окремо для кожної сторінки, а за необхідності виконується виправлення перекосів.

Видалення шуму (очищення зображень від «сміття»)

Ця функція видаляє із зображення чорні цятки, які з’являються під час сканування документів середньої та поганої якості. Якщо такі цятки знаходяться близько до літер, такий шум може погіршити якість розпізнавання, і в такому разі необхідно застосувати функцію «видалення шуму».

Відфільтровування текстур і адаптивна бінаризація

Технологія відфільтровування текстур дозволяє видалити фонові шуми, такі як кольоровий чи текстурний фон, і підвищити якість розпізнавання складних для читання документів (газет, кольорових документів, факсів, ксерокопій).
Інноваційна технологія адаптивної бінаризації динамічно коригує поріг яскравості для окремих фрагментів зображення під час розпізнавання. Завдяки вибору індивідуальних параметрів розпізнавання технологія дозволяє отримати точний результат під час розпізнавання документів із контрастним сірим, змінним кольоровим чи текстурним фоном.

Автоматичне визначення орієнтації сторінки (поворот на 90, 180 і 270 градусів)

Ця функція важлива у разі пакетного введення зображень, коли орієнтація сторінок під час сканування невідома чи може відрізнятися в різних документах. Система автоматично визначає орієнтацію кожної сторінки й у разі необхідності коригує її.

Виправлення кольору тексту та фону

Цю функцію розроблено для користувачів, які працюють із системами архівування та керування документообігом (DMS). Під час відправлення розпізнаного документа в архів він зберігається і як зображення, і як звичайний текст, а координати кожного символу на зображенні записуються в архівний індекс. Під час здійснення пошуку в архіві користувач отримує зображення релевантного документа, а щоб підсвітити шуканий текст на зображенні, програма змінює колір тексту та фону.

Технології оптичного розпізнавання для цифрових камер

Технологія ідентифікує зображення, отримані цифровою фотокамерою та застосовує до них спеціальні алгоритми обробки для виправлення спотворень, які часто зустрічаються на цифрових фотографіях: текст не в фокусі, вигнуті рядки, відсутність інформації про роздільну здатність знімка, дефекти через недостатню освітленість.

Видалення шуму в окремих фрагментах зображення з можливістю задати розмір чорних цяток.

Витягнення даних із полів, обмежених різними рамками, таких як combo box, поля с підкресленням, рамки тощо.