Спеціальні функції аналізу документів

Аналіз документів для розпізнавання рахунків

Ця функція попередньої обробки для конвертування напівструктурованих документів, таких як рахунки, платіжні доручення, накладні, візитні картки, контракти, бланки страхових вимог, резюме тощо. Вона знаходить усі можливі текстові об’єкти на таких документах, зокрема цифри, навіть якщо вони знаходяться всередині печаток, малюнків, логотипів чи в коротких відрізках тексту.

На відміну від стандартного повносторінкового аналізу документів ця функція виходить з того, що все надруковане документі є текстом. Функція також стежить за тим, щоб текстова інформація не інтерпретувалася як графічні елементи, а числа не розбивалися на велику кількість символів. В результаті на аналіз документів і їх подальшу обробку іншими системами подається максимум інформації про текст, зокрема його координати.

Блок аналізу документів для розпізнавання рахунків використовується в програмі ABBYY FlexiLayout Studio на першому етапі аналізу напівструктурованих документів, що допомагає видобувати дані з документів зі схожими даними, але з різною структурою.

Аналіз документів для повнотекстового індексування

Автоматично знаходить і розпізнає весь текст на документах, зокрема текст, який міститься на малюнках, графіках і діаграмах. Розробникам ця функція може знадобитися для витягнення всієї текстової інформації з документів із метою подальшого індексування (наприклад, у системах керування документообігом, системах керування контентом і системах архівування).

Зональне розпізнавання/розпізнавання на рівні полів

ABBYY FineReader Engine 9.0 підтримує розпізнавання на рівні полів (зональне розпізнавання), необхідне в ключових бізнес-процесах, таких як введення форм, класифікація за ключовими словами та індексування за ключовими словами. Потужні функції обробки зображень дозволяють знаходити невеликі блоки будь-якої якості з будь-якими графічними особливостями, які можуть вплинути на якість розпізнавання (наприклад, підкреслений текст, шум від сканування, пробіли в тексті тощо)

Основна функціональність для зонального розпізнавання включає в себе багатомовне оптичне розпізнавання та читання штрих-кодів, а також ряд спеціальних функцій: