Відновлення структури документа

Технологія адаптивного розпізнавання документів (ADRT) призначена для відновлення різних елементів структури документа.

Перетворення документів у редаговані формати (DOC, RTF) передбачає не лише розпізнавання всього тексту, але й структури документа та відновлення оригінального розташування елементів. Таким чином, OCR-система повинна аналізувати вміст документа, видобувати та зберегти у фінальний документ такі елементи, як верхні та нижні колонтитули, номери сторінок, зноски, вміст таблиць тощо. Також необхідно відновити форматування документа: стилів шрифтів, заливки тексту, форматування таблиць і малюнків.

ADRT містить наступні можливості:

ABBYY FineReader Engine 10 for Windows > Ключевые преимущества

o Заголовки для зображень/таблиць/діаграм — Покращено

ABBYY FineReader Engine 10 for Windows > Ключевые преимущества

o Верхні та нижні колонтитули
o Номери сторінок
o Зноски Покращено
o Заливка тексту
o Відновлення буллітів (точок і чисел)
o Збереження гіперпосилань

Цю можливість підтримано в API структури документа, за допомогою якого можна отримати доступ до всіх елементів документа. Розробники мають можливість створювати свої додатки, використовуючи функцію ADRT