ABBYY Recognition Server і Google Search Appliance

Оперативний пошук потрібної інформації в лічені секунди давно став актуальною проблемою для багатьох організацій. Найчастіше пошук документа або даних займає надто багато часу у співробітників, що негативно позначається на роботі в цілому. Швидкий пошук документів в рамках підприємства може бути здійснений завдяки спеціальним пошуковим серверам, які індексують документи всередині організації. Приклад тому – пошуковий сервер Google Search Appliance (GSA).

 

ABBYY Recognition Server и Google Search Appliance

Google Search Appliance (GSA) представляє собою спеціалізований мережевий пристрій, призначений для вирішення проблеми пошуку інформації у внутрішній мережі підприємства. Google Search Appliance автоматично індексує документи в корпоративній системі для здійснення пошуку. Google Search Appliance дозволяє вести пошук по більш ніж 200 форматам документів, в тому числі HTML, DOC, XLS, TXT та інші.

Однак не всі документи зберігаються у придатному для індексування форматі. Безліч документів зберігається у вигляді графічних зображень, пошук по вмісту яких неможливий. Прикладами таких документів можуть бути факси, копії відсканованих договорів, презентації та інші документи. Для здійснення пошуку по графічним образам документів, перш за все необхідно перевести їх в текстовий формат для можливості індексування. Найзручнішим способом для цього є інтеграція системи розпізнавання в роботу пошукового сервера.

ABBYY Recognition Server представляє собою єдине серверне рішення для розпізнавання та конвертації документів. При роботі з Google Search Appliance ABBYY Recognition Server здійснює функціонал розпізнавання і дозволяє індексувати текст відсканованих або надісланих факсом документів. Тепер для індексування доступні документи у форматах TIFF, JPEG, PDF, DjVu тощо. В основі ABBYY Recognition Server лежить потужна технологія обробки документів на понад 190 мовах.

Схема роботи Google Search Appliance й ABBYY Recognition Server:

  1. Google Search Appliance автоматично індексує документи в корпоративній системі. Якщо в систему надходять документи у графічних форматах, які немає можливості проіндексувати, то такі документи направляються на обробку в ABBYY Recognition Server.
  2. ABBYY Recognition Server розпізнає документи й надсилає результати у вигляді XML-фіда в Google Search Appliance для індексування, після чого ці документи стають доступними для пошуку.
ABBYY Secognition Server и Google Search Appliance

Переваги спільного рішення:

  1. Жоден документ не залишиться незнайденим. Спільне рішення Google Search Appliance і ABBYY Recognition Server дозволяє здійснювати пошук за понад 200 форматами файлів, зокрема TIFF, JPEG, PDF, DjVu тощо.
  2. Готове до використання рішення. Не потрібно вручну сортувати документи й надсилати графічні документи на попередню обробку. Спільне рішення Google Search Appliance і ABBYY Recognition Server дозволяє автоматично обробляти графічні документи до їх індексування в системі.
  3. Масштабованість. ABBYY Recognition Server може бути встановлено на окремому комп’ютері в корпоративній мережі, при цьому обробка документів може виконуватися одночасно на декількох процесорах, що пришвидшує та полегшує роботу.